V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
yech1990
V2EX  ›  Python

这里有没有人用python做生物研究的?

  •  
  •   yech1990 · 2013-01-31 03:13:37 +08:00 · 7907 次点击
    这是一个创建于 4299 天前的主题,其中的信息可能已经有所发展或是发生改变。
    生物信息博士一枚,做实验,写点代码。想学一学python,发现python的论坛气氛都很浓,就没发现用python做科研的啊。。。
    31 条回复    1970-01-01 08:00:00 +08:00
    dndx
        1
    dndx  
       2013-01-31 03:28:21 +08:00 via iPad   ❤️ 1
    不是学生物的,不过我看到很多做生物研究的用的是 perl ,不知何故。

    可能 Python 做科学计算貌似国内不多,或者都是学院派,默默无闻型的。
    toothpaste
        2
    toothpaste  
       2013-01-31 06:32:52 +08:00
    @dndx +1
    我一个做生物的朋友十分推崇perl, 十分不明白.
    zhensun
        3
    zhensun  
       2013-01-31 08:16:06 +08:00
    具体是做什么?
    hfeeki
        4
    hfeeki  
       2013-01-31 08:36:53 +08:00
    有专门为生物研究开发的Python版本:
    biopython : http://biopython.org/
    bioSQL:http://biopython.org/wiki/BioSQL
    python好用,易学,功能强大,而且还有很多同行在用。
    luikore
        5
    luikore  
       2013-01-31 08:40:16 +08:00
    perl和ruby都有很多一行能搞定的字符串函数, 还有模拟awk的命令行参数
    zhensun
        6
    zhensun  
       2013-01-31 08:41:21 +08:00
    这东西主要还是因为库。
    Part
        7
    Part  
       2013-01-31 09:03:10 +08:00
    @yech1990 求推荐研究生~
    cassyfar
        8
    cassyfar  
       2013-01-31 09:07:39 +08:00
    这东西主要还是库, LZ是做模拟神经,大脑之类的吗
    chunshuai
        9
    chunshuai  
       2013-01-31 09:08:56 +08:00
    @Part @yech1990 +1 同求
    kaiqiz89
        10
    kaiqiz89  
       2013-01-31 09:27:56 +08:00 via Android
    你哪个学校的?
    HowardMei
        11
    HowardMei  
       2013-01-31 10:57:33 +08:00   ❤️ 1
    不懂生物,但一直关注开源工程计算。生物学家用perl比较多,大概喜欢它对弱格式文本处理的强悍,就像 @luikore 提的,而python里需要额外库支持:https://github.com/gvalkov/python-oneliner
    bioperl 也最老最成熟,其它语言的bio库都是从它port过去的,包括biopython

    不过python在计算领域发展较快,开发很活跃,模仿matlab的开源集成安装包有蛮多:
    http://www.sagemath.org 最老,偏数学计算
    http://www.enthought.com/products/ 集成作图,与matlab交互,有商业支持
    http://code.google.com/p/pythonxy/ 较新,偏GUI,打包IDE和QT设计器
    https://store.continuum.io/cshop/anaconda 偏大数据性能,有商业版本

    学校里写论文ipython notebook用处比较大,可以仿真、作图、写markdown/latex,
    以网页形式展现:
    http://blog.fperez.org/2012/09/blogging-with-ipython-notebook.html
    然后转换成pdf等格式。
    最重要ipython支持本地和在线两种部署,用来教学,在线提交作业很方便,MIT有在EC2上开搞的部署工具StarCluster:
    http://star.mit.edu/cluster/docs/latest/plugins/ipython.html
    zhensun
        12
    zhensun  
       2013-01-31 12:16:15 +08:00
    现在 matlab 很多都用 R 来代替了。
    empilot
        13
    empilot  
       2013-01-31 14:11:51 +08:00
    yech1990
        14
    yech1990  
    OP
       2013-01-31 15:03:39 +08:00
    @zhensun 主要做进化,也做其他的
    yech1990
        15
    yech1990  
    OP
       2013-01-31 15:10:54 +08:00
    @chunshuai @Part @kaiqiz89 这里的研究生主要还是做分子和细胞的实验,编程都算入门的级别。中大的。
    kaiqiz89
        16
    kaiqiz89  
       2013-01-31 18:10:43 +08:00 via Android
    @yech1990 中山大学?
    kaiqiz89
        17
    kaiqiz89  
       2013-01-31 18:13:24 +08:00 via Android
    @yech1990 干毛?算遗传距离?
    Todd_Leo
        18
    Todd_Leo  
       2013-01-31 19:57:57 +08:00
    发现很多人都在用R来做生物学上的计算
    yech1990
        19
    yech1990  
    OP
       2013-01-31 20:01:32 +08:00
    @kaiqiz89 是。不全是。
    kaiqiz89
        20
    kaiqiz89  
       2013-01-31 21:09:36 +08:00 via Android
    @yech1990 我们实验室有个教授,也是搞生物信息学的,专长就是在进化……

    他说他就是要推翻达尔文,他的理论大致概括出来就是变异会随着物种进化程度升高而降低,他的理论还没被认可,但是也没有人举出反例。

    叫黄石
    yech1990
        21
    yech1990  
    OP
       2013-01-31 21:56:15 +08:00
    @kaiqiz89 有没有文献的链接?这个名字不好搜—— ——#
    frogs
        22
    frogs  
       2013-01-31 22:10:20 +08:00   ❤️ 1
    借问一句 生物信息学现在钱景咋样 XD
    Vienta
        23
    Vienta  
       2013-01-31 23:04:06 +08:00
    @frogs 和生物沾边的暂时都没有大质变,我是学四年生物的,现在iOS
    Vienta
        24
    Vienta  
       2013-01-31 23:06:09 +08:00
    @yech1990 楼主,一直不明白生物信息到底是啥,和编程有什么关系,我本科四年生物,现在已经转战iOS了,要是生物信息也能够编程,而不是那些无聊的概念和抽象到根本没有得到实际证明的理论,我也想混个那个玩玩
    yech1990
        25
    yech1990  
    OP
       2013-02-01 01:25:42 +08:00
    @Vienta 计算应该是现在生物学的主流,从做分子到做生态都离不开计算了。编程在生命科学研究中的重要性国外有很多讨论,搬运一篇《computational thinking in the era of big data biology》。
    原因的话,一方面与历史有关,生物学是一个喜欢收集数据的物种,在达尔文时代之前就有收集标本的习惯,随便一套植物学志,动物学志都有过万页吧,只是当时没有计算机来处理。不过现在的生物学已经很少研究形态学了。
    一方面是当今的生物学已经深入到基因,蛋白的角度,很多人不理解这有多少东西好算的。很不负责任的估算一下:一个人的基因组的数据量是3个G(10的9次方),转录组之类的会更大,如果要比较100个人样本的差异,那应该就有300G吧,加上annotation的话会更大。其实这也不算什么,大美利坚做了很多烧钱的项目,比如花几十个billion把1000个癌症病人的所有癌细胞(每个人大概有10的14次方个细胞,癌组织会少一点)都测序,每个细胞也都有3G的数据,这样的数据量的话如果不借助编程的话是搞不定的。 同理蛋白结构,网络的拓扑结构之类的都是需要算的。
    说点实的,现在TOP500的supercomputer其中有很大一部分就在进行生物学计算来的。
    ^_^,至于有没有趣的看个人了,想想如果通过计算能知道有些人为什么容易得癌症,有些病毒为什么更容易突变,还算挺有趣的。 不过生物信息学还算有前途,没钱途的东西。
    enzyme
        26
    enzyme  
       2013-02-01 04:41:23 +08:00
    生物信息有很多方向。有面向算法的,开发软件的,亦有研究进化模型,推导理论的,还有更多的是用于二代测序应用的。

    其实涉及很多的计算问题。简单的例子如下:

    人个体之间的不同的最根本是源于你我的基因组不同。人类的基因组大约有3*10^9个ATCG四个碱基,这些ATCG的不同排列造成了个体之间的差异。

    举个简单的粗糙不严谨的例子:
    以二型糖尿病为例,简单鉴定一个健康人与患者的基因组差异不能够解释为什么患病,因为这些差异可能是因为身高等其他性状的不同。而通过测序多个患者与健康人的基因组,全基因组关联分析,则有可能真正找到究竟是那些基因变异增加了患病的风险。需要大量计算。

    至于,为什么会有很多人用perl。可能一是因为习惯原因,perl有很多这方面的库了,2是可能perl在写一些一次性用的脚本上很方便。虽然,有时quick and dirty,但能干活儿。
    azalea
        27
    azalea  
       2013-02-01 10:30:54 +08:00
    我是读生信的,一直用Python,不过就是处理下文本文件,画画图什么的。具体工作还是要用对应软件,比如short read aligner用Bowtie,找相似序列用BLAST。最近打算转向R。
    zhensun
        28
    zhensun  
       2013-02-01 11:47:09 +08:00
    Matlab 转向 R 比较常见。
    Vienta
        29
    Vienta  
       2013-02-01 17:44:32 +08:00
    @yech1990 感谢你的回答,看到后面的一句话,确实是道出了我们这些学生物的童鞋的小命了。哈哈,我相信它会是很有前景的,本科同学八成以上都在读研了,读完研出来相信也会好点。我呢,其实学的也不错,不过最后对它已经不感兴趣了,所以就转了,现在也做这个也挺好,能创造点东西。毕竟大学不只是是学某个专业嘛,学的也是学习力。祝楼主好运
    kaiqiz89
        30
    kaiqiz89  
       2013-02-01 18:27:48 +08:00 via Android
    @yech1990 www.sklmg.edu.cn/articles_98.shtml 我们实验室网站

    @enzyme 5看你头像,搞遗传的?
    unionx
        31
    unionx  
       2013-08-17 04:15:46 +08:00
    话说我最近开始bioinfo了,LZ可以看看这个网站,用py解决bioinfo问题的教学网站:

    rosalind.info
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3369 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 10:37 · PVG 18:37 · LAX 02:37 · JFK 05:37
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.