这里有没有人用python做生物研究的？

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

推荐学习书目

› Learn Python the Hard Way

Python Sites

› PyPI - Python Package Index

› http://diveintopython.org/toc/index.html

› Pocoo

值得关注的项目

› PyPy

› Celery

› Jinja2

› Read the Docs

› gevent

› pyenv

› virtualenv

› Stackless Python

› Beautiful Soup

› 结巴中文分词

› Green Unicorn

› Sentry

› Shovel

› Pyflakes

› pytest

Python 编程

› pep8 Checker

Styles

› PEP 8

› Google Python Style Guide

› Code Style from The Hitchhiker's Guide

这是一个创建于 4764 天前的主题，其中的信息可能已经有所发展或是发生改变。

生物信息博士一枚，做实验，写点代码。想学一学python，发现python的论坛气氛都很浓，就没发现用python做科研的啊。。。

Python

人用

一学

31 条回复 • 1970-01-01 08:00:00 +08:00

dndx

2013 年 1 月 31 日 via iPad

不是学生物的，不过我看到很多做生物研究的用的是 perl ，不知何故。

可能 Python 做科学计算貌似国内不多，或者都是学院派，默默无闻型的。

toothpaste

2013 年 1 月 31 日

@dndx +1
我一个做生物的朋友十分推崇perl, 十分不明白.

zhensun

2013 年 1 月 31 日

具体是做什么？

hfeeki

2013 年 1 月 31 日

有专门为生物研究开发的Python版本：
biopython : http://biopython.org/
bioSQL：http://biopython.org/wiki/BioSQL
python好用，易学，功能强大，而且还有很多同行在用。

luikore

2013 年 1 月 31 日

perl和ruby都有很多一行能搞定的字符串函数, 还有模拟awk的命令行参数

zhensun

2013 年 1 月 31 日

这东西主要还是因为库。

Part

2013 年 1 月 31 日

@yech1990 求推荐研究生~

cassyfar

2013 年 1 月 31 日

这东西主要还是库, LZ是做模拟神经,大脑之类的吗

chunshuai

2013 年 1 月 31 日

@Part @yech1990 +1 同求

kaiqiz89

2013 年 1 月 31 日 via Android

你哪个学校的？

HowardMei

2013 年 1 月 31 日

不懂生物，但一直关注开源工程计算。生物学家用perl比较多，大概喜欢它对弱格式文本处理的强悍，就像 @luikore 提的，而python里需要额外库支持：https://github.com/gvalkov/python-oneliner
bioperl 也最老最成熟，其它语言的bio库都是从它port过去的，包括biopython

不过python在计算领域发展较快，开发很活跃，模仿matlab的开源集成安装包有蛮多：
http://www.sagemath.org 最老，偏数学计算
http://www.enthought.com/products/ 集成作图，与matlab交互，有商业支持
http://code.google.com/p/pythonxy/ 较新，偏GUI，打包IDE和QT设计器
https://store.continuum.io/cshop/anaconda 偏大数据性能，有商业版本

学校里写论文ipython notebook用处比较大，可以仿真、作图、写markdown/latex，
以网页形式展现:
http://blog.fperez.org/2012/09/blogging-with-ipython-notebook.html
然后转换成pdf等格式。
最重要ipython支持本地和在线两种部署，用来教学，在线提交作业很方便，MIT有在EC2上开搞的部署工具StarCluster：
http://star.mit.edu/cluster/docs/latest/plugins/ipython.html

zhensun

2013 年 1 月 31 日

现在 matlab 很多都用 R 来代替了。

empilot

2013 年 1 月 31 日

http://azaleasays.com/
http://hyry.dip.jp:8000/pydoc/index.html

yech1990

2013 年 1 月 31 日

@zhensun 主要做进化，也做其他的

yech1990

2013 年 1 月 31 日

@chunshuai @Part @kaiqiz89 这里的研究生主要还是做分子和细胞的实验，编程都算入门的级别。中大的。

kaiqiz89

2013 年 1 月 31 日 via Android

@yech1990 中山大学？

kaiqiz89

2013 年 1 月 31 日 via Android

@yech1990 干毛？算遗传距离？

Todd_Leo

2013 年 1 月 31 日

发现很多人都在用R来做生物学上的计算

yech1990

2013 年 1 月 31 日

@kaiqiz89 是。不全是。

kaiqiz89

2013 年 1 月 31 日 via Android

@yech1990 我们实验室有个教授，也是搞生物信息学的，专长就是在进化……

他说他就是要推翻达尔文，他的理论大致概括出来就是变异会随着物种进化程度升高而降低，他的理论还没被认可，但是也没有人举出反例。

叫黄石

yech1990

2013 年 1 月 31 日

@kaiqiz89 有没有文献的链接？这个名字不好搜—— ——#

frogs

2013 年 1 月 31 日

借问一句生物信息学现在钱景咋样 XD

Vienta

2013 年 1 月 31 日

@frogs 和生物沾边的暂时都没有大质变，我是学四年生物的，现在iOS

Vienta

2013 年 1 月 31 日

@yech1990 楼主，一直不明白生物信息到底是啥，和编程有什么关系，我本科四年生物，现在已经转战iOS了，要是生物信息也能够编程，而不是那些无聊的概念和抽象到根本没有得到实际证明的理论，我也想混个那个玩玩

yech1990

2013 年 2 月 1 日

@Vienta 计算应该是现在生物学的主流，从做分子到做生态都离不开计算了。编程在生命科学研究中的重要性国外有很多讨论，搬运一篇《computational thinking in the era of big data biology》。
原因的话，一方面与历史有关，生物学是一个喜欢收集数据的物种，在达尔文时代之前就有收集标本的习惯，随便一套植物学志，动物学志都有过万页吧，只是当时没有计算机来处理。不过现在的生物学已经很少研究形态学了。
一方面是当今的生物学已经深入到基因，蛋白的角度，很多人不理解这有多少东西好算的。很不负责任的估算一下：一个人的基因组的数据量是3个G（10的9次方），转录组之类的会更大，如果要比较100个人样本的差异，那应该就有300G吧，加上annotation的话会更大。其实这也不算什么，大美利坚做了很多烧钱的项目，比如花几十个billion把1000个癌症病人的所有癌细胞（每个人大概有10的14次方个细胞，癌组织会少一点）都测序，每个细胞也都有3G的数据，这样的数据量的话如果不借助编程的话是搞不定的。同理蛋白结构，网络的拓扑结构之类的都是需要算的。
说点实的，现在TOP500的supercomputer其中有很大一部分就在进行生物学计算来的。
^_^，至于有没有趣的看个人了，想想如果通过计算能知道有些人为什么容易得癌症，有些病毒为什么更容易突变，还算挺有趣的。不过生物信息学还算有前途，没钱途的东西。

enzyme

2013 年 2 月 1 日

生物信息有很多方向。有面向算法的，开发软件的，亦有研究进化模型，推导理论的，还有更多的是用于二代测序应用的。

其实涉及很多的计算问题。简单的例子如下：

人个体之间的不同的最根本是源于你我的基因组不同。人类的基因组大约有3*10^9个ATCG四个碱基，这些ATCG的不同排列造成了个体之间的差异。

举个简单的粗糙不严谨的例子：
以二型糖尿病为例，简单鉴定一个健康人与患者的基因组差异不能够解释为什么患病，因为这些差异可能是因为身高等其他性状的不同。而通过测序多个患者与健康人的基因组，全基因组关联分析，则有可能真正找到究竟是那些基因变异增加了患病的风险。需要大量计算。

至于，为什么会有很多人用perl。可能一是因为习惯原因，perl有很多这方面的库了，2是可能perl在写一些一次性用的脚本上很方便。虽然，有时quick and dirty，但能干活儿。

azalea

2013 年 2 月 1 日

我是读生信的，一直用Python，不过就是处理下文本文件，画画图什么的。具体工作还是要用对应软件，比如short read aligner用Bowtie，找相似序列用BLAST。最近打算转向R。

zhensun

2013 年 2 月 1 日

Matlab 转向 R 比较常见。

Vienta

2013 年 2 月 1 日

@yech1990 感谢你的回答，看到后面的一句话，确实是道出了我们这些学生物的童鞋的小命了。哈哈，我相信它会是很有前景的，本科同学八成以上都在读研了，读完研出来相信也会好点。我呢，其实学的也不错，不过最后对它已经不感兴趣了，所以就转了，现在也做这个也挺好，能创造点东西。毕竟大学不只是是学某个专业嘛，学的也是学习力。祝楼主好运

kaiqiz89

2013 年 2 月 1 日 via Android

@yech1990 www.sklmg.edu.cn/articles_98.shtml 我们实验室网站

@enzyme 5看你头像，搞遗传的？

unionx

2013 年 8 月 17 日

话说我最近开始bioinfo了，LZ可以看看这个网站，用py解决bioinfo问题的教学网站：

rosalind.info