1
dndx 2013-01-31 03:28:21 +08:00 via iPad 1
不是学生物的,不过我看到很多做生物研究的用的是 perl ,不知何故。
可能 Python 做科学计算貌似国内不多,或者都是学院派,默默无闻型的。 |
2
toothpaste 2013-01-31 06:32:52 +08:00
@dndx +1
我一个做生物的朋友十分推崇perl, 十分不明白. |
3
zhensun 2013-01-31 08:16:06 +08:00
具体是做什么?
|
4
hfeeki 2013-01-31 08:36:53 +08:00
有专门为生物研究开发的Python版本:
biopython : http://biopython.org/ bioSQL:http://biopython.org/wiki/BioSQL python好用,易学,功能强大,而且还有很多同行在用。 |
5
luikore 2013-01-31 08:40:16 +08:00
perl和ruby都有很多一行能搞定的字符串函数, 还有模拟awk的命令行参数
|
6
zhensun 2013-01-31 08:41:21 +08:00
这东西主要还是因为库。
|
8
cassyfar 2013-01-31 09:07:39 +08:00
这东西主要还是库, LZ是做模拟神经,大脑之类的吗
|
10
kaiqiz89 2013-01-31 09:27:56 +08:00 via Android
你哪个学校的?
|
11
HowardMei 2013-01-31 10:57:33 +08:00 1
不懂生物,但一直关注开源工程计算。生物学家用perl比较多,大概喜欢它对弱格式文本处理的强悍,就像 @luikore 提的,而python里需要额外库支持:https://github.com/gvalkov/python-oneliner
bioperl 也最老最成熟,其它语言的bio库都是从它port过去的,包括biopython 不过python在计算领域发展较快,开发很活跃,模仿matlab的开源集成安装包有蛮多: http://www.sagemath.org 最老,偏数学计算 http://www.enthought.com/products/ 集成作图,与matlab交互,有商业支持 http://code.google.com/p/pythonxy/ 较新,偏GUI,打包IDE和QT设计器 https://store.continuum.io/cshop/anaconda 偏大数据性能,有商业版本 学校里写论文ipython notebook用处比较大,可以仿真、作图、写markdown/latex, 以网页形式展现: http://blog.fperez.org/2012/09/blogging-with-ipython-notebook.html 然后转换成pdf等格式。 最重要ipython支持本地和在线两种部署,用来教学,在线提交作业很方便,MIT有在EC2上开搞的部署工具StarCluster: http://star.mit.edu/cluster/docs/latest/plugins/ipython.html |
12
zhensun 2013-01-31 12:16:15 +08:00
现在 matlab 很多都用 R 来代替了。
|
13
empilot 2013-01-31 14:11:51 +08:00
|
15
yech1990 OP |
18
Todd_Leo 2013-01-31 19:57:57 +08:00
发现很多人都在用R来做生物学上的计算
|
20
kaiqiz89 2013-01-31 21:09:36 +08:00 via Android
@yech1990 我们实验室有个教授,也是搞生物信息学的,专长就是在进化……
他说他就是要推翻达尔文,他的理论大致概括出来就是变异会随着物种进化程度升高而降低,他的理论还没被认可,但是也没有人举出反例。 叫黄石 |
22
frogs 2013-01-31 22:10:20 +08:00 1
借问一句 生物信息学现在钱景咋样 XD
|
24
Vienta 2013-01-31 23:06:09 +08:00
@yech1990 楼主,一直不明白生物信息到底是啥,和编程有什么关系,我本科四年生物,现在已经转战iOS了,要是生物信息也能够编程,而不是那些无聊的概念和抽象到根本没有得到实际证明的理论,我也想混个那个玩玩
|
25
yech1990 OP @Vienta 计算应该是现在生物学的主流,从做分子到做生态都离不开计算了。编程在生命科学研究中的重要性国外有很多讨论,搬运一篇《computational thinking in the era of big data biology》。
原因的话,一方面与历史有关,生物学是一个喜欢收集数据的物种,在达尔文时代之前就有收集标本的习惯,随便一套植物学志,动物学志都有过万页吧,只是当时没有计算机来处理。不过现在的生物学已经很少研究形态学了。 一方面是当今的生物学已经深入到基因,蛋白的角度,很多人不理解这有多少东西好算的。很不负责任的估算一下:一个人的基因组的数据量是3个G(10的9次方),转录组之类的会更大,如果要比较100个人样本的差异,那应该就有300G吧,加上annotation的话会更大。其实这也不算什么,大美利坚做了很多烧钱的项目,比如花几十个billion把1000个癌症病人的所有癌细胞(每个人大概有10的14次方个细胞,癌组织会少一点)都测序,每个细胞也都有3G的数据,这样的数据量的话如果不借助编程的话是搞不定的。 同理蛋白结构,网络的拓扑结构之类的都是需要算的。 说点实的,现在TOP500的supercomputer其中有很大一部分就在进行生物学计算来的。 ^_^,至于有没有趣的看个人了,想想如果通过计算能知道有些人为什么容易得癌症,有些病毒为什么更容易突变,还算挺有趣的。 不过生物信息学还算有前途,没钱途的东西。 |
26
enzyme 2013-02-01 04:41:23 +08:00
生物信息有很多方向。有面向算法的,开发软件的,亦有研究进化模型,推导理论的,还有更多的是用于二代测序应用的。
其实涉及很多的计算问题。简单的例子如下: 人个体之间的不同的最根本是源于你我的基因组不同。人类的基因组大约有3*10^9个ATCG四个碱基,这些ATCG的不同排列造成了个体之间的差异。 举个简单的粗糙不严谨的例子: 以二型糖尿病为例,简单鉴定一个健康人与患者的基因组差异不能够解释为什么患病,因为这些差异可能是因为身高等其他性状的不同。而通过测序多个患者与健康人的基因组,全基因组关联分析,则有可能真正找到究竟是那些基因变异增加了患病的风险。需要大量计算。 至于,为什么会有很多人用perl。可能一是因为习惯原因,perl有很多这方面的库了,2是可能perl在写一些一次性用的脚本上很方便。虽然,有时quick and dirty,但能干活儿。 |
27
azalea 2013-02-01 10:30:54 +08:00
我是读生信的,一直用Python,不过就是处理下文本文件,画画图什么的。具体工作还是要用对应软件,比如short read aligner用Bowtie,找相似序列用BLAST。最近打算转向R。
|
28
zhensun 2013-02-01 11:47:09 +08:00
Matlab 转向 R 比较常见。
|
29
Vienta 2013-02-01 17:44:32 +08:00
@yech1990 感谢你的回答,看到后面的一句话,确实是道出了我们这些学生物的童鞋的小命了。哈哈,我相信它会是很有前景的,本科同学八成以上都在读研了,读完研出来相信也会好点。我呢,其实学的也不错,不过最后对它已经不感兴趣了,所以就转了,现在也做这个也挺好,能创造点东西。毕竟大学不只是是学某个专业嘛,学的也是学习力。祝楼主好运
|
30
kaiqiz89 2013-02-01 18:27:48 +08:00 via Android
|
31
unionx 2013-08-17 04:15:46 +08:00
|