第一篇:生物信息学论文
生物信息学的进展综述
韩雪晴
(生物工程1201班,学号:201224340124)
摘要:生物信息学是一门研究生物和生物相关系统中信息内容和信息流向的综合性系统科学。80年代以来新兴的一门边缘学科,信息在其中具有广阔的前景。伴随着人类基因组计划的胜利完成与生物信息学的发展有着密不可分的联系,生物信息学的发展为生命科学的发展为生命科学的研究带来了诸多的便利,对此作了简单的分析。
关键词:生物信息学;进展;序列比对;生物芯片
A review of the advances in Bioinformatics
Han Xueqing(Bioengineering, Class1201,Student ID:201224340124)
Abstract: Bioinformatics is the science of comprehensive system of information content and information flows to a study on the biological and bio related in the system.The edge of an emerging discipline since 80, has broad prospects in which information.With the human genome project was completed and the development of bioinformatics are inextricably linked, for the life science research development of bioinformatics for the development of life science has also brought a lot of convenience, has made the simple analysis.Keywords:
bioinformatics;progress;Sequence alignment;biochip
1、生物信息学的产生背景
生物信息学是20世纪80年代末开始,随着基因组测序数据迅猛增加而逐渐兴起的一门学科[1]。应用系统生物学的方法认识生物体代谢、发育、分化、进化以及疾患发生规律的不可或缺的工具[2]。及时、充分、有效地利用网络上不断增长的生物信息数据库资源,已经成为生命科学和生物技术研究开发的必要手段,从而诞生了生物信息学。
2、生物信息学研究内容
主要是利用计算机存储核酸和蛋白质序列,通过研究科学的算法,编制相应的软件对序列进行分析、比较与预测,从中发现规律。白细胞介素-6(IL-6)是机体重要的免疫因子,但在两栖类中未见报道。采用生物信息学方法对两栖类模式动物非洲爪蟾IL-6进行分析[3]。以人IL-6基因对非洲爪蟾数据库进行搜索、分析,并采用RT-PCR方法对所得序列进行验证。结果表明,非洲爪蟾IL-6基因位于scaffold_52基因架上,具有保守的IL-6家族基序[4]。采用生物信息新方法进行不同物种的免疫基因挖掘、克隆,是一种有效的方法[5]。
2.1序列比对
比较两个或两个以上符号序列的相似性或不相似性。序列比对是生物信息学的基础。两个序列的比对现在已有较成熟的动态规划算法,以及在此基础上编写的比对软件包BLAST和FASTA[6]。序列数据库搜索最著名且最常用的工具之一便是BLAST算法。FASTA算法是另一族常用的序列比对及搜索工具[7]。
2.2结构比对
比较两个或两个以上蛋白质分子空间结构的相似性或不相似性。
2.3蛋白质结构预测
从方法上来看有演绎法和归纳法两种途径。前者主要是从一些基本原理或假设出发来预测和研究蛋白质的结构和折叠过程。分子力学和分子动力学属这一范畴。后者主要是从观察和总结已知结构的蛋白质结构规律出发来预测未知蛋白质的结构[8]。
3、生物信息学的新技术 3.1 Lipshutz(Affymetrix,Santa clara,CA,USA)
描述了一种利用DNA探针阵列进行基因组研究的方法,其原理是通过更有效有作图、表达检测和多态性筛选方法,可以实现对人类基因组的测序[9]。光介导的化学合成法被应用于制造小型化的高密度寡核苷酸探针的阵列,这种通过软件包件设计的寡核苷酸探针阵列可用于多态性筛查、基因分型和表达检测[10]。
3.2基因的功能分析
Overton(University of Pennsylvania School of Medicine,Philadelphia,PA,USA)论述了人类基因组计划的下一阶段的任务基因组水平的基因功能分析。
4生物信息学前沿
4.1生物芯片技术
4.1.1生物芯片的简介
生物芯片技术是通过缩微技术,根据分子间特异性地相互作用的原理,按照芯片上固化的生物材料的不同,可以将生物芯片划分为基因芯片、蛋白质芯片、细胞芯片和组织芯片。4.1.2生物芯片的基本内容
生物芯片技术通过微加工工艺在厘米见方的芯片上集成有成千上万个与生命相关的信息分子,它可以对生命科学与医学中的各种生物化学反应过程进行集成,从而实现对基因、配体、抗原等生物活性物质进行高效快捷的测试和分析。4.1.3生物芯片的发展
生物芯片将会给21世纪整个人类生活带来一场“革命”。生物芯片产业也有望与“微电子芯片”并列成为21世纪最大的产业之一。4.1.4与生物芯片相关的技术
平面微加工技术、微机械技术、CCD成像技术、基因芯片技术等。
4.2药物设计与生物信息学
药物基因组学可以说是基因功能学与分子药理学的有机结合,在很多方面这种结合是非常必要的。药物基因组学以药物效应及安全性为目标,研究各种基因突变与药效及安全性的关系。
4.3基因治疗
基因治疗(gene therapy)是指将外源正常基因导入靶细胞,以纠正或补偿因基因缺陷和异常引起的疾病,达到治疗目的[11]。也就是将外源基因通过基因转移技术将其插入病人的适当的受体细胞中,使外源基因制造的产物能治疗某种疾病[12]。通过对miR-29a进行靶基因预测及相关生物信息学分析,为miR-29a靶基因的实验验证提供数据支持,以期为深入研究miR-29a的生物学功能和调控机制提供理论指导[13]。从广义说,基因治疗还可包括从DNA水平采取的治疗某些疾病的措施和新技术。在基因治疗中迄今所应用的目的基因转移方法可分为两大类:病毒方法和非病毒方法[14]。
4.4虚拟细胞--人工生命的模型
虚拟细胞是应用信息科学的原理和技术,通过数学的计算和分析,对细胞的结构和功能进行分析、整合和应用,以模拟和再现细胞和生命的现象的一门新兴学科。虚拟细胞亦称人工细胞或人工生命[15]。目前,国际上已有两个虚拟细胞问世,一个是日本的原核虚拟细胞模型,一个是美国的真核虚拟细胞模型。
参考文献
[1].张阳德,生物信息学(第二版)科学出版社,2010,21世纪高等院校教材ISBN978-7-03-023931-0 [2].迈克尔 R.巴恩斯(Barnes.M.R.),遗传学工作者的生物信息学,科学出版社2010年10月1日出版ISBN 9787030254900 [3].齐志涛;张启焕;王资生;许伟;黄贝;王爱民,非洲爪蟾IL-6基因的克隆及生物信息学分析 出版日期: 2010 [4].齐志涛;张启焕;黄贝;王资生;仇明;黄金田;许伟;王爱民.非洲爪蟾BAFF及其信号通路相关基因的比较生物信息学分析,生物技术,2011,(4):
[5].廖明帜,生物背景学生的《生物信息学》课程教学思考与探索,教育教学论坛,2014年第36期
[6].Dan E.Krane&Michael L.Raymer,生物信息学概论,清华大学出版社 2010年出版
[7].Eddy S R.Profile Hidden Markov Models.Bioinformatics,1998,14(9):755~763 [8].Coombes KR,Fristche HA,Clarke,et al.Qutility control and peak finding for proteomics data collected from nipple aspirate fluid by surface-en-hanced laser desorption and ionization.Clin Chem,2013,49(10):1615~1623 [9].Lim HA,Batt tR.TIBTECH,1998;16(3)):104.[10].Williams n.Science,1997;277(5328):902.[11].顾健人,曹雪涛,基因治疗,北京:科学出版社,2011 [12].余国膺,生物信息学,中国心脏起博与心电生理杂志,2014年01期 [13].施伟杰
曾玉
姚纯
曹笑梅
童华,miR-29a靶基因预测及其相关生物信息学分析,现代生物医学进展,2014年32期
[14].安冬
姜涛
张翠丽
殷玉玲
曹雪姣
辛毅,臧师竹利用生物信息学研究肥胖与2型糖尿病患者肝组织基因表达变化,《现代生物医学进展》 2014年30期
[15].孙冬泳,汤健,虚拟细胞-人工生命的模型,中华医学杂志,2011,21(81):1342~1344
第二篇:生物信息学论文
浅谈生物信息学的发展和前景
摘 要:本文阐述了生物信息学产生的背景,生物学数据库,生物信息学的主要研究内容,与生物信息学关系密切的数学和计算机科学技术领域,生物信息学产业等内容,展望了其未来并提出了若干在我国发展生物信息学的建议。着重指出,理解大量生物学数据所包括的生物学意义已成为后基因组时代极其重要的课题。生物信息学的作用将日益重要。有理由认为,今日生物学数据的巨大积累将导致重大生物学规律的发现。生物信息学的发展在国内、外基本上都处在起步阶段。因此,这是我国生物学赶超世界先进水平的一个百年一遇的极好机会。关键字:生物信息学产生背景发展现状前景
随着生物科学技术的迅猛发展,生物信息数据资源的增长呈现爆炸之势,同时计算机运 算能力的提高和国际互联网络的发展使得对大规模数据的贮存、处理和传输成为可能,为了 快捷方便地对已知生物学信息进行科学的组织、有效的管理和进一步分析利用,一门由生命 科学和信息科学等多学科相结合特别是由分子生物学与计算机信息处理技术紧密结合而形 成的交叉学科——生物信息学(Bioinformatics)应运而生,并大大推动了相关研究的开展,被誉为“解读生命天书的慧眼”。
一、生物信息学产生的背景
生物信息学是80年代未随着人类基因组计划(Human genome project)的启动而兴起的一门新的交叉学科。它通过对生物学实验数据的获取、加工、存储、检索与分析,进而达到揭示数据所蕴含的生物学意义的目的。由于当前生物信息学发展的主要推动力来自分子生物学,生物信息学的研究主要集中于核苷酸和氨基酸序列的存储、分类、检索和分析等方面,所以目前生物信息学可以狭义地定义为:将计算机科学和数学应用于生物大分子信息的获取、加工、存储、分类、检索与分析,以达到理解这些生物大分子信息的生物学意义的交叉学科。事实上,它是一门理论概念与实践应用并重的学科。
生物信息学的产生发展仅有10年左右的时间---bioinformatics这一名词在1991年左右才在文献中出现,还只是出现在电子出版物的文本中。事实上,生物信息学的存在已有30多年,只不过最初常被称为基因组信息学。美国人类基因组计划中给基因组信息学的定义:它是一个学科领域,包含着基因组信息的获取、处理、存储、分配、分析和解释的所有方面。
自1990年美国启动人类基因组计划以来,人与模式生物基因组的测序工作进展极为迅速。迄今已完成了约40多种生物的全基因组测序工作,人基因组约3x109碱基对的测序工作也接近完成。至2000年6月26日,被誉为生命“阿波罗计划”的人类基因组计划终于完成了工作草图,预示着完成人类基因组计划已经指日可待。截止目前为止,仅登录在美国GenBank数据库中的DNA序列总量已超过70亿碱基对。此外,迄今为止,已有一万多种蛋白质的空间结构以不同的分辨率被测定。基于cDNA序列测序所建立起来的EST数据库其纪录已达数百万条。在这些数据基础上派生、整理出来的数据库已达500余个。这一切构成了一个生物学数据的海洋。这种科学数据的急速和海量积累,在人类的科学研究历史中是空前的。
数据并不等于信息和知识,但却是信息和知识的源泉,关键在于如何从中挖掘它们。与
正在以指数方式增长的生物学数据相比,人类相关知识的增长(粗略地用每年发表的生物、医学论文数来代表)却十分缓慢。一方面是巨量的数据;另一方面是我们在医学、药物、农业和环保等方面对新知识的渴求,这些新知识将帮助人们改善其生存环境和提高生活质量。这就构成了一个极大的矛盾。这个矛盾就催生了一门新兴的交叉科学,这就是生物信息学。
二、生物信息学研究的发展现状
资金和实力非常重要,生物信息的研究投入短期不算大,但是结合成果,其投入相当的大。因为目前生物信息主要在于教学和和研究,商业领域的应用不算很广。如一套LIMS加上软件就要花上数千万。加上相关项目的研究开发,不是国内相关的机构所能承受的。所以需要得到政府的支持和帮助。以及有识之士的投入。否则我们又将远远落后国外。国内的制药行业将永不得翻身!基因的流失(国外一些国家打着给国内免费治疗,分析疾病的考旗帜,暗中收集了国内不同省份,地区的遗传类疾病和特性。这些资源,我们国家忽略,应当说目前还没有这样的实力进行研究)。落后就要挨打,21世纪是生物的世纪。基因大战不可避免。基因和疾病的研究很大程度就是数据的分析。里面的领头羊就是生物信息。国内应当在基础教学,基础研究并结合应用力度。
当然国内的人才济济,如有更多计算机领域和数学(统计方面的)人才参与到生物信息,将如虎添翼。目前我国生物信息学发展面临着如下几方面的困境:
⒈政府投资不足
虽然国际上生物信息学研究在各发达国家中比较受重视,但仍有不少研究机构抱怨政府资金投入不够。最近美国许多研究院纷纷申请要求政府加大生物信息学工具与数据库方面的投入,而且欧洲、日本、澳大利亚在这些领域也存在着资金困扰问题,欧洲生物信息学研究所(EBI)和欧洲基金会生命科学中心去年都遇到了麻烦。目前虽然危机已经暂时渡过,但未来几年EBI数据库和其它基础结构仍将受到资金短缺的困扰,一致有人发出了“免费数据服务还能维持多久”的疑问。
2.来自商业机构的竞争
基因组研究潜在的巨大商业利润使得国际上一批大型制药公司和化学公司向该领域大规模的进军。世界最大制药集团之一的Giba Geigy和Sandoz合资建立的Novartis公司投资2.5亿美元建立基因组研究所;Glaxo-Wellcome在基因组研究领域投入4700万美元,将研究人员增加一倍;Smith Kline公司花125亿美元扩展人基因组的顺序,将生物信息学的研究人员从2人增加至70人,并将该公司药物开发项目中的25%建立在基因组学之上。这一方面给生物信息学发展注入了生机,另一方面对那些政府支持的不以赢利为目的的研究机构造成了巨大的压力,学术部门的资金投入远远不及工业部门,其负面冲击力不可忽视。毕竟经济利益的盲目追求会导致基因组研究的片面性,生物信息学长路漫漫,保护这些学术部门的良好发展非常有必要。
3.专业人才匮乏
目前该领域缺乏懂得如何利用计算机技术处理大量生物数据的生物学家,不少生物学家只是将计算机用来打字或作为图纸的替代品。甚至出现了这样有趣的现象:制药业、工业、农业、生物技术研究团体经常在学术机构大肆搜查那些“可疑人”,更有甚者他们彼此间互挖“墙角”。虽然对于人才的渴求与日俱增,但全世界也仅有20多个专业人才培训中心,而且这些中心本身也处在恶性循环中,那些经培训后的人才往往由于高薪诱惑而投身应用工业部门,导致培训教育人员越来越少,出现“断层”现象。
综上所述,不难看出,生物信息学并不是一个足以乐观的领域,究竟原因,是由于其是基于分子生物学与多种学科交叉而成的新学科,现有的形势仍表现为各种学科的简单堆砌,相互之间的联系并不是特别的紧密。在处理大规模数据方面,没有行之有效的一般性方法;而对于大规模数据内在的生成机制也没有完全明了,这使得生物信息学的研究短期内很难有突破性的结果。那么,要得到真正的解决,最终不能从计算机科学得到,真正地解决可能还是得从生物学自身,从数学上的新思路来获得本质性的动力。毫无疑问,正如Dulbecco1986年所说:“人类的DNA序列是人类的真谛,这个世界上发生的一切事情,都与这一序列息息相关”。但要完全破译这一序列以及相关的内容,我们还有相当长的路要走。
三、生物信息学的发展前景
《第三次技术革命》里有这样描述:“一场与工业革命和以计算机为基础的革命有相同影响力的变化正在开始。下一个伟大时代将是基因组革命时代,它现在处于初期阶段。”基因组学的发展已经进入后基因组研究阶段,致力于蛋白质功能研究的蛋白质组学和功能蛋白质组学正在蓬勃发展,在生物信息学发展的带动下,我们必定能够揭示各种生命现象的奥秘,并带动多个学科的跨越式发展。生物信息学的发展将对分子生物学、药物设计、工作流管理和医疗成像等领域产生巨大的影响,极有可能引发新的产业革命。此外,生物信息学所倡导的全球范围的资源共享也将对整个自然科学乃至人类社会的发展产生深远的影响。有理由相信,今日生物学数据的巨大积累将导致重大生物学规律的发现,生物信息学的发展在国内、外基本上都处在起步阶段,因此,这是我国生物学赶超世界先进水平的一个百年一遇的极好机会。
生物学是生物信息学的核心和灵魂,数学与计算机技术则是它的基本工具。这一点必须着重指出。预测生物信息学的未来主要就是要预测他对生物学的发展将带来什么样的根本性的突破。这种预测是十分困难的,甚至几乎不可能。但机不可失,时不再来,鉴于生物信息学在我国生物信息学和经济发展中的重要意义和其发展的紧迫性,因此,由国家出面组织全国的力量,搞个类似“两弹一星”那样的,但是,规模要小的多,花钱也少的多的生物信息学发展计划,不是不可以考虑的。要充分发挥中央与地方,生物学科研究人员等方方面面的积极性。生物信息学研究投资少,见效快,可充分发挥我国智力资源丰富的长处,是特别适合我国国情的一项研究领域。要在大学里建立生物信息学专业,设立硕士点和博士点,培养专门人才。可以组织一大批数学、物理、化学和计算机科技工作者,在自愿的基础上,学习有关的生物学知识,开展多方面的生物信息学研究。
经过十几年或更长的时间的努力,逐渐使我国成为生物信息学研究强国,是完全有可能的。信息学的商业价值十分显著。国外很多大学,研究机构,软件公司甚至政府机构纷纷成立各种生物信息机构,建立自立的生物信息集成系统,研制这方面的软件,重金招聘人才,期望从中获取更多的生物信息和数据加以研究和利用,缩短药物开发周期,抢注基因专利,获取更大利润。我国如不加大资金投入力度,将来可能会花更多的钱去购买别人的软件,使用专利基因或购买新的药物。所幸,我国也开始重视这一学科:南、北方人类基因组中心的相继建成,北大生物城的破土动工等,标志着我国对生物信息学的重视。我们有理由相信,我国的生物信息学在21世纪会有巨大的飞跃。
参考文献
1.陈润生.生物信息学.生物物理学报,1999,15(1):5
2.北京生物技术和新医药产业促进中心.世纪之交的新科学:生物信息学.生物技术通 报,1999,(8):49
3.杨福愉.展望21世纪的分子生物学.生物物理学报,1999,15(1):1
4.郑国清,张瑞玲,;生物信息学的形成与发展;河南农业科学;2002.11
5.王玉梅,王艳.国外生物信息学发展动态分析;科技情报开发与经济;2002.06
6.张春霆.生物信息学昀坝状与展望;世界科技研究与发展.2000,22(6)
第三篇:生物信息学
生物信息学是上世纪90年代初人类基因组计划(HGP)依赖,随着基因组学、蛋白组学等新兴学科的建立,逐渐发展起来的生物学、数学和计算机信息科学的一门交叉应用学科。目前生物信息学的研究领域主要包括基于生物序列数据的整理和注释、生物信息挖掘工具开发及利用这些工具揭示生物学基础理论知识等领域。生物信息学作为新型交叉应用学科,可以依托本校已有的计算机科学、信息学、生物学和数学等学科优势,充分展现投入少、见效快、起点高的特色,推动学校学科建设和本科教学水平。
本实验指导书中的8个实验均设计为综合性开发实验,面向生物信息学院全体本科学生和研究生,以及全校对生物信息学感兴趣的其他专业学生开放。生物信息学实验室将提供系统的保障,包括采用mail服务器和linux帐号管理等进行实验过程管理和支持。限选《生物信息学及实验》的生物技术专业本科生至少选择其中5个实验,并不少于8个学时,即为课程要求的0.5个学分。其他选修者按照课时和学校相关规定计算创新学分。实验一 熟悉生物信息学网站及其数据的生物学意义
实验目的:
培养学生利用互联网资源获取生物信息学研究前沿和相关数据的能力,熟悉生物信息学相关的一些重要国内外网站,及其核酸序列、蛋白质序列及代谢途径等功能相关数据库,学会下载生物相关的信息数据,了解不同的数据文件格式和其中重要的生物学意义。
实验原理:
利用互联网资源检索相关的国内外生物信息学相关网站,如:NCBI、SANGER、TIGR、KEGG、SWISSPORT、Ensemble、中科院北京基因组研究所、北大生物信息
学中心等,下载其中相关的数据,如fasta、genbank格式的核算和蛋白质序列、pathway等数据,理解其重要的生物学意义。
实验内容:
1.浏览和搜索至少10个国外和至少5个国内生物信息学相关网站,并描
述网站特征;
2.下载各网站的代表性数据各10条(组)以上,并说明其生物学意义;
3.讨论各网站适合做何种生物信息学研究的平台,并设计一个研究设想。实验报告:
1.各网站网址及特征描述;
2.代表性数据的下载和生物学意义的描述;
3.讨论:这些生物信息学相关网站的信息资源,可以被那些生物信息学
研究所利用。
参考书目:
《生物信息学概论》 罗静初 等译,北京大学出版社,2002;《生物信息学手册》 郝柏林 等著,上海科技出版社,2004;
《生物信息学实验指导》 胡松年 等著,浙江大学出版社,2003。实验二 利用BLAST进行序列比对
实验目的:
了解BLAST及其子程序的原理和基本参数,熟练地应用网络平台和Linux计算平台进行本地BLAST序列比对,熟悉BLAST结果的格式和内容并能描述其主要意义,同时比较网上平台和本地平台的优缺点。
实验原理:
利用实验一下载的核算和蛋白质序列,提交到NCBI或者其他拥有BLAST运算平台的网页上,观察其基本参数设定库文件类型,并得到计算结果;同时在本地服务器上学会用formatdb格式化库文件,并输入BLAST命令进行计算,获得结果文件。
实验内容:
1.向网上BLAST服务器提交序列,得到匹配结果;
2.本地使用BLAST,格式化库文件,输入命令行得到匹配结果;
3.对结果文件进行简要描述,阐述生物学意义。
实验报告:
1.阐述BLAST原理和比对步骤;
2.不同类型BLAST的结果及其说明;
3.讨论:不同平台运行BLAST的需求比较。
参考书目:
《生物信息学概论》 罗静初 等译,北京大学出版社,2002;
《生物信息学实验指导》 胡松年 等著,浙江大学出版社,2003。
实验三 利用ClustalX(W)进行
多序列联配
实验目的:
掌握用Clustal X(W)工具及其基本参数,对具有一定同源性和相似性的核酸与蛋白质序列进行联配和聚类分析,由此对这些物种的亲缘关系进行判断,并且对这些序列在分子进化过程中的保守性做出估计。
实验原理:
首先对于输入的每一条序列,两两之间进行联配,总共进行n*(n-1)/2次联配,这一步通过一种快速的近似算法实现,其得分用来计算指导树,系统树图能用于指导后面进行的多序列联配的过程。系统树图是通过UPGMA方法计算的。在系统树图绘制完以后,输入的所有序列按照得分高低被分成n-1个组,然后再对组与组之间进行联配,这一步用Myers和Miller算法实现。
实验内容:
1.明确软件所支持的输入文件格式,搜集整理出合适的数据;
2.在Windows环境运行Clustal X,在Linux环境运行Clustal W;
3.实验结果及分析,用TREEV32或Njplotwin95生成NJ聚类图。
实验报告:
1.整理好的符合Clustal的序列数据;
2.提交数据网页记录和各步骤记录;
3.提供聚类图和多序列联配图,并说明意义。
参考书目:
《生物信息学概论》 罗静初 等译,北京大学出版社,2002;
《生物信息学实验指导》 胡松年 等著,浙江大学出版社,2003。实验四 ESTS分析
实验目的:
熟悉使用一系列生物信息学分析工具对测序得到ESTs序列数据进行聚类处理,由此对获得表达基因的丰度等相关信息,并且对这些表达基因进行功能的初步诠释,为后续实验通过设计RACE引物获得全长基因,以及进一步的功能注
释和代谢途径分析做好准备。
实验原理:
首先用crossmatch程序去除ESTs原始序列中的载体成分和引物成分,然后用phrap生成congtig和singlet,用blast程序进一步将有同源性的contig和singlet进行功能聚类,最后通过blast对聚类获得的cluster进行功能注释。在实验过程中将用到一些本实验室写好的perl程序用于连接各数据库和工具软件。
实验内容:
1.运行CodonCode Aligner程序,并用它建立工程文件,导入例子文件
夹里面的数据;练习对序列的各种查看方式。
2.使用CodonCode Aligner程序里的Clip Ends, Trim Vector, Assemble
等功能,完成序列的剪切、去杂质、组装工作。
实验报告:
1.实验各步骤记录和中间结果文件;
2.举例简要说明结果文件中数据的生物学意义。
参考书目:
《生物信息学概论》 罗静初 等译,北京大学出版社,2002;
《基因表达序列标签(EST)数据分析手册》 胡松年 等著,浙江大学出版社,2005。
实验五 利用Primer Premier5.0设计
RACE引物
实验目的:
熟悉PCR引物设计工具Primer Premier5.0的一些基本功能,能够根据实验需要选择相应的引物设计方法设计PCR引物。
实验原理:
PCR实验是当代分子生物学的基本实验之一,由于目标序列和实验目的的不同,相应设计引物的要求也不一样。本实验延续ESTs分析结果,对于其中需要获得全长的基因进行RACE引物的设计,及5’和3’RACE引物,配合接头序列设计单向引物,并模拟练习通过连接获得全长的基因CDS序列。最后设计已知全长基因序列的PCR扩增引物。
实验内容:
1.从网站下载并安装Primer Premier5.0;
2.从 GenBank 中任意获取一个 DNA 序列,设计出该序列的合适引物; 实验报告:
1.实验各步骤使用的数据、运算平台、结果文件记录;
2.比较不同引物设计平台和不同PCR实验的差别;
参考书目:
《生物信息学概论》 罗静初 等译,北京大学出版社,2002;《生物信息学实验指导》 胡松年 等著,浙江大学出版社,2003。
实验八 perl程序的安装、编写、调试 实验目的:
培养学生能在windows和Linux两种平台安装perl解释器、编写perl程序以及debug和运行的能力,熟悉perl语言基本语法,学会熟练编写和运用perl程序进行基础生物信息学研究。
实验原理:
Perl语言是一门通用的脚本语言,具有强大的字符串处理功能,是生物信息学研究的强大帮手,学会了perl语言,就能方便地处理生物信息学研究中遇到的各种字符串文本,促进研究的快速进行。
实验内容:
1.下载perl程序在Windows和Linux下的安装包并进行安装;
2.编写简单的perl程序,并学会debug;
3.编写具有简单功能的碱基处理perl程序。
实验报告:
1.perl解释器安装方法;
2.perl解释器debug方法;
3.讨论:perl语言在生物信息学研究中所起到的积极作用。
参考书目:
《PERL 编程24学时教程》(美)皮尔斯著 王建华等译,机械工业出版社,2000;
《生物信息学手册》 郝柏林 等著,上海科技出版社,2004;《生物信息学实验指导》 胡松年 等著,浙江大学出版社,2003
第四篇:生物信息学
浅谈对生物信息学的认识
摘要生物信息学是采用计算机技术和信息论方法研究蛋白质及核酸序列等各种生物信息的采集、储存、传递、检索、分析和解读的科学, 是现代生命科学与信息科学、计算机科学、数学、统计学、物理学和化学等学科相互渗透而形成的交叉学科。经过一学期的学习,我学到了很多很有用的知识,给我印象最深的有序列比对、蛋白质结构分析、核酸序列分析、数据库及数据库检索等内容。关键字:生物信息学认识基因组学数据库
时光飞逝,一学期马上就要结束了,本学期的专业选修课也即将结束。在上课之前,我一直认为生物信息学就是在讲关于人类及动物的基因,以及基因之间的差别。但是,刚上了几节课,我就发现生物信息学根本不是我想象的那么简单,就这样我怀着对自己的怀疑和对这门课的好奇走进了这门课。
生物信息学是一门新兴的、正在迅速发展的交叉学科,美国国家基因组研究中心认为, 生物信息学是一个代表生物学、数学和计算机的综合力量的新兴学(Bioinformatics is an emerging scientific discipline representing the combined power of biology,mathematics, and computers)。
现代生物信息学是采用计算机技术和信息论方法研究蛋白质及核酸序列等各种生物信息的采集、储存、传递、检索、分析和解读的科学, 是现代生命科学与信息科学、计算机科学、数学、统计学、物理学和化学等学科相互渗透而形成的交叉学科。
在这短短的一学期课中,在老师的带领下,我们学到了很多关
于生物信息学的知识,其中给我印象最深的有序列比对、蛋白质结
构分析、核酸序列分析、数据库及数据库检索等内容。
比如,序列比对,它的基本问题是比较两个或两个以上符号序列的相似性或不相似性。从生物学角度来看,它包含很多意义;如从
相互重叠的序列片段中重构DNA的完整序列等。老师主要给我们介
绍了blast比对。
再如,对蛋白质的分析。比如我们实验测定了一条蛋白质序列
或者从DNA序列翻译得来一条蛋白质序列,我们要借助生物信息学
方法来对它进行基本性质及结构分析。其中基本性质包括它的分子
量、氨基酸数目、排列顺序、等电点分析等。结构分析包括跨膜螺
旋分析等。要运用的工具是protparam tool 和TMHMM。对于这两
个工具我都进行了实际操作练习,我觉得这对我们以后的理论学习
和实验分析都非常重要。现代生物信息学的主要研究领域及其进展
1、基因组学和蛋白组学研究
基因组和蛋白组研究是生物信息学的主要内容.同样, 生物信息
学是基因组和蛋白组研究中必不可少的工具。
基因组学(Genomics)和蛋白组学(Proteomics)的实质就是分析和解读核酸和蛋白质序列中所表达的结构与功能的生物信息.这方面的研究已成为生物信息学的主要研究内容之一.一种生物的全部遗传构成被称为该种生物的基因组.有关基因组的研究称为基因组学.其中, 序列基因组学(Sequence genomics)主要研究测序和核苷酸序列;结构基因组学(Structural genomics)着重于遗传图谱、物理图谱和测序等方面的研究;功能基因组学
(Functional genomics)则研究以转录图为基础的基因组表达图谱;比较基因组学(Comparative ge2nomics)的研究内容包括对不同进化阶段基因组的比较和不同种群和群体基因组的比较。
蛋白组和蛋白组学的概念是随基因组和基因组学的出现而出现的.蛋白组(proteme)的概念是由于基因表达水平并不能代表细胞中活性蛋白质的数量, 基因组序列并不能描述活性蛋白质所必需的翻译后修饰和反映蛋白质种类和含量的动态变化过程而提出的.在一定条件下某一基因组蛋白质表达的数量类型称为蛋白组, 代表这一有机体全部蛋白质组成及其作用方式.有关蛋白组的研究称为蛋白组学.其中, 蛋白组的研究技术与方法、双向凝胶电泳图谱以及对不同条件下蛋白组变化的比较分析是蛋白组学的主要研究内容。生物信息学在基因组和蛋白组研究中所起的作用主要有:(1)基因组信息结构的计算分析.即对基因组数据进行大规模并行计算并预测各种新基因和功能位点, 研究大量非编码区序列的信息结构和可能的生物学意义。(2)模式生物全基因组信息结构的比较研究.即
对已完成全基因组测序的各种模式生物的基因组信息结构进行比较分析, 包括同源序列的搜索比较和指导基因克隆.(3)功能基因组的相关信息分析, 包括对基因表达图谱及其相关算法和软件的研究, 与功能基因组信息相关的核酸、蛋白质的空间结构的预测模拟以及蛋白质的功能预测。
2、生物信息数据库
复杂的生物和生物界和日新月异的生命科学研究产出的大量的生物学信息,对这些信息的储存、检索、比较分析必须借助于计算机数据库技术, 包括各类生物学信息数据库的建立与维护、数据的添加与注释、更新与查询、数据库资料的网络化等研究内容。现有的数据库有:核酸序列数据库(GenBank、EMBL、DDBJ)、基因组数据库、基因图谱数据库、蛋白质序列数据库(SWTSS-
PROT、PIR)和蛋白质结构数据库(Interpro)等。随着生命科学的不断发展,数据库种类不断增加、结构日益复杂、使用也越来越方便。
生物信息学作为一门新兴学科已经成为生命科学研究中必不可少的研究手段 本文对数据库与数据库搜索序列比对蛋白质结构预测药物设计基因芯片技术几个方面做了介绍较为系统地阐述了生物信息学在这些领域的应用 当然它所涉及的内容与方法远远不只上面提到的那些 新基因和 的发现与鉴定非编码区信息结构分析遗传密码的起源和生物进化完整基因组的比较
研究 大规模基因功能表达谱的分析等都是生物信息学研究的对象 相信不久的将来生物信息学会在生命
科学领域扮演越来越重要的角色。
参考文献:
1、现代生物信息学及其主要研究领域 萧浪涛(湖南农业大学理学院, 湖南长沙 410128)
2、生物信息学技术进展 郭志云 张怀渝 梁龙 军事医学科学院 生物工程研究所,北京100071;四川农业大学生命科学及理学院,雅安 6250143、利用生物信息学技术研究蛋白功能的几种方法 王剑利 杨章民综述 王一理审阅 西安交通大学医学院免疫病理学研究室(西安, 710061)
第五篇:生物信息学研究进展
我国生物信息学发展现状及展望
摘要:简要叙述了我国生物信息学发展现状,以及我国当前生物信息学发展中的一些问题,并对生物信息学的发展前景进行概述。
关键词:生物信息学 现状 展望
1生物信息学简介
生物信息学(Bioinformatics)是20世纪末才诞生的一门新学科,是信息技术在生物数据处理上的应用,该学科涉及分子生物学技术、计算机信息技术、数据库技术等多门学科,是生物学、数学、物理学、计算机科学等众多学科交叉的新兴学科。它主要利用计算机信息处理工具和软件对分子生物学实验数据进行加工和分析,从中发现有价值的信息,它是生命科学的前沿学科,其数据信息主要来自于人类及各种模式生物基因组的分子数据,包括DNA、RNA和蛋白质片断的序列数据,也有蛋白质的结构数据和经过计算机处理的分子数据。
2国内生物信息学发展状况
我国生物信息学研究近年来发展较快,相继成立了北京大学生物信息学中心、华大基因组信息学研究中心、中国科学院上海生命科学院生物信息中心,部分高校已经或准备开设生物信息学专业。2002年国家自然科学基金委在生物化学、生物物理学与生物医学工程学学科设立了生物信息学项目,并列入生命科学部优先资助的研究项目。国家 863计划特别设立了生物信息技术主题,从国家需求的层面上推动我国生物信息技术的大力发展。
但是由于起步较晚及诸多原因,我国的生物信息学发展水平远远落后于国外。在PubMed收录的以关键词“Bioinformatics”检索到的历年发表的文章数,可以看出大量的研究文献出现在21世纪以后。其中我国共有138篇占全部5548篇的2.5%,而美国则发表2160篇占全部的39%之多(统计数据截至2004年2月15日)。我国学者在生物信息学领域发表的有高影响力的论文只有不到美国学者发表数量的6%,差距相当大。在生物信息学领域,一些著名院士和教授在各自领域取得了一定成绩,显露出蓬勃发展的势头,有的在国际上还占有一席之地。如北京大学的罗静初和顾孝诚教授在生物信息学网站建设方面、中科院生物物理所的陈润生研究员在EST序列拼接方面以及在基因组演化方面、天津大学的张春霆院士在DNA序列的几何学分析方面、中科院理论物理所郝柏林院士、清华大学的李衍达院士和孙之荣教授、内蒙古大学的罗辽复教授、上海的丁达夫教授等等。北京大学于1997年3月成立了生物信息学中心,这个中心在1996年欧洲EMBNet扩大到欧洲之外时已正式成为中国结点(每个国家只有一个结点),目前已有60多种生物数据库的经常更新的镜像点。近年来,它已组织过多次国内和地区的培训班及会议,有着较广泛的国际联系。另外,中国科学院、中国医学科学院、军事医学科学院、清华大学、天津大学、浙江大学、复旦大学、哈尔滨工业大学、东南大学、中山大学、内蒙古大学等等都先后开展了生物信息学研究和教学工作,许多大学都设立了生物信息学专业,并同时招收本科、硕士、博士研究生。
各种学术会议及论坛的召开,对于促进我国在这一前沿领域的发展起着越来越重要的作用。中国科学院于1997年9月和12月召开了第80、87次香山会议,首次邀请有关专家就“DNA芯片的现状与未来”和“生物信息学”进行探讨。1999年3月,清华大学生物信息学研究所、国家人类基因组北方研究中心和北京生物技术和新医药产业促进中心共同举办了“北方生物信息学学术研讨会”。1999年4月,北京大学举办了“国际生物信息学讲习班”。2001年4月,由北京市科技委员会、中国人类基因组北方研究中心、中国人类基因组南方研究中心、北京华大基因研究中心、军事医学科学院、北京生物工程学会生物信息学专业委
员会、北京生物技术和新医药产业促进中心等共同举办的首届“中国生物信息学大会”在北京召开。2003年11月28-29日,中国科协“生物信息学与进化计算”第81次青年科学家论坛在北京中国科技会堂成功召开。这次论坛是中国科协举办的一次多学科交叉的盛会,旨在促进国内青年科学家在这一全新领域内的相互交流,促进该学科的成长与发展。这是国内首次以“生物信息学”为主题的一次多学科交叉的青年科学家论坛。与会者一致认为系统生物学、非编码区功能研究、基因调控和相互作用网络等是当前生物信息学研究的热点问题。
尽管如此,真正开展生物信息学具体研究和服务的机构或公司仍相对较少,仅有的几家科研机构主要开展生物信息学理论研究,声称提供生物信息学服务的公司所提供的服务也仅局限于简单的计算机辅助分子生物学实验设计,而且服务体系并不完善;国内互联网上已有的几家生物信息学网站,大部分偏于所有生物(医)学领域的新闻报道,而生物信息学专业技术服务的含量太少,这就与国外有了较大差距。
3我国生物信息学发展中存在的问题
一方面,在生物信息学研究领域,一般的教授、教师能力有限,有些甚至对生物信息学本身知其一不知其二,缺乏正规的训练,很少了解目前的研究重点、热点和今后方向。由于所申请的经费支持力度和持续时间原因,大多数学者只能选择易于获得研究成果的科研项目,一般缺乏新颖性和创造性。这可能与我们国家处于快速发展阶段的“短平快”思路和环境有关。另一方面,可能是教育体制上的原因,科研项目的分配问题、行政管理中存在的问题,传统教育不鼓励学生进行批判性、创新性地学习和思考的问题,也可能是症结所在。另外,生物信息学对信息交流有很高的要求,尤其是Internet的畅通,我国曾经有人为的限制访问或限制流量这些今后回顾时会成为苦涩消化的举措[6]。目前我国的科研经费真正投入并落到实处的占国家GDP的份额还很小,科研经费问题进一步限制了生物信息学在我国的发展。
4展望
生物信息学作为一门新兴的工程技术学科,对刚起步的我们来说充满了机会和挑战,“后基因组时代”给我国的生物信息学发展提供了很大的舞台。生物信息学首先是一门信息学,所以我们必须端正一些可能的认识错误,必须呼吁引导更多的计算机、数学、物理学人才加入到其中的研究。统计学、概率论、组合数学(尤其是图论)、拓扑学、运筹学、函数论、信息学、计算数学、群论、人工智能,都已经在生物信息学研究中发挥了巨大的作用。我们应尽快缩小我国在计算机信息学的核心技术、巨型计算机的应用以及互联网核心技术方面与世界领先国家的差距。生物信息学的发展对生物学、医学、农业、环境科学、信息技术以及新材料的研究必将起到深刻的作用,生物信息学进一步深入研究和广泛应用必将为这些领域带来根本性的变革。生物信息学的特点是投资少,见效快,效益大,适合于我国的现实条件。即从英特网上源源不断地采集数据,进行分析、归类与重组,发现新线索、新现象和新规律,用以指导实验工作的设计,这是一条既快又省的科研路线,可避免不必要的重复,少走弯路,提高我国生物科学的研究水平。