发布时间:2024-04-09 14:46:34
导语:想要提升您的写作水平,创作出令人难忘的文章?我们精心为您整理的13篇生物信息学产生的背景范例,将为您的写作提供有力的支持和灵感!
一、生物信息学的产生
生物学是一门古老的学科,在人类历史发展的长河中,人类从未停止过对生命奥秘的探索。人们逐渐认识到,虽然生物种类多种多样,但是它们的最基本分子却是相同的。DNA、RNA和蛋白质等分子构成了生命的基本单位,再由细胞到组织、器官,最后器官系统组成完整的生物体。
传统的生物学研究中,由于受到技术水平的限制,生物学家多采用低通量的生物实验方法,其研究对象通常是一个基因或者几个基因组成的通路。在这种情况下,实验后的简单观察就可以满足研究需要。随着生物研究的不断深入,积累了大量实验数据,人们不禁想到,如何把不同的实验结果整合起来?另一方面,随着生物技术的发展,大量新兴技术出现,产生了海量的数据。例如90年代兴起的基因芯片技术,单张芯片就可以测定成千上万个基因在某一状态下的表达情况。1990年启动的人类基因组计划更为生命科学的研究提供了海量的序列数据。面对如此多的数据,以前依靠生物实验研究单个或几个基因的方法很难再适用,生命科学、统计学、计算机科学和信息科学等若干学科的交叉学科――生物信息学应运而生。生物信息学以计算机、统计、模式识别等方法为手段,以生物数据为研究对象,通过对大量生物数据的储存、处理和分析,提取其中有意义的生物知识[1],从而最终揭示蕴藏在核酸序列和蛋白质序列中的信息,对了解生命活动的基本规律出贡献。
二、生物信息学在生命科学研究中的作用
作为一门新兴的学科,大家对生物信息的作用并不十分明确。很多人认为生物信息学只是为实验科学服务。从广义上讲,这种说法也不无道理,但是生物信息学并不是实验科学的附属品,与生物实验一样,它也是解决生物问题的一种手段。为了解决生物问题,生物学家依靠的是实验台,生物信息学家依靠的是计算机。
在生命科学的发展过程中,以分子生物学的产生为界,可以分为传统生物学和现代生物学。传统生物学和现代生物学取得的成就为生命科学的发展做出了巨大贡献。人类基因组计划启动以来,人们一度认为只要把各种生物基因组的全部碱基排列顺序测定清楚,生命的遗传奥秘就会显露无余,但是真实的情况远不像想象的那样简单。人类的个体发育开始于一个单细胞受精卵,受精卵经过一系列的细胞分裂和分化,产生具有不同形态和功能的细胞,不同细胞之间相互作用构成各种组织和器官。虽然人类基因组中有两万多个基因,但是在单个细胞当中,同时起作用的基因往往是很少的。有些基因只在特定阶段起作用,有些基因只在特定组织起作用。只关心某个基因或蛋白的功能是不够的,因为在不同时空条件下,同一个基因或蛋白的功能可能不同。生物是一个复杂的系统,其表型和功能不仅体现于基因数量和序列的不同,更体现在基因、蛋白以及其他生物分子之间的相互作用之中。因此,把研究对象当成一个整体,系统地分析内部的相互关系尤其重要。但是无论是传统生物学还是现代生物学,都是一门实验学科,生物学的发展中缺乏一种系统思想。生物信息学可以从大量生物数据中提取有意义的生物知识,通过对已有数据的总结,进一步推测生物体的某些性质和变化趋势,生物信息学为大量生物数据的整合提供了可能,与生物实验一样,是生物研究中的一种重要途径。
三、生物信息学学生的培养
生物信息学是一门交叉学科,要求学生具有较好的分子生物学、计算机科学、数学和统计学素养,目前国内只有少数几个学校设立了生物信息学本科专业,大部分的学生都是进入研究生阶段才开始生物信息学的培养。在进入生物信息学专业前,本科阶段可能接受过计算机、统计学、信息学、生物学等某一方面的教育,但要进行生物信息学的研究,大多需要补充其他方面的知识。
生物信息学研究可以分为两类:第一,在深刻理解生物问题的基础上,利用计算技术解决生物问题,第二,为生物学家提供性能更好的方法(算法)。理工科背景学生的生物知识较少,但是对于各种计算方法的原理和使用非常熟悉,对于这类学生的培养,第二类问题比较适合他们入门。在生物信息领域,有很多经典的分类问题。这些问题已经明确了分类目标,并且大都有通用的数据集。但是这类工作也受到了生物学家的质疑,因为大部分工作都是把已有的经典算法用在生物数据上,由于对生物问题不够了解,最后成为只有做生物信息的人才看的方法。这也在一定程度上导致了部分生物学家对生物信息存在偏见,认为生物信息就是提出新算法,做一些数据库。要想真正让生物学家认识到生物信息学的重要性,就要以解决生物问题为根本出发点,即使是做预测方法,也要建立在解决生物问题的基础上。做出更好预测方法的关键是深入理解生物问题并抓住关键特征。举个例子,要把男生和女生分开,我们可以根据很多特征,比如身高、体重、头发长短,虽然大多数情况下来说,男生比女生高、比女生重、比女生头发短。但是只基于这些特征还是会造成很多的分类错误,因为这些特征不是男生女生差别的最根本因素。如果我们是根据性染色体来分,那正确率的提高就非常显著了。在预测问题中,利用五花八门的方法并不是关键,如何能够对生物问题深入了解并找到关键特征,才是最主要的。
作为一门新兴的学科,大家对生物信息的了解还很少,很多人对它的定位也不同。但既然是生物信息,就是先生物后信息,可见生物的重要性。所以,在生物信息的研究过程中,对生物问题只限于表面地理解,势必不能做出好的工作。只有对生物问题有了深入了解,才能发现其中的问题。能够找到值得做的问题,可以说工作已经成功了一大半。当然,解决问题过程中也会有很多困难,比如发现了值得研究的课题,但在解决的过程当中发现某些数据无法获得,或者某些技术超出了自己的能力范围。在这种情况下,可以首先想想有没有其它变通的办法可以解决问题,如果经过慎重的考虑都无法找到,就要果断的放弃。这里要强调一定要慎重考虑,不能遇到一点困难就放弃。
相比理工科背景的学生,生物背景的学生有着扎实的生物学知识基础。但是如果是从本科阶段直接进入生物信息学,由于还没有进行过实验操作,他们对生物问题的理解也很难非常深入。不管是理工科背景还是生物背景的学生,丰富的生物学知识都是进行好的生物信息学研究的前提。在培养学生时不可忽视对其基础生物学知识的传授和教育,并适当引导其对生物学问题的思考。生物学问题可以很大也可以很小。大的生物学问题任何一个懂得基础生物学知识的人都可以提出,但也是最难解决的,比如到底是什么改变使细胞恶变,自身免疫病是如何形成的,心血管病糖尿病等复杂疾病是如何发生的,为何有人容易生某种病而其他人不易感。小的生物学问题就是各自领域的具体研究课题,比如表观遗传学领域的DNA去甲基化酶是否存在,基因表达调控领域的转录起始频率是如何决定的,RNA领域的大量非编码RNA的作用,蛋白修饰领域新发现的修饰如何调控蛋白的功能等等。在脑中提出并试图思考一系列大大小小的生物学问题是对学生培养目标的第一步。这些问题的产生的前提是对生物学知识的熟悉掌握。然而在对学生培养的过程中没必要也不可能告诉他们所有的知识,生物学知识教育的原则是为他们打开门,当他们思考问题的时候知道去哪里找到相关的知识。
另一方面,只有生物学基础知识和问题是不够的。很多问题在生物信息学产生之前就存在了,传统的方法无法带给人们问题的答案。人们一直期待新的方法去理解和解决这些问题。生物信息学的产生无疑提供给人们另一种思考生物问题的方式,为一些经典问题的解决提供了可能。例如最近的大规模的肿瘤基因组测序和分析使我们发现了很多新的肿瘤相关基因[2]。对于生物背景的学生,在教学中要把这样的例子介绍给学生,生物背景的学生在理解信息学理论方面会存在困难。最初很难要求他们理解所有具体过程。但是至少要让他们知道这些方法的基本原理,还有在什么情况下使用。这样在以后的研究中遇到类似问题才能想到应该选择什么样的信息学工具去解决,在具体应用过程中加深对整个过程的理解。生物背景的学生如果想成为生物信息学专家,只会应用是不够的,补充一些计算机、统计、信息方面的基础知识是必不可少的。
生物信息学是一门仍处在快速发展之中的学科。还没有一本教材能够满足生物信息学教学的需要,生物信息学立足于分子生物学、模式识别、计算机科学与技术、数学和统计学等学科,所以学生要先对这些学科的基本概念和系统有一个较为全面和直观的认识,为日后的科研打下坚实的基础。另外,培养过程中要包括大量的实例介绍,对一些重要的应用还加以详细解剖,使得同学们不再仅掌握理论,而是能够学会如何在实际工作中灵活应用这些理论。在此基础之上,向同学们推荐一些最新的论文、期刊、参考读物和相关的学术报告,让同学们能够切身感受到学科发展的前沿,培养学生的创新能力。21世纪是生命科学的时代,也是信息科学的时代。生物信息学在这样的历史条件下产生并壮大,它作为多个领域的交叉新兴学科,对生命科学研究有着巨大的推动力。生物信息学是一门应用性非常强的学科,也是一门非常活跃的前沿学科,良好的教学效果必须以先进的内容体系为基础,我们应时刻注意以科研促进教学,教学科研相长,使教学研究达到更高的水平。
[参考文献]
中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2016)36-0134-02
生物信息学(Bioinformatics)的发展与上世纪90年代人类基因组计划的启动密切相关,它综合运用生物学、计算机科学和数学等多方面知识与方法来阐明和理解大量生物数据所包含的生物学意义。生物信息学已成为当今生命科学的重大前沿领域之一,是生命科学研究中重要的、不可或缺的研究工具。
我校生物信息学课程开设较晚,所以课程教学仍处于探索阶段,尚未形成成熟的课程体系。本文针对本校学生的需求、课堂教学反馈等情况对教学内容、教学方法等多方面开展了改革与实践,以期提高教学的质量和效果,培养全面发展的人才。
一、生物信息学课程教学现状
(一)教材较多,因此难以选择一本适合的教材
生物信息学教材很多,有些教材侧重于生物信息学理论和算法,如许忠能主编的《生物信息学》对生物信息学的理论和算法讲解详细,但是对于师范院校生物科学专业的本科生而言较为深奥,不易理解;有些教材侧重于生物信息学软件使用,学生对于软件分析所需要的背景知识掌握不够,即使能够运用软件,却不能正确分析和理解所得到的分析结果;由于生物信息学发展较快,教材更新速度相对较慢,一些新的生物信息学知识未能及时纳入到已出版的教材中,而且有些书中所讲的数据库资源早已停用,有些软件及其应用也早已更新版本。
(二)学生理论基础薄弱,学习主动性不够
虽然这门课程在我校是专业选修课程,考核方式以考查为主,但是选修这门课程的学生都对生物信息学有浓厚的兴趣。这门课程开设在大三下学期,很多同学尚未开展或即将毕业课题设计,希望通过本课程的学习对毕业论文或将来考研深造有所帮助。然而在学习过程中,由于对分子生物学、生物化学、遗传学等理论知识掌握不扎实,并且对学科前沿进展关注不够,很少阅读实验性论文,在学习生物信息学相关理论知识时理解困难,而且对于如何将生物信息学应用于实际的课题研究也感到困惑。
(三)学生英语基础不同,学习过程中容易产生消极情绪
要学好生物信息学,离不开大量专业文献的阅读,尤其是外文文献,追踪学科前沿研究进展,这就需要具备一定的专业英语基础。此外,很多生物信息学数据库以及应用软件都是全英文的,涉及专业英语词汇较多。由于学生的英语基础不同,在学习过程中有些学生感觉专业英语阅读和理解方面较吃力,容易产生畏难情绪。
二、教学改革与实践
(一)修改教学大纲,理论与实践结合
生物信息学是一门实践性很强的学科,仅仅靠教师单一的讲解理论和软件的使用方法学生是很难理解和掌握的,因此在教学过程中要理论和上机实践结合。教学大纲中原36学时为理论24学时、上机实践12学时。考虑到我校学生学习该门课程的实际需求,强化实践运用,将理论和上机实践课时均调整为18学时,学生在实践的过程中带着问题主动去思考,发现问题、解决问题,更好地去理解生物信息学的理论知识。原教学大纲中理论课学习结束后再进行上机实践,但是教学过程中发现理论课信息量大,有些知识学生初次接触没有较好地理解,或者当时能够理解,但过了一段时间后再进行上机实践时又要重新学习。在课程安排方面,调整为一个章节的理论课学习结束后开设相应的上机实践,通过实际操作练习有利于巩固所学理论知识,学生也比较喜欢这样的教学方式。
(二)调整教学目标,优化教学内容
生物信息学内涵广泛,应用领域广,但是生物信息学在不同研究领域中的研究内容和应用程度有所不同。选修本课程的学生都是生物学背景,主要希望运用生物信息学知识去解释课题研究中的生物学问题。考虑到本科生理论知识基础相对较弱,很多学生尚未开展课题研究,因此应该在有限的学时里让学生掌握与专业需求相关的生物信息学知识和实用技术,教学的重点和难点要根据本校学生特点进行调整,对教学内容进行优化、精简。例如多序列比对算法、马尔科夫模型等涉及数学、计算机知识,可以简要介绍,但不做深入的讲解。理论和上机实践部分主要介绍生物信息学数据库资源、序列比对、核酸序列分析、系统进化分析、蛋白质结构与预测,同时理论部分还包括生物芯片、高通量测序技术、介绍生物信息学的前沿进展。此外,还结合学生的需求在上机实践课中增加了引物设计内容。
课堂教学内容并不拘泥于一套教材,而是根据讲授的章节选择该章节适合的2~3套教材综合讲解,最终形成适合我校学生学习的讲义。例如在讲系统进化发育时,理论讲解选择由Masatoshi Nei和Sudhir Kumar编写的高等教育出版社出版的《分子进化与系统发育》和蔡禄编写的《生物信息学教程》,上机实践选择吴祖建等编写的《生物信息学分析实践》。
(三)教学与科研相结合,学以致用
生物信息学有很多分析软件,应用很广,即使是分章节按照序列比对、核酸序列分析、系统进化树构建等给学生逐一讲解相关的算法和实际的应用,学生仍然感觉知识零散,信息量太大难以掌握,容易产生畏难情绪而导致学习积极性不高。有些应用软件学生即使有所了解,却又不知道在科研中如何运用。所以在教学过程中,我们以课题研究为例,再结合相关的文献来进行讲解。例如选择DNA条形码开展物种鉴定为例,让学生去查阅相关文献,如DNA条形码在中药材混伪品鉴定中的应用、DNA条形码在肉制品掺假中的鉴定等。这个课题应用性强,对本科生而言阅读专业文献的难度相对较小,仅涉及DNA提取、PCR扩增等实验内容,容易激发学生的学习兴趣。在学生理解课题背景知识的基础上,让学生重点看文献中涉及的生物信息学相关知识,要求学生下载文献中涉及的基因序列,根据下载的序列用MEGA软件进行序列比对,计算遗传距离,同时利用MEGA软件构建NJ树。这个过程就把生物信息数据库、序列比对、系统发育分析等几个章节的教学知识串联起来,学生就知道为什么要下载序列、做序列比对,更好地理解系统进化树构建的原理及意义。同时,也促进了学生阅读专业文献,尤其是外文文献,增加专业英语词汇量,主动关注学科前沿发展动态,更好的利用生物信息开展课题研究,做到学以致用。
(四)改革教学手段和教学方法
生物信息学理论教学中往往是教师主讲、学生听,学生被动接受,这种“灌输式”的学习让学生感觉枯燥乏味,教学效果较差。教学时应突出学生的主体地位,教师起主导作用,引导学生积极思考,参与课堂教学,激发学生的学习热情。例如讲解生物信息学数据库资源时,可以布置课后作业,要求学生搜索国外生物信息学数据库资源,并将查阅的资料制作成PPT,下一次上课时让学生利用PPT讲解搜索情况,分享经验。教师在学生讲完后点评,鼓励学生关注生物信息学的前沿进展,在学习生物信息学的同时提高专业英语的水平。在讲解生物芯片与高通量测序技术时,布置课前预习作业,针对高通量测序技术原理、应用、数据分析等教学内容设置几个选题,让学生分小组,每个小组选择一个选题,通过查阅文献资料,以PPT形式在课堂上讲解。学生根据讲解内容提问,交流讨论。教师根据学生的汇报内容进行点评,进行有针对性的讲解、补充。这样的形式使学生主动去探究问题,而不是被动地接受教师传递的信息,对知识的理解更加深入,学生也反馈这种教学活动提高了学习的积极性,并留下深刻的印象。
三、结语
生物信息学作为一门新兴学科,仍然在不断的发展中,知识更新速度快,因此生物信息学课程的教学内容、教学方式应紧跟学科前沿发展,立足学校专业特点及培养特色,不断摸索教学经验,在教学模式上深入研究,提高教学质量,实现培养学生理论与实践运用综合能力的教学目标。
参考文献:
[1]许忠能.生物信息学[M].北京:清华大学出版社,2008.
[2]Masatoshi Nei,Sudhir Kumar.分子进化与系统发育[M].北京:高等教育出版社,2002.
[3]蔡禄.生物信息学教程[M].北京:化学工业出版社,2007.
作者简介:刘伟(1979-),女,辽宁铁岭人,国防科技大学机电工程与自动化学院,讲师;张纪阳(1979-),男,湖南泌阳人,国防科技大学机电工程与自动化学院,讲师。(湖南?长沙?410073)
中图分类号:G642.0?????文献标识码:A?????文章编号:1007-0079(2012)23-0060-02
21世纪是生命科学的世纪,生物技术飞速发展,生物学数据大量积累。而生物信息学正是在这种大背景下蓬勃兴起的交叉型学科,旨在用信息学方法解决生物学问题。为了培养复合型人才,大力发展交叉学科,国防科技大学(以下简称“我校”)近年来面向全校理工科研究生开设了“生物信息学”选修课程。
“生物信息学”作为新兴的交叉学科,具有融合性、发展性和开放性的特点。[1]融合性是指生物信息学涉及的生物、计算机、数学等多个学科的交叉与融合。从20世纪90年代到现在,该学科发展非常迅速,研究热点发生了数次改变。开放性是指该学科存在大量有待探索和研究的新问题。这些特点一方面为课堂教学提供了大量的主题和素材,一方面也对授课方式提出了较高的要求。经过认真分析,选定研讨式教学作为该课程的主要授课方式。研讨式教学即研究讨论式教学,是将研究与讨论贯穿于教学的全过程。[2]在教师的具体指导下,充分发挥学生的主体作用,通过自我学习、自我教育、自我提高来获取知识和强化能力培养。[3]通过确立教学目标,精心设计和组织教学内容,在实践中贯彻研讨式教学理念和方法,在生物信息学课程中对研讨式教学模式进行了理论探索和实践创新。
一、教学目标的确立
合理的课程目标与定位是决定课程建设成败和教学效果的基础,其主要依据是人才培养需求和授课对象的实际情况。首先,教学对象是研究生,已具备一定的自主学习和创新思维的能力。教师不仅要传授知识,而且要讲解基本的研究方法,让学生具备独立思考问题、分析问题和解决问题的能力。其次,作为军校学生,以后从事的工作可能涉及很多学科方向,展现如何针对一门新的学科方向进行研究的整体思路显得很有意义。最后,考虑到学生不同的知识背景,对于各部分内容的理解程度不同,必须兼顾不同的专业方向,让每个学生都能有所收获。因此,确立教学目标为:介绍生物信息学的基本概念和方法,通过案例分析展现科学研究的基本方法和实践过程。
二、教学内容的设计和组织
1.教学内容的总体设计
确定了教学目标之后,需要对课程的教学内容进行总体设计。参考国内外多所高校的相关课程设置,如北京大学的“生物信息学导论”、中科大的“生物信息学”、中科院的“生物信息学与系统生物学”和MIT的“Bioinformatics and Proteomics”等,发现这些课程主要是针对生物专业的学生开设,侧重于方法学介绍。而我校学生大部分是工科背景,对于统计和机器学习方法有一定基础,重点是了解相关的生物学问题,并应用已有的工科知识去分析和解决这些问题。同时,随着生物信息学的快速发展,研究领域不断扩大,有必要展现该学科的最新进展。
因此,课程内容总体设计上以生物学问题为主线,结合最新的研究成果,对各种计算方法的应用过程进行深入和细致的讲解。在介绍生物信息学的研究现状和生物学基础知识之后,分多个专题详述生物信息学最新的研究进展,各专题在内容上相互衔接,由浅入深,以便学生理解和接受。以问题为导向的课程设计对于启发学生思考,积极参与课堂研讨具有重要作用。
进一步,为了突出部分重点专题及其分析方法,采用案例分析课的形式,针对一些重要问题进行深入探讨。鼓励学生应用所学知识,结合自身的专业背景,通过积极地思考和讨论提出相应的解决方案。案例选择为教师有一定研究基础的开放性问题,一方面介绍已有的研究成果,一方面结合教师的研究体会,通过积极讨论拓展新的研究思路。案例分析课有助于学生更多地参与课堂研讨,对于知识的综合应用和科学研究过程产生切身体会。
2.教学内容的组织
研讨式教学的关键是调动学生的积极性,鼓励学生踊跃地参与课堂讨论,提出自己的观点。通过集中备课,学习和吸取老教师的成功经验,总结调动学生积极性的基本要素,对授课内容进行了认真的组织和编排。
(1)重点突出,详略得当。由于生物信息学涵盖内容非常丰富,有必要对课程内容进行取舍,在保证知识面的基础上,突出授课的重点。减少或删除重要性较低的部分,采用图片和动画等形式对重要的知识点加以强调,以深化学生的理解。只有学生对重点内容理解透彻,才能激发出浓厚的学习兴趣,积极参与课堂研讨,碰撞出智慧的火花。
1.生物信息学学科特点
生物信息学是当今生命科学的重大前沿领域之一,是一门交叉学科,包含生命过程中各种信息的获取、加工、存储、分配、分析、解释等在内的所有方面,综合运用数学、计算机科学和生物学等方法与技术,阐明和理解大量数据包含的生物学意义[1]。随着20世纪80年代人类基因组计划的实施,生物信息学蓬勃发展,并渗透到生物学研究的各个领域。掌握生物信息学相关技术及分析能力已成为生物专业本科毕业生的必要要求[2]。因此,做好生物信息学教学工作对提高生物信息学研究水平具有重要的理论和实践意义[3]。然而由于学科的综合性和学科本身的迅猛发展,生物信息学课程教学仍然处于探索阶段,目前还没有成熟的生物信息学教学模式,各高校尚处于摸索探讨阶段。
2.案例教学法概述
案例教学法(Case-Based Learning),指在教师的指导下,根据教学目的,通过呈现案例材料,组织学生以团体和小组讨论、角色扮演等方式对案例进行调查、阅读、思考、分析、讨论和交流等活动;经过分析讨论,将课本中的理论与案例材料结合起来,并利用理论分析说明复杂的案例内容。案例教学法引导学生学习新的知识,加深对理论的认识,训练学生运用所学知识分析和解决实际生物学问题[4]。
不同于传统教学模式注重“知识的传授”,案例教学法更注重“能力培养”。案例教学法不直接给学生提供解决案例问题的标准答案或者具体方法,而通过教师引导学生积极讨论得出问题的解决方法,侧重于理论应用,是一种“以学习者为中心的学习方法”。
案例教学可划分为讲解定义型、综合分析型和操作技能型三种类型。(1)讲解定义型,引入案例,对基本概念和原理进行讲解;(2)综合分析型,提出问题,学生通过讨论给出解决案例问题的方案或者对已有方案进行评价;(3)操作技能型,引入案例,使学生掌握相关理论课程的基本应用技能。案例教学还可以综合其他教学方法,如以问题为基础的教学法共同改善课堂教学效果[5]。
案例教学法基本环节包括:教师根据学科特点提出案例;引导学生辩论交流、提出解决方案;完成与解决案例;教师评价与总结[4],[6],[7]。案例教学过程中,首先教师把握整体教学进度,选用与本专业课程有关的案例,案例选择要具体、易于学习和理解,能够引起学生的兴趣,调动学生学习主动性;其次,将案例分解,从子案例中提出问题,启发学生思考,鼓励学生对案例进行分析、讨论甚至辩论,提出解决方法,逐步完成案例;最后,引导学生完成和解决案例,分析点评整个案例教学过程及结果[4]。
3.案例教学法应用于生物信息学本科教学的意义
生物信息学课堂讲授以介绍生物信息学的相关算法、原理、方法为主,这也是教学的重点和难点。传统“知识传授”型讲课方式容易让学生觉得枯燥乏味、晦涩难懂,产生畏惧心理[8]。运用案例教学法,能够帮助学生更深入理解算法的思想,真正掌握解决问题的思路,培养科学的思维能力。
另外,生物信息学是一门实用性较强的学科,大学本科阶段开设生物信息学课程主要目的不是开发新的数据库和发展新的生物数据分析方法,而是如何利用现有数据库资源查找特定数据,并根据科研实践需要分析整合数据资源,为后续科研奠定基础,具有极强的实践意义。要达到实践目的,除了让学生掌握生物信息学的基本理论和方法、数据库和软件的原理外,更重要的是让学生亲身实践,在实践中对所学理论进行验证、对数据和软件的使用加以熟悉[9]。但生物信息学涉及专业领域内容广泛,学生不可能做到完全亲身实践,因此,案例教学法能替代亲身实践,吸取前人经验,是理论联系实践的一个便捷通道,是培养学生解决实际问题能力的好方法[7]。
4.案例教学法在生物信息学本科教学中的应用
4.1 案例选择
笔者针对生物信息学本科的教学大纲和知识体系,以及多年从事昆虫线粒体基因组分析的科研工作情况,精心选择了一系列分析案例,其中以鳞翅目灰蝶科线粒体基因组[10]数据分析为例说明。
4.2 教学过程
4.2.1学生分组。根据学生专业、兴趣分组,每组6人,统一采用同一案例。
4.2.2案例背景介绍。让学生了解该论文的目的、操作过程及意义。学生查找相关文献资料,归纳总结知识背景。
4.2.3案例分解。将整个案例分为若干个子案例:①序列数据来源;②序列比对分析③计算遗传距离;④分子系统发育重建;⑤蛋白质家族和基序与结构域分析;⑥蛋白质三级结构与结构分类分析。对每一个子案例完成的关键步骤提出问题,启发学生思考,鼓励学生对案例进行分析、讨论甚至辩论,提出解决方法,逐步完成案例。每个子案例的顺利完成都需要特定的生物信息知识作为基础,对应于教学大纲中完整的知识体系。
4.2.4评价考核。引导学生完成案例,教师归纳学生在整个案例教学过程中出现的普遍性问题并进一步讲解,对于个别小组在解决案例过程中展现出来的创造性解决方案进行分享学习。采用PPT成果展示、提交每一个子案例生物信息分析结果和解释报告,考查学生对案例设计的相关生物信息学理论知识和操作技能的掌握情况。
案例教学法作为一种具有启发性和实践性的教学方法,有效提高学生利用生物信息学工具获取相关知识解决生物学问题的学习兴趣和能力,增强教学效果。然而实践过程中还存在一些问题,例如:如何选择合适的案例既能激发学生的学习兴趣又反映生物信息学教学大纲的知识体系内容、如何有效把握课堂讨论的节奏和方向及与其他教学方法的融合,在今后教学工作中还需要不断改进教学方法,优化教学模式,丰富教学案例库,在实践中不断探索案例教学法在生物信息学本科教学中的适用性和有效性。
参考文献:
[1]石生林,韩艳君,刘彦群等.非专业研究生生物信息学课程教学中存在的问题及对策[J].生物信息学,2009,7(2):125-127.
[2]袁道军,杨细燕.农学专业生物信息学概论本科教学实践探讨[J].安徽农业科学,2016,44(13):304-305.
[3]李广林.大数据背景下的生物信息学教学探索[J].教育教学论坛,2015,(29):210-211.
[4]张林,柴惠.CM教学法和PBL教学法的结合应用研究――以医学生物信息学为平台[J].中国高等医学教育,2012(8):116-117.
[5]武亚军,孙轶.中国情境下的哈佛案例教学法:多案例比较研究[J].管理案例研究与评论,2010,3(1):12-25.
[6]吴东,王福成,孙畅等.案例教学法在计算机绘图课程中的应用[J].山东工业技术,2016(1):145-146.
[7]胡珊珊,刘兴起.案例教学法在水文学教学中的应用[J].首都师范大学学报(自然科学版),2016,37(2):93-95.
[8]高亚梅,韩毅强.《生物信息学》本科教学初探[J].生物信息学,2007,5(1):46-48.
生物信息学作为一门新兴的交叉性学科,综合生物学、计算机科学和信息技术试图,从大量数据中寻找具有指导和开创性价值的依据,为生命科学研究提供必要的、有效的系统模拟和信息预测结果。目前,生物信息学在生物医学、生物工程、植物学、动物学、生态学、遗传学、制药和高科技产业领域中的应用越来越广泛,产生巨大的影响力和推动力。
一、生物信息学在生物科学领域的作用
生物科学是研究生物结构、功能、发生和发展规律,及其与周围环境关系的科学。在分子生物学技术突飞猛进的发展过程中,生物科学从传统的个体及群体表征研究逐步演变为内在分子机制的研究,随着基因测序技术的发展,生物科学领域的研究不仅聚焦于生物个体的内在分子机制,同时还从大量的生物个体的基因数据中获取和解析生命的本质和规律,并以此尝试对生命过程进行干涉和改造。而在获取、解析、干涉和改造的过程中扮演重要角色的就是生物信息学。
生物信息学是在生物科学领域各个学科发展的过程中逐步产生的一门综合性学科,该学科在生物科学领域的应用极为广泛。目前,植物基因组研究取得了重大进展,水稻、大豆、小麦等农作物的遗传图谱、基因序列、基因组注释已公布于美国国立生物技术信息中心(NCBI)的生物信息数据库中。利用生物信息学的相关方法和技术能够对这些数据进行查询、统计和分析,从而更好地理解和认识植物基因组的功能,指导后续的科学研究和生产应用。传统的生物学分类方法已经鉴定及分类了成千上万的物种,但是随着生物科学的发展和认知,越来越多的物种在遗传进化上的分类依据较为模糊,而利用生物信息学结合传统的分类学可以更好的研究生物类群间(植物、动物、微生物等)的异同性、亲缘关系、遗传进化过程和发展规律,这在当今的生物分类学中应用日趋广泛。生物信息学还可以综合利用数学、统计学和计算机等学科对生态系统进行模拟和计算分析,探索物种间基因流动的本质,揭示生态系统的物质和能量循环规律,从而为找到决定生态系统平衡和稳定的根本因素提供重要的依据,帮助生态系统平衡的恢复。此外,通过生物信息学技术构建遗传工程菌,降解目标污染物的分子遗传物质,从而达到催化目标污染物的降解,维护生态环境的空气、水源、土地等质量,也是当今生态环境保护的新兴研究方向。
二、生物信息学的学科内容和课程要求
生物信息学主要由基因组学、蛋白质组学、系统生物学、比较基因组学、计算生物学等学科构成,主要涉及的内容有生物数据的收集、存档、显示和分析,体外预测、模拟基因及蛋白质的结构和功能,对生物的遗传基因图谱进行分析处理,对大量的核苷酸和氨基酸序列进行比对分析,确定进化地位等。从生物信息学的概念及其涉及的内容中可以明确生物信息学不是一门独立的学科,所以要求教师在教学过程中掌握多领域的知识和技能,才能较好地把握该课程。
1.高等数学和统计学基础
生物信息学将数学和统计学作为主要的计算理论基础,主要包括数学建模、统计方法、动态规划方法、数据挖掘等方面。此外还包括隐马尔科夫链模型(HMM)在序列识别上的应用,蛋白质空间结构预测的最优理论,DNA超螺旋结构的拓扑学,遗传密码和DNA序列的对称性方面的群论等。因此,在生物信息学教学过程中要求教师具备数学及统计学的计算方法的基础知识,能够利用牛顿迭代法、线性方程回归分析、矩阵求拟、最小二乘法等进行数学建模和计算,从而对基因和蛋白质序列进行比对、进化分析和绘制遗传图谱等。
2.生物科学基础
生物信息学包含的生物类学科有,生物化学、分子生物学、遗传学等基础学科,基因工程、蛋白工程、生物技术等应用学科。根据其课程特点,学生在学习生物信息学课程前需要学习生物化学、分子生物学、遗传学、基因组学、蛋白质组学等基本生物学课程,对于基因序列、蛋白质序列、启动子、非编码区等概念有深刻的理解,同时需要对一些重要的生物学数据库有一定的了解,如美国基因数据库(GeneBank)、欧洲分子生物学实验室数据库(Embl)和日本核酸数据库(DDBJ)等。此外,要求学生能够利用生物学数据库查找基因序列、蛋白质序列、基因及蛋白质结构模型,能够读懂数据库中基因和蛋白质的信息注释,能够计算蛋白质序列的分子量和等电点,能够为扩增特定的基因片段设计引物,能够对特定物种进行系统发育分析等。
3.计算机科学基础
计算机是生物信息学的主要辅助工具,利用生物信息学研究生物系统的过程需要能够熟练使用计算机对大量的生物信息数据进行处理和分析,这主要包括对数据信息进行搜索(收集和筛选)、处理(编辑、整理、管理和显示)及利用(计算、模拟)。所以,学生在学习生物信息学的过程中需要了解和掌握一些常用的生物信息学软件,如BLAST和FASTA序列比对分析软件,Oligo和Primer引物设计软件,VectorNTI、DNASTAR、DNASIS等综合分析软件。此外,学生还需要学习和掌握一些常用的计算机语言,如正则表达式、Unix shell脚本语言和Perl语言。
利用生物信息学在处理和分析海量生物数据的过程中,计算机软硬件资源需要配合处理分析软件的运行,因此要求计算机操作系统使用Unix和Linux操作系统,这些操作系统需要大量的操作命令进行输入执行过程,对于经常使用Windows操作系统的学生来说是一个较难跨越的障碍。
三、生物信息学课程教学中存在的问题
目前国内大多数高校的生物信息学教学采用传统的教学模式,即以课堂式的理论教学为主,缺乏必要的实践教学。理论教学模式固定、教学方法单一、教学内容狭窄,通常是介绍性、科普性的课程,甚至作为公选课程。少数高校开展生物信息学的实践课程教学,但多以验证性实验为主,缺乏和专业相适应的综合性、设计性实验,而开放性实验更无从谈起。
1.教学模式固定单一
生物信息学在内容层面涵盖诸多学科领域,注重应用性和实践性。然而,目前大部分高校把生物信息学作为一门孤立的课程,这导致教师需要将大多数课程内容压缩到一门课程进行教学,在有限的教学时数下灌输大量内容,增加了学生学习的难度,降低了教学质量。再者,大多数高校仅开展生物信息学的理论教学,忽视实践教学过程,造成生物信息学理论与实践内容的脱节,使学生在学习完理论知识后难以深入理解和吸收,无法将所学的知识应用到后续的工作和学习中,最终未能体现出该门课程的价值。
2.教师专业背景薄弱
作为一门交叉学科,生物信息学的教学要求教师具有较强的数学、生物学和计算机科学背景。然而,目前从事生物信息学教学的教师即便具备深厚的生物学背景,但是多数教师在数学和计算机方面较为薄弱,并不具备完整的生物信息学知识体系,对生物信息学发展趋势也了解不多。在师资缺乏的情况下,院系开设生物信息学课程,教师为了完成教学任务,仅仅在教学中进行介绍性的讲解,在课程考查方式上通过小论文、综述和课外活动等方式完成该课程的学习。因此,无论是理论教学还是实践教学均无法实现该课程大纲的要求,从而影响学生对生物信息学课程的理解和掌握,生物信息学的实践操作能力更无从谈起。
3.实践教学薄弱,专业教材缺乏
生物信息学实践课需要学生在网络环境下用计算机学习NCBI数据库的检索与使用、序列比对分析软件的应用、蛋白质空间结构图视软件的应用、序列拼接软件的应用等。但是目前,大多数高校开设的生物信息学课程多以理论教学为主,实践教学课时非常少或者为零,学生对于生物信息学课程的学习仅仅通过教材上抽象的文字描述进行理解和掌握,这导致学生在理论课中学到的知识无法在实践课中进行验证或操作,严重影响了生物信息学的教学质量,也偏离了教学大纲中强调的重在培养学生实践操作能力的培养目标。
另外,目前还没有适用于生物科学专业的生物信息学教材。国内各大高校使用的教材多为国外教材的影印版或者中文翻译版本,这些教材偏重介绍生物信息学的理论和方法,涉及的实践内容较少,学生需要具有较高的相关知识才能接受和使用这些教材。因此,部分高校在生物信息学教学过程中往往使用自家编写的简化教材,从而造成生物信息学教学内容不统一,教学大纲混乱等情况。
4.实践课程经费不足,实践教学环境落后
当今,许多发达国家都很重视生物信息学的教学和研究,积极开展各种生物信息资源的收集和分析工作,培养大量生物信息学人才,为整个生物学的理论研究及其相关产业创新(主要是医药和农业)提供指导和支撑。国内对生物信息学的关注和认识起步较晚,其发展落后于国际发达国家。国家和高校对生物信息学的教学和科研资金投入力度不大,缺乏必要的仪器设备,生物信息学的实践教学条件得不到保障,比如大多数高校的生物科学专业没有相应的计算机实训室,配套软件也相对匮乏,落后于国际发展水平。
四、生物信息学教学模式改革的探索
1.修改理论和实践教学大纲,编写适用的实践教材
根据当今生物信息学的发展方向,制定和修改理论教学大纲,除了引物设计、基因和蛋白质序列比对、基因和蛋白质结构功能预测等基本内容外,还需添加系统进化树分析、聚类分析、蛋白质互作网络谱图等较为综合的内容。另外,增加实践教学课程比例,充实实践教学内容,结合理论教学内容增加综合性、设计性实验,适当提供科研环境,鼓励开展开放性实验。
目前国内并没有系统的、专业的生物信息学实践教材,因此针对高校生物科学专业方向的特点,联合多学科领域(数学、生物科学、计算机科学)编写相应的生物信息学实践教材,在制定、修改实践教学大纲和编写教材的过程中结合学生的接受能力,由浅入深,多设实例和相关练习,使学生循序渐进的理解和掌握生物信息学的原理和方法,掌握更多的生物信息学工具。
2.紧密联系科研、基于实践问题开展教学
通过实践教学把生物信息学教学与科研有机结合起来,能够促进教学与科研的共同发展。在紧密联系科研的过程中,采用基于问题的教学(PBL)方法,通过实践教学环节,培养和训练学生把所学的生物信息学的知识和方法应用于各种生物科学领域的科研活动中,通过解决实际问题训练学生的实践技能,从而促进教学与科研的双重发展。例如,在生物信息学实践教学中多加入生产和科研中遇到的经典实例,鼓励学生利用相关的生物信息学软件及相关的理论和方法解决问题。学生也可以选择自己感兴趣的课题,利用自己熟悉的、合适的生物信息学软件和相关知识开展课题研究。此外,专业教师在指导学生课题研究的过程中还可以发现理论和实践教学的不足,不断的完善生物信息学理论和实践课程大纲和内容,提高教学质量。
3.开展多学科实践结合的教学模式
生物信息学属交叉学科,包含了不同领域的专业知识和技能,为使生物信息学教学达到教学的目标,该课程教学需要采用多学科实践结合的教学模式。
多学科实践结合的教学模式是指联合不同领域、不同学科、不同专业的课程在教学的过程中结合生物信息学涉及到的知识和技能进行基础性、铺垫性教学。比如,在高等数学和统计学的教学过程中,针对生物信息学的需求,适当增加数学建模、统计方法、动态规划方法、数据挖掘等方面的基础内容,同时,开设实例实践教学,使学生理解和掌握隐马尔科夫链模型,牛顿迭代法、最小二乘法等方法的应用原理和规则;在生物科学专业课程设置上,尤其是实践课程的教学过程中,结合生物信息学涉及的引物设计、序列比对分析、基因及蛋白质结构功能预测等方面开展相应的设计性、综合性、开放性实验项目,使学生了解和掌握基本的生物信息学原理及软件的应用;在计算机科学的教学过程中,应根据生物信息学的需求,开设正则表达式、Perl语言、R语言等课程学习,以及增加Linux和Unix操作系统课程学习,使学生在学习生物信息学前打好坚实的基础。
值得注意的是,生物信息学课程与其他课程的开设时间和顺序需要有一定的探索和评估,对于开设该课程的时间把握是开展多学科实践结合的教学模式的关键因素。过早开设生物信息学则会导致学生在不具备相应学科基础的条件下跨越式的接触生物信息学,无法理解和掌握相关的知识和技能;过晚开设则会使学生学习了相关学科知识和技能后,由于课程衔接不紧,导致在学习生物信息学时出现理解滞后和无法适应的现象。因此,针对不同专业和学科的特点,根据具体情况进行统筹安排,使生物信息学和其他相关学科课程有很好的衔接和过渡,以确保和提高生物信息学的教学质量。
五、结语
生物信息学是现代基因组学时代的开阔者,也是生物科学研究的重要的工具和载体。针对生物信息学的特点,高校生物科学专业课程设置、教学方法、教学模式和教学软硬件等需进行一定的改革,将多学科实践结合的教学模式运用到生物信息学的教学实践中,在提高教学质量的同时将更好的提升学生科研、应用和创新能力。
参考文献:
[1] 郝柏林,张淑誉.生物信息学手册[M].上海:上海科学技术出版社,2002.1-10.
[2]GUYD, NOELE, MIKEA. Using bioinformatics to analyse germplasm collections [J]. Springer Netherlands,2004.39-54.
[3]王春华,谢小保,曾海燕.深圳市空气微生物污染状况监测分析[J].微生物学杂志,2008,28(4):93-97.
[4]张菁晶,冯晶,朱英国.全基因组预测目标基因的新方法及其应用.遗传,2006, 28(10):1299-1305.
中图分类号:Q811-4 文献标识码:A
21世纪是生命科学的世纪,人类及模式生物基因组计划的全面实施,使分子生物学数据以爆炸性速度增长。面对基因组学、蛋白质组学、基因芯片、分子进化等大量的生物信息,在计算机科学、网络技术以及生物分析技术的相互作用和渗透下,诞生了一门崭新的学科――生物信息学(Bioinformatics)。生物信息学利用计算机和互联网,以数据库为载体,运用数学算法和计算模型,研究生物信息数据的获取、处理、存储、分发、分析和解释等方面,进而阐明和解释庞杂的生物数据所蕴含的意义。生物信息学跨越了整个生命科学领域,近年来在医药学研究中发挥了不可替代的作用,无论是从分子生物学的角度阐述病因,还是对疾病的预防、诊断、治疗与新药研发都将产生巨大的推动作用,医学生物信息学必然在未来的医学研究中处于关键地位,但生物信息学的理工科特性决定了该课程在医学教育中开展的难度。本文结合医学院校特色和生物信息学课程特点,探讨开设医学生物信息学课程的必要性,分析生物信息学课程在教学实践中存在的问题,提出本校开展生物信息学教学的实施方法。
1 医学生物信息学的主要研究内容
1.1 疾病基因的发现与鉴定
约有6000种以上的人类疾患与特异基因的改变有关,某些关键性基因或其产物的结构功能异常,可以直接或间接地导致疾病的发生。使用基因组信息学的方法通过超大规模计算是发现新基因的重要手段。例如:通过构建肿瘤cDNA文库或表达序列标签(expression sequence tag,EST)分析差异表达基因,揭示肿瘤发生的分子水平变化,寻找靶基因。
1.2 药物设计与新药研发
生物信息技术为药物研究、设计提供了崭新的研究思路和手段。利用数据资料、软件工具筛选药物作用的靶位和候选基因,阐明其结构和功能关系,指导设计能激活或阻断生物大分子发挥其生物功能的治疗性药物。
生物信息药物设计常用的方法有:①三维结构搜寻,寻找符合特定性质和三维结构的分子,从而发现合适的药物分子。②分子对接,建立大量化合物的三维结构数据库,依次搜索小分子配体使其与受体的活性位点结合,通过优化使得配体与受体的形状和相互作用最佳匹配。③全新药物设计,利用计算机自动设计出与受体活性部位的几何形状和化学性质相匹配的结构新颖的药物分子。
生物信息学方法为药物研制提供了更多的、潜在的靶标,大大减少药物研发的成本,提高研发的质量和效率。
1.3 流行病学研究中的应用
将流行病学的遗传和非遗传性的研究与生物信息学结合起来,会对疾病的机理、个体对某种疾病的易感性和疾病在群体中的分布有更明确的认识,对疾病的预防和治疗有极大的指导意义。
2 医学生物信息学课程的特点及主要困难分析
2.1 课程内容丰富,学科交叉,数据庞杂
生物信息学利用生物学,计算机科学和信息技术揭示大量复杂的生物数据所赋有的生物学奥秘,是一门交叉性学科,并且理科特性很强,需要深入理解分析。目前生物信息学包含了基因组、蛋白质组、代谢及药物等多个部分,每个部分都具有各自的特色和相应的分析技术。根据《Nucleic Acids Research》统计,全球共有约1000多个主要的生物医学数据库,涵盖了生物医学研究的诸多领域。学生不仅要掌握获取和利用海量生物信息的基本知识和技术,还应掌握相关的数学、物理学、计算机程序设计等知识和技术,又因为医学专业学生的数理知识有限,学习起来有一定的困难。
2.2 操作性和实践性强
生物信息学是一门操作性和实践性很强的学科,主要是在互联网环境中,依靠计算机,利用数据库和各种信息处理软件来进行生物信息学方面的分析工作。针对医学专业学生开设生物信息学课程,其教学内容应注重理论与实践紧密结合,着重学习利用计算机对各种生物信息资源和数据库的检索,使用方法与技巧,真正做到学有所用。
2.3 现状与困难分析
目前,国内的生物信息学教学基本沿用以“教师讲授为主”的传统教学模式,与生物信息学交叉前沿性特点不相适应,实验教学单一,多为验证性试验,缺乏综合性和设计性。此外,医学专业学生计算机知识薄弱,对生物信息学的算法与数据库的原理和特点等不甚了解,在高通量数据处理面前力不从心,影响对问题的分析能力。
3 医学生物信息学课程开设实施方法和对策
3.1 根据医学专业特点设计教学内容,建立具有模块化的教学大纲
目前尚未形成系统、成熟的生物信息学教学模式。开设课程之前,对医学专业学生进行问卷调查,让他们选择医学生物信息学课程中感兴趣的、需要学习的知识内容,并提出难点问题。教师汇总问卷结果,对授课内容进行调整,建立模块化的教学大纲,例如:导论模块、数据库及使用模块、基因组信息学及其分析方法模块、蛋白质组生物信息学模块、代谢和药物生物信息学及系统生物学模块等,使学生清楚每个模块的特点和作用,提高学生的学习兴趣,激发学生的学习热情。
3.2 强化实验教学,激发学生的创新思维和创新意识
生物信息学的学习是运用生物医学、数学、以及计算机科学等诸多学科知识进行分析、判断、推理、综合的实践过程,强化实验教学显得尤为重要。另外,采用PBL(Problem Based Learning)教学法,可以有效地激发学生的创新思维和创新意识。
3.2.1 注重实验操作
生物信息学实验课程以计算机操作为主,需要学生灵活应用互联网、数据库和多种生物信息学软件,所以实验操作显得尤为重要,加大实验比例,为学生提供较多的实验操作机会,不仅提高了学生的动手能力,而且大大提高了学生在因特网环境下对生物大分子序列、生物大分子结构进行生物信息学分析的能力,是提高学生学习生物信息学效果的有力保障。
3.2.2 采用PBL教学模式,优化实验内容
加大设计性实验的比例,采用PBL教学法,根据学生能力和兴趣进行分组,由教师提出问题并布置真实性任务,使学生在已有的知识基础上,通过查找文献、小组讨论、探索,最终完成任务,写出试验报告。由教师对任务完成过程及结果进行点评,对学生掌握知识的程度及学生的科研、应用能力进行评价,并提出进一步的提高方向。学生在实验操作的过程中,不断地发现问题、解决问题,有效地激发了学生的创新思维和创新意识。
3.3 改革教学方法,革新考核方式
3.3.1 结合多媒体技术与双语教学
多媒体技术教学灵活生动,教师在讲授难于理解的概念和生物信息学工具时,可以直接打开相关软件和网站进行演示,使抽象的生物信息学知识以具体的、动态的形式展现出来,从而加深学生对课程的掌握程度。此外,生物信息学涉及到的数据库、网站、应用软件多为英文界面,所以双语授课显得尤为重要,教师可借助多媒体,对课程进行中英整合讲解。
3.3.2 结合科研实例进行教学
生物信息学是一门不断完善和发展的学科,数据库的更新、相关软件的升级、算法的优化等,通常会随着科研中遇到的生物学问题变化而变化,所以教师可以结合现阶段的科研背景和具体的研究方向,结合实例进行教学,可以让学生真正掌握利用生物信息学方法解决生物学问题的思路,并培养和提高学生的科学思维能力,使学生由知识的被动接受者变为知识的主动发现者、探究者,教师则由知识的传授者转变为教学活动的指导者、组织者。
3.3.3 采用无纸化考核方式
适当降低课程理论难度,减少不必要的数学理论推导,注重实际应用、解决问题能力的培养,通过上机实践操作,考核学生对基本知识和原理的掌握情况,克服传统的死记硬背现象。
4.结语
生物信息学作为一门交叉学科,发挥了其独特的桥梁作用,已经广泛地渗透到医学的各个研究领域。本文针对开设医学生物信息学课程的必要性和教学模式进行了探讨,以提高学生学习的自主性、实际操作能力和解决问题的应用能力为目标,不断改进教学手段、加强教学过程的趣味性,以期培养综合型的、高素质、现代化医学人才。
参考文献
[1] 伍欣星,赵.生物信息学基础与临床医学应用指南[M].北京:科学出版社,2005.
[2] 张阳德.生物信息学[M].北京:科学出版社,2009.
[3] WeiLi-ping,YuJun.BioinformaticsinChina:APersonalPerspective[J].PlosComputationalBiology,2008,4(4):e1000020.
中图分类号:G642 文献标识码:A 文章编号:1009-3044(2016)27-0123-03
Abstract: Analyzed the developing status of Bioinformatics combined with Chinese Medicine, proposed the education directions for the combinations of Chinese Medicine and Bioinformatics, discussed the using of Bioinformatics techniques in Chinese Medicine big data with teaching and researching area by three common method in Bioinformatics.
Key words: chinese medicine big data; bioinformatics; education in university
1 引言
生物信息学是一门新兴学科,在各大高等院校医学或生物学相关专业都有与之相关的课程或专业开设。与我们常见的物理、数学、法学等学科不同,生物信息学更像是一个学科领域,它不仅仅局限于某个科学研究,而是综合运用数学、计算机学和生物学的各种工具及方法来分析和理解在大数据背景下的生物学意义[1]。经过20余年的发展,生物信息学已在分子进化、基因测序、遗传及变异研究等领域取得了突破和成果,是21世纪人类三大计划之一“人类基因组计划(Human Gene Project HGP)”的核心支撑学科。在美国,早于1988年便成立国家生物技术信息中心(NCBI),随后欧洲和日本在1993年和1995年分别建立了欧洲生物信息学研究所(EBI)和信息生物学中心(CIB)用来对数以万计的核酸及蛋白质等数据进行维护并发展至今日趋成熟[2]。生物信息学于上世纪90年代初开始逐渐引起国内科学工作者的重视,经过20多年的发展也已初具规模。笔者通过对近20年公开发表的有关生物信息学关键字的文章进行搜索,运用Excel制图绘制了自1996年至今每年发表文章数量的散点图。从图1可以发现,关于生物信息学学科的研究数量在2014年达到顶峰,并逐渐开始下滑。同时,由于搜索结果包含杂质数据(如被动截取“信息学”为关键词),为了使图表信息量有度可量,笔者继续对在认知上与生物信息学相关的科学领域进行关键词搜索,分别为“数据挖掘”和“人工智能”,并绘制图2。由该图可直观地看出,人工智能的研究一直稳步发展,符合21世纪科技高度发展的大趋势,而数据挖掘技术的相关研究自2005年以来迅猛增长并赶超人工智能。综合分析其主要原因是由于中国人口众多,自2005年以来互联网用户不断增加,全民联网的时代逐渐构成,互联网信息产业的急剧扩大以及电子商务、云技术等网络相关产业的发展带来的信息膨胀,使越来越多的人意识到大数据的作用和研究数据挖掘对经济发展、社会进步的重要影响,进而推动数据挖掘的学科发展。
2 中医大数据背景下的生物信息学课程教学
从图2的对比可以看出,生物信息学的研究数量与其他两个学科对比,则显得相形见绌。也就是说,生物信息学在我国的发展仍较为缓慢,使之与其对人类社会的贡献度不成正比。进一步对图1的搜索结果进行高级检索,对已有的生物信息学研究进行划分,将”中医”关键词加入其中,结果发现将中医与生物信息学相结合进行研究的文献少之又少,每年文献不过20左右。生物信息学的作用就是利用计算机等技术对海量的生物数据进行分析并洞察隐藏在其中的规律,而中医数据经历数代中医名师的记录和数十年来信息存储技术的发展已经俨然呈现出高纬度、高阶度的大数据结构。因此,生物信息学在中医数据的研究中一定具有其特殊的价值和意义,是从微观层面描述中医整体结构的重要手段。本文将以中医证侯、病证和中医复杂性为切入点,结合研究生物信息学在其中的应用价值,并讨论在教育教学过程中如何使中医和生物信息学有机结合,做到融会贯通。
2.1从“定性”和“定量”学习角度看基因组学学习中医“证”本质
在中医学中,“证”是立方立法的基础,医者通过四诊获取的信息进行综合分析和判断,从病症体征等表现集合入手,得出相应的证候,有针对性的用药治疗。中医与西医不同,讲究以整体论看待人体以及病变,“辨证论治”思想也是千百年来各名中医学者通过反复探索得出的实践经验,对中医遣方用药具有决定性的指导意义。而西医认为,疾病的发生与发展是与人体某段特异的基因的改变有关,HGP的研究目的也正是为了揭示人体的构成奥秘从而从本质上研究疾病的产生和发展规律[3]。因此,中医与西医在指导医者诊疗的哲学思想上是有很大不同,甚至可以说是截然相反的。然而中医与西医的内在关联却无处不在,结合点之一正是基因与证候的关联。对于基因组学和中医证候的学习方法是不同的,一个是定量学习,另一个则是定性学习,定量学习有助于学生更加客观的研究生物体的发展规律,并结合现代计算机技术做到多学科交叉学习与实验,而不足之处在于缺乏主观思考、学习方式较为分散缺乏整体思维把控;而定性学习则以某一指导思想为主线,通过对某些案例及知识长时间的观察和分析,从中得出结论。定量学习如基因组学更重视量化计算及工具的使用,而定性学习如中医证候则更重视理论与实践结合,整体到局部学习。在学习的过程中,无论基因组学还是中医证候,都会以疾病为具体的研究对象。从西医上说,基因是决定人是否患病的内部原因,通过遗传或基因状态的改变都可能导致疾病的产生,从中医上说,证候是疾病状态下的临床类型,反映了机体在疾病发展过程中的病理特征[4]。因此,将证候与基因组学统一学习,实则是将定量与定性学习相结合以实际疾病案例和数据着手从而多方面运用计算机、西医学、证候学、数学等学科知识对生物大数据进行分析的综合学习方法。
2.2 基于蛋白质组学学习中医病证相关性
证侯是人体生命活动的一种表现,而生命活动的主要执行者是蛋白质,两者之间必然会有隐秘且细致的联系,我们也应以此为出发点,培养学生的发散学习方法,综合学科进行学习。自HGP的完成宣告了后基因组时代的到来后,研究生命科学的重心也由基因组学向蛋白质组学逐渐转变,作为教育者也应跟上科学发展的潮流,把生物科学研究和相关教学模式从基因水平向蛋白质水平转变。与此同时,蛋白质组学是从整体角度分析细胞内的动态变化以及蛋白质组成成分、表达水平等,它的研究方法学内容与中医的整体观和辩证论治观有着许多相同之处。蛋白质组学在分子水平上的DNA修饰和基因调控反应生命体的整体状态(即阴平阳秘),中医理论强调从整体观对疾病进行认知,认为疾病的发生是人体整体功能的失调所致(即阴阳失调),重点在于辩证论治[5]。在教育教学过程中,将基因或蛋白质方面的研究从结构研究向功能研究转变,使研究更具体,透过相关功能性测试实验,发现基因之间的相互联系及相互作用,在定量学习的过程中培养学生的定性思维,使学生善于发现问题及对象之间的关联。正如数据库实体关系模型中的E-R图一样,在进行蛋白质组学和中医病症相关性研究教育的过程中,中医病证和蛋白组学可以看做是两个看似毫无关联的实体,而通过“疾病”将两者相连,透过此种关系可以衍射出两个学科方面的深入学习。
2.3 运用复杂系统性方法学习中医药复杂系统
中医药的复杂性相比西医有过之而无不及,原因主要在于相对于“结构决定功能”的西方医学思想,中医更侧重于“关系决定功能”,在这种情况下,无论是辨证论治还是症状体征变化,有关中医诊断和治疗的信息都是已高度离散和非线性的方式存储,使得中医称为典型的“复杂自组织系统”[6]。尤其在信息离散度和复杂度较高的中医证侯系统中,症状变量与证侯信息混杂在一起,想辨别两者的区别和联系是非常困难的事情,单纯的研究数据往往缺乏正确的方向,而单纯的研究理论则往往枯燥乏味。因此,在教学过程中,可以将复杂系统方法学引入中医系统学习,通过复杂系统中的熵分划方法将证侯系统的离散变量加工转化为线性关联集合,即将症状变量通过关联度集合成多个症状集合,并将症状集合与关联度较高的证侯要素进行联结。以此方法既可以激发学生对理论学习的兴趣,又能以理论指导实践,对中医证侯大数据进行信息提取,达到全面学习。
3 结束语
中医信息学已经作为一门新兴学科在我国各大高校开设,相关师生深入研究和学习,主要目的就是发掘蕴含在中医几千年发展结晶中的奥秘。关于中医药数据的数据挖掘技术和研究也在近年日益增长,这都表明人们已经愈来愈关注国粹,关注健康,关注未来。这也表明与之相关的学习和研究对未来的人生发展和机遇都有着深远的影响。然而,数据挖掘的技术并不完全适用于中医药复杂系统中的信息发掘,若单纯地将两者进行结合教学,学生可能缺少知识衔接,缺乏过渡。这时若将生物信息学引入二者其中并结合生物信息学相关智能科技手段和技术,则可以从宏观和微观两个方面去看待生命体:宏观上面对复杂的中医系统不需感到困惑,而是以“复杂系统方法论去解决复杂系统”,使学生不要总想着从每一个局部都能分析到问题的本质,而是接受复杂性,从复杂系统的角度去解释生命体的自组织现象,对生命体的宏观表现进行研究;微观即是在分子水平上去分析中医证侯的本质,方剂的复杂体系,去了解生命体内部的调控机制等,以此加深学生对中医理论的理解以及对生物信息学工具和技术运用的融会贯通。
参考文献:
[1] 钟涛.基于复杂系统方法的慢性胃炎中医问诊证侯建模研究[D].上海:华东理工大学,2014.
[2] 谭从娥,王米渠,冯文哲等. 生物信息学分析寒症海量数据的探索[J].中华中医药学刊,2008,26(12):2569-2570.
[3] 李方玲,梁嵘.对中医证侯规范化研究的探讨[J].辽宁中医杂志,2006,33(4):386-387.
中图分类号 G642.0 文献标识码 A 文章编号 1007-7731(2016)22-0120-02
随着基因组测序技术的飞速发展,学科交叉的趋势也越来越明显,如生物信息学、数字医学、金融数学、环境生态学等,交叉学科的产生意味着跨学科时代的到来,这是不同科学门类领域学科相互渗透融合,凭借对象整合、概念移植理论渗透和类比推理等方法,对象世界及其变化进行体认和再现后形成的新学科[1]。这就要求我们必须创新,鼓励创新,而鼓励创新需要鼓励创新性人才培养,尤其是研究生阶段的人才培养,因为这个阶段的培养是建立在学科发展的国际前沿基础上的,但在高等院校中,由于当前研究生教育制度的“单一专业制”,限制了跨学科人才培养。然而,面对如此巨大变革,庞大的测序数据也是当前研究人员面对最困难的问题,此时生物信息学得到高度重视。尽管生物信息学是以生物为研究对象的学科,但是它的研究手段却是计算机与统计学算法相结合,涵盖了生物信息的获取、处理、存储、分配、分析以及阐述等各个方面以理解和利用海量的生物学数据为目的学科,这对我们生物学专业的学生来说无疑是学习和研究的屏障,培养其理论思维能力,创新能力和实践能力尤为重要,如何在生物学本科生中培养生物信息学研究生是生物学科研究生培养的难点。探索如何克服这一难点而培养能力和自主性强的生物信息学科研究生将具有十分重要的意义,本文就跨学科培养生物信息学研究生所面临的一些问题进行探讨。
1 跨学科培养生物信息学研究生的必要性
跨学科或交叉学科的出现发挥了明显的作用,为许多领域的科学问题提供了答案。法国作家普鲁斯特曾说,真正的发现之旅,并不是去寻找新大陆,而是采用一种新视角[2]。在某一个学科内无法解决的问题,如果换个角度就很可能迎刃而解,这种创新性的问题答案的获得不但需要多学科的协同攻关,更需要在研究生教育方面培养一大批高层次的具有跨学科思维并掌握多学科理论与方法的人才,这样才能更好地推动科技创新。在国外,跨学科研究已经非常普遍。如在德国的柏林工业大学已经建立跨系研究中心、跨学科研究小组、大学研究论坛以及跨学科研究协会等组织;在日本,名古屋大学建立了复合专业群以促进学科前沿交叉领域的发展和研究生素质的提高[3]。这些不争的事实均反映了在世界范围内跨学科研究生培养的趋势所在,跨学科生物信息学研究生的培养也不例外。
2 跨学科培养生物信息学研究生的优势与不足
我国研究生教育培养已从传统单一学科的培养模式向跨学科和学科交叉的培养方向发展,跨学科、跨专业选择的研究生数量也日渐增多,已成规模。跨学科的研究生同本专业研究生相比,既有优势,也存在一定的不足,当然包括跨学科培养的生物信息学研究生。跨学科培养的优势在于研究生能虼佣嘟嵌瓤悸俏侍猓有可能因为学科交叉而产生独特的研究方法和思维方式,形成创新点;也可以从不同的专业角度发现问题、观察问题、研究问题、解决问题。不足之处有:在新学科的基础知识及专业知识积累上有所欠缺,对很多问题理解不透彻,初期也可能学习,科研压力大很难进入科研状态,如果自我调节能力不强,导致有些研究生可能会出现自卑情绪,需要一定的适应阶段,但过了这个阶段,跨学科的优势即可逐步显现出来。
3 跨学科培养生物信息学研究生的制约因素
在高等教育体系中,本科教育和研究生教育分别培养应用型人才和研究型、创新型人才[4]。近年来,为了适应社会发展对复合型高层次人才的需求,我国许多高等院校逐步开展了对研究生的跨学科培养。但在培养过程中,存在一些制约其发展因素,主要表现在以下几个方面:
3.1 培养理念与方式 在传统的教育管理理念与方式下,研究生教育的培养主题依然是单学科,而非多学科、交叉学科、跨学科。我国大多数院校的研究生培养仍然采取这种模式,虽然也培养了一些杰出人才,但总体上不利于研究生多方面知识的获取,使研究生缺乏创新性。对于跨学科培养研究生,行政管理条例应该灵活,研究生学制期限也不应该固定,因人而异等等均收到一定的限制,无法实施。在高等院校在课程的设置上,一般很少设立学科跨度大的专业必修课和选修课,学院与学院之间基本不再进行跨学院跨学科开课,选课上缺乏协作性,研究生培养计划中也没有整体的培养应对跨学科的培养方案等。
3.2 培养体制与机构 我国大多数的高校是以一级学科为基础设置学院,学院数量较多,学校也习惯于以学院为基本单位,学院内部学科包容量较少,专业划分过于详细,而此时可能忽略了跨学科与交叉学科过于规范的培养框架。目前,我国有很多高校拥有独具特色和优势的学科与专业,但由于僵化的培养制度,难于形成特色或优势学科主导下的跨学科培养方案,更不利于高层次人才的培养。所以,跨学科培养存在一定的体制问题,学生在掌握了大量交叉学科知识及研究方法后,还要认清主导学科并能解决实际问题。如果在培养过程中过于重视现有的培养制度和教学计划,就容易使整个培养体系走向僵化,不但不能促进跨学科的发展,更难以培养出适应社会发展需要的复合型高层次的人才。
3.3 导师与研究生个人 在指导教师方面,大多数导师也不具有跨学科学习与跨学科研究的经历,其开展的研究项目也只是单一学科的。而刚刚跨学科的研究生也可能和导师的情况类似,这样导师与学生的学科知识结构都相对单一,对其他学科知识及发展动态掌握不够,使跨学科培养在双方面都受到了阻碍。所以,在跨学科研究上,导师和学生都应该拥有跨学科研究的知识背景,既要掌握一定的跨学科相关知识和研究方法,也要经常参与跨学科的学术交流,积极进行跨学科建设和跨学科项目的研究。
4 跨学科培养生物信息学研究生的必要措施
跨学科的研究生培养是一个长期而又复杂的过程,跨学科生物信息学研究生培养也不例外,从培养过程中涉及的制约因素考虑,为提高跨学科生物信息学研究生创新人才的培养水平,提出以下主要措施:
4.1 建立健全相关跨学科培养制度 在组织机构上,设置好学院后,应注意适当增加学院的学科数量,以促进不同学科不同专业的交叉与融合。在资源利用上,实现资源共享,由学校统一进行管理大型实验设备和仪器,建立相关的技术与服务平台,避免资源闲置或浪费现象的发生,提高资源利用率,更要打破学科专业之间的界限,积极争取校企与科研院所的合作等,进行研究生联合培养。
4.2 完善跨学科培养方式 跨学科培养涉及到很多环节,首先在考试科目的设置、试卷命题及复试上,都要尽可能按跨学科招生。既要注重考察考生知识容量,也要考察考生的能力是否具备跨学科培养的潜力,优先录取综合素质高的跨学科考生。此外,招生录取途径也应该多样化,如导师有招生自[5]。在研究生课程教学上,更要注重课程的交叉性与综合性,还要引入交叉学科研究的最新成果,使研究生了解学科发展动态。另外,跨学科研究生可以在不同实验室进行学习,提高自身能力,积极参加学校或学院组织的学术交流、多听跨学科的学术报告和学术讲座等。
此外,还要注重激励机制,目前,许多高校及科研院所在评估科研人员的业绩时,过于注重甚至只考虑第一作者的贡献,其他作者的贡献忽略不计,这样非常不利于跨学科研究的培养,影响积极性。许多生物信息学的研究是和其他的生物学科交叉发展的,第一作者贡献固然大,其他位次的也要适当的考虑,这样才能使得研究生的跨学科教育快速发展。
4.3 重视导师与研究生的跨学科研究 跨学科研究生的水平高低c导师的学术水平、综合能力等有直接的关系,因为导师对研究生选题、技术路线等方面具有很大的指导作用。研究生在跨学科上也应高度重视,储备知识,拓展思维,这样和导师进行的跨学科沟通时才能顺利进行,有利于发展。导师方面,我们倡导的多导师制,也就是我们常听说的还有副导师,这样更能有效地培养研究生的全面知识与试验技能,有助于跨学科的创新性。培养跨学科的生物信息生学研究生的知识与技能,多导师制更值得提倡,因为其中涉及很多软件知识、计算机知识、生物学知识等多个学科的知识和技能,这样可以相互补充,有助于问题的解决。
我国研究生教育具有多层次性、多类型的人才培养模式,但跨学科人才培养仍处在探索阶段,存在很多制约因素,但跨学科研究生培养对于培养创新型人才有着及其重要的作用,可能成为培养交叉学科人才、创新人才的有效途径。
参考文献
[1]炎冰,宋子良.交叉学科概念新解[J].科学技术与辩证法,1996,13(4):51-54.
[2]林崇德,罗良.建设创新型国家与创新人才的培养[J].北京师范大学学报(社会科学版)2007,1:29-34.
[3]何沐蓉,朱浩,常军武.跨学科培养生物医学研究生[J].学位与研究生教育,2011,7(7):11-16.
“你能猜得出我最初是学什么专业的吗?”在系统生物学界已经小有名气的赵兴明问记者,随后他自己笑着说,“你们肯定猜不到!我其实是机械专业出身,和计算机及生物学简直是风马牛不相及。”赵兴明本科在校时学的是机械专业,但是由于对计算机产生了浓厚的兴趣,他完全凭借着自学学习了很多计算机的课程。到了研究生期间,赵兴明决定正式转入计算机专业学习。他原本计划从事传统计算机领域的研究,但是他的导师给了他一个建议,希望他能够研究生物信息学。
生物信息学在当时刚刚流行起来,是世界上一个非常热也非常新的方向,这激起了赵兴明非常强烈的挑战兴趣,于是便阴差阳错地进入了这个领域。但他毕竟不是生物背景出身,生物知识很匮乏,对于生物信息可以说一点概念都没有,刚开始学习的时候特别困难,完全是靠自己的勤奋和摸索才坚持下来而没有掉队。但是有磨炼必然有收获,也正是从那个时候,赵兴明养成了极强的独立科研能力,对他日后攀登科研高峰有着极大的帮助。
博士毕业后,赵兴明东渡日本到东京大学读博士后。在日本,他学到了日本人严谨认真、一丝不苟的敬业态度,这对他日后的治学之道触动非常深刻。他的合作者是当时日本非线性科学领域的著名教授Kazuyuki Aihara,在与他的合作研究中,赵兴明受益匪浅,大大拓宽了自己的研究思路,并踏入了一个新的研究领域-系统生物学,开始考虑如何从系统科学的角度研究生物学问题。 随后几年,赵兴明又赴欧洲游学,并与欧盟分子生物学实验室(EMBL)的国际著名生物信息学家Peer Bork开展合作研究。在EMBL,他见到了很多世界顶级的科学家,带给了他非常大的冲击。在与他们的交流中,赵兴明实实在在地认识到了山外有山,学无止境的道理。
赵兴明所研究的网络生物学,就是将复杂生物系统抽象表达为网络,建立网络模型,进而通过网络挖掘来揭示生物体内给成分之间的复杂关系,从而揭示生物系统的运行机制。采用数学领域中图论的研究方法,借助网络的概念和复杂网络的研究手段,将生物体中各种分子及其相互作用加以抽象,组成一个包含多个体、多层次相互作用的复杂网络。这是一门涉及生物学、医学、计算机学、生物信息学等多学科交叉的研究领域,这在有些人看来既枯燥又繁琐,但这些在赵兴明看来却是充满了“趣味”。
“读万卷书,行万里路”是赵兴明为自己定下的目标,在国外游历多年之后,他最终还是选择叶落归根,回到祖国发展。没有什么豪言壮语,只是在他内心深处有那么一个朴实的声音:国家培养了我,总要为国家做出些成绩来!不可否认,当下国内的科研环境充满了浮躁和压力,有不少科研工作者本身并不热衷于做研究,只是将其看作为养家糊口的谋生工具而已。那么,这只是一份工作,却做不成事业。在赵兴明看来,搞科研就像攀登珠峰,首先你要有一颗不断征服的雄心,还要有发现风景的眼睛,自然能在风雪兼程中找到坚持的乐趣。
老药新用:
网络生物学大显身手
赵兴明时刻在思考怎么利用数学和计算机的方法来构建一个生物网络,怎么用这个网络把分子之间的关系描述出来,怎么挖掘网络里所蕴含的知识,从而用来识别疾病基因,进而可以在药物研发方面大展身手。
在过去10余年中,国际上新药研发成功率出现明显下降。导致研发新药研发失败的主要原因是药物的有效性和安全性这两大问题。尽管随着我国对生物医药领域的投入增多,国内研发的硬件条件得到了很大的提高,但相对于新药研发的巨额投入而言,仍然不得不认真思考如何利用有限的资源实现成果产出最大化和研发风险最小化这一关键问题。新药物研发成本的增长和成功率的降低,使得药物重新定位逐渐成为各大药物公司和科研机构最重要的新药物开发模式之一。药物重新定位(repositioning/repurposing)指的是发现旧药物新疗效的技术,因而也被称为老药新用,就是利用相关的技术方法对已有的药物进行重新筛选、组合或改造从而发现其未知新用途的过程。
赵兴明给我们举了一个著名的老药新用的例子是沙立度胺(thalidomide),该药物最初用于治疗孕妇早晨恶心,由于其严重的副作用被禁用;后来,该药物被发现可以用来治疗麻风结节性红斑并作为ENL药物于1998年重新上市,最近该药物又被发现可以用来治疗二型糖尿病。相比于从零开始的新药研发, 药物重新定位基于已有药物的重新开发能够节省大量前期研发投入并大大缩短研发周期,因此越来越受到政府部门、制药企业、学术机构等各方面的关注。
尽管药物重新定位已经不是一个新的概念并蕴含着巨大的潜力,但是药物新疗效的发现并不是一件容易的事情。比如,大多数重新定位的药物其新用途与其最初的目的很少有明显的关系,这使得药物重新定位有种让人无从下手的感觉。赵兴明认为,在药物重新定位的研究过程中,应当系统地综合考虑疾病产生的分子机制及其所涉及和影响的分子网络特征,以及药物所影响的分子网络特征,这将会大大提高药物重新定位的准确率。在过去的3年里,赵兴明和他的团队针对“药物重新定位”开展了深入的研究,最近他在乳腺癌药物重定位方面取得了很大进展,他针对乳腺癌所识别的药物,不仅在多个乳腺癌细胞细胞系上得到了验证,而且可以很好地抑制小鼠体内的肿瘤生长。
向脑科学研究进军
中药复方具有整体性和系统性的特征,通过君臣佐使的有机组合,协同发生功能上的改变,这种改变并非中药作用简单的线性相加,而是“整体大于部分之合”的结果。基于中医药整体观,本课题组提出了方药物质基础“组分结构理论”假说:中药及复方物质基础是多成分构成的,理化性质和药理活性相似的成分按照一定的比例构成了“组分”,组分与组分之间,组分内部成分与成分之间的这种量的比例也是一种“结构”[1]。中药与机体均是复杂体系,各组分/成分的药效活性和靶向性有所区别,又相互影响、相互作用,使得中药药效物质基础组分结构的研究就更加复杂。生物信息学(bioinformatics)综合运用数学、计算机科学和系统生物学等技术方法,从中药研究、复杂疾病治疗等生命科学的海量数据中,挖掘、发现、阐述其中所包含生物学意义[2]。本文拟从生物信息学的角度,综述组分中药与药效的关系、中药组分结构优化和组分中药多成分、多途径、多靶点的综合作用相关方面的研究思路与方法。
1生物信息学思路与方法是推动中药研究的新动力
生物信息学思路与方法为中药研究注入了新的动力。系统生物学、网络药理学等研究策略,基因组学、蛋白质组学、代谢组学、转录组学[3]等组学技术以及相关数据挖掘方法推动了中医药基本理论、中药资源以及成分鉴定、中药(复方)机制等多方面的发展。
系统生物学与网络药理学的结合是揭示中医药理论的物质基础以及单味药复杂作用本质的新策略。LiuJ等[4]基于系统生物学原理,采用数学建模和人工智能技术,结合网络药理学方法,建立补气补血分子预测模型,气血分子识别公式,揭示了气血的物质基础,阐明了人参等补气中药、当归等补血中药的分子基础和作用机制。同时对中药的补气补血理论研究提供了新方法。LiuH等[5]根据靶标与疾病相关关系,利用网络药理学研究方法,从系统水平阐明甘草治疗心血管、呼吸系统、胃肠道、肾脏疾病和恶性肿瘤的分子机制,也阐明了“除百毒调诸药”的本质和被称为“国老”的传统经验。
组学技术广泛应用于中药资源、药用植物分子鉴定[6]。陈士林等[7]提出针对具有重大经济价值和典型次生代谢途径的药用植物进行的全基因组测序和后基因组学研究的本草基因组计划,促进各种“组学”研究方法在药用植物研究领域中的应用,推动中国传统药学进入生命科学研究前沿领域。近年来,基于DNA分子标记的鉴定方法在单味中药材基源鉴别和真伪鉴别的研究中已日臻成熟。SunC等[8]结合了Real-timePCR实验和甲基茉莉酸诱导实验研究西洋参P.quinquefolius的转录组,确定了5个可能参与人参皂苷合成的候选基因,包括4个UDP-糖基和一个细胞色素P450转移酶基因。朱英杰等[9]对紫芝NRPS,PKS和TPS基因簇进行挖掘,还构建了药用植物基因组数据库和中药材DNA条形码网络鉴定系统,为数据的有效利用提供平台,促进中药现代化和全球化进程。
中药药性归经基本理论、中药复方作用机制研究依赖生物信息学的推动。胡亚楠等[10]运用决策树中C4.5算法方法,基于39个药理作用建立了20个药性预测模型,其中四气(寒,凉,平,温,热)建立一个模型,五味归经分别建立模型,所建立的模型用直观决策树图表示。并使用药性模型将中药复方血必净为例预测其药性,对其清热解毒功效给出药性理论方面的合理说明。利用决策树算法建立基于药理作用的中药药性理论中四气、五味、归经的预测模型,为组分中药的药性研究提供了一种新的思路与方法,对中药药性理论可描述的中药载体范围的扩大有重要的意义。Yang等[11]利用蛋白质组学技术考察了四物汤对于血虚证患者血清蛋白表达谱的影响,结果发现四物汤可能通过增加血红蛋白、提高免疫、减轻基因损伤等途径治疗血虚证。Wang等[12]运用UPLC-ESI-MS技术通过对大鼠尿液进行代谢组学分析,考察了茵陈汤对酒精肝的治疗作用,并成功地检测到与酒精肝毒性相关的3个潜在的生物标志物:TG,GSH和MDA。结果表明,使用茵陈汤对肝损伤大鼠进行干预治疗可以使大鼠体内上述3种标志物的水平趋于正常。
由此可见,生物信息学的研究内容和技术手段以及相关数据挖掘方法推动中药的各方面发展,结合生物信息学进一步研究中药的信息化、数字化是中药发展的必由之路。中药研究及生物信息学领域的科学家在中药信息化建设方面构建了大量中药数据库[13-14],但大多只是对中药信息的收集和罗列,不能代表中药整体性的作用特点,缺乏中医理论指导。组分结构中药和生物信息学研究技术方法结合可以解决这方面的不足。“组分结构中药”认为中药是在继承中医药整体性和系统性的基础上和“组分结构”理论的指导下,明确组分内/组分间量比关系,能清晰揭示其药效作用机制的物质基础整体。二者相结合对中药知识的整合发现、趋势走向信息的预测甚至是组分中药数据库的构建有重要参考意义。
2生物信息学为解析组分中药与药效相互关系提供有效的数学工具
中药(复方)物质基础与药效研究要体现中药整体效应的特点,组分结构中药是基于复方研究提出的一个有序整体,具有中药整体性和系统性的特征。神经网络、灰色关联度等机器学习技术;聚类分析、主成分分析等统计方法在对中药药效之间的相关性分析方面的分析已有成功探索,结合组分中药可以继承并发扬中药(复方)物质基础的整体性、系统性理念,为科学的揭示作用机制奠定基础。
神经网络属于数据挖掘中机器学习的重要内容,不论在单味中药还是复方的物质基础与药效关系研究中均有所发展。侯恩广等[15]根据大量实验数据,针对黄芩运用BP神经网络进行回归和分类,建立了两味中药谱效结合评价系统,并进行参数训练。测试结果显示了模型的可靠性,其误差均在理想的范围之内,是中药药效评价的有效尝试。陈超等[16]采用正交设计法以加味生化汤的6个组分进行对抗雌激素的子宫增重实验,以药物对抗雌激素的子宫增重作用指数作为目标,建立基于RBF人工神经网络的药效模型,发现模型的预测值与实测值相关性较好。神经网络可以同时处理定量和定性知识,具有自适应性、容错性、非线性等特点,运用神经网络建立相应的复杂非线性药效模型,可以有效地解决中药与药效的非线性相关关系问题。
灰色关联分析是一种模式识别方法。根据灰关联矩阵,利用其优势分析原则,判断中药复杂成分与药效关系的紧密程度,可以得出各成分对药效影响的顺序,最终确定出各成分药效贡献度[17]。陈跃飞等[18]计算出该方各味药物对心肌收缩力的影响因子,利用灰色关联度来研究葶苈大枣桑白皮汤组方,并对复方中各药的药效贡献度进行分析。按照基本步骤与公式计算出苦葶苈、桑白皮、大枣对心肌收缩力的影响的两两灰关联度依次为r01=0.609,r02=0.573,r03=0.551,因素间的灰关联度为|r01|>|r02|>|r03|。得出苦葶苈对心肌收缩力的影响最大,其次为桑白皮和大枣。朱诗塔等[19]采用灰色关联度分析方法研究掌叶大黄不同炮制品水提取物的指纹图谱与其止血作用的谱效关系,确定了对止血作用贡献较大的色谱峰,从中药多成分、多组分的角度,为中药“谱效关联”的质控模式提供理论依据。相对于神经网络以及相似度等常用的数据挖掘方法,灰色关联分析对数据要求较低,计算量也较低;分析者可根据“最大匹配度”原则获取识别结果,在中药与药效关系的应用中具有很大的指导意义。
神经网络与灰色关联度相结合可以更好的将药效与中药多组分进行非线性、多变量相关性分析。许雯雯等[20]采用拉丁超立方法对气滞胃痛颗粒中6味药材随机采样成不同比例组,将药效信息与各组HPLC指纹图谱化学信息用灰色关联度分析得出各色谱峰对抗炎活性的影响程度,再用BP神经网络进行拟合,建立谱效关系。较好的拟合复方中复杂的非线性关系,是中药(复方)药效关系和寻找药效物质基础的有效途径。
聚类分析(clusteranalysis)是数据挖掘的一种统计分析方法,也称为群分析,以药效为指标,可以研究中药的不同品种、不同产地分类问题,是组分结构中药产地质量与药效关系的可靠分析方法。其具体实现算法又分为K-means算法、K-medoids算法、Clara算法等。封亮等[21]通过指纹图谱技术,获得化学成分信息,利用类间平均距离的聚类分析方法,为夏枯草属药材品种、产地药效筛选提供依据。除此之外,聚类分析与主成分分析的结合能进一步确定组分结构中药中的单体层面,为药效质量评价奠定基础。孙雪飞等[22]通过聚类分析、主成分分析将不同产地的余甘子药材和鞣质部位分别聚为3类。其中,聚类分析得到说明福建,广西,印度,云南产余甘子药材质量最好,与相似度计算得到的样品之间的相关性结果一致。主成分分析确定粘酸-2-O-没食子酸酯,柯里拉京等成分是为余甘子的主要指标成分。为余甘子药材质量评价和合理应用提供依据。聚类分析首先数据进行聚类,然后将聚类结果与药效指标进行对比分析,进而用以挖掘可能的药效活性成分。然而聚类分析不能评价各数据与药效指标的相关性大小和方向,也无法体现各色谱峰对应成分对药效的综合作用[23]。
生物信息学的数据挖掘方法在中药中的应用并未成熟,适用性及利弊还处于探索阶段。中药的临床应用具有整体性和系统性特点,其物质基础是由众多化学成分即多组分/成分构成。运用不同的生物信息学数据处理方法,将“组分结构理论”与药效关系研究相结合,不仅推动了组分结构中药与药效关系的发展,也为创新发展中医药物质基础研究提供了新视角。
3生物信息学方法为优化中药组分结构提供新技术手段
组分结构中药是由多组分/成分构成,特点在于这种构成不是简单的化合物堆积,而是结构和性质类似的最基本单元成分之间按照一定组成结构比构成亚组分以及组分。因此,组分内/组分间量比关系是发展组分结构中药必须解决的基础性问题。目前,组分结构中药结构优化方法主要有基线等比、均匀设计、偏最小二乘(PLSR)等分析设计方法。生物信息学技术手段可以在原有方法基础上推动组分中药结构优化和药理指标改进。
基线等比最初是作为小复方优选的方法[24],优点是信息处理的空间大,不仅可以使用传统的假设检验,一些生物信息学分析方法(如聚类分析、模糊综合评判等)也可使用,是组分中药结构优化最常用且比较成熟的方法。顾俊菲等[25]采用基线等比增减法,设计赤芍总苷、川芎总酚酸组分不同组分组成结构对人脐静脉内皮细胞(HU-VEC)缺氧损伤模型的保护作用,结果显示赤芍总苷、川芎总酚酸组分组成结构比例为8∶2时,对缺氧损伤的内皮细胞保护作用最好。赵海平等[26]采用基线等比设计方法研究红管药总皂苷与总黄酮止咳效果的最优配比。结果显示在红管药总皂苷、总黄酮部位总量恒定的情况下,2类组分不同配比的祛痰作用具有总皂苷比例依赖性;而止咳作用却不完全取决于总黄酮的比例变化,可能两者在1∶1,1∶2时还存在协同增效的配伍关系。
均匀实验均匀设计(uniformdesign,UD)适用于多因素多水平实验研究,设计方法不会受因素数、因素水平的限制,在实验设计过程中仅考虑实验点的“均匀分散”性,实验次数可明显减少[27]。陈倩等[28]运用均匀设计法确定小半夏加茯苓汤的效用组分用量的优化配比,组方体现了一定的肿瘤抑制及免疫调节作用,便于对该方诱导肿瘤细胞凋亡的机制进行深入研究,有望用于肿瘤放化疗的辅助及预后治疗。杨鸿等[29]按照均匀试验设计-药效试验-数学建模(模型验证)-综合药效评价程序,进行甘草总黄酮、银杏叶提取物、羊藿总黄酮和黄芪总苷4个中药组分不同配伍剂量体外清除DPPH和多环芳烃的研究,得到中药组分配伍最佳剂量组合为甘草总黄酮-银杏叶提取物-羊藿总黄酮-黄芪总苷。且比例为1∶0.2545∶0.0076∶0.0115。
偏最小二乘(PLSR)是一种多元统计数据处理方法。中药属于复杂体系,复方配伍间各单味药、各组分存在多重相关[30]。偏最小二乘可实现回归建模、利用主成分分析简化数据结构及2组变量间相关分析,对于存在多重相关、模型样本少于自变量的情况较普通回归有明显优势[31]。实现了中药组效关系与药效相关主成分的拟合以及数学模型对药效结果的预测,可以根据预测得到组分的最佳配比。蒋海强等[32]钩藤总碱和莱菔子总碱有效组分的降血压效应为研究对象,以收缩压为指标,对数据进行极差分析、方差分析、多元回归分析和偏最小二乘回归分析,从组分配伍和药效结合层次说明钩藤总碱和莱菔子总碱的化学成分存在交互作用,明确了钩藤总碱和莱菔子总碱组分配伍的合理性,从而提出PLSR分析适用于中药从饮片层次配伍过渡到组分层次配伍的剂量配比优选。
将以上较为成熟的组分中药结构优化实验设计方法结合生物信息学的研究技术、数据挖掘手段,使组分中药结构优化研究更为全面。均匀设计与高通量筛选(uniformdesign-highthroughputscreeningUD-HTS)技术相结合,在中药配比研究中已经初步显示出其优势[33]。金灿等[34]通过均匀设计-高通量筛选(UD-HTS)技术,对丹参多种有效单体成分进行多因素多水平配伍组合样品抗氧化及海马神经细胞保护作用的筛选,得到A13,PA2个抗氧化及海马神经细胞保护作用最佳配伍组合样品,为多因素多水平配比的大规模药物筛选提供借鉴。宋志斌等[35]选取人参皂苷Re,Rb1,Rg1,Rg3和三七皂苷R1等5种皂苷单体6个水平进行均匀设计配伍组合,通过神经细胞血清剥夺损伤模型进行药效高通量筛选,得到的最佳组合样品,再通过小鼠脑缺血再灌注损伤模型相关酶测定,进行药效学评价。结果表明高通量筛选出的5种皂苷3个最佳配伍组合样品对脑缺血再灌注损伤具有保护作用,均匀设计-高通量筛选适用于中药及其复方有效成分大规模药效筛选。除此之外,传统方法结合机器学习进行数学建模也推动了组分结构优化的研究。李晓杰等[36]对大黄有效成分治疗缺血性脑中风的实验数据进行中药组方量效关系的多目标优化研究。采用均匀设计给药配比作为输入向量,药理指标的组内均值作为输出向量,分别使用RBF人工神经网络、支持向量机等方法建立有监督型灰度模型,比较了权重系数法、分式规划法以及改进的一些算法的优化效果,获得了可以权衡考虑各药理指标的全局优化的组方配伍,为中药组方研究及其现代化开发提供了方法学参考。王秀峰等[37]将中药碧血胶囊的4个成分按四因素六水平的均匀设计,对异丙肾上腺素诱导大鼠心肌细胞损伤模型进行了实验干预,通过灰色关联分析其成分配伍方的主次关系,优化了中药碧血胶囊成分配伍的组方。由此可见,生物信息学方法结合成熟的实验设计方法能够为中药复方研究中组方配伍的理论解析提供研究手段,同时也为组分中药结构优化提供新思路。
4生物信息学有助于阐明组分中药多成分、多途径、多靶点的综合作用
随着人们对复杂生物体与药物相互作用的深入认识,系统生物学的相关内容成为生物信息学研究发展的主要推动力。组分中药与生物体均是复杂体系,组分中药与机体的相互作用也具有系统性、整体性、网络性的特点。越来越多证据表明,组分中药通过多成分、多途径、多靶点的综合作用实现改善或恢复生物网络平衡的整体效应[38]。采用生物信息学这一双“解读生命天书的慧眼”来阐述这些问题是一个崭新的视角。
系统生物学作为生物信息学的主要研究对象,其“整体、层次、整合、动态”的特点则更能契合中医药整体性、复杂性[39]。自从“多成分,多途径,多靶点”的药物研究模式诞生以来,基于“疾病-基因-靶点-药物”的网络药理学应运而生[40]。系统生物学、网络药理学不可分割、相互融合,不断深化人们对生物体和药物相互作用的理解[41]。中药多种成分组合配伍所产生的药效是多指标的,利用系统生物学的研究模式构建药理作用网络,比如利用DrugBank数据库[42],HIT(HerbalIngredients′TargetsDatabase)[43],药物-靶点库(drug-targetnetwork)[44],人类疾病库[45]等资源可以揭示中药复方或者组分之间配伍产生的生物活性及其复杂的分子机制。FangH等[46]在研究黄连解毒汤的抗类风湿机制时,通过搜索HIT,DrugBank数据库获得靶标信息,同时提取了FDA批准的对应西药32种,以及它们对应的相关靶标的信息作为黄连解毒汤的对照组。结果发现黄连解毒汤有5个靶蛋白与3类西药的靶蛋白一致,一定程度上解释了该复方的抗类风湿作用。YaoY等[47]利用系统网络药理学的方法以麻黄汤为例,构建药物-靶点-疾病网络模型,从分子水平证实麻黄、桂枝、杏仁、甘草这4味中药在复方中的角色地位,系统的阐明了君臣佐使丰富的科学内涵,对中药复方配伍机理的系统深入研究具有重要意义。吕燕妮等[48]采用系统生物学方法模拟丹参和红花的配伍机制,挖掘丹参、红花各自作用的蛋白,分别构建蛋白相互作用网络,结果显示丹参和红花配伍可能主要在RNA代谢,NF-κB级联反应以及细胞增殖、迁移和自噬等生物学途径上协同发挥防治疾病的作用。
随着组学技术的逐渐成熟,组学技术越来越成为发展系统生物学的关键[49]。利用组学技术对成分复杂的中药复方研究逐渐被认可,也取得一定成果,这给多成分、多组分配伍的中药作用机制研究带来希望[50]。陈竺、陈赛娟院士领导的团队采用蛋白质组学研究手段,较完美地诠释了中药复方黄黛片“君臣佐使”配伍规律,并在一定程度上揭示了其治疗急性早幼粒细胞性白血病多靶点协同作用的机制[51]。马增春等[52]通过前期研究发现了与四物汤补血密切相关的基因构成四物汤补血的信号分子组合。其主要物质基础为多糖、芍药苷、阿魏酸、川芎嗪等,进而应用基因组学技术设计和制备鼠造血相关基因表达谱分析寡核昔酸芯片,并在细胞和整体水平上分析了四物汤可能是通过调节细胞因子,提升正向造血调控因子和免疫因子表达,抑制负向调控因子表达,促进造血调控相关的信号转导因子分泌,影响整个造血调控网络而实现补血、造血作用。向丽等[53]采用代谢组学方法,结合先进的液质联用(LC-Q-TOF/MS)分析技术,系统研究麝香保心丸及其组分配伍对急性心肌梗死(acutemyocardialinfraction,AMI)大鼠长期治疗和预保护作用的机制及多成分协同作用特点;通过代谢组学方法共鉴定了28个相关生物标志物,发现AMI的主要发病机制与色氨酸代谢通路和嘧啶代谢通路的异常相关,并从偏最小二乘判别分析(PLS-DA)的得分图和对生物标志物的逆转个数及程度可以得出组分协同增效的优势。
从系统生物学研究的整体性特征来看,疾病的发生发展是多重因子参与的系统网络失衡的结果。传统中医药的防病治病原则也是从整体生物系统的角度系统调控这种失衡紊乱,将其调至正常水平或范围。组分结构中药继承了中医药整体性和系统性特点,在系统生物学背景下结合网络模型、组学技术来研究组分结构中药的多成分、多靶点的作用,能从宏观、微观的不同角度帮助我们从本质上了解中药的整体、辨证、协调的用药观点,揭示多组分结构中药调控疾病生物网络的机制,对创新发展组分结构中药起着积极的推动作用。
5结论与展望
组分结构中药继承中医药整体性和系统性的特点,具有层次、结构的独特优势,再结合生物信息学的研究内容和相关数据挖掘技术方法,丰富发展了组分结构中药和药效关系的深入解析、配伍配比结构的优化、组分结构中药作用机制等方面,给组分结构中药的数字化、信息化和中医药现代化提供新的契机和希望。随着生物信息学的研究深入,有很多新的技术方法不断更新,复杂的公式和软件的选择应用、跨学科和专业的学习对于中医药的研究人员在借鉴新方法和研究成果方面是一个很大的挑战。除此之外,组分结构中药数据库的建立更有助于生物信息学技术的高效应用,这还需要中医药科研人员的不断努力和相关技术人员的合作。有理由相信,组分结构中药结合生物信息学知识会给中医药研究带来一个新的突破口,会更好的传承、发展和创新中医药研究,使中医药的应用更加科学、标准,推动现代化和国际化进程。
[参考文献]
[1]封亮,张明华,顾俊菲,等.中药物质基础“组分结构”理论的创新与实践[J].中国中药杂志,2013,38(21):3603.
[2]谢腾,王升,马炯,等.生物信息学在中药资源研究中的应用[J].中国中药杂志,2012,37(24):3684.
[3]张召宝,侯林,潘晴,等.中药高通量转录组研究进展[J].中国中药杂志,2014,39(9):1553.
[4]LiuJ,PeiM,ZhengC,etal.Asystems-pharmacologyanalysisofherbalmedicinesusedinhealthimprovementtreatment:predictingpotentialnewdrugsandtargets[J].EvidBasedComplementAlternatMedi,2013,doi:10.1155/2013/938764.
[5]LiuH,WangJ,ZhouW,etal.Systemsapproachesandpolypharmacologyfordrugdiscoveryfromherbalmedicines:anexampleusinglicorice[J].JEthnopharmacol,2013(146):773.
[6]ZhaoZZ,HuY,LiangZT,etal.AuthenticationisfundamentalforstandardizationofChinesemedicines[J].PlantMed,2006(72):865.
[7]陈士林,孙永珍,徐江,等.本草基因组计划研究策略[J].药学学报,2010,45(7):807.
[8]SunC,LiY,WuQ,etal.DenovosequencingandanalysisoftheAmericanginsengroottranscriptomeusingaGSFLXTitaniumplatformtodiscoverputativegenesinvolvedinginsenosidebiosyn-thesis[J].BMCGenomics,2010,11(1):262.
[9]朱英杰.药用植物基因资源的生物信息学研究[D].北京:北京协和医学院,2014.
[10]胡亚楠,任颖龙,曹佳,等.基于药理作用的组分中药药性预测研究[J].中国中药杂志,2014,39(13):2382.
[11]杨明会,马增春,窦永起,等.四物汤对血虚证患者血清蛋白质的影响[J].中国中药杂志,2008,33(4):420.
[12]WangX,LvH,SunH,etal.MetabolicurinaryprofilingofalcoholhepatotoxicityandinterventioneffectsofYinChenHaoTanginratsusingultra-performanceliquidchromatography/electrosprayionizationquadrupletime-of-flightmassspectrometry[J].JPharmBiomedAnal,2008,48(4):1161.
[13]QiaoX,HouT,ZhangW,etal.A3DstructuredatabaseofcomponentsfromChinesetraditionalmedicinalherbs[J].JChemInfComputSci,2002,42(3):481.
[14]XueR,FangZ,ZhangM,etal.TCMID:traditionalChinesemedicineintegrativedatabaseforherbmolecularmechanismanalysis[J].NucleicAcidsRes,2013,41(D1):D1089.
[15]侯恩广,李树彬,李珂,等.基于神经网络的中药黄芩药效评价方法研究[J].山东科学,2011,24(1):72.
[16]陈超,沈志滨.基于RBF神经网络的加味生化汤药效模拟研究[J].中草药,2009,40(8):1239.
[17]魏航,林励,张元,等.灰色系统理论在中药色谱指纹图谱模式识别中的应用研究[J].色谱,2013,31(2):127.
[18]陈跃飞,喻嵘.葶苈大枣桑白皮汤组方的灰关联分析[J].湖南中医药大学学报,2009,29(1):35.
[19]朱诗塔,雷鹏,李新中.掌叶大黄不同炮制品指纹图谱与其止血作用的灰关联度分析[J].中南药学,2009,7(1):55.
[20]许雯雯,王帅,孟宪生,等.神经网络结合灰色关联度法对气滞胃痛颗粒复方药材抗炎活性谱效关系研究[J].中国中药杂志,2013,38(11):1806.
[21]封亮,陈彦,贾晓斌,等.夏枯草属药材指纹特征聚类分析评价[J].中华中医药杂志,2009,24(9):1216.
[22]孙雪飞,张鸿雁,夏青,等.藏药余甘子药材及其鞣质部位的指纹图谱评价研究[J].中国中药杂志,2014,39(7):1173.
[23]邓书鸿,聂磊.中药谱效关系的分析方法及数据处理技术研究进展[J].中药材,2010,33(11):1819.
[24]商洪才,张伯礼,王永炎,等.一种适用于中药小复方配比优选设计方法的建立[J].中国实验方剂学杂志,2003,9(3):1.
[25]顾俊菲,封亮,袁嘉瑞,等.赤芍总苷、川芎总酚酸组分组成结构对缺氧损伤人脐静脉内皮细胞的影响[J].中国中药杂志,2015,40(5):920.
[26]赵海平,康林之,任刚,等.基于红管药祛痰止咳有效组分的最佳配比研究[J].中国实验方剂学杂志,2013,19(3):163.
[27]FangKT,DennisKJ.Uniformdesign-theapplicationofthenumbertheorymethodinexperimentaldesign[J].ActaMathApplSin,1980,3(4):363.
[28]陈倩,杨长福,韦佳,等.均匀设计法优化小半夏加茯苓汤效用组分配比实验研究[J].中国民族民间医药,2015,5(7):7.
[29]杨鸿,吴彦,马琰岩,等.具抗氧化活性的中药有效组分的配伍研究[J].中国中药杂志,2012,37(12):1826.
[30]唐启义,唐洁.偏最小二乘回归分析在均匀设计试验建模分析中的应用[J].数理统计与管理,2005,25(5):45.
[31]CallejaP,Estévez-FernándezA,BormP,etal.Jobscheduling,cooperation,andcontrol[J].OperResLett,2006(34):22.
[32]蒋海强,聂磊,周洪雷,等.基于偏最小二乘回归分析的钩藤总碱和莱菔子总碱组分配伍优化研究[J].中草药,2012,44(18):2531.
[33]张丹参,张天泰,杜冠华.均匀设计-高通量筛选技术在中药丹参多成分配比研究中的应用[J].中国药学杂志,2009,44(14):1048.
[34]金灿,张丹参.应用均匀设计-高通量筛选技术评价丹参有效单体成分抗氧化及海马神经细胞保护作用的最佳配伍[J].神经药理学报,2013,3(3):8.
[35]宋志斌,张丹参.人参皂苷和三七皂苷五种成分神经保护作用的均匀设计-高通量筛选研究[J].神经药理学报,2011,1(3):7.
[36]李晓杰.中药组方量效关系的多目标优化研究[D].广州:广东药学院,2014.
[37]王秀峰,刘新军,孙继佳,等.基于均匀设计与灰色关联分析的中药碧血胶囊成分配伍组方研究[J].中华中医药杂志,2012,27(4):1189.
[38]陈娟,顾俊菲,汪春飞,等.组分结构中药与网络药理学:病理机制网络的系统整体调控[J].中国中药杂志,2015,40(4):758.
[39]TianP.Convergence:whereWestmeetsEast[J].Nature,2011,480(7378):S84.
[40]workpharmacology:thenextparadigmindrugdiscovery[J].NatChemBiol,2008,4(11):682.
[41]XiaoyanAQu,DeepakKRajpal.Applicationsofconnectivitymapindrugdiscoveryanddevelopment[J].DrugDiscovToday,2012,17(22):1289.
[42]WishartDS,KnoxC,GuoAC,etal.DrugBank:aknowledgebasefordrugs,drugactionsanddrugtargets[J].NucleicAcidsRes,2008,36(50):D901.
[43]YeH,YeL,KangH,etal.HIT:linkingherbalactiveingredientstotargets[J].NucleicAcidsRes,2011,39(Suppl1):D1055.
[44]YildirimMA,GohKI,CusickME,etal.Drug-targetnetwork[J].NatBiotechnol,2007,25(48):1119.
[45]GohKI,GusickME,ValleD,etal.Thehumandiseasenetwork[J].ProcNatlAcadSciUSA,2007(104):8685.
[46]FangH,WangY,YangT,etal.BioinformaticsanalysisfortheantirheumaticeffectsofHuang-Lian-Jie-Du-Tangfromanetworkperspective[J].EvidBasedComplementAlternatMed,2013(13):245.
[47]YaoY,ZhangX,WangZ,etal.DecipheringthecombinationprinciplesoftraditionalChinesemedicinefromasystemspharmacologyperspectivebasedonMa-huangdecoction[J].JEthnopharmacol,2013(150):619.
[48]吕燕妮,付龙生,魏筱华,等.丹参与红花配伍机制的系统生物学分析[J].中国实验方剂学杂志,2015,21(5):220.
[49]BurianiA,Garcia-BermejoML,BosisioE,etal.OmictechniquesinsystemsbiologyapproachestotraditionalChinesemedicineresearch:presentandfuture[J].JEthnopharmacol,2012(140):535.
[50]Ulrich-MerzenichG,ZeitlerH,JobstD,etal.Applicationoftheomic-technologiesinphytomedicine[J].Phytomedicine,2007(14):70.
生物医学与计算机科学的双重人才
随着科学向综合性发展和大数据时代到来,各种交叉学科不断形成,生物医学信息学就是其中之一。
作为北京大学生物学系毕业的高材生,刘雷从一开始就选择了遗传学。后来,从中国科学院发育生物学研究所的硕士到美国康涅狄格大学分子与细胞生物学系的博士,刘雷在专业上日益精进,不断获得突破。当时,康涅狄格大学有一位生物系的老师,热衷研究分子进化,刘雷在他的影响下,对生物信息学产生了浓厚的兴趣。90年代,人类基因组计划正在轰轰烈烈地开展,生物信息学从中孕育而生。然而,生物信息学是一门交叉学科,融合了生物技术与计算机科学,这类复合型人才奇缺。刘雷抓住了这一契机,不顾别人疑惑的目光,毅然选择了到康涅狄格大学计算机系做博士后,从此成为兼备生物学与计算机技术的复合型人才。
1999年,博士后结束,由于刘雷既懂计算机又懂生物学,受聘于美国伊利诺伊大学香槟分校生物技术中心,组建生物信息学实验室并担任主任。在这里,刘雷进行服务器基础设施建设、基因组数据序列分析,还开课讲授生物信息的一些课程,各项工作顺利进行,成果迭出。“交叉学科存在语言的问题,你要听懂学计算机的人在说什么,也要听懂学生物的人在说什么。”在这种情况下,刘雷的双重学科背景为团队的沟通交流提供了便利,他一方面将生物学的问题转化成计算机的问题开展工作,一方面将计算机专用的算法与结果解释给生物学家们听,成为了不同学科之间沟通对话的桥梁。
为了适应交叉学科对不同专业人才的需求,生物信息学实验室招纳了计算机领域、生物领域、数学领域等不同领域的人才。刘雷在组建实验室的过程中对整个生物信息领域有了更加深切的了解,冥冥之中为他回国开展相关工作奠定了坚实的基础。
助力我国生物医学信息技术
2002年,上海生物信息技术研究中心成立,研究中心的两位负责人在去美国访问期间,与刘雷一见如故。应他们的邀请,刘雷从2003年开始担任上海生物信息技术研究中心客座研究员,逐渐与国内生物信息研究领域建立起广泛的交流和沟通。2007年,刘雷入选中科院“百人计划”正式回国,任中科院上海生命科学研究院系统生物学重点实验室研究员、上海生物信息技术研究中心副主任,用所学知识报效祖国。
面对数量大、内容层次复杂的医学证据,要想从中全面、系统、快速的获取最佳的医学知识和证据,就必须借助计算机巨大的存储和处理信息的能力。上世纪90年代之后,医疗信息化成为改进医疗服务质量、提高服务效率、把医疗卫生服务成本控制在民众可接受水平的主要技术手段。2010年,刘雷申请主持了国家高技术研究发展计划(“863”计划)项目“数字化医疗工程技术开发”中的第二课题“医学知识库与临床决策支持系统研发”,旨在为临床提供更为便捷和随需而得的医学知识和证据获取途径,促进医疗水平的提高。
在这一科研项目中,刘雷带领团队围绕医学知识库的构建和临床决策知识系统的研发,开展了医学知识库构建技术研究、数字化临床指南知识库与决策支持系统研发、数字化临床路径实现技术与应用模式研究、智能化合理用药系统研发、以及数字化人体仿真建模与辅助诊疗技术研究。
刘雷说:“现在医疗电子化程度已经很高了,有电子病例等各种系统,但是这些数据都是分散的,相互之间并不联通。我们想要建立一个数据中心,将分散的数据集中在一起,并整理成体系,以利于数据挖掘。”基于此,刘雷与团队研发了数字化临床指南知识库与决策支持系统。“当医生遇到一个难题,计算机的决策支持系统会将相关知识推送给他,省去了医生查阅文献的时间。”而对基层医生,知识库提供了一个医疗指南,“比如遇到高血压病人,系统会给基层医生提示,显示该做什么检查、开什么药,来辅助临床治疗”。
刘雷认为,数字化医疗不但在医学信息化、生物信息的发展过程中会起到重要作用,而且对构建和谐医患关系也大有裨益。“医患关系最大的问题是信息不对称。患者知道的很少,医生知道的很多,患者听不懂医生所说的专业术语。那么这时候还是沟通的问题,大家有误会就会造成医患关系紧张。”在刘雷看来,医学知识库和临床决策支持系统在给医生提供服务的同时,也应该给患者提供服务,要将医学知识库的知识进一步变得通俗易懂,让患者能够清楚了解。
曾经有医生不理解刘雷,“你们的工作难道要取代医生吗?”,他们认为,对患者解释医学知识只会浪费时间。刘雷解释说,“我是在帮你们,也是在帮助患者,让你们更好地沟通。只有这样工作才能更顺畅”。那么,如何让知识库更好地为患者服务呢?刘雷设想,现在中国的病人太多,排队等候时间很长,可以将患者排队等候的时间利用起来,将一些知识推送给患者,这样一来,患者对病况有所了解之后,再和医生沟通起来就会容易很多。
像马儿一样驰骋
如今,回国已有8年,刘雷说:“我做了正确的选择。”他目睹了2008年的北京奥运会,见证了2010年的上海世博会,中国大地上的一派欣欣向荣之景令他倍受鼓舞。“在国内,我有自己的实验室,承担大数据项目、‘863’项目,最近又在做精准医疗。这让我站得更高,看得更远。”
精准医疗是个性化医疗的延伸,将促使医学进入智能时代,产生颠覆式医学创新。刘雷说,他不久前刚去天津做了题为“生物医学信息――从大数据到精准医疗”的报告,精准医疗研究已经成为各国科研和医疗机构以及企业界高度关注和大力投入的重要研究领域。据刘雷介绍,精准医疗是一个很庞大的项目,一是要做生物信息数据分析总结,二是做临床数据信息的采集分析,三是软件和产品的开发。最终,要实现从临床数据到样本、到分析、再到知识库和临床决策支持系统的整合。
[Abstract]Traditional Chinese medicine (TCM) has contributad greatly to improving human health However, the biological characteristics and molecular mechanisms of TCM in the treatment of human diseases remain largely unknown Genomics plays an important role in modern medicine and biology Here, we introduce genomics and other related omics to the study of herbs to propose a new discipline, Herbgenomics, that aims to uncover the genetic information and regulatory networks of herbs and to clarify their molecular mechanisms in the prevention and treatment of human diseases Herbgenomics includes herbal structural genomics, functional genomics, transcriptomics, proteomics, metabonomics, epigenomics and metagenomics Genomic information, together with transcriptomic, proteomic, and metabolomic data, can therefore be used to predict secondary metabolite biosynthetic pathways and their regulation, triggering a revolution in discoverybased research aimed at understanding the genetics and biology of herbs Herbgenomics provides an effective platform to support chemical and biological analyses of complex herbal products that may contain more than one active component Herbgenomics is now being applied to many areas of herb related biological research to help understand the quality of traditional medicines and for molecular herb identification through the establishment of an herbal gene bank Moreover, functional genomics can contribute to model herb research platforms, geoherbal research, genomicsassisted herb breeding, and herbal synthetic biology, all of which are important for securing the future of medicinal plants and their active compounds In addition, Herbgenomics will facilitate the elucidation of the targets and mechanism of herbs in disease treatment and provide support for personalized precise medicineHerbgenomics will accelerate the application of cuttingedge technologies in herbal research and provide an unprecedented opportunity to revolutionize the use and acceptance of traditional herbal medicines
[Key words]Herbgenomics; genomics; omics; traditional Chinese medicine (TCM)
doi:10.4268/cjcmm20162101
本草基因组学(herbgenomics)是利用组学技术研究中药基原物种的遗传信息及其调控网络,阐明中药防治人类疾病分子机制的学科,从基因组水平研究中药及其对人体作用的前沿科学。涉及中草药结构基因组、中草药转录组、中草药功能基因组、中草药蛋白质组、中药代谢组、中草药表观基因组、中草药宏基因组、药用模式生物、基因组辅助分子育种、DNA鉴定、中药合成生物学、中药基因组学、中草药生物信息学及数据库等理论与实验技术。
传统药物应用历史悠久,应用方式多样,相关研究主要集中在形态识别、化学物质基础揭示、药效作用分析、资源调查、人工栽培等方面,但长期以来对传统药物基因资源的认识和了解十分薄弱,人才极其匮乏。由于中药原植物基因组信息缺乏,中医药学和现代生命科学之间缺乏沟通的桥梁,新兴的前沿生命科学技术很难应用于传统中医药研究,如对于中药道地性形成和维持的遗传机制及道地性和药性的相互关系缺乏深入了解,已严重影响了我国道地药材的资源保护和新品种选育,中药道地性形成和维持的遗传基础研究急需加强;中药药性的生物学本质研究亟待加强,多年来中药药性研究主要集中在化学和药理方向,但对于中药药性的生物学本质研究还非常薄弱,已从根本上制约了对中药药性的深入研究;中药基因资源是一种珍贵的国家战略资源,国际竞争严峻,韩国、美国、日本等国家已启动许多中药基原物种全基因组研究,对我国传统中药研究领域造成极大挑战。另外,由于大多数药用植物有效成分含量低,分离提取需要消耗大量原料,对天然资源造成极大破坏,也使得多数提取类药物的生产成本很高。
本草基因组学作为新兴学科,广义而言是从基因组水平研究中药及其对人体作用。一方面从基因组水平研究基因序列的多态性与药物效应多样性之间的关系,研究基因及其突变体对不同个体药物作用效应差异的影响,从蛋白质组学角度研究中药作用靶点,特别是中药复方的多靶点效应,为中药配伍提供科学依据,指导药物开发及合理用药,为实现个体化精准医疗提供重要信息和技术保障;另一方面建立含有重要活性成分的中药原植物基因组研究体系,系统发掘中药活性成分合成及优良农艺性状相关基因,解析代谢物的合成途径、代谢物网络及调控机理,为中药道地品种改良和基因资源保护奠定基础,为中药药性研究提供理论基础,对传统药物学理论研究和应用具有重要意义,从基因组层面阐释中药道地性的分子基础,推动中药创新药物研发,为次生代谢产物的生物合成和代谢工程提供技术支撑,创新天然药物研发方式,为优质高产药用植物品种选育奠定坚实基础,推动中药农业的科学发展,对揭示天然药物形成的生物学本质具有重要价值,对培养多学科人才充实到传统药物研究具有引领作用。狭义而言本草基因组学集中研究中草药本身的遗传信息,不涉及对人体的作用。也就是说狭义本草基因组学主要研究中草药结构基因组、转录组、功能基因组、蛋白质组、代谢组、表观基因组、宏基因组,以揭示中药道地性和中药药性的遗传本质。本草基因组学正促进前沿生命科学技术应用到中药领域,推动中药研究迅速走到生命科学的最前沿。
1 本草基因组学的产生和发展
1.1 本草基因组学的产生 从“神农尝百草,一日而遇七十毒”的传说到现存最早的中药学著作《神农本草经》(又称《本草经》),从世界上现存最早的国家药典《新修本草》(即《唐本草》)到本草学巨著《本草纲目》,两千多年来,中药学的发展反映了我国劳动人民在寻找天然药物、利用天然药物方面积累了丰富经验。中药学是中国医药学的伟大宝库,对世界医药学发展作出了巨大贡献。随着现代科学技术的发展,特别是人类基因组计划(Human Genome Project)的提出和完成,对人类疾病的认识和治疗开启了全新的篇章,在此背景下,中药学研究逐渐深入到基因组水平从而导致本草基因组学产生和兴起。
1977年Sanger完成首个物种全基因组测序,噬菌体φX174基因组,大小为5.836 kb[1];人类基因组计划由美国科学家于1985年率先提出,1990年正式启动,2000年完成,是一项规模宏大,跨国跨学科的科学探索工程,其宗旨在于测定组成人类染色体(指单倍体)中所包含的30亿个碱基对组成的核苷酸序列,从而绘制人类基因组图谱,并且辨识其载有的基因及其序列,达到破译人类遗传信息的最终目的[2-3]。2000年,破译拟南芥Arabidopsis thaliana全基因组,大小为125 Mb,作为第一个植物全基因组测序在植物科学史上具有里程碑意义[4]。我国药用植物有11 146种,约占中药材资源总数的87%[5],是所有经济植物中最多的一类。同时,药用植物也是S多化学药物的重要原料,目前1/3以上的临床用药来源于植物提取物或其衍生物,其中最著名的青蒿素来源植物是黄花蒿。
中国学者应用光学图谱和新一代测序技术,完成染色体水平的灵芝基因组精细图绘制,通过基因组解析提出灵芝为首个中药基原的药用模式真菌,文章发表在《自然通讯》上,期刊编辑部以特别图片(featured image)形式进行了推介(图1)[6],认为该论文表明灵芝对于研究传统菌类中药的次生代谢途径及其调控是一个有价值的模式系统。灵芝基因组图谱的公布为开展灵芝三萜等有效成分的合成研究提供了便利,随着这些合成途径的逐步解析,使得通过合成生物学合成灵芝有效成分成为可能。同时,对灵芝生长发育和抗病抗逆关键基因的发掘和认知,将推动灵芝的基因组辅助育种研究,加速灵芝新品种的培育,并为灵芝的科学栽培和采收提供理论指导。
2009年,陈士林团队提出本草基因组计划,即针对具有重大经济价值和典型次生代谢途径的药用植物进行的全基因组测序和后基因组学研究,全基因组测序、组装和分析策略:测序物种的筛选原则,待测物种基因组预分析,测序平台的选择,遗传图谱和物理图谱的绘制,全基因组的组装及生物信息学分析;模式药用植物突变体库的建立和基因功能研究;药用植物有效成分的合成及其调控研究;药用植物抗病抗逆等优良性状的遗传机制研究及优良品种选育。在此基础上,详细介绍了本草基因组方法学研究:全面介绍物种基因组大小、染色体数目测定方法、第二代高通量测序方法、全基因组组装和基因组注释方法、基因组比较等生物信息学分析手段、简要阐述重测序在药用植物全基因组研究中的应用方法。由此,本草基因组学逐渐形成和完善,包括中草药结构基因组、转录组、功能基因组、蛋白质组学、代谢组、表观基因组、宏基因组、基因组辅助分子育种、中药合成生物学、中药基因组学、中草药生物信息学及数据库等内容。基于分子生物学和基因组学的药用植物鉴别是当前研究的活跃领域,用于鉴别的分子生物学和基因组学技术:AFLP、RFLP、RAPD、DNA微阵列技术(microarray)、DNA条形码(barcoding)等,基于基因组鉴别的分子基础是植物分子系统发育关系反映物种进化关系。在这些技术当中,药用植物DNA条形码鉴定策略及关键技术是最受关注的方向,中药材DNA条形码分子鉴定指导原则已列入《中国药典》2010年版增补本Ⅲ和《中国药典》2015年版。
1.2 本草基因组学的发展 2015年国际期刊《科学》增刊详述“本草基因组解读传统药物的生物学机制”,提出本草基因组学为药用模式生物、道地药材研究、基因组辅助育种、中药合成生物学、DNA鉴定、基因数据库构建等提供理论基础和技术支撑(图2)。目前,药用植物基因组学与生物信息学已经进入快速发展阶段,必将对传统药物学产生巨大影响。国内外已经开展青蒿[7]、丹参[8-15]、西洋参[16]、甘草[17]等多种药用植物的大规模转录组研究。基因组序列包含生物的起源、进化、发育、生理以及与遗传性状有关的一切信息,是从分子水平上全面解析各种生命现象的前提和基础。第二代高通量测序技术的飞速发展及第三代单分子测序技术的兴起使测序成本大大降低,测序时间大大缩短,为本草基因组计划的实施奠定了坚实的技术基础。目前,赤芝[6]、紫芝[18]、丹参[19]及铁皮石斛[20-21]等重要药用植物的基因组已完成测序工作并发表,人参、苦荞、穿心莲、紫苏等中草药基因组图谱也完成绘制。
例如为了解析丹参的遗传背景,陈士林团队联合国内外著名高校和研究机构,通过联合测序技术完成了丹参基因组图谱的组装,丹参基因组的完成代表着首个鼠尾草属物种基因组图谱的成功绘制。进化分析显示丹参与芝麻亲缘关系更近,估计其分化时间约6 700万年前。丹参基因组的发表推动首个药用模式植物研究体系的确立。本草基因组学将开辟中药研究和应用的全新领域,把握历史性机遇,将极大提高我国开发中药资源的能力,增强我国中药基础研究实力、提高我国中药研究的自主创新能力,对于加速中药现代化进程具有重大的战略性科学意义,促进中药研究和产业的快速发展[22]。本草基因组学将使中草药生物学研究进入一个崭新的时代――本草基因组时代。
1.3 学科内涵和外延 根据本草基因组学产生和发展过程,主要从3个方面确定学科的内涵,即理论体系、实验技术和应用方向(图3)。本草基因组学形成了高度综合的理论体系,包括从基因组水平研究本草的九大内容:中草药结构基因组、中草药功能基因组、中草药转录组和蛋白质组、中药代谢组、中草药表观基因组、中草药宏基因组、中药合成生物学、中药基因组学、中草药生物信息学等。本草基因组学的实验方法主要包括九大技术:高通量测序技术、遗传图谱构建技术、光学图谱构建技术、基因文库构建技术、突变库构建技术、组织培养与遗传转化、蛋白质分离纯化与鉴定技术、四大波谱技术及联用、基因组编辑技术等。基于本草基因组学的理论体系和实验技术,形成了该学科的七大应用方向:药用模式生物研究、阐明道地药材形成机制、基因组辅助育种、基因资源保护和利用、中药质量评价和控制、中药新药研发、指导相关学科研究。
本草基因组学的学科外延与本草学、中药学、基因组学、生物信息学、分子生物学、生物化学、生药学、中药资源学、中药鉴定学、中药栽培学、中药药理学、中药化学等密切相关(图4)。本草学和中药学为本草基因组学奠定了深厚的历史基础和人文基础,为本草基因组学研究对象的确定提供丰富候选材料,基因组学和生物信息学为本草基因组学提供前沿理论和技术支撑,分子生物学、生物化学、中药化学则为本草基因组学提供基础理论和基本实验技术支持,生药学、中药资源学、中药鉴定学、中药栽培学与本草基因组学互相支撑发展,各学科的侧重点不同,中药药理学、中药化学为本草基因组学的应用提供技术支持。与以上各学科相呼应,本草基因组学促进本草学和中药学从经典走向现代、从传统走向前沿,为中医药更好服务大众健康提供强大知识和技术支撑,扩大了基因组学和生物信息学的研究对象和应用领域,为分子生物学、生物化学、中药化学走向实践应用提供了生动案例,推动生药学、中药资源学、中药鉴定学、中药栽培学从基因组和分子水平开展研究,为中药药理学的深入研究提供理论和技术支持。
2 本草基因组学研究热
本草基因组学借助基因组学研究最新成果,开展中草药结构基因组、中草药功能基因组、中草药转录组和蛋白质组、中草药表观基因组、中草药宏基因组、中药合成生物学、中药代谢组、中药基因组学、中草药生物信息学及数据库等理论研究,同时对基因组研究相关实验技术在本草学中的应用与开发进行评价,推动本草生物学本质的揭示,促进遗传资源、化学质量、药物疗效相互关系的认识,以下详细阐述本草基因组学的研究内容。
2.1 中草药结构基因组研究 我国药用资源种类繁多,因此药用物种全基因组计划测序物种的选择应该综合考虑物种的经济价值和科学意义,并按照基因组从小到大、从简单到复杂的顺序进行测序研究。在测序平台的选择上应以第二代及第三代高通量测序平台为主,以第一代测序技术为辅。近年来,紫芝、赤芝、茯苓、丹参、人参、三七等10余种药用植物被筛选作为本草基因组计划的第一批测序物种,其中赤芝结构基因组发表被《今日美国》(USA Today)以“揭秘中国‘仙草’基因组”为题报道(图5),丹参基因组小(约600 Mb)、生长周期短、组织培养和遗传转化体系成熟等原因,被认为是研究中药活性成分生物合成理想的模式植物[23]。丹参全基因组测序完成已推动丹参作为第一个药用模式植物研究体系形成。
由于多数药用植物都缺乏系统的分子遗传学研究,因此在开展全基因组计划之前进行基因组预分析非常必要。基因组预分析的主要内容包括:①利用条形码等技术对满足筛选原则的待测物种进行鉴定[24-25];②通过观察有丝分裂中期染色体确定待测物种的染色体倍性和条数;③采用流式细胞术[26]或脉冲场电泳技术估测物种的基因组大小,为测序平台的选择提供参考;④基因组Survey测序,在大规模全基因组深度测序之前,首先对所选药用植物进行低覆盖度的Survey测序,用来评价其基因组大小、复杂度、重复序列、GC含量等信息。
遗传图谱和物理图谱在植物复杂的大基因组组装中具有重要作用。借助于遗传图谱或物理图谱中的分子标记,可将测序拼接产生的scaffolds按顺序定位到染色w上。但遗传图谱的构建需要遗传关系明确的亲本和子代株系,因此其在大多数药用植物中的应用受到限制。物理图谱描绘DNA上可以识别的标记位置和相互之间的距离(碱基数目)。最初的物理图谱绘制多是基于BAC文库,通过限制性酶切指纹图谱、荧光原位杂交等技术将BAC克隆按其在染色体上的顺序排列,不间断地覆盖到染色体上的一段区域[27]。如今,光学图谱OpGen[28]和单分子光学图谱BioNano等[29]依赖于大分子DNA酶切标记的方法常用于物理图谱的绘制。
随着第二代测序技术的快速发展,用于短序列拼接的生物信息学软件大量涌现,常用软件包括Velvet[30], Euler[31], SOAPdenovo2[32], CAP3[33]等。基因组草图组装完成后,可利用生物信息学方法对基因组进行分析和注释,为后续功能基因组研究提供丰富的资源。例如,可以通过GeneScan[34], FgeneSH[35]等工具发现和预测基因,利用BLAST同源序列比对或InterProScan[36]结构域搜索等方法对基因进行注释,利用GO分析对基因进行功能分类[37],利用KEGG对代谢途径进行分析等[38]。
2.2 中草药功能基因组研究 根据全基因组序列和结构信息,中草药功能基因组研究充分利用转录组学、蛋白组学、代谢组学等方法,对药用植物的功能基因进行发掘和鉴定,研究内容主要集中于构建模式药用植物平台、次生代谢产物合成途径和调控机制的解析、抗病抗逆等优良农艺性状遗传机制的揭示等。
拟南芥、水稻等重要模式植物均具有大规模的T-DNA 插入突变体库,利用这些突变体库发掘了大量生长发育、抗逆性、代谢相关的重要基因。丹参等模式药用植物全基因组序列和大规模突变体库的建立将为药用植物研究提供丰富的资源和材料,从而推动药用植物功能基因研究, 尤其是次生代谢途径相关基因的鉴定进程,突变体库中的一些具有抗逆、抗病、高产等优良性状的突变株系以及转基因植株也是良好的新种质资源。药用植物有效成分的生物合成途径和调控方面的研究还很薄弱,主要集中在长春花、青蒿和甘草等少数物种,一些具有重大商业价值的天然药物,如紫杉醇、长春碱、喜树碱等生物合成途径至今还未被完全解析,已有报道多采用单基因研究策略。本草基因组学为次生代谢途径相关基因的“批量化”发掘奠定基础,对次生代谢产物的生物合成及代谢工程等应用领域产生重要影响。
与生长发育、抗逆抗病、重要遗传性状及种质性状控制相关的基因是药用植物重要的功能基因,利用基因组注释信息,发掘优良基因,运用基因工程的手段打破生殖隔离,培育活性成分含量高的具有优良农艺性状的新品种,为活性成分的大量提取和广泛临床应用奠定基础[39]。中草药结构基因组将为转录组分析和基因组重测序研究提供参考序列,通过对种内或品种间种群个体的转录组测序和重测序可快速、准确、大规模地发现SNP,SSR,InDel等分子标记,加速分子标记和优良性状的遗传连锁研究,快速发现药用植物的表型、生理特征与基因型的关系,提高育种工作效率[39]。
2.3 中药组学其他研究 中草药转录组学是中草药功能基因组学的重要研究内容,是在整体水平上研究中草药某一生长阶段特定组织或细胞中全部转录本的种类、结构和功能以及基因转录调控规律的科学。中草药转录组研究为鉴定中草药植物生长发育及抗病抗逆等优良性状相关的基因功能提供基础[40-41]。目前,在多数中草药植物无法进行全基因组测序的情况下,转录表达谱研究成为比较基因序列、鉴定基因表达的一种快速方法。通过对中草药不同组织部位、不同生长时期、不同生长环境下的转录组进行比较分析,可有效发掘参与中草药植物生长发育及抗病抗逆等优良性状相关基因。
中药蛋白质组学是将蛋白质组学技术应用于中药研究领域,一方面通过比较对照细胞或动物组织的蛋白质表达谱和给予中药后蛋白质表达谱的差异,可找到中药的可能靶点相关蛋白质,另一方面不同中草药及其不同组分例如根茎叶中蛋白质组的差异,以评价中草药活性成分与其生长过程中蛋白组变化的关系,寻找中药高活性的机制。不同于其他蛋白质组学,中药蛋白质组学的研究对象为中草药本身及用中药(单体化合物、中药组份或复方)处理后的生物体(细胞或组织),发现中药的有效成分及作用机制。中药蛋白质组学的研究目标包括:中药药物作用靶点的发现和确认,特别是中药复方的多靶点效应,蛋白质组学能更好发现中药复方的多种靶点,研究中药植物蛋白质组成差异,阐明中药作用机制及中药毒理作用机制,以及为中药配伍提供科学依据。
中药代谢组学结合中草药结构基因组解析代谢物的合成途径、代谢物网络及调控机理,研究内容主要包括药用植物的鉴别和质量评价,药用植物品种选育及抗逆研究,初生、次生代谢途径解析,代谢网络、代谢工程研究及合成生物学研究等几个方面,最终为药用植物品种选育、创新药物研发和质量安全性评价奠定基础。
中药基因组学从基因水平研究基因序列的多态性与药物效应多样性之间的关系,研究基因及其突变体对不同个体药物作用效应差异的影响,以此平台指导药物开发及合理用药,为提高药物的安全性和有效性,避免不良反应,减少药物治疗费用和风险,实现个体化精准医疗提供重要信息和技术保障。例如,Sertel等[42]经基因检测得出53/56的基因上游位置包含一个或多个c-Myc/Max结合位点,c-Myc和Max介导的转录控制基因表达可能有助于提高青蒿琥酯对癌细胞的治疗效果[43]。又如,银杏具有显著的诱导CYP2C19活性效应,研究显示不同CYP2C19基因型个体,银杏与奥美拉唑(omeprazole,广泛使用的CYP2C19底物)存在潜在的中西药互作关系。Chen等 [44]研究了健康志愿者体内六味地黄丸潜在的中-西药相互作用以及是否受基因型影响。
中草药表观基因学是针对本草基因组计划中具有重要经济价值的药用植物和代表不同次生代谢途径的模式药用植物开展表观基因组学研究。研究内容主要包含4个领域:分别是DNA甲基化、蛋白质共价修、染色质重塑、非编码RNA调控。中草药表观基因组学将通过研究重要中药材(药用生物)的基因组信息及其表观遗传信息变化,探索环境与基因、基因与基因的相互作用,解析哪些基因受到环境因素的影响而出现表观遗传变化可能提高中药材的药效品质,哪些表观遗传信息影响中药的性味等。
中草药宏基因组学是以多种微生物基因组为研究对象,对药材生长环境中微生物的多样性、种群结构、进化关系、功能活性以及微生物与药材生长相互协作关系进行研究的一门学科,对于帮助解决中草药连作障碍等现实问题具有重要指导作用。
药用模式生物研究体系的确立是本草基因组学的重大贡献,该体系具有模式生物的共同特征。从一般生物学属性上看,通常具有世代周期较短、子代多,表型稳定等特征。从遗传资源看,基因组相对较小,易于进行全基因组测序,遗传转化相对容易。从药用特点看,需适于次生代谢产物生物合成和生产研究。
3 本草基因组学的实践应用
本草基因组学作为前沿科学,具有很强的理论性,同时该学科涉及的技术方法和理论对中医药实践具有巨大的指导意义。例如,基于中草药结构基因组开发的DNA条形码分子鉴定技术被国际期刊《生物技术前沿》以题为“草药鉴定从形态到DNA的文艺复兴”发表,将给传统中药鉴定带来革命性影响;基于中草药功能基因组和表观基因组研究阐明道地药材的形成机制,将对优质中药生产和栽培技术的改进提供指导;基于本草基因组学构建的基因数据库、代谢物数据库、蛋白数据库等,以及开发的相关生物信息学方法,将为中药药理学、中药化学、新药开发等提供战略资源;基于合成生物学技术实现目标产物的异源生产,具有环境友好、低耗能、低排放等优点,将为天然药物研发提供全新方式。
3.1 道地药材的生物学本质研究 道地药材是优质药材的代表,既受遗传因素的控制,又受环境条件的影响。组学技术可提供有用工具阐明道地药材的分子机制,例如,道地药材“沙漠人参”肉苁蓉Cistanche deserticola是中国最具特色的干旱区濒危药用植物和关键物种,新疆和内蒙古是其重要主产区和传统道地产区,研究表明,内蒙古阿拉善和新疆北疆是肉苁蓉两大生态适宜生产集中区(2类生态型),黄林芳等[45]对两大产区肉苁蓉化学成分、分子地理标识及生态因子进行考察。应用UPLC-Q-TOF/MS技术对肉苁蓉苯乙醇苷及环烯醚萜苷类成分进行分析;基于psbA-trnH序列对不同产地肉苁蓉进行分子鉴别及分析;通过“中国气象科学数据共享服务网”,获得两大产区包括温度、水分、光照等生态因子数据;运用生物统计、数量分类等分析方法,对肉苁蓉进行生态型划分。UPLC-Q-TOF/MS分析表明,内蒙古与新疆产肉苁蓉明显不同,鉴定出16种成分,其中2′-乙酰毛蕊花糖苷可作为区分两大产地肉苁蓉的指标成分;psbA-trnH序列比对分析发现,肉苁蓉不同产地间序列位点存在差异,新疆产肉苁蓉在191位点为G,内蒙古产则为A,NJ tree分析表明,肉苁蓉2个产地明显分为2支,差异显著;生态因子数据亦表明,肉苁蓉的两大气候地理分布格局,为研究不同生态区域中药生态型及品质变异的生物学本质提供了一种新思路,也为深化道地药材理论研究奠定重要基础。
另外,针对同一药材在不同种植区域,开展中草药表观基因组研究,明确不同生产区域的遗传变异,特别是环境不同对药材表观遗传的修饰作用,包括DNA甲基化修饰、小RNA测序分析、染色质免疫共沉淀分析等。此外,土壤微生物也是道地药材生长环境中的重要因素。采用宏基因组分析土壤微生物群落,为揭示土壤微生物和药材生长的相互作用提供依据。
3.2 中药分子标记用于中药质量控制研究 本草基因组和功能基因组研究为开发药材分子标记提供了丰富基因资源。基于基因组的分子标记有AFLP, ISSR, SNP等,基于转录组的分子标记有SSR等。当前国际上最受关注的分子标记是DNA条形码,已经构建标准操作流程和数据库、鉴定软件,可广泛应用于中药企业、药房、研究院所和大专院校等。中药材DNA条形码分子鉴定指导原则已被纳入《中国药典》,植物药材以ITS2序列为主、psbA-trnH为辅助序列,动物药材以COI序列为主、ITS2为辅助序列,在此基础上,进一步开发了质体基因组作为超级条形码对近缘物种或栽培品种进行鉴定。该体系可广泛应用于中药材种子种苗、中药材、中药超微破壁饮片、中成药等鉴定,已出版专著《中国药典中药材DNA条形码标准序列》和《中药DNA条形码分子鉴定》。
3.3 本草基因资源的保护与利用 随着本草基因组研究的发展,本草遗传信息快速增加,灵芝基因组论文被Nature China网站选为中国最佳研究(图6),迫切需要一个通用平台整合所有组学数据。数个草药数据库已经被建立,例如草药基因组数据库(http://)、转录组数据库(http://medicinalplantgenomics.msu.edu)、草药DNA条形码数据库(http:///en)、代谢途径数据库(http://)等。但是这些数据库缺乏长期维护,对使用者要求具备一定生物信息学技能。因此整合DNA和蛋白质序列、代谢组成分信息,方便使用的大数据库十分必要和迫切。进一步提升生物信息分析方法,更好地利用基因组和化学组信息解析次生代谢产物的生物合成途径,将有助于有效设计和寻找植物和真菌药物。
利用简化基因组测序技术获得数以万计的多态性标记。通过高通量测序及信息分析,快速鉴定高标准性的变异标记(SNPs),已广泛应用于分子育种、系统进化、种质资源鉴定等领域。利用该技术可以筛选抗病株的特异SNPs位点,建立筛选三七抗病品种的遗传标记,辅助系统选育,有效的缩短育种年限。通过系统选育的方法获得的抗病群体,并采用RAD-Seq技术筛选抗病株的SNPs位点,为基因组辅助育种提供遗传标记,进而有效缩短了三七的育种年限,加快育种进程。利用遗传图谱识别影响青蒿产量的基因位点取得突破,于《科学》[7],该文基于转录组及田间表型数据,通过构建遗传图谱识别影响青蒿素产量的位点。青蒿植株表型的变异出现在Artemis的F1谱系中,符合高水平的遗传变异。Graham等[7]发现与青蒿素浓度相关的QTL分别为LG1,LG4及 LG9(位于C4)。在开发标记位点用于育种的同时,Graham等检测了23 000株植株的青蒿素含量,这些植株是青蒿的F1种子经甲基磺酸乙酯诱变后于温室培养12周的F2、F3代。结果发现经诱变后的材料大约每4.5 Mb有一个突变,其变异频率小于Artemis中的每1/104碱基对的SNP多态性。该方法能够识别携带有益变异的个体(来源于甲基磺酸乙酯诱变处理),同时亦能识别遗传背景获得提升的个体(由于自然变异而导致有益等位基因分离的个体)。Graham等也检测高产F2代植株青蒿素的含量:尽管F2的植株杂合性较低,但其青蒿素含量比UK08 F1群体植株的含量高。另外,Graham等验证了基于田间试验获得与青蒿素含量相关的QTL在温室培育的高产植株中高效表达。同时发现,大量分离畸变有利于有益的等位基因(位于C4 LG1且与青蒿素产量相关的QTL)。这些数据证实了QTL及其对青蒿素产量的影响,同时也证明了基因型对于温室及田间培育的青蒿材料具有极大影响。
3.4 中药合成生物学研究 结构复杂多样的中药药用活性成分是中药材发挥药效的物质基础,也是新药发现的重要源泉。然而许多中药材在开发和使用的过程中往往面R一系列难题,如许多药材生长受环境因素影响较大;有些珍稀药材生长缓慢,甚至难以人工种植;大多数药用活性成分在中药材中含量低微,结构复杂,化学合成困难;传统的天然提取或者人工化学合成的方法难以满足科研和新药研发的需求,中药合成生物学将是解决这一矛盾的有效途径。中药合成生物学是在本草基因组研究基础上,对中药有效成分生物合成相关元器件进行发掘和表征,借助工程学原理对其进行设计和标准化,通过在底盘细胞中装配与集成,重建生物合成途径和代谢网络,实现药用活性成分的定向、高效的异源合成,从而提升我国创新性药物的研发能力和医药产业的国际核心竞争力[40]。
随着基于高通量测序的中草药结构基因组学和转录组学研究的快速发展,利用生物信息学技术和功能基因组学方法从大量中药原物种的遗传信息中筛选和鉴定出特定次生代谢途径的酶编码基因,将极大加快次生代谢途径的解析进程,为中药合成生物学研究奠定坚实基础。通过优化密码子偏好性、提高关键酶编码基因的表达量、下调或抑制代谢支路等方法来优化和改造异源代谢途径, 按人们实际需求获取药用活性成分[40]。
3.5 中药作用靶点与个性化治疗 中药蛋白质组学将蛋白组学技术应用于中药研究领域,对寻找中药的可能靶点和阐明中药有效成分作用机制具有重要意义。譬如,蒋建东教授团队在小檗碱降血脂研究中开展的突出工作[46],以及Pan等[47]利用蛋白组学技术分析丹参酮ⅡA对宫颈癌Caski细胞的抑制作用,发现C/EBP同源蛋白和细胞凋亡信号调节激酶1参与丹参酮ⅡA的抑癌作用。对于中药复方的相关作用靶点也有报道,Nquyen-Khuong等[48]探讨了由栝楼、大豆、中药五味子和西地格丝兰提取物组成的混合物作用于人膀胱癌细胞后蛋白质组的表达谱变化,鉴定了多种与能量代谢、细胞骨架、蛋白质降解以及肿瘤抑制相关的蛋白。
青蒿素及其衍生物青蒿琥酯表现出明显的体内外抗肿瘤活性,但其抗肿瘤的分子机制并不明确。研究者采用了基因芯片技术,在转录水平解析青蒿琥酯抗肿瘤相关的基因。再将表达谱数据导入信号通路分析和转录因子分析,结果表明c-Myc/Max可能是作为肿瘤细胞应对青蒿琥酯效应基因的转录调控因子,这一结果可能指导针对不同个体采用不同的治疗策略[42]。由于银杏具有显著的诱导CYP2C19活性效应,通过研究不同CYP2C19基因型健康中国人个体,银杏与奥美拉唑(omeprazole,广泛使用的CYP2C19底物)潜在的中西药互作关系。结果显示,银杏诱导CYP2C19基因型模式依赖的奥美拉唑羟基化反应,随后降低5-羟基奥美拉唑肾脏清除率。银杏和奥美拉唑或其他CYP2C19底物共同服用可显著减弱其药效,还需更多证据支持[49]。这一研究证实个体化治疗基于人体基因差异,可能发挥更好疗效。
[参考文献]
[1]Sanger F, Air G M, Barrell B G, et al. Nucleotide sequence of bacteriophageφX174 DNA[J]. J Mol Biol, 1978, 125(2):225.
[2]Sachidanandam R, Weissman D, Schmidt S C, et al. A map of human genome sequence variation containing 1.42 million single nucleotide polymorphisms[J]. Nature, 2001, 409(6822):928.
[3]Venter J C, Adams M D, Sutton G G, et al. Shotgun sequencing of the human genome[J]. Science, 1998, 280(5369):1540.
[4]Initiative A G. Analysis of the genome sequence of the flowering plant Arabidopsis thaliana[J]. Nature, 2000, 408(6814):796.
[5]中国药材公司.中国中药资源 [M]. 北京:科学出版社, 1995.
[6]Chen S, Xu J, Liu C, et al. Genome sequence of the model medicinal mushroom Ganoderma lucidum[J]. Nat Commun, 2012, 3(2):177.
[7]Graham I A, Besser K, Blumer S, et al. The genetic map of Artemisia annua L. identifies loci affecting yield of the anti-malarial drug artemisinin [J]. Science, 2010, 327: 328.
[8]Yan Y, Wang Z, Tian W, et al. Generation and analysis of expressed sequence tags from the medicinal plant Salvia miltiorrhiza[J]. Sci Chin Life Sci, 2010, 53(2):273.
[9]李滢,孙超,罗红梅,等. 基于高通量测序454 GS FLX的丹参转录组学研究[J]. 药学学报,2010, 45(4):524.
[10]Hua W, Zhang Y, Song J, et al. De novo transcriptome sequencing in Salvia miltiorrhiza to identify genes involved in the biosynthesis of active ingredients [J]. Genomics, 2011, 98(4):272.
[11]Yang L, Ding G, Lin H, et al. Transcriptome analysis of medicinal plant Salvia miltiorrhiza and identification of genes related to tanshinone biosynthesis[J]. PLoS ONE, 2013, 8(11):e80464.
[12]Luo H, Zhu Y, Song J, et al. Transcriptional data mining of Salvia miltiorrhiza in response to methyl jasmonate to examine the mechanism of bioactive compound biosynthesis and regulation[J]. Physiol Plantarum, 2014, 152(2):241.
[13]Ge Q, Zhang Y, Hua W P, et al. Combination of transcriptomic and metabolomic analyses reveals a JAZ repressor in the jasmonate signaling pathway of Salvia miltiorrhiza [J]. Sci Rep, 2015, 5: 14048.
[14]Gao W, Sun H X, Xiao H, et al. Combining metabolomics and transcriptomics to characterize tanshinone biosynthesis in Salvia miltiorrhiza [J]. BMC Genomics, 2014, 15:73.
[15]Xu Z, Peters R J, Weirather J, et al. Full-length transcriptome sequences and splice variants obtained by a combination of sequencing platforms applied to different root tissues of Salvia miltiorrhiza, and tanshinone biosynthesis [J]. Plant J, 2015, 82(6):951.
[16]Sun C, Li Y, Wu Q, et al. De novo sequencing and analysis of the American ginseng root transcriptome using a GS FLX Titanium platform to discover putative genes involved in ginsenoside biosynthesis [J]. BMC Genomics, 2010, 11:262.
[17]Li Y, Luo H M, Sun C, et al. EST analysis reveals putative genes involved in glycyrrhizin biosynthesis [J]. BMC Genomics, 2010, 11: 268.
[18]Zhu Y J, Xu J, Sun C, et al. Chromosome-level genome map provides insights into diverse defense mechanisms in the medicinal fungus Ganoderma sinense [J]. Sci Rep, 2015, 5:11087.
[19]Xu H, Song J Y, Luo H M, et al. Analysis of the genome sequence of the medicinal plant Salvia miltiorrhiza[J]. Mol Plant, 2016, 9: 949.
[20]Liang Y, Xiao W, Hui L, et al. The genome of Dendrobium officinale, illuminates the biology of the important traditional Chinese orchid herb [J]. Mol Plant, 2014, 8(6):922.
[21]Zhang G Q, Xu Q, Bian C, et al. The Dendrobium catenatum Lindl.genome sequence provides insights into polysaccharide synthase, floral development and adaptive evolution [J]. Sci Rep, 2016, 6: 19029.
[22]士林,何柳,刘明珠,等. 本草基因组方法学研究[J].世界科学技术,2010, 12(3):316.
[23]宋经元,罗红梅,李春芳,等. 丹参药用模式植物研究探讨 [J]. 药学学报,2013, 48(7):1099.
[24]Chen S L, Yao H, Han J P, et al. Validation of the ITS2 region as a novel DNA barcode for identifying medicinal plant species [J]. PLoS ONE, 2010, 5(1):e8613.
[25]Pang X H, Song J Y, Zhu Y J, et al. Applying plant DNA barcodes for Rosaceae species identification [J]. Cladistics, 2011, 27: 165.
[26]Dolezel J, Greilhuber J, Suda J. Estimation of nuclear DNA content in plants using flow cytometry [J]. Nat Protoc, 2007, 2(9):2233.
[27]Vu G T, Dear P H, Caligari P D, et al. BAC-HAPPY mapping (BAP mapping): a new and efficient protocol for physical mapping [J]. PLoS ONE, 2010, 5: e9089.
[28]Microbial genetic analysis-OpGen[EB/OL]. [2016-10-16]. http:///.
[29]Bionano genomics――whole genome mapping with the irys system[EB/OL]. [2016-10-16]. http:///.
[30]Zerbino D R, Birney E. Velvet: algorithms for de novo short read assembly using de Bruijn graphs [J]. Genome Res, 2008, 18(5):821.
[31]Chaisson M J, Pevzner P A. Short read fragment assembly of bacterial genomes [J]. Genome Res, 2008, 18(2):324.
[32]Luo R, Liu B, Xie Y, et al. SOAPdenovo2: an empirically improved memory-efficient short-read de novo, assembler [J]. Gigascience, 2012, 1(1):18.
[33]Huang X, Madan A. CAP3: a DNA sequence assembly program [J]. Genome Res, 1999, 9(9):868.
[34]Lynn A M, Jain C K, Kosalai K, et al. An automated annotation tool for genomic DNA sequences using GeneScan and BLAST [J]. J Genet, 2001, 80: 9
[35]Solovyev V, Kosarev P, Seledsov I, et al. Automatic annotation of eukaryotic genes, pseudogenes and promoters [J]. Genome Biol, 2006, 7(Suppl 1): S10.
[36]Zdobnov E M, Apweiler R. InterProScan――an integration platform for the signature recognition methods in InterPro [J]. Bioinformatics, 2001, 17(9):847.
[37]Joslyn C A, Mniszewski S M, Fulmer A, et al. The gene ontology categorizer [J]. Bioinformatics, 2004, 20(1):169.
[38]Kanehisa M, Goto S, Hattori M, et al. From genomics to chemical genomics: new developments in KEGG [J]. Nucleic Acids Res, 2006, 34:354.
[39]士林,孙永珍,徐江,等. 本草基因组计划研究策略[J]. 药学学报, 2010, 45 (7), 807.
[40]陈士林, 朱孝轩, 李春芳, 等. 中药基因组学与合成生物学[J].药学学报,2012, 47 (8): 1070.
[41]Chen S L, Song J Y, Sun C, et al. Herbal genomics: examining the biology of traditional medicines [J]. Science, 2015, 347 (6219 Suppl): S27.
[42]Sertel S, Eichhorn T, Simon C H, et al.Pharmacogenomic identification of c-Myc/Max-regulated genes associated with cytotoxicity of artesunate towards human colon, ovarian and lung cancer cell lines [J]. Molecules, 2010, 15(4): 2886.
[43]Scherf U, Ross D T, Waltham M, et al.A gene expression database for the molecular pharmacology of cancer [J]. Nat Genet, 2000, 24(3): 236.
[44]Chen Y, Ouyang D S, Kang Z, et al. Effect of a traditional Chinese medicine Liu Wei Di Huang Wan on the activities of CYP2C19, CYP2D6 and CYP3A4 in healthy volunteers [J]. Xenobiotica, 2012, 42(6): 596.
[45]S林芳,郑司浩,武拉斌,等. 基于化学成分及分子特征中药材肉苁蓉生态型研究 [J]. 中国科学: 生命科学, 2014, 44(3): 318.
[46]Kong W, Wei J, Abidi P, et al. Berberine is a novel cholesterol-lowering drug working through a unique mechanism distinct from statins [J].Nat Med, 2004, 10(12):1344.
中图分类号:G642.0 文献标识码:A DOI:10.3969/j.issn.1672-8181.2013.15.028
创新教育是以培养人们创新精神和创新能力为基本价值取向的教育[1],实施创新教育是全面推进素质教育的重要突破口[2]。大学是建设创新型国家重要组成部分,大学的主要职责是培养创新人才和开展知识创新,因此,大学创新教育受到了广泛关注,在理论和实践两方面都取得了显著的成果[3]。
随着互联网的普及,高校大学生获取知识的方式发生了明显变化,网络已成为大学生获取知识和各种信息的重要途径。这种变化对大学生的价值观念、学习方式、思维方式及行为模式等都产生了深刻影响,为高等教育带来了新的机遇与挑战。但目前人们主要关注互联网对大学生思想政治教育[4]和德育[5]的影响,对于网络时代大学生创新教育出现的变化和面临的问题关注较少。
1 网络对大学生创新教育的影响
1.1 网络为大学生提供了自主学习和独立解决问题的新途径
互联网上丰富的知识资源如多媒体课件、网络课程等,消除了学校之间的空间距离,为大学生提供了不出学校就能接受名校老师授课的机会;各种各样的论坛、百科类网站提供不同学科门类的知识,学生可以方便地提问并获得及时解答;搜索引擎的成熟和完善,使得大部分问题都可以在网络上找到答案。这些为大学生自学和自己动手解决问题提供了一条新的有效途径,比起以往从浩瀚的图书中查找解决问题的方法更便捷、高效,若能利用好,将对大学生创新性思维及动手能力的培养产生积极影响。
1.2 网络对指导老师和学生之间交流的影响
互联网的普及对指导老师与学生交流的影响有两方面:一方面,与研究生大部分时间在实验室中不同,由于实验场地的限制,参与科研的本科生在课余时间并不能经常与指导老师面对面交流,而互联网提供的电子邮件和即时通讯服务方便了师生交流,指导老师对学生在科研中遇到的问题能及时予以解答,对于性格内向不善交流的学生也提供了一条替代途径,能有效提高指导老师的效率和学生的课题进度控制;但从另一方面看,如果对这种网上交流过于依赖,自觉性较差的学生可能会出现拖延的情况,指导老师对学生的研究进度难以掌握,学生也可能逐渐对课题失去兴趣,影响创造性思维形成和动手能力的提高。
1.3 网络对大学生创新教育内容的影响
互联网对大学生创新教育内容的影响表现在两方面:一方面,互联网为大学生了解国内外最新研究动态提供了新途径,能及时了解所参加课题的研究现状,减少盲目重复别人研究工作;另一方面,互联网本身包含的丰富内容也提供了大量新的研究课题,如网络文本挖掘和各种网络应用开发等,都可以作为大学生创新教育的研究课题,学校和指导老师可以根据实际需要,充分利用网络扩展和丰富大学生创新教育内容。
1.4 网络对大学生社会实践的影响
社会实践是高校对学生进行素质教育,培养学生创新精神和实践能力,加快大学生社会化进程的重要形式[6]。互联网的普及消除了高校与外界的隔阂,为大学生接触社会提供了一个新的广阔的空间,不但联系实习单位更方便,有些公司还提供只需要上网就可以完成工作的实习岗位,既免去了学生在学校和实习单位之间的奔波,又提高了效率。随着互联网的进一步发展,网络社会实践必将更加流行。
1.5 网络过多的娱乐功能影响学生的专业学习
网络对学生的消极影响主要是网络上娱乐类的应用挤占了学生大部分本该用来学习的时间,而这些应用多数对创造性思维并无益处。大学生与中学生不同,课余时间基本上是自己安排,而互联网丰富的娱乐和应用对学生的吸引力较大。适当的游戏和娱乐有利于大学生放松身心、开阔视野和增强社交能力,但自制力稍差的学生往往流连于这些网络应用难以自拔,连基本的课程要求都难已完成,更别说创新教育了。
2 网络时代大学创新教育应对
“创新是一个民族进步的灵魂”,创新教育是目前各高校的重要教研课题。创新教育的本质是变“授之以鱼”为“授之以渔”,提高学生独立思考和解决问题的能力。网络的普及极大地影响了大学生的学习习惯,若能充分发挥互联网的积极作用,降低不利影响,大学创新教育将达到一个新的高度。应对网络时代大学创新教育出现的新情况,需要政府、高校、互联网企业、高校教师和大学生自身的共同努力,才能收到良好的效果。
2.1 政府
互联网内容鱼龙混杂,大学生很容易被一些娱乐内容甚至不健康的内容吸引,因此政府对互联网的管理显得尤为重要。对互联网的管理除了利用法律法规规范外,政策上的引导也必不可少,例如为给大学生提供网络实习机会的互联网企业予以补贴等。
网络游戏是一个新生事物,与单机版游戏相比,网游更容易上瘾。目前,我国政府对网络游戏更多的是作为一个产业来发展,针对网络游戏对学生的影响重视不够。虽然出台了一些措施如网吧禁止未成年人进入等,但对绝大部分大学生并无约束力,而且大部分大学生有自己的电脑,学生宿舍也基本都能上网,网游对大学生的影响已经非常严重,已经成为青少年尤其是大学生网络成瘾的原因之一。政府在把网络游戏作为一个产业发展的同时,应更多地考虑其对青少年的影响,规范互联网企业的行为。我们呼吁政府一方面应尽快出台网络游戏管控措施,如限制网游每天的上线时长等;另一方面,应鼓励和引导互联网企业考虑大学生的创新教育需求,实现商业利润和社会效益的双赢。
2.2 学校
高等学校是大学生学习与生活的主要场所,学校的管理模式直接影响到大学生的行为。目前,大部分高校对学生上网管理主要通过夜间断电断网等方式实现对学生上网时间的约束,这对白天逃课在宿舍玩游戏的学生并无约束力。学校可以尝试从技术上利用端口控制等实现定时开放部分网络游戏,但这需要政府在立法上配合。学校可以通过资助创新实验,对接收本科生参加科研工作的指导老师给予补助等措施鼓励学生参加科研活动。此外,还可以设立大学生小额发明创造资助基金,学生有好的想法可以随时申请,提高大学生参与发明创造的积极性。
2.3 互联网企业
公司的行为不完全是商业行为,同时也应承担起社会责任,主动开发有利于提高智力的游戏,并按照国家法律法规的要求,限制开服时间,而不是一味追求利润最大化,使学生在游戏上花费大量的时间和金钱来升级、练装备。当然,这需要政府完善法律法规并严格执行。同时,互联网企业也应抓住机遇,积极参与大学生创新教育,提供网络实践平台及实习项目。
2.4 教师
教师的“传道、授业、解惑”职能在创新教育中应偏重“传道”和“解惑”,在传统教育中占有重要地位的“授业”甚至简单的“解惑”应主要由学生独立完成。在网络时代,教师的主要任务是引导学生更有效地利用网络资源,提高独立解决问题的能力,如怎样填写关键词能利用网络搜索引擎查询更准确的结果等。学生在寻找解决方法的过程中能提高动手能力,学习解决问题的技巧。
2.5 学生
创新教育中,教学的主体是学生,一切外部的管理和引导必须有学生的配合才会有效果。大学生一方面应控制上网时间,抵制互联网的不良内容,避免沉溺在网络游戏和其它网络应用中;另一方面,应充分利用互联网提供的丰富知识资源、网络应用和网络工具,解决学习和科研中的问题,提高独立解决问题的能力,或者通过网络寻找社会实践的机会,锻炼动手能力。
3 结束语
互联网像把双刃剑,如果利用好了可以促进学习,开阔视野,提高大学生的学习兴趣和创新能力,但如果沉溺在网络游戏或其它的网络应用中,则会严重影响大学生的学习。为更好地利用好互联网这个工具,充分发挥其在创新教育中的促进作用,需要全社会各个层面的合作,从整体上管理和引导互联网的发展,提高创新教育的质量。
参考文献:
[1]王磊.实施创新教育培养创新人才――访中央教育科学研究所所长阎立钦教授[J].教育研究,1999,(7):3-7.
[2]王娜.大学生创新教育初探[J].教育探索,2007,(2):117-118.
[3]杨丽,温恒福.大学创新教育的内涵、难点与推进策略[J].黑龙江高教研究,2011,(8):28-31.
[4]蔡芳艳.网络时代背景下高校思想政治教育方法探究[J].时代教育,2010,(1):20.
[5]孙伟.网络时代大学生伦理道德教育的思考[J].中国高教研究,2003,(2):68-69.