【摘 要】 基因组相对较稳定,而且各种细胞或生物体的基因组结构有许多基本相似的特征;蛋白质组是动态的,随内外界刺激而变化。对蛋白质组的研究可以使我们更容易接近对生命过程的认识。蛋白质组学是在细胞的整体蛋白质水平上进行研究、从蛋白质整体活动的角度来认识生命活动规律的一门新学科,简要介绍功能基因组学和蛋白质组学的科学背景、概念及其应用。 【关键词】 基因组;功能基因组学;蛋白质组学;
一、基因组及基因组学的概念
基因组(genome)一词系由德国汉堡大学H.威克勒教授于1920年首创,用以表示真核生物从其亲代所继承的单套染色体,或称染色体组。更准确地说,基因组是指生物的整套染色体所含有的全部DNA序列。由于在真核细胞的线粒体和植物的叶绿体中也发现存在遗传物质,因此又将线粒体或叶绿体所携带的遗传物质称为线粒体基因组或叶绿体基因组。原核生物基因组则包括细胞内的染色体和质粒DNA。此外非独立生命形态的病毒颗粒也携带遗传物质,称为病毒基因组。所有生命都具有指令其生长与发育,维持其结构与功能所必需的遗传信息,本书中将生物所具有的携带遗传信息的遗传物质总和称为基因组。[1]
基因组学(genomic)一词系由T.罗德里克(T.Roderick)于1986年首创,用于概括涉及基因组作图、测序和整个基因组功能分析的遗传学学科分支,并已用来命名一个学术刊物Genomics。基因组学是伴随人类基因组计划的实施而形成的一个全新的生命科学领域。[1]
基因组学与传统遗传学其他学科的差别在于,基因组学是在全基因组范围研究基因的结构、组成、功能及其进化,因而涉及大范围高通量收集和分析有关基因组DNA的序列组成,染色体分子水平的结构特征,全基因组的基因数目、功能和分类,基因组水平的基因表达与调控以及不同物种之间基因组的进化关系。基因组学的研究方法、技术和路线有许多不同于传统遗传学的特点,各相关领域的研究仍处于迅速发展和不断完善的过程中。
基因组学的主要工具和方法包括: 生物信息学,遗传分析,基因表达测量和基因功能鉴定。
二、功能基因组学的概念及应用
2001年,人类基因组计划公布了人类基因组草图,为基因组学研究揭开新的一页。基因组学是研究生物基因组的组成,组内各基因的精确结构、相互关系及表达调控的科学。基因组学、转录组学、蛋白质组学与代谢组学等一同构成系统生物学的组学(omics)生物技术基础。基因组研究应该包括两方面的内容:以全基因组测序为目标的结构基因组学(structural genomics)和以基因功能鉴定为目标的功能基因组学(functional genomics),又被称为后基因组(postgenome)研究,成为系统生物学的重要方法。
(一)功能基因组学的概念
功能基因组学是指在全基因组序列测定的基础上,从整体水平研究基因及其产物在不同时间、空间、条件的结构与功能关系及活动规律。新药开发的关键是药物发现。目前多数以药物作用靶点为基础的药物发现流程是:基因组-作用新靶点-筛选-先导物-药物。[2]
结构基因组学是继人类基因组之后又一个国际性大科学热点,主要目的是试图在生物体的整体水平上(如全基因组、全细胞或完整的生物体)测定出(以实验为主、包括理论预测)全部蛋白质分子、蛋白质-蛋白质、蛋白质-核酸、蛋白质-多糖、蛋白质-蛋白质-核酸-多糖、蛋白质与其他生物分子复合体的精细三维结构,以获得一幅完整的、能够在细胞中定位以及在各种生物学代谢途径、生理途径、信号传导途径中全部蛋白质在原子水平的三维结构全息图。在此基础上,使人们有可能在基因组学、蛋白质组学、分子细胞生物学以致生物体整体水平上理解生命的原理。对疾病机理的阐明、对疾病的防治有重要应用意义。 (二)功能基因组学的应用
基因组DNA测序是人类对自身基因组认识的第一步。随着测序的完成,功能基因组学研究成为研究的主流,它从基因组信息与外界环境相互作用的高度,阐明基因组的功能。功能基因组学的研究内容:人类基因组 DNA 序列变异性研究、基因组表达调控的研究、模式生物体的研究和生物信息学的研究等。 (1)基因组表达及调控的研究。在全细胞的水平,识别所有基因组表达产物mRNA和蛋白质,以及两者的相互作用,阐明基因组表达在发育过程和不同环境压力下的时、空的整体调控网络。
(2)人类基因信息的识别和鉴定。要提取基因组功能信息,识别和鉴定基因序列是必不可少的基础工作。基因识别需采用生物信息学、计算生物学技术和生物学实验手段,并将理论方法和实验结合起来。基于理论的方法主要从已经掌握的大量核酸序列数据入手,发展序列比较、基因组比较及基因预测理论方法。识别基因的生物学手段主要基于以下的原理和思路:根据可表达序列标签(STS);对染色体特异性Cosmid进行直接的cDNA选择;根据CpG岛;差异显示及相关原理;外显子捕获及相关原理;基因芯片技术;基因组扫描;突变检测体系等。 (3)基因功能信息的提取和鉴定。包括:人类基因突变体的系统鉴定;基因表达谱的绘制;“基因改变-功能改变”的鉴定;蛋白质水平、修饰状态和相互作用的检测。
(4)在测序和基因多样性分析。人类基因组计划得到的基因组序列虽然具有代表性,但是每个人的基因组并非完全一样,基因组序列存在着差异。基因组的差异反映在表型上就形成个体的差异,如黑人与白人的差异,高个与矮个的差异,健康人与遗传病人的差异,等等。出现最多基因多态性就是单核苷酸多态性(SNPs)。
(5)比较基因组学。将人类基因组与模式生物基因组进行比较,这一方面有助于根据同源性方法分析人类基因的功能,另一方面有助于发现人类和其他生物的本质差异,探索遗传语言的奥秘 。
三、蛋白质组及蛋白质组学
(一)蛋白质组及蛋白质组学的概念
蛋白质是生命功能的主要体现者,多数疾病体现在蛋白质水平,基因表达和蛋白表达之间并不总是呈现良好的相关性[3]。蛋白质组是从整体水平研究胞内蛋白质组成及其活动规律。蛋白质组学以蛋白质组为研究对象,从蛋白质整体水平上认识生命活动的规律。同基因组比,蛋白质组在时间、空间上具有多样性,变化性大,研究的切入点多。蛋白质组学(基于2DE,灵敏、多功能地研究蛋白水平的变化)可以分析非转录水平控制的细胞过程,寻找靶点和优化化合物(抗菌活性、抗菌谱、生物利用度、药代动力学等指标),补充DNA芯片等技术的不足。
蛋白质组(Proteome)这一概念是由澳大利亚学者Wilkins和Williams等人[4]
于1994年提出,并首次公开发表在1995年7月的Electrophoresis杂志上,指的是