-
基因 编辑
19世纪60年代,奥地利遗传学家格雷戈尔·孟德尔就提出了生物的性状是由遗传因子控制的观点,但这仅仅是一种逻辑推理。20世纪初期,遗传学家摩尔根通过果蝇的遗传实验,认识到基因存在于染色体上,并且在染色体上是呈线性排列,从而得出了染色体是基因载体的结论。1909年丹麦遗传学家约翰逊(W. Johansen,1859~1927)在《精密遗传学原理》一书中正式提出“基因”概念。
20世纪50年代以后,随着分子遗传学的发展,尤其是沃森和克里克提出DNA双螺旋结构以后,人们进一步认识了基因的本质,即基因是具有遗传效应的DNA片段。研究结果还表明,每条染色体只含有1~2个DNA分子,每个DNA分子上有多个基因,每个基因含有成百上千个脱氧核苷酸。自从RNA病毒发现之后,基因的存在方式不仅仅只存在于DNA上,还存在于RNA上。由于不同基因的脱氧核糖核苷酸的排列顺序(碱基序列)不同,因此,不同的基因就含有不同的遗传信息。1994年中科院曾邦哲提出系统遗传学概念与原理,探讨猫之为猫、虎之为虎的基因逻辑与语言,提出基因之间相互关系与基因组逻辑结构及其程序化表达的发生研究。
(1)原核生物结构基因:连续的,RNA合成不需要剪接加工;
(2)真核生物结构基因:由外显子(编码序列)和内含子(非编码序列)两部分组成。
非结构基因
结构基因两侧的一段不编码的DNA片段(即侧翼序列),参与基因表达调控。
(1)顺式作用元件:能影响基因表达,但不编码RNA和蛋白质的DNA序列;
其中包括:
启动子:RNA聚合酶特异性识别结合和启动转录的DNA序列。有方向性,位于转录起始位点上游。
上游启动子元件:TATA盒上游的一些特定DNA序列,反式作用因子可与这些元件结合,调控基因的转录效率。
反应元件:与被激活的信息分子受体结合,并能调控基因表达的特异DNA序列。
增强子:与反式作用因子结合,增强转录活性,在基因任意位置都有效,无方向性。
沉默子:基因表达负调控元件,与反式作用因子结合,抑制转录活性。
Poly(A)加尾信号:结构基因末端保守的AAUAAA顺序及下游GT或T富含区,被多聚腺苷酸化特异因子识别,在mRNA 3′端加约200个A。
基因有两个特点:一是能忠实地复制自己,以保持生物的基本特征;二是在繁衍后代上,基因能够“突变”和变异,当受精卵或母体受到环境或遗传的影响,后代的基因组会发生有害缺陷或突变。绝大多数产生疾病,在特定的环境下有的会发生遗传。也称遗传病。在正常的条件下,生命会在遗传的基础上发生变异,这些变异是正常的变异。
含特定遗传信息的核苷酸序列,是遗传物质的最小功能单位。除某些病毒的基因由核糖核酸(RNA)构成以外,多数生物的基因由脱氧核糖核酸(DNA)构成,并在染色体上作线状排列。基因一词通常指染色体基因。在真核生物中,由于染色体在细胞核内,所以又称为核基因。位于线粒体和叶绿体等细胞器中的基因则称为染色体外基因、核外基因或细胞质基因,也可以分别称为线粒体基因、质粒和叶绿体基因。在通常的二倍体的细胞或个体中,能维持配子或配子体正常功能的最低数目的一套染色体称为染色体组或基因组,一个基因组中包含一整套基因。相应的全部细胞质基因构成一个细胞质基因组,其中包括线粒体基因组和叶绿体基因组等。原核生物的基因组是一个单纯的DNA或RNA分子,因此又称为基因带,通常也称为它的染色体。
基因在染色体上的位置称为座位,每个基因都有自己特定的座位。在同源染色体上占据相同座位的不同形态的基因都称为等位基因。在自然群体中往往有一种占多数的(因此常被视为正常的)等位基因,称为野生型基因;同一座位上的其他等位基因一般都直接或间接地由野生型基因通过突变产生,相对于野生型基因,称它们为突变型基因。在二倍体的细胞或个体内有两个同源染色体,所以每一个座位上有两个等位基因。如果这两个等位基因是相同的,那么就这个基因座位来讲,这种细胞或个体称为纯合体;如果这两个等位基因是不同的,就称为杂合体。在杂合体中,两个不同的等位基因往往只表现一个基因的性状,这个基因称为显性基因,另一个基因则称为隐性基因。在二倍体的生物群体中等位基因往往不止两个,两个以上的等位基因称为复等位基因。不过有一部分早期认为是属于复等位基因的基因,实际上并不是真正的等位,而是在功能上密切相关、在位置上又邻接的几个基因,所以把它们另称为拟等位基因。某些表型效应差异极少的复等位基因的存在很容易被忽视,通过特殊的遗传学分析可以分辨出存在于野生群体中的几个等位基因。这种从性状上难以区分的复等位基因称为同等位基因。许多编码同工酶的基因也是同等位基因。
属于同一染色体的基因构成一个连锁群(见连锁和交换)。基因在染色体上的位置一般并不反映它们在生理功能上的性质和关系,但它们的位置和排列也不完全是随机的。在细菌中编码同一生物合成途径中有关酶的一系列基因常排列在一起,构成一个操纵子(见基因调控);在人、果蝇和小鼠等不同的生物中,也常发现在作用上有关的几个基因排列在一起,构成一个基因复合体或基因簇或者称为一个拟等位基因系列或复合基因。
从孟德尔定律的发现,一百多年来人们对基因的认识在不断深化。
1866年,奥地利学者G.J.孟德尔在他的豌豆杂交实验论文中,用大写字母A、B等代表显性性状如圆粒、子叶黄色等,用小写字母a、b等代表隐性性状如皱粒、子叶绿色等。他并没有严格地区分所观察到的性状和控制这些性状的遗传因子。但是从他用这些符号所表示的杂交结果来看,这些符号正是在形式上代表着基因,而且至今在遗传学的分析中为了方便起见仍沿用它们来代表基因。20世纪初孟德尔的工作被重新发现以后,他的定律又在许多动植物中得到验证。1909年丹麦学者W.L.约翰森提出了基因这一名词,用它来指任何一种生物中控制任何性状而其遗传规律又符合于孟德尔定律的遗传因子,并且提出基因型和表现型这样两个术语,前者是一个生物的基因成分,后者是这些基因所表现的性状。
1910年美国遗传学家兼胚胎学家T.H.摩尔根在果蝇中发现白色复眼(white eye, W)突变型,首先说明基因可以发生突变,而且由此可以知道野生型基因W+具有使果蝇的复眼发育成为红色这一生理功能。1911年摩尔根又在果蝇的X连锁基因白眼和短翅两品系的杂交子二代中,发现了白眼、短翅果蝇和正常的红眼长翅果蝇,首先指出位于同一染色体上的两个基因可以通过染色体交换而分处在两个同源染色体上。交换是一个普遍存在的遗传现象,不过直到20世纪40年代中期为止,还从来没有发现过交换发生在一个基因内部的现象。因此当时认为一个基因是一个功能单位,也是一个突变单位和一个交换单位。
20世纪40年代以前,对于基因的化学本质并不了解。直到1944年O.T.埃弗里等证实肺炎双球菌的转化因子是DNA,才首次用实验证明了基因是有遗传效应的DNA片段。
1955年S.本泽用大肠杆菌T4噬菌体作材料,研究快速溶菌突变型rⅡ的基因精细结构,发现在一个基因内部的许多位点上可以发生突变,并且可以在这些位点之间发生交换,从而说明一个基因是一个功能单位,但并不是一个突变单位和交换单位,因为一个基因可以包括许多突变单位(突变子)和许多重组单位(重组子)(见互补作用)。
1969年J.夏皮罗等从大肠杆菌中分离到乳糖操纵子,并且使它在离体条件下进行转录,证实了一个基因可以离开染色体而独立地发挥作用,于是颗粒性的遗传概念更加确立。随着重组DNA技术和核酸的顺序分析技术的发展,对基因的认识又有了新的发展,主要是发现了重叠的基因、断裂的基因和可以移动位置的基因。
重叠基因是在1977年发现的。早在1913年A.H.斯特蒂文特已在果蝇中证明了基因在染色体上作线状排列,20世纪50年代对基因精细结构和顺反位置效应等研究的结果也说明基因在染色体上是一个接着一个排列而并不重叠。但是1977年F.桑格在测定噬菌体ΦX174的DNA的全部核苷酸序列时,却意外地发现基因D中包含着基因E。基因E的第一个密码子(见遗传密码)从基因D的中央的一个密码子TAT的中间开始,因此两个部分重叠的基因所编码的两个蛋白质非但大小不等,而且氨基酸也不相同。在某些真核生物病毒中也发现有重叠基因。
断裂的基因也是在1977年发现的,它是内部包含一段或几段最后不出现在成熟的mRNA中的片段的基因。这些不出现在成熟的mRNA中的片段称为内含子,出现在成熟的mRNA中的片段则称为外显子。例如下面这一基因,有三个外显子和两个内含子。在几种哺乳动物的核基因、酵母菌的线粒体基因以及某些感染真核生物的病毒中都发现了断裂的基因。内含子的功用以及转录后的加工机制是真核生物分子遗传学的一个吸引人的课题。
功能、类别和数目到目前为止在果蝇中已经发现的基因不下于1000个,在大肠杆菌中已经定位的基因大约也有1000个,由基因决定的性状虽然千差万别,但是许多基因的原初功能却基本相同。
1945年G.W.比德尔通过对脉孢菌的研究,提出了一个基因一种酶假设,认为基因的原初功能都是决定蛋白质的一级结构(即编码组成肽链的氨基酸序列)。这一假设在20世纪50年代得到充分的验证。
①编码蛋白质的基因。
②没有翻译产物的基因。
③不转录的DNA区段。
一个生物体内的各个基因的作用时间常不相同,有一部分基因在复制前转录,称为早期基因;有一部分基因在复制后转录,称为晚期基因。一个基因发生突变而使几种看来没有关系的性状同时改变,这个基因就称为多效基因。
数目不同生物的基因数目有很大差异,已经确知RNA噬菌体MS2只有3个基因,而哺乳动物的每一细胞中至少有100万个基因。但其中极大部分为重复序列,而非重复的序列中,编码肽链的基因估计不超过10万个。除了单纯的重复基因外,还有一些结构和功能都相似的为数众多的基因,它们往往紧密连锁,构成所谓基因复合体或叫做基因家族。
等位基因:位于一对同源染色体的相同位置上控制某一性状的不同形态的基因。不同的等位基因产生例如发色或血型等遗传特征的变化。等位基因控制相对性状的显隐性关系及遗传效应,可将等位基因区分为不同的类别。在个体中,等位基因的某个形式(显性的)可以比其他形式(隐性的)表达得多。等位基因(gene)是同一基因的另外“版本”。例如,控制卷舌运动的基因不止一个“版本”,这就解释了为什么一些人能够卷舌,而一些人却不能。有缺陷的基因版本与某些疾病有关,如囊性纤维化。值得注意的是,每个染色体(chromosome)都有一对“复制本”,一个来自父亲,一个来自母亲。这样,我们的大约3万个基因中的每一个都有两个“复制本”。这两个复制本可能相同(相同等位基因allele),也可能不同。图一显示的是一对染色体,上面的基因用不同颜色表示。在细胞分裂过程中,染色体的外观就是如此。如果比较两个染色体(男性与女性)上的相同部位的基因带,你会看到一些基因带是相同的,说明这两个等位基因是相同的;但有些基因带却不同,说明这两个“版本”(即等位基因)不同。
拟等位基因(pseudoalleles):表型效应相似,功能密切相关,在染色体上的位置又紧密连锁的基因。它们象是等位基因,而实际不是等位基因。
传统的基因概念由于拟等位基因现象的发现而更趋复杂。摩根学派在其早期的发现中特别使他们感到奇怪的是相邻的基因一般似乎在功能上彼此无关,各行其是。影响眼睛颜色、翅脉形成、刚毛形成、体免等等的基因都可能彼此相邻而处。具有非常相似效应的“基因”一般都仅仅不过是单个基因的等位基因。如果基因是交换单位,那就绝不会发生等位基因之间的重组现象。事实上摩根的学生在早期(1913;1916)试图在白眼基因座位发现等位基因的交换之所以都告失败,后来才知道主要是由于试验样品少。然而自从斯特体范特(1925)提出棒眼基因重复的不均等交换学说以及布里奇斯(1936)根据唾液腺染色体所提供的证据支持这学说之尼,试图再一次在仿佛是等位基因之间进行重组的时机已经成熟。Oliver(1940)首先取得成功,在普通果蝇的菱形基因座位上发现了等位基因不均等交换的证据。两个不同等位基因(Izg/Izp)被标志基因拼合在一起的杂合子以0.2%左右的频率回复到野生型。标志基因的重组证明发生了“等位基因”之间的交换。
非常靠近的基因之间的交换只能在极其大量的试验样品中才能观察到,由于它们的正常行为好像是等位基因,因此称为拟等位基因(Lewis,967)。它们不仅在功能上和真正的等位基因很相似,而且在转位(transposition)后能产生突变体表现型。它们不仅存在于果蝇中,而且在玉米中也已发现,特别在某些微生物中发现的频率相当高。分子遗传学对这个问题曾有很多解释,然而由于对真核生物的基因调节还知之不多,所以还无法充分了解。
位置效应的发现产生了深刻影响。杜布赞斯基在一篇评论性文章中曾对此作出下面的结论:“一个染色体不单是基因的机械性聚合体,而且是更高结构层次的单位……染色体的性质由作为其结构单位的基因的性质来决定;然而染色体是一个合谐的系统,它不仅反映了生物的历史,它本身也是这历史的一个决定因素”(Dobzhaansky,1936:382)。
有些人并不满足于这种对基因的“串珠概念”的温和修正。自从孟德尔主义兴起之初就有一些生物学家(例如Riddle和Chiid)援引了看来是足够份量的证据反对基因的颗粒学说。位置效应正好对他们有利。Goldschmidt(1938;1955)这时变成了他们的最雄辩的代言人。他提出一个“现代的基因学说”(1955:186)来代替(基因的)颗粒学说。按照他的这一新学说并没有定位的基因而只有“在染色体的一定片段上的一定分子模式,这模式的任何变化(最广义的位置效应)就改变了染色体组成部分的作用从而表现为突变体。”染色体作为一个整体是一个分子“场”,习惯上所谓的基因是这个场的分立的或甚至是重叠的区域;突变是染色体场的重新组合。这种场论和遗传学的大量事实相矛盾因而未被承认,但是像Goldschmidt这样一位经验丰富的知名遗传学家竟然如此严肃地提出这个理论这件事实就表明基因学说还是多么不巩固。从20世纪30年代到20世纪50年代所发表的许多理论性文章也反映了这一点(Demerec,1938,1955;Muller,1945;Stadler,1954)。
复等位基因:基因如果存在多种等位基因的形式,这种现象就称为复等位基因(multiple allelism)。任何一个二倍体个体只存在复等位基中的二个不同的等位基因。
在完全显性中,显性基因中纯合子和杂合子的表型相同。在不完显性中杂合子的表型是显性和隐性两种纯合子的中间状态。这是由于杂合子中的一个基因无功能,而另一个基因存在剂量效应所致。完全显性中杂合体的表型是兼有显隐两种纯合子的表型。此是由于杂合子中一对等位基因都得到表达所致。
比如决定人类ABO血型系统四种血型的基因IA、IB、i,每个人只能有这三个等位基因中的任意两个。
生物的一切表型主要是蛋白质活性的表现。换句话说,生物的各种性状几乎都是基因相互作用的结果。所谓相互作用,一般都是代谢产物的相互作用,只有少数情况涉及基因直接产物,即蛋白质之间的相互作用。
非等位基因
依据非等位基因相互作用的性质可以将它们归纳为:互补基因:
若干非等位基因只有同时存在时才出现某一性状,其中任何一个发生突变时都会导致同一突变型性状,这些基因称为互补基因。
异位显性基因:
影响同一性状的两个非等位基因在一起时,得以表现性状的基因称为异位显性基因或称上位基因。
累加基因:
对于同一性状的表型来讲,几个非等位基因中的每一个都只有部分的影响,这样的几个基因称为累加基因或多基因。在累加基因中每一个基因只有较小的一部分表型效应,所以又称为微效基因。相对于微效基因来讲,由单个基因决定某一性状的基因称为主效基因。
修饰基因:
本身具有或者没有任何表型效应,可是和另一突变基因同时存在便会影响另一基因的表现程度的基因。如果本身具有同一表型效应则和累加基因没有区别。
抑制基因:
一个基因发生突变后使另一突变基因的表型效应消失而恢复野生型表型,称前一基因为后一基因的抑制基因。如果前一基因本身具有表型效应则抑制基因和异位显性基因没有区别。
调节基因:
一个基因如果对另一个或几个基因具有阻遏作用或激活作用则称该基因为调节基因。调节基因通过对被调节的结构基因转录的控制而发挥作用。具有阻遏作用的调节基因不同于抑制基因,因为抑制基因作用于突变基因而且本身就是突变基因,调节基因则作用于野生型基因而且本身也是野生型基因。
影响同一性状的基因为数较多,以致无法在杂交子代中明显地区分它们的类型,这些基因统称为微效多基因或称多基因。
从理论上看,任何一个基因的作用都要受到同一细胞中其他基因的影响。除了人们正在研究的少数基因以外,其余的全部基因构成所谓的背景基因型或称残余基因型。
等位基因
基本类型
1932年H.J.马勒依据突变型基因与野生型等位基因的关系归纳为无效基因、亚效基因、超效基因、新效基因和反效基因。
无效基因
不能产生野生型表型的、完全失去活性的突变型基因。一般的无效基因却能通过回复突变而成为野生型基因。
亚效基因
表型效应在性质上相同于野生型,可是在程度上次于野生型的突变型基因。
超效基因
表型效应超过野生型等位基因的突变型基因。
新效基因
产生野生型等位基因所没有的新性状的突变型基因。
反效基因
作用和野生型等位基因相对抗的突变型基因。
对于某一性状来讲,一个等位基因影响身体的一个部分,另一等位基因则影响身体的另一部分,而在杂合体中两个部分都受到影响的现象称为镶嵌显性。
概述
基因作用的表现离不开内在的和外在的环境的影响。在具有特定基因的一群个体中,表现该基因性状的个体的百分数称为外显率;在具有特定基因而又表现该一性状的个体中,对于该一性状的表现程度称为表现度。外显率和表现度都受内在环境和外在环境的影响。
内在环境指生物的性别、年龄等条件以及背景基因型。
性别
性别对于基因作用的影响实际上是性激素对基因作用的影响。性激素为基因所控制,所以实质上这些都是基因相互作用的结果。
年龄
人类中各个基因显示它的表型的年龄有很大的区别。
背景基因型
通过选择,可以改变动植物品系的某一遗传性状的外显率和表现度,说明一些基因的作用往往受到一系列修饰基因或者背景基因型的影响。
由于背景基因型的差异而造成的影响,在下述3种情况中可以减低到最低限度:由高度近交得来的纯系;一卵双生儿;无性繁殖系(包括某些高等植物的无性繁殖系、微生物的无性繁殖系以及高等动物的细胞株)。用这些体系作为实验系统,可以更为明确地显示环境因素的影响,更为确切地说明某一基因的作用。双生儿法在人类遗传学中的应用及纯系生物在遗传学和许多生物学研究中的应用都是根据这一原理。
外在环境:①温度。温度敏感突变型只能在某些温度中表现出突变型的性状,对于一般的突变型来说,温度对于基因的作用也有程度不等的影响。②营养。家兔脂肪的黄色决定于基因y的纯合状态以及食物中的叶黄素的存在。如果食物中不含有叶黄素,那么yy纯合体的脂肪也并不呈黄色。y基因的作用显然和叶黄素的同化有关。
演化:就细胞中DNA的含量来看,一般愈是低等的生物含量愈低,愈是高等的生物含量愈高。就基因的数量和种类来讲,一般愈是低等的生物愈少,愈是高等的生物愈多。DNA含量和基因数的增加与生理功能的逐渐完备是密切相关的。
基因最初是一个抽象的符号,后来证实它是在染色体上占有一定位置的遗传的功能单位。大肠杆菌乳糖操纵子中的基因的分离和离体条件下转录的实现进一步说明基因是实体。今已可以在试管中对基因进行改造(见重组DNA技术)甚至人工合成基因。对基因的结构、功能、重组、突变以及基因表达的调控和相互作用的研究始终是遗传学研究的中心课题。
基因的表达过程是将DNA上的遗传信息传递给mRNA,然后再经过翻译将其传递给蛋白质。在翻译过程中tRNA负责与特定氨基酸结合,并将它们运送到核糖体,这些氨基酸在那里相互连接形成蛋白质。这一过程由tRNA合成酶介导,一旦出现问题就会生成错误的蛋白质,进而造成灾难性的后果。值得庆幸的是,tRNA分子与氨基酸的匹配非常精确,只不过迄今为止人们对这种机制还缺乏足够的了解。
按照遗传基本原理,如果某些基因能帮助父母生存和繁殖,父母就会把这些基因传给后代。但一些研究表明,真实情况要复杂得多:基因可以被关闭或沉默,以应对环境或其他因素,这些变化有时也能从一代传到下一代。
美国马里兰大学遗传学家提出了一种特殊机制,父母通过这种机制可以把沉默基因遗传给后代,而且这种沉默可以保持25代以上。这一发现可能改变人们对动物进化的理解,有助于将来设计广泛的遗传疾病疗法。相关论文在线发表于2015年2月2日的美国《国家科学院院刊》上。
他们对一种叫做秀丽隐杆线虫的线虫进行了研究,让它的神经细胞产生了与特殊基因相配的双链RNA分子(dsRNA)。dsRNA分子能在体细胞之间移动,当它们的序列与相应的细胞DNA匹配时,就能使该基因沉默。他们此次发现dsRNA还能进入生殖细胞,使其中的基因沉默。更令人惊讶的是,这种沉默可以保持25代以上。
长期稳定的沉默效果在开发遗传疾病疗法方面至关重要。研究人员一直把一种名为“RNA干扰”的过程(通常称为RNAi)作为一种潜在基因疗法,它可以用配对dsRNA瞄准任何疾病基因。而最大障碍是如何实现稳定的沉默,这样病人才不必反复使用高剂量dsRNA。
当环境中的有害物质进入受精卵或母体,当父母有一定的共同血缘或有一定相同数目的遗传基因关系,在这些情况下,后代的基因组里的基因会发生缺陷,产生疾病。通过使用基因芯片等技术分析人类基因组,可找出致病的遗传缺陷基因区域。癌症、糖尿病等,大部分是遗传基因缺陷引起的疾病。医学和生物学研究人员将能在数秒钟内鉴定出最终会导致癌症等的突变基因。借助一小滴测试液,医生们能预测药物对病人的功效,可诊断出药物在治疗过程中的不良反应,还能当场鉴别出病人受到了何种细菌、病毒或其他微生物的感染。利用基因芯片分析遗传基因,将使10年后对糖尿病的确诊率达到50%以上。
未来人们在体检时,由搭载基因芯片的诊断机器人对受检者取血,转瞬间体检结果便可以显示在计算机屏幕上。利用基因诊断,医疗将从千篇一律的“大众医疗”的时代,进一步精确到依据个人遗传基因而异的“定制医疗”的时代,也可以抽羊水进行产前基因诊断。
基因突变(gene mutation)一个基因内部可以遗传的结构的改变,又称为点突变,通常可引起一定的表型变化。广义的突变包括染色体畸变,狭义的突变专指点突变。实际上畸变和点突变的界限并不明确,特别是微细的畸变更是如此。野生型基因通过突变成为突变型基因。突变型一词既指突变基因,也指具有这一突变基因的个体。
生物体内控制基因表达的机制。基因表达的主要过程是基因的转录和信使核糖核酸(mRNA)的翻译。基因调控主要发生在3个水平上,即:①DNA修饰水平、RNA转录的调控、和mRNA翻译过程的控制;②微生物通过基因调控可以改变代谢方式以适应环境的变化,这类基因调控一般是短暂的和可逆的;③多细胞生物的基因调控是细胞分化、形态发生和个体发育的基础,这类调控一般是长期的,而且往往是不可逆的。基因调控的研究有广泛的生物学意义,是发生遗传学和分子遗传学的重要研究领域。
DNA分子类似“计算机磁盘”,拥有信息的保存、复制、改写等功能。将人体细胞核中的23对染色体中的DNA分子连接起来拉直,其长度大约为0.7米,但若把它折叠起来,又可以缩小为直径只有几微米的小球。因此,DNA分子被视为超高密度、大容量的分子存储器。
基因芯片经过改进,利用不同生物状态表达不同的数字后还可用于制造生物计算机。基于基因芯片和基因算法,未来的生物信息学领域,将有望出现能与当今的计算机业硬件巨头——英特尔公司、软件巨头——微软公司相匹敌的生物信息企业。
由于人类基因具有唯一性(同卵双胞胎除外),目前法医学上用途最广的方面就是个体识别和亲子鉴定。
在法医学上,STR位点和单核苷酸(SNP)位点检测分别是第二代、第三代DNA分析技术的核心,是继RFLPs(限制性片段长度多态性)、VNTRs(可变数量串联重复序列多态性)研究而发展起来的检测技术。作为最前沿的刑事生物技术,DNA分析技术为法医物证检验提供了科学、可靠和快捷的手段,使物证鉴定从个体排除过渡到了可以作同一认定的水平,DNA检验能直接认定犯罪、为凶杀案、强奸杀人案、碎尸案、强奸致孕案等重大疑难案件的侦破提供准确可靠的依据。随着DNA技术的发展和应用,DNA标志系统的检测将成为破案的重要手段和途径。此方法作为亲子鉴定已经是非常成熟的,也是国际上公认的最好的一种方法。
2022年8月,中国计量科学研究院、复旦大学成功研制中华家系1号(同卵双胞胎家庭)人源B淋巴细胞系全基因组DNA序列和全转录组RNA标准物质,该成果在基因组测试质量及计量标准交流会上正式发布。该系列标准物质填补了国内外空白,将为基因测序的可靠性提供保障。
基因检测是通过血液、其他体液、或细胞对DNA进行检测的技术。基因检测可以诊断疾病,也可以用于疾病风险的预测。疾病诊断是用基因检测技术检测引起遗传性疾病的突变基因。目前应用最广泛的基因检测是新生儿遗传性疾病的检测、遗传疾病的诊断和某些常见病的辅助诊断。目前有1000多种遗传性疾病可以通过基因检测技术做出诊断。
男/女性肿瘤基因检测,通过肿瘤基因检测可以预知自身是否是高危人群以及通过良好的预防措施提高自身的健康免疫力。筛查疾病有结肠腺瘤、鼻咽癌、食管癌、白血病、肝癌、胃癌等等。
生产领域
人们可以利用基因技术,生产转基因食品。例如,科学家可以把某种肉猪体内控制肉的生长的基因植入鸡体内,从而让鸡也获得快速增肥的能力。但是,转基因因为有高科技含量,有些人怕吃了转基因食品中的外源基因后会改变人的遗传性状,比如吃了转基因猪肉会变得好动、喝了转基因牛奶后易患恋乳症等等。实际上这些担心都是不必要的,人们吃的所有食物都来自于其他生物体,几乎所有食物中都含有不计其数的带有异源基因的DNA,这些DNA分子在消化道类会被降解为单个的脱氧核糖核苷酸,才能被人体吸收用于自身遗传物质的构建。华中农业大学的张启发院士认为:“转基因技术为作物改良提供了新手段,同时也带来了潜在的风险。基因技术本身能够进行精确的分析和评估,从而有效地规避风险。对转基因技术的风险评估应以传统技术为参照。科学规范的管理可为转基因技术的利用提供安全保障。生命科学基础知识的科普和公众教育十分重要。”
军事领域
生物武器已经使用了很长的时间。细菌,毒气都令人为之色变。但是,传说中的基因武器却更加令人胆寒。
环境保护
我们可以针对一些破坏生态平衡的动植物,研制出专门的基因药物,既能高效的杀死它们,又不会对其他生物造成影响,还能节省成本。例如一直危害中国淡水区域的水葫芦,如果有一种基因产品能够高效杀灭的话,那每年就可以节省几十亿了。
科学是一把双刃剑,基因工程也不例外。我们要发挥基因工程中能造福人类的部分,抑止它的害处。
医疗方面
随着人类对基因研究的不断深入,发现许多疾病是由于基因结构与功能发生改变所引起的。科学家将不仅能发现有缺陷的基因,而且还能掌握如何进行对基因诊断、修复、治疗和预防,这是生物技术发展的前沿。这项成果将给人类的健康和生活带来不可估量的利益。所谓基因治疗是指用基因工程的技术方法,将正常的基因转入病患者的细胞中,以取代病变基因,从而表达所缺乏的产物,或者通过关闭或降低异常表达的基因等途径,达到治疗某些遗传病的目的。已发现的遗传病有6500多种,其中由单基因缺陷引起的就有约3000多种。因此,遗传病是基因治疗的主要对象。第一例基因治疗是美国在1990年进行的。当时,两个4岁和9岁的小女孩由于体内腺苷脱氨酶缺乏而患了严重的联合免疫缺陷症。科学家对她们进行了基因治疗并取得了成功。这一开创性的工作标志着基因治疗已经从实验研究过渡到临床实验。1991年,我国首例B型血友病的基因治疗临床实验也获得了成功。
基因治疗的最新进展是即将用基因枪技术于基因治疗。其方法是将特定的DNA用改进的基因枪技术导入小鼠的肌肉、肝脏、脾、肠道和皮肤获得成功的表达。这一成功预示着人们未来可能利用基因枪传送药物到人体内的特定部位,以取代传统的接种疫苗,并用基因枪技术来治疗遗传病。
科学家们正在研究的是胎儿基因疗法。如果实验疗效得到进一步确证的话,就有可能将胎儿基因疗法扩大到其它遗传病,以防止出生患遗传病症的新生儿,从而从根本上提高后代的健康水平。
2022年6月27日,在第二十四届中国科协年会闭幕式上,中国科协隆重发布10个对产业发展具有引领作用的产业技术问题,其中包括“ 如何建立细胞和基因疗法的临床转化治疗体系? ”。
基因工程药物
基因工程药物,是重组DNA的表达产物。广义地说,凡是在药物生产过程中涉及用基因工程的,都可以成为基因工程药物。在这方面的研究具有十分诱人的前景。
基因工程药物研究的开发重点是从蛋白质类药物,如胰岛素、人生长激素、促红细胞生成素等的分子蛋白质,转移到寻找较小分子蛋白质药物。这是因为蛋白质的分子一般都比较大,不容易穿过细胞膜,因而影响其药理作用的发挥,而小分子药物在这方面就具有明显的优越性。另一方面对疾病的治疗思路也开阔了,从单纯的用药发展到用基因工程技术或基因本身作为治疗手段。
还有一个需要引起大家注意的问题,就是许多过去被征服的传染病,由于细菌产生了耐药性,又卷土重来。其中最值得引起注意的是结核病。据世界卫生组织报道,现已出现全球肺结核病危机。本来即将被消灭的结核病又死灰复燃,而且出现了多种耐药结核病。据统计,全世界现有17.22亿人感染了结核病菌,每年有900万新结核病人,约300万人死于结核病,相当于每10秒钟就有一人死于结核病。科学家还指出,在今后的一段时间里,会有数以百计的感染细菌性疾病的人将无药可治,同时病毒性疾病日益曾多,防不胜防。不过与此同时,科学家们也探索了对付的办法,他们在人体、昆虫和植物种子中找到一些小分子的抗微生物多肽,它们的分子量小于4000,仅有30多个氨基酸,具有强烈的广普杀伤病原微生物的活力,对细菌、病菌、真菌等病原微生物能产生较强的杀伤作用,有可能成为新一代的“超级抗生素”。除了用它来开发新的抗生素外,这类小分子多肽还可以在农业上用于培育抗病作物的新品种。
农作物培育
科学家们在利用基因工程技术改良农作物方面已取得重大进展,一场新的绿色革命近在眼前。这场新的绿色革命的一个显著特点就是生物技术、农业、食品和医药行业将融合到一起。
20世纪五六十年代,由于杂交品种推广、化肥使用量增加以及灌溉面积的扩大,农作物产量成倍提高,这就是大家所说的“绿色革命”。但一些研究人员认为,这些方法已很难再使农作物产量有进一步的大幅提高。
基因技术的突破使科学家们得以用传统育种专家难以想象的方式改良农作物。例如,基因技术可以使农作物自己释放出杀虫剂,可以使农作物种植在旱地或盐碱地上,或者生产出营养更丰富的食品。科学家们还在开发可以生产出能够防病的疫苗和食品的农作物。基因技术也使开发农作物新品种的时间大为缩短。利用传统的育种方法,需要七八年时间才能培育出一个新的植物品种,基因工程技术使研究人员可以将任何一种基因注入一种植物中,从而培育出一种全新的农作物品种,时间则缩短一半。
虽然第一批基因工程农作物品种才开始上市,但美国种植的玉米、大豆和棉花中的一半将使用利用基因工程培育的种子。据估计,今后5年内,美国基因工程农产品和食品的市场规模将从的40亿美元扩大到200亿美元,20年后达到750亿美元。有的专家预计,“到21世纪初,很可能美国的每一种食品中都含有一点基因工程的成分。”
尽管还有不少人、特别是欧洲国家消费者对转基因农产品心存疑虑,但是专家们指出,利用基因工程改良农作物已势在必行。这首先是由于全球人口的压力不断增加。专家们估计,今后40年内,全球的人口将比增加一半,为此,粮食产量需增加75%。另外,人口的老龄化对医疗系统的压力不断增加,开发可以增强人体健康的食品十分必要。
加快农作物新品种的培育也是第三世界发展中国家发展生物技术的一个共同目标,我国的农业生物技术的研究与应用已经广泛开展,并已取得显著效益。
分子进化研究
分子进化工程是继蛋白质工程之后的第三代基因工程。它通过在试管里对以核酸为主的多分子体系施以选择的压力,模拟自然中生物进化历程,以达到创造新基因、新蛋白质的目的。
这需要三个步骤,即扩增、突变和选择。扩增是使所提取的遗传信息DNA片段分子获得大量的拷贝;突变是在基因水平上施加压力,使DNA片段上的碱基发生变异,这种变异为选择和进化提供原料;选择是在表型水平上通过适者生存,不适者淘汰的方式固定变异。这三个过程紧密相连缺一不可。
科学家已应用此方法,通过试管里的定向进化,获得了能抑制凝血酶活性的DNA分子,这类DNA具有抗凝血作用,它有可能代替溶解血栓的蛋白质药物,来治疗心肌梗塞、脑血栓等疾病。
韦斯(Carl Richard Woese)认为,一些氨基酸与它们相对应的密码子有选择性的化学结合力(立体化学假说,stereochemical hypothesis),这显示现在复杂的蛋白质制造过程可能并非一早存在,最初的蛋白质可能是直接在核酸上形成。但王子晖(J. Tze-Fei Wong)认为,氨基酸和相应编码的忠实性反映了氨基酸生物合成路径的相似性,并非物理化学性质的相似性(共进化假说,co-evolution hypothesis)。谢平提出,遗传密码子是生化系统的一部分,因此,必须与生化系统的演化相关联,而生化系统的核心是ATP,只有它才能建立起核酸和蛋白质之间的联系(ATP中心假说,ATP-centric hypothesis)。
原始的遗传密码可能比今天简单得多,随着生命演化制造出新的氨基酸再被利用而令遗传密码变得复杂。虽然不少证据证明这一观点,但详细的演化过程仍在探索之中。经过自然选择,现时的遗传密码减低了突变造成的不良影响。Knight等认为,遗传密码是由选择(seleCTion)、历史(history)和化学(chemistry)三个因素在不同阶段起作用的(综合进化假说)。其它假说:艾根提出了试管选择(in vitro selECTion)假说,奥格尔(Leslie Eleazer Orgel)提出了解码(decoding)机理起源假说,杜维(Christian de Duve)提出了第二遗传密码(second genetic code)假说。Wu等推测,三联体密码从两种类型的双联体密码逐渐进化而来,这两种双联体密码是按照三联体密码中固定的碱基位置来划分的,包括前缀密码子(Prefix codons)和后缀密码子(Suffix codons)。不过,BaraNOv等推测三联体密码子是从更长的密码子(如四联体密码子quadruplet codons)演变而来,因为长的密码子具有更多的编码冗余从而能抵御更大的突变压力。