复旦大学副校长中科院院士杨玉良在中科院的讲演
毋庸讳言,基因对于地球生命而言有根本的意义,但生命的有些奥秘比遗传密码埋藏得更深。在生物形态发生和行为的过程中,基因的作用被夸大了。我想说明,恐怕基因不是最基本的定律,注意我用的是“定律”,而定律通过基因发挥作用。定律在英语里是Law,具有法的地位。然而,在当前的生命科学里没有定律,因此把Central Dogma译为“中心法则”并不恰当,因为它不具备法则的全部特征,它只是一种信条。
作为一名高分子科学家,只是最近一年多来想在生命科学的某些领域作些研究。因此,作为外行来谈生命科学问题总有点心虚、有点惴惴不安。量子力学的创立者之一薛定谔在1944年写了一本书名为《什么是生命》的小册子,阐述了作者作为一位理论物理学家对当时的生命科学的看法并作了许多精到和准确的预言。他在该书序言中的话可以用来给我壮胆。他认为:人们普遍认为,科学家只是对某一学科具有广博而深邃的第一手知识,而不该就自己不精通的论题发表意见。……但是近100多年来知识在深度和广度的扩展使我们陷入一种奇异的两难境地。……除非我们中有人敢于着手总结那些知识和理论,即使其中有些知识是第二手的或者不完备的,而且敢于冒被看成蠢人的风险,除此之外,我看不到其他摆脱这种两难境地的其它方法。我想,从薛定谔时代至今又过了60年,科学家的观念发生了很大的变化,变得更加容忍和开放。我今天讲的观点有不少可能是错误的,好在歌德说过:“真理与谬误出自同一来源,这是奇怪的但又确实。所以我们任何时候都不应该粗暴地对待谬误,因为在这样做的同时,我们就是在粗暴地对待真理。”再说,生命科学的问题实在太复杂,许多问题生命科学家也不清楚,作为外行也就可斗胆地发表一些看法,哪怕谈的都是谬误。
基因的作用被夸大了
我对于生命科学的兴趣始于媒体和一些高级的科普刊物的宣传。我们可以看到,在人类基因组计划开始前和执行期间,基因的作用被一些生物学家使劲地夸大。从一些大众媒体上大家可以得到一种印象,似乎一个人的犯罪、成才、个性和长相等等都是基因决定的,甚至连哪里长一颗痣也是基因直接在起作用,……总之,我们都受到了严重的误导,似乎生命体的一切都是由基因决定的。似乎人类对基因的问题搞清楚了,那么生命科学的问题就都解决了一样。如果基因确实决定了那么多的东西,那么或许哲学、心理学和社会学的一大半的研究领域都可归入遗传学,或者说这些学科只不过是遗传学的一些分支或延伸而已。就一个个体而言,如果我的一生的一切早已被我体内的“上帝”——我的DNA所设计好了,那该有多乏味!事实上,一些负责任的生物学家也认为,人类基因组计划完成之后,它所带来的问题似乎比所解决的问题更多。当然,我在这里一点不想去贬低基因的核心重要性,而只是想提出一些问题,诸如:所有生命过程都是由基因直接决定的吗?基因的重要性是否已经被强调过头?换个角度来提问就是,基因后的生物学是怎样的一种形式,数学和物理在生命科学中的作用和地位又是什么?……这些问题都需要非常大胆而谨慎地回答。1944年时薛定谔的《什么是生命》一书出版时,分子生物学尚未出现,但他作为物理学家却走在了生物学家的前面。他运用十分基本的数学和物理知识对生命科学的发展做了精到的预料,至今读来仍深受启发。继承他的大胆探索精神来考察基因时代的生命科学也将是十分有意义的。
我们先来看一下在生命过程中,基因究竟做了什么?按照生物学的“中心信条”,DNA作为遗传基因的载体,它将遗传基因转录到RNA,然后由RNA将遗传基因翻译成为蛋白。这些蛋白可以是一些具有催化作用的酶,它们使大量的代谢反应等生化反应得以进行。这些蛋白也可以是生物膜上的一些水或离子的通道或是其它一些特定功能的蛋白,它们在生命过程中扮演着各自的角色,通常被称为基因的表达。因此,不难看出,即使在人类基因组计划完成后,甚至所谓的蛋白质组计划也得以完成后,对基因表达的细节不会带来太大的帮助。纵然,人们可以通过基因剔除的办法来获取某一基因的表达形式,但该过程完全如同一个黑匣子,对该黑匣子输入一个信号就可获得一个输出,但对中间过程全然不知。显然,黑匣子不打开,神创论就容易抬头,就会有《审判达尔文》和《达尔文的黑匣子》之类的书的问世。这些书的作者注意到细菌鞭毛系统的精巧组装或是凝血机制的精妙平衡,于是就认为其必定经由超智能的设计。
我在这里想要说明的是:基因似乎仅直接管到蛋白质合成。蛋白质合成以后的生命过程似乎与基因并没有直接关系,而数学、物理和化学规律将在这个过程中起到支配的作用。因此,我们有必要设法打开这个黑匣子。我比较赞同英国数学家I.Stewart在他的《生命的第二重秘密》一书中所表述的观点。他说:“为了弄清生命的本质,人们千方百计地急于查看生命的DNA密码序列,DNA序列安排得井井有条,然而生命科学本身却乱麻一团。几乎只需用一组符号就能够把DNA表达得一清二楚,而对于其物理特征来讲,哪怕是将其陈述一遍也要涉及到高等数学。……物理是彻底地遵循数学的方程形式,生物学却我行我素杂乱无章,完全听命于冲动与幻想。”难道不是吗?当我们打开一本诸如《细胞生物学》的生命科学的教材,凭我的化学知识从第一页看到最后一页没有任何困难,困难在于得记住许多庞杂的东西。有时,你的感觉像是看彩色连环画。难道数学和物理等严密科学在面对生命体系时就必定显得无能为力吗?
毋庸讳言,基因对于地球生命而言有根本的意义,但生命的有些奥秘比遗传密码埋藏得更深。在生物形态发生和行为的过程中,基因的作用被夸大了。我想说明,恐怕基因不是最基本的定律,注意我用的是“定律”,而定律通过基因发挥作用。定律在英语里是Law,具有法的地位。然而,在当前的生命科学里没有定律,因此把CentralDogma译为“中心法则”并不恰当,因为它不具备法则的全部特征,它只是一种信条。DNA更不是定律,是一个密码系统,需要根据物理定律来解码。换言之,生命过程毕竟不能违反物理定律,生物学所作的一切都要受到物理定律的限制。
图案的产生并不需要基因
我想通过一些例子来说明哪些似乎不是由基因直接决定的。
第一个例子想说明基因无法直接解释生物形态发生和生长的过程。请注意我这里用的“直接”二字,含义是如果我们能够直接解释了,那么过程的黑匣子就被打开了。比如向日葵盘上葵花籽的排列很奇怪,是一组满足发散角为黄金角(137.50776o)的对螺旋曲线。这个发散角非常精确,当其略小于或略大于黄金角(±0.1o)时,葵花籽在盘上的排列就不紧密,有空缺。事实上,葵花籽的排列满足这个特定的数学要求只不过是在生长过程中为了达到密堆积的效果而已。我常开这样的玩笑:难道葵花基因懂得数学?显然,基因不懂得数学,葵花籽的排列方式和基因没有直接的关系,而是物理在起作用。
近年来,越来越多的事实表明,细菌的生长、细胞的迁移和肠腔化过程等均满足所谓的反应-扩散方程。一个最为简单而有效的应用是在黏菌和网柄菌的生长时-空模式的研究上。人们甚至认为反应-扩散方程是生命形态发生的基本方程。反应-扩散类型的方程有一个重要特点是它们在短程上体现的是一个活化过程,而在长程上表现的是一个拟制过程,因此也常常被称为是“活化-抑制模型”。
或许反应-扩散方程的一个成功实例是在动物皮毛花纹的计算。图灵很早就注意到,反应-扩散体系的扩散系数和反应速率常数的改变可以导致各式各样非常复杂的图样。当采用这个模型来描述色素在皮下的生成和扩散时取得了很大的成功。例如,在斑马腿的跟部与腹部的交界处总是出现人字型的花纹,有人说这是基因决定的,而计算发现,其无非是因为从腹部到腿的跟部表皮的面积突然减小的缘故,用数学化的语言来说就是该处的边界条件发生了变化而已。我们知道,每个斑马身上的图案是不同的,据称斑马互相之间靠其皮毛上的条纹的不同来进行相互的识别。那么每头斑马的条纹是否完全由其基因所决定呢?答案是否定的。有个实验的例子,即,当斑马在胚胎的时候在某个固定的地方施加一点摩擦刺激,认为改变其色素分子在该局部的扩散行为,则其图案明显不同。可见这是后天,非先天的基因所决定的。
同样的道理,有着斑点状皮毛图案的豹的尾巴上的花纹一般都是从尾巴根部的斑点图案过渡到尾巴尖上的条纹图案。这也不是基因决定的,而是在尾巴尖上的皮毛的面积较小,很容易使得斑点连接成条纹图案。事实上,这个模型会告诉我们更多的东西。例如,该模型指出,当色素的扩散系数D和动物的尺寸L的比值改变时,几乎所有的已知哺乳动物皮毛的图案都会出现。一个很有趣的传闻是关于美国大片《侏罗纪公园》恐龙身上的花纹问题。艺术家根据恐龙的骨骼化石很容易地重构了恐龙的造型,然而问题在于恐龙的表皮究竟有没有花纹?反应-扩散方程告诉我们,当相对于色素的扩散系数D而言动物的尺寸L很大时,更有利于均匀解的出现,因此不会出现花纹。比如,大象身上就没有花纹,同理可以推断恐龙身上不会有花纹。所以在《侏罗纪公园》中,好莱坞的艺术家不敢在恐龙的皮上画上图案。反之,当相对于色素的扩散系数D而言动物的尺寸L很小时,色素分子十分容易扩散至全身,故小尺寸的动物一般也是单色的,不易出现花纹,老鼠就是一个典型的例子。更为有趣的是,当色素的扩散系数D与动物尺寸L相当时,计算获得了前后半身分别为两种颜色的图案,好像不可能,后来发现一种大角羊就是这样,前半身是黑色的,而后半身则是白色的。看来反应-扩散方程还是抓住了问题的部分本质。虽然,我们不能说这些问题已经得到了完全的理解,但我们至少可以说,这些问题与基因没有直接关系。
以上讨论的毕竟是生命体系,其中毕竟有基因的存在。那么图案的出现一定需要基因吗?答案是确切的,图案的产生并不需要基因。例如,大家熟知的B-Z反应,就是一个实例。这个反应呈现出非常复杂的时-空结构,各化学物种浓度的空间呈现周期性的分布,并且随时间呈周期性的变化。一会儿图案消失了,再等一会儿又出现了,好像呼吸一样,这就是著名的振荡化学反应。我们必须注意到,B-Z反应中这种空间图案和特殊的时间节律的出现是完全没有基因参与的。可见反应-扩散方程的重要性。
我们在这里还要强调相分离的重要性,因为即便在细胞中脂肪和水是不互溶的。我们来看一个我们曾经研究过的简单的例子。设想一个简单得不能再简单的体系,其中有A、B和C三种化合物,三者又不相容,会如同油和水一样发生相分离。同时,我们假设A+B可生成C,而C又能经逆反应解离成A和B。即便对于如此简单的反应-扩散-相分离体系,其出现的图案十分复杂,如果考虑其间流体力学影响,情况更加复杂不堪。所以,我们可以设想,反应-扩散-相分离方程可以出现各种超乎想象的复杂性。我们知道,在一个细胞当中的代谢反应数目可以高达数千个,而且代谢产物之间不能够完全互溶,对于如此复杂的体系,那么有什么奇迹不能发生呢!
值得一提的是,近年来,弹性模型在植物叶片上茎的空间分布图样和植物叶边的褶皱的生成机理作出了非常出色的阐述,而且得到了实验的验证。在这些弹性模型中,我们也无法看到基因的踪影,更找不到其与基因的直接联系。
大部分病毒组装的时候与基因也没有直接的关系
我们来讨论蛋白质如何装配成最简单的“生命”-病毒。病毒没有细胞膜,细胞会分裂病毒不会。最为简单的病毒结构可以看作是由外面裹着蛋白质组装体的一条DNA链(或RNA链)所构成。实验的直接观察可见病毒一般都具有很好的对称性,常常是一个拼得非常好的正多面体。这就产生了一个问题:病毒的蛋白组装体为什么那么青睐正多面体?最近有人指出,这等同于一个困扰了人类100多年的“汤姆森问题”,也就是在一个球面上放置刚性小球的能量最低的构型问题。一个熟悉的例子是C60,即足球烯,它的表面有20个六边形,但必须还有12个反映缺陷的五边形。出现五边形的“缺陷”,蛋白在该处就会产生突起,但是这个突起只能在曲面的特定位置上,不能是任意的,球面上缺陷的数目也是固定的。所以,一方面一个折叠好的蛋白要装配成一个病毒的时候想要尽量紧密;另一方面,具有固定形状的蛋白必定是无法铺满一个球面,从而在特定的缺陷位置上产生突起而出现正多面体的病毒形状。由此看来,大部分病毒组装的时候与基因也没有直接的关系,而是需要满足一个简单的物理要求,即所谓的汤姆森问题。
现在,我们再来看一个不是球形的病毒的例子,烟草花叶病毒(TMV)。它是一个棒状的病毒,长度约3000纳米,直径约180纳米。它的一个奇异的行为是,在没有RNA链存在时,折叠好的蛋白质组装成一系列看上去像“圆垫圈”样的组装体。若此时加入RNA链,则RNA链就自发地将这些“圆垫圈”串起来形成一根棒,棒的轴心上就是RNA链。而且,组装好的棒(TMV)的长度非常均一,取决于RNA链的长度。大家知道病毒不能自己繁殖,它必须将另一个生命体作为宿主,并利用宿主中的原料来复制自己。这个组装行为看来很特殊,但是其行为与一种分子叫环糊精的十分相像。环糊精看起来也很像个垫圈,中心是空的,它的外面有许多极性的羟基,喜欢和水在一起。但是,垫圈的中心确实疏水的,而且在没有高分子链参与的情况下,这些环糊精分子基本是游离的。如果从中加入一些高分子链(如,PEG),那么高分子链就会把这些环糊精分子串起来而形成一根棒,而且棒的长度就和加入的高分子链的长度有关,与TMV非常相像。我们采用统计力学对它进行了非常完整的理论描述,依此可以计算它的组装行为。同样的理论很容易推广到微管蛋白的组装问题。所以,看来病毒组装也并不是不可琢磨的事情。
基因只是通过物理学等基础科学的基本定律在发挥作用
我再讲一点膜的问题,因为膜是细胞的基本构件。一个典型的动物细胞的结构,表面上看其非常复杂,而且很拥挤,有细胞核,内质网,高尔基体,线粒体等等。至于膜,则其主要成分是磷脂和胆固醇,膜上还嵌了一些多糖和膜蛋白。为了了解生物膜的结构,先来看一个肥皂泡。肥皂泡由两亲性分子构成。两亲性分子有一个很大的特点:分子的一头喜欢和水在一起,一头喜欢和油在一起。洗衣粉也是两亲性分子,所以洗衣服的时候它能把衣服上的油污带到水里,把衣服洗干净。正因为两亲性分子一头亲水而另一头亲油,它在水里可以形成囊泡。囊泡的结构是:由两亲性分子亲油端-亲油端待在一起的双层分子构成闭合膜。它的里面是水,它和膜内层的亲水端有很好的相容性;而囊泡的外面也是水,它和外层膜的亲水端有很好的相容性。
实际的生物膜与肥皂泡非常相像。生物膜有一个非常重要的特点是,如果把分子标记一下,就会发现约一半的磷脂分子在膜上可以自由扩散,但内层磷脂分子与外层的磷脂分子发生位置的交换却非常困难,可以忽略。它还有一个特点,就是大的极性分子无法穿透膜进行扩散。在生物体内,一些分子要穿越细胞膜的话,就必须有通道,通道就是蛋白质折叠成筒状物,特定的分子可以从中就进出。如果没有离子通道蛋白的话,离子就不能跨越生物膜。这就是细胞膜的一些基本的性质。
细胞膜是一个简单的东西,但是要预言细胞膜,或者囊泡,或者“肥皂泡”在特定条件下的形状却相当困难。如果在显微镜下看它,就会发现真是丰富多彩,形状各异,其复杂性是显而易见的。一直到了八十年代,德国科学家Helfrich和中国科学家欧阳钟灿在原来的囊泡形状方程中引入了膜的自发曲率,Co,也就是膜在没有承受任何外加力量的时候的曲率。
那么,自发曲率又是怎样生成的呢?这在生命体里很简单。因为生命体里有外面的膜被蛋白,或者里面的膜被蛋白。如果是外层膜上的膜被蛋白受外面的化学环境影响而被溶胀,这个膜就会自动地往里弯,就得到了这样一个正的自发曲率。反之,若里面的膜被蛋白被溶胀,膜就向外弯,就得到了一个负的自发曲率。这种情况在实际生活中也会遇到。比如,我常坐飞机,在飞机上习惯拿一本书来看,但是因为高空中非常干燥,页面上的水分会很快蒸发,而页的反面则尚未直接暴露在干燥的空气中,因此就导致了一面潮湿,而反面干燥。潮湿的一面会发生膨胀,干燥的一面就会收缩,因此书页就会翘起来。自发曲率就是这个原理。当然导致非零的自发曲率的原因还很多。
在引入了自发曲率后,Helfrich和欧阳导出了较为普遍的囊泡形状方程。这样一来,囊泡形状的诸多问题都迎刃而解了。譬如,大家知道红血球的双凹碟状的形状,即它是一个中间凹陷的饼状的客体。大家或许已经产生了疑问。从直观上看,球型似乎应该永远是能量最低的。然而,红血球又为什么不是一个球形?是不是物理错了?实际上,物理是正确的。由于Co的存在,使得球状不是在任何条件下都是稳定的。红血球比较简单,基本上可以看作是一个囊泡,里面是“一包水”,膜上嵌有一些血红蛋白。因此,Helfrich-欧阳方程成功地获得了描述红血球形状的双凹碟状的解。必须指出,Helfrich-欧阳方程是纯力学的,其中没有用到关于基因的任何知识。
说到红血球的形状,还有一个非常重要的形状,即镰刀状红血球,看起来很像一个香蕉。它出现在一种病人的血液中,叫做镰刀状红细胞贫血症,即地中海贫血病。红细胞原来是饼状的时候它很软,流过毛细血管的时候能够自由的弯曲。但是变成香蕉一样的形状就带来了麻烦,很难流过毛细血管,整个身体的血氧交换就会发生问题,导致贫血病。生物学上已经知道这是因为血红蛋白上有一个氨基酸出了错。出错的氨基酸导致这些血红蛋白会一个个地粘了起来,形成很长的棒。这个各向异性的棒状的蛋白组装体嵌入到红血球膜上后,导致了红血球从双凹碟状转变为镰刀状。这个道理生物学家都已经知道,但是很遗憾的,至今尚未像双凹碟状红血球那样有了严格的理论计算。
再来看看红细胞的生命周期。一个红血球的生命周期大概在两到三个月。红细胞膜表面上,大概有百分之六十是磷脂分子,百分之四十是胆固醇-胆固醇不是坏东西,是必须要有的。胆固醇比较刚性,膜上掺入有胆固醇后,它的弹性就相对比较好一点。但是胆固醇自身是不能形成囊泡的,胆固醇只有和卵磷脂在一起才能形成一个比较完整的红血球。有一种观点认为,在红细胞生命周期的晚期,卵磷脂和胆固醇会发生相分离。相分离形成的卵磷脂相因其十分柔软而会发生出芽(Budding)并进入血浆中。于是,卵磷脂不断流失之后,膜上剩下的越来越多的是胆固醇,因胆固醇不能形成囊泡而导致红血球的散架,胆固醇游离进入血浆中,并可能会在血管壁上富集。如果这个看法是正确的,那么用一定的方式补充卵磷脂,对防治冠心病等心血管疾病应该是有效的。事实上,对由卵磷脂和胆固醇制成的人工囊泡的实验发现,膜上的卵磷脂和胆固醇的相分离确实会导致出芽现象。我们采用统计力学方法计算了囊泡膜上的相分离,相分离诱导出芽的现象得到确证。因此,我们可以说生命过程同样必须严格遵守物理学的定律。基因只是通过物理学等基础科学的基本定律在发挥作用。
细胞膜还有更为复杂的胞吞和胞吐现象。胞吞是细胞内的囊泡与细胞膜融合将小囊泡里的东西释放到细胞外,但是内囊泡的膜与细胞膜融合。胞吞则是胞吐的反过程。但是,细胞是采用什么机制来实现胞吞和胞吐过程的呢?有一个实验很简单也很有意思,即在囊泡外膜上吸附少量的高分子,如PEG,则会看到囊泡会发生形状的转变,管状囊泡会变成一串球、而其它形状的囊泡则会出现出芽、胞吞和胞吐的形状转变。这样的现象在生物学上有重要的意义。这种现象广泛地存在于高尔基体和内质网的蛋白质分选和内分泌过程中。我们将吸附有高分子链的囊泡作为模型,并采用统计力学方法计算了囊泡的形状转变。计算结果告诉我们,囊泡膜的内或外表面吸附了高分子后会转变为丰富的形状。这种形状与细胞中的高尔基体、内质网和线粒体等细胞器的形状有着十分密切的关系。囊泡为诸多细胞生命过程提供了十分有意义的模型。在这里,基因也没有直接出现,而是物理学的基本规律在起作用。
基因更像一个配方
还能列举出更多的例子来说明我的观点,因为时间的关系,我只能结束我的这个报告。总结起来说,基因不是为了某个细胞的出现指明位置的建筑蓝图。它更像一个配方,细胞只是按这张配方,通过物理和化学的原理导致的某些结果。基因只是对物理学定律的一种补充,但不能代替,更不能压倒物理学定律。生物学所作的一切,都要受到物理学和化学的支配和限制。生命体的很多属性可能属于生物,而不属于物理。然而,生命过程的更多属性,可能属于物理学的范畴,而不属于生物学。大家能够看到,已经有不少与生命过程相关的问题得到了不同程度的解释,但我必须指出,不能解释的比能解释得更多。按我的观点,打开蛋白合成后的生物学应该是基因后生物学的重要内容。人类基因组计划的完成带来了更多的疑问,我相信即使在蛋白质组学的计划后,基因表达的黑匣子仍然不能打开。可以预言,一个复杂生命体仅仅靠搞清楚蛋白质组仍是不够的,而在蛋白质后面所隐藏的数学、物理和化学规律才是打开这个黑匣子的钥匙。
我用薛定谔的一句话来结束我今天的讲演。他说:我们不必为物理学的通常定律不能解释生命现象而感到沮丧,因为这只不过是我们现在还没有研究得非常深透。由我们对构成生命的物质结构的理解,这正是意料之中的事情,生命本身就是一个非常复杂的现象。我们还要努力发现能够揭示生命现象的新的物理学定律。而这些物理学定律,除了被称作更高级的物理学之外,还能被称作什么呢?
讲演者小传
杨玉良
1952年11月出生,浙江海盐人。教授,博导,中科院院士。1974年9月毕业于复旦大学化学系高分子化学专业,1982年8月毕业于复旦大学化学系高分子化学与物理专业,获理学硕士学位,1984年12月毕业于复旦大学材料科学系高分子化学与物理专业,获理学博士学位;1986年10月至1988年9月在西德马普高分子研究所从事博士后工作;1999年5月起任复旦大学副校长至今。并兼任上海新材料研究中心副主任、上海高分子材料开发研究中心主任等职。至今在国内外著名学术刊物上发表论文120余篇,专著一部。担任《化学学报》等五份学术杂志的编委。