斯(sī)坦(tǎn)福科学家日前在Cell杂志上发表文章,提出了一个全新的概念——“细胞法则”。作者大胆设想:未来的生物学研究也许不仅要关注基因和蛋白质,更要理解细胞中的信息流。这不仅有助于解答生命的基本问题,还可能为医学、合成生物学等领域带来突破性进展。
撰文 | 顾舒晨
“我们的身体究竟由什么组成?”这个问题在生物学领域一直是个永恒的谜题。
“基因决定一切”的说法大家或许并不陌生。基因携带着遗传信息,按(àn)照(zhào) “中心法则” 指导蛋白质合成。蛋白质作为生命活动的主要执行者,广泛参与细胞内各类生命活动。正因如此,包含众多基因的DNA显得至关重要,仿佛生命的所有奥秘都蕴藏在其双螺旋结构之中。但生命的真相,真的如此简单吗?
自DNA双螺旋结构被发现、第一个蛋白质结构确定以来,科研人员已经能够从原子层面解释诸多分子机器的运作机制。但随着基因组测序技术的成熟,我们逐渐意识到,生命的复杂性远不止于此。如今,我们已经完成了所有主要模式生物的完整基因组的测序,发现了超过2.5亿个基因,并已经确定了20万个蛋白质的结构。然而,即便在分子层面取得了重大进展,人们依然无法完全理解这些基因和蛋白质是如何协同工作,进而构成生命的最小不可分割单位——细胞。
近期,斯坦福大学的科学家斯蒂芬·R·奎克(Stephen R. Quake)在顶级期刊Cell上发表了一篇文章,提出了一个全新的概念——“细胞法则”(The Cellular Dogma)[1]。这篇文章不仅为人们认识生命提供了新视角,还指明了未来生物学研究的重要方向:从细胞中的信息流探索生命的奥秘。

从“中心法则”到“细胞法则”:探寻生命信息的多样性
“中心法则”是分子生物学的核心理论之一,由弗朗西斯·克里克(Francis Crick)在1958年提(tí)出。它描述了细胞中的信息流,即遗传信息在生物体内的传递方向,即从DNA到RNA,再到蛋白质。简单来说,就是DNA通过转录生成RNA,RNA再通过翻译合成蛋白质,而蛋白质则是执行细胞功能的主要分子。
“中心法则”的提出意义非凡,不仅揭示了生命的基本运作机制,也为后续的基因工程、基因组学等领域的突破奠定了基础。该法则提出之日,正是分子生物学刚刚起步之时,科学家们正试图理解细胞中单个分子的功能和它们的生成原理。这一法则在当时宛若一盏明灯,照亮了分子生物学的黎明。
不过,随着科技的进步,尤其是基因组学和单细胞技术的飞速发展,我们逐渐意识到,细胞中的信息流远比“中心法则”所描述的复杂得多。以逆转录病毒(如HIV)为例,它能借助逆转录酶将RNA基因组逆转录为DNA,并整合到宿主细胞基因组中,这种从RNA到DNA的信息流与 “中心法则” 的方向完全相反[2]**。**还有一些RNA病毒(如流感病毒、SARS-CoV-2)的RNA基因组可以通过RNA依赖的RNA聚合酶(RdRP)直接复制RNA,而这种信息流完全绕过了DNA[3]。此外,表观遗传修饰(如DNA甲基化、组蛋白修饰)能在不改变DNA序列的情况下影响基因表达,并且这些修饰有时会在细胞分裂时传递给子代细胞[4]。这些现象都充分体现了细胞中信息流的复杂性和多样性。
受克里克“中心法则”的启发,奎克在文章中提出了一个大胆的设想:未来的生物学研究也许不仅要关注基因和蛋白质,更要理解细胞中的信息流,他将这一挑战称为“细胞法则”。同时,奎克还提出了一系列值得探索的问题,例如基因组如何编码细胞信息?不同细胞类型是怎样进化而来的?人工智能能否助力我们理解细胞中的信息?这些问题不仅对基础生物学研究意义重大,还可能为医学、合成生物学等领域带来革命性突破。
基因组的秘密:信息远不止于DNA
通(tōng)常,人们会把基因组看作生命的 “说明书”,认为其中详细记录了构建和运行生物体的所有指令,这些信息都存储在DNA的碱基对中。然而,实际情况并非如此简单。如今,科研人员已经完成了大量生物的基因组测序,甚至能够预测蛋白质结构,但仍然无法仅凭基因组序列,直接判断一个生物体的细胞类型。
早在25年前,大肠杆菌(E. coli)的基因组就已完成测序,但直到现在,人们仍不清楚其大多数基因的调控(kòng)机(jī)制(zhì)。部(bù)分(fēn)原(yuán)因(yīn)在(zài)于(yú)基(jī)因(yīn)组(zǔ)是(shì)带(dài)有(yǒu)表(biǎo)观(guān)遗(yí)传(chuán)化(huà)学(xué)修(xiū)饰(shì)的(de)分(fēn)子(zi),而(ér)这(zhè)些(xiē)修(xiū)饰(shì)并未在基因组序列中体现。这就好比人们虽然认识了基因的“字母”,却还没有掌握它们的 “语言”。
更复杂的是,基因组本身并不是孤立存在的。它被包装在染色质中,染色质的化学修饰和物理状态的变化也会影响基因的可及性。基因组包含的DNA序列,除了编码蛋白质(zhì)的(de)基(jī)因(yīn),还(hái)有(yǒu)调(diào)控(kòng)基(jī)因表达的非编码区域。DNA如何通过特定的碱基排列存储遗传指令,以及这些指令如何被细胞解读和执行,都是理解细胞信息流的关键。此外,基因组序列只是细胞信息的一部分,细胞中的RNA、蛋白质、代谢物等其他化学物质也传递着重要信息。一些非编码RNA(如miRNA、lncRNA),虽然并不会被翻译成蛋白质,但(dàn)也(yě)参(cān)与(yǔ)基(jī)因(yīn)表(biǎo)达(dá)的(de)调控**[5]。前面提到的表观蛋白(bái)修(xiū)饰(shì)能(néng)够(gòu)储(chǔ)存(cún)和(hé)传(chuán)递(dì)信(xìn)号(hào),细(xì)胞(bāo)代(dài)谢(xiè)物(wù)则(zé)能(néng)反(fǎn)映(yìng)细(xì)胞状态,参与细胞功能调节[6]**。因此,探究基因组序列编码的信息量,以及细胞中其他化学物质的信息存储方式,是极具价值的研究方向。
多细胞生物的奥秘:从单细胞迈向复杂生命
如果说单个细胞的信息流已经足够复杂,那么多细胞生物的信息流则更是宛如一场精密的交响乐。当生物体从单个细胞发育为多细胞完整个体时,细胞之间需要密切协作,通过发送和接收信号协调各自行为。虽然科研人员已经了解到许多信号分子(如肽、受体、配体等(děng))在(zài)细(xì)胞(bāo)通(tōng)信(xìn)中发挥着重要作用,但对于这些信号如何协同工作,进而指导单细胞发育成复杂多细胞生物,仍然没有完全弄清楚。
比如,有的细胞会告诉它的邻居们:“我要变成心脏细胞了,你们也赶紧变成血管细胞吧!”这种通信依靠蛋白质、激素等特殊分子实现。但目前,人们并不完全清楚这些信号是如何被精准控制的,也不明白细胞为何能在正确的时间和地点做出恰当反应。
目前,科学家们已通过实验方法创建了单细胞转录组图谱,这些图谱展示了每个细胞类型中表达的基因的mRNA数量,为我们提供了宝贵的参考,但我们却发现基因组序列并不能完全预测多细胞生物的细胞类型。神经元、肌肉细胞、上皮细胞等不同类型的细胞,虽拥有相同的基因组,但基因表达模式却截然不同。不过,虽然基因组序列不能直接预测细胞类型,但它还是为预测提供了基础。
随着技术不断进步,未来或许能通过整合基因调控网络、表观遗传数据和单细胞组学等新技术的信息,仅依据新生物的基因组序列预测其细胞(bāo)类(lèi)型(xíng)。这(zhè)也(yě)引(yǐn)发(fā)了(le)一(yī)个(gè)有(yǒu)趣的设想:如果基因组序(xù)列(liè)不(bù)足(zú)以(yǐ)定(dìng)义(yì)细胞类型,那将是一个颠覆性的发现,意味着除了DNA,细胞中的蛋白质、代谢物等,其他分子(zi)也(yě)可(kě)能(néng)携(xié)带(dài)关键信(xìn)息(xi)。
进(jìn)化(huà)与(yǔ)发(fā)育(yù)过(guò)程(chéng)中(zhōng)的(de)信(xìn)息(xi)流(liú):多(duō)细(xì)胞(bāo)生(shēng)物(wù)的(de)起(qǐ)源(yuán)与(yǔ)进(jìn)化(huà)
多(duō)细(xì)胞(bāo)生(shēng)物(wù)中(zhōng)存(cún)在(zài)许(xǔ)多(duō)不(bù)同(tóng)的(de)细(xì)胞(bāo)类(lèi)型(xíng),细(xì)胞(bāo)类型就像是生物体的“工具箱”,不同的工具(细胞类型)负责不同的任务。比如,肌肉细胞负责运动,神经细胞负责传递信号。但令人好奇的是,这些 “工具” 在进化过程中是如何演变的呢?鱼类的鳍和人类的手外形差异巨大,它们是否由相似的细胞类型演化而来?彼此之间又存在怎样的关系?也就是说,细胞类型之间的关系能否揭示生物体从简单到复杂的进化历程?趋同进化(不同物种独立进化出相似结构)是否依赖相同的细胞类型?对这些进化过程中信息流的研究,不仅有助于深入了解进化生物学,还可能为合(hé)成(chéng)生(shēng)物(wù)学(xué)提(tí)供(gōng)新(xīn)思(sī)路。如(rú)果(guǒ)能(néng)够(gòu)明(míng)晰(xī)细(xì)胞(bāo)类(lèi)型(xíng)的(de)进(jìn)化(huà)关系(xì),或(huò)许(xǔ)就(jiù)能(néng)设(shè)计(jì)出(chū)新(xīn)的(de)细(xì)胞(bāo)类(lèi)型(xíng),甚(shén)至创造出全新的生物结构。
更令人惊叹的是,多细胞生物的发育过程具有很(hěn)强(qiáng)的(de)可(kě)塑(sù)性(xìng)。科(kē)学(xué)家(jiā)曾(céng)将(jiāng)胚(pēi)胎(tāi)的(de)一(yī)部(bù)分(fēn)移(yí)植(zhí)到(dào)另(lìng)一(yī)个(gè)胚(pēi)胎(tāi)中(zhōng),生(shēng)物(wù)体(tǐ)依(yī)然(rán)能(néng)够(gòu)正(zhèng)常(cháng)发(fā)育(yù)。这(zhè)种(zhǒng)抗(kàng)扰(rǎo)动(dòng)的(de)稳(wěn)定(dìng)性(xìng)表(biǎo)明(míng),细(xì)胞(bāo)之(zhī)间(jiān)的(de)信(xìn)息(xi)流(liú)具(jù)有(yǒu)高(gāo)度(dù)冗(rǒng)余(yú)性(xìng)和(hé)灵(líng)活(huó)性(xìng)。只(zhǐ)要(yào)胚(pēi)胎(tāi)的(de)关键信(xìn)号(hào)中(zhōng)心(xīn)(如(rú)胚(pēi)胎(tāi)的(de)组(zǔ)织(zhī)者(zhě)区(qū)域)未(wèi)被(bèi)破(pò)坏(huài),胚(pēi)胎(tāi)通(tōng)常(cháng)就(jiù)能(néng)正(zhèng)常(cháng)发(fā)育(yù)。深(shēn)入(rù)探(tàn)究(jiū)这(zhè)种(zhǒng)信(xìn)息(xi)流(liú)的(de)机(jī)制(zhì),将(jiāng)为(wèi)人(rén)们(men)揭(jiē)示(shì)生(shēng)命(mìng)的(de)更(gèng)多(duō)奥(ào)秘(mì)。
人(rén)工(gōng)智(zhì)能(néng)与(yǔ)细(xì)胞(bāo)信(xìn)息(xi)流(liú):开(kāi)启(qǐ)未(wèi)来(lái)希(xī)望(wàng)之(zhī)门(mén)
在(zài)人(rén)工(gōng)智(zhì)能(néng)和(hé)机(jī)器(qì)学(xué)习(xí)蓬(péng)勃(bó)发(fā)展(zhǎn)的(de)当(dāng)下(xià),这(zhè)些(xiē)技(jì)术(shù)在(zài)理(lǐ)解(jiě)细(xì)胞(bāo)信(xìn)息(xi)流(liú)方(fāng)面(miàn)展(zhǎn)现(xiàn)出(chū)巨(jù)大(dà)潜(qián)力(lì)。随(suí)着(zhe)技(jì)术(shù)不(bù)断(duàn)进(jìn)步(bù),人(rén)们(men)有(yǒu)机(jī)会(huì)构(gòu)建(jiàn)模(mó)型(xíng)来(lái)捕(bǔ)捉(zhuō)细(xì)胞(bāo)内(nèi)部(bù)和(hé)细(xì)胞(bāo)之(zhī)间(jiān)的(de)信(xìn)息(xi)流(liú)。事(shì)实(shí)上(shàng),人(rén)工(gōng)智(zhì)能(néng)在(zài)蛋(dàn)白(bái)质(zhì)结构预测领域已经取得显著成果,AlphaFold项目就是很好的例证。未来,类似技术或许能帮助人们理解细胞状态的变化,甚至设计出新的细胞类型。
借助人工智能大模型,我们甚(shén)至(zhì)可(kě)以(yǐ)将细胞的所有可能转录状态视为一个高维空间,而其中只有一小部分代表了细胞实际可以达到的生物状态。通过训练语言模型,有望学习到这些可达到的细胞状态的“流形”,并利用这些模型设计合成生物学方法,创造(zào)出(chū)工(gōng)程(chéng)细(xì)胞状态。
生命的密码,依然等待着破解
自(zì)19世纪细胞学说建立以来,人类对细胞的探索从未停止。经历了深入研究基因的“基因世纪”后,如今似乎正迎来聚焦细胞的“细胞世纪”。细胞,不仅是生命的基本单位,也是未来医疗革命的核心。
理解细胞中的信息流,不仅有助于解答生命的基本问题,还可能为医学、合成生物学等领域带来突破性进展。未来十年,随着基因组学、单细胞技术和人工智能持续发展,生物学有望迎来又一次重大革命,而这场革命的关键,或许就隐藏在细胞中的信息流里。
生命的密码,正等待着人们去破解。
(本文审核专家:沈阳药科大学曹家庆副教授)
参考资料
[1] Quake S R (2024).The cellular dogma. Cell, 187(23):6421-6423.
[2] Temin, H. M., & Mizutani, S. (1970). RNA-dependent DNA polymerase in virions of Rous sarcoma virus. Nature, 226(5252), 1211-1213.
[3] Baltimore, D. (1971). Expression of animal virus genomes. Bacteriological Reviews, 35(3), 235-241.
[4] Allis, C. D., & Jenuwein, T. (2016). The molecular hallmarks of epigenetic control. Nature Reviews Genetics, 17(8), 487-500.
[5] Bartel, D. P. (2004). MicroRNAs: genomics, biogenesis, mechanism, and function. Cell, 116(2), 281-297.
[6] Fiehn, O. (2002). Metabolomics—the link between genotypes and phenotypes. Plant Molecular Biology, 48(1-2), 155-171.
注:本文封面图片来自版权图库,转载使用可能引发版权纠纷。

特 别 提 示
1. 进入『返朴』微信公众号底部菜单“精品专栏“,可查阅不同主题系列科普文章。
2. 『返朴』提供按月检索文章功能。关注公众号,回复四位数组成的年份+月份,如“1903”,可获取2019年3月的文章索引,以此类推。
版权说明:欢迎个人转发,任何形式的媒体或机构未经授权,不得转载和摘编。转载授权请在「返朴」微信公众号内联系后台。