新闻中心 >> 公司新闻 >>

当生命被编程:AI教会细胞“听话”,未来启发机器自进化

2025-11-13 12:00:24

作者:郭瑞东

现在,我们可以让AI生成任何想象中的画面——梵高笔触下的猫,或在火星上奔跑的企鹅。算法从噪声出发,反向推理出图像的结构与色彩,仿佛在混乱中召唤出秩序。科学家也在思考一个(gè)问(wèn)题(tí),那(nà)生(shēng)命(mìng)能(néng)被(bèi)“生(shēng)成(chéng)”吗(ma)? 

今(jīn)年8月,哈佛大学与瑞士洛桑大学的研究团队在模拟环境中实现了一项令人惊叹的成果:为“生命生成模型”找到了它的“提示词”。科学家给让虚拟细胞群一个“目标形态”,然后让它反向推理,找出那套让细胞们自组织形成该形态的算法。该发现加深了我们对生物发育过程的理解,更让可编程物质走出科幻小说成为可能。

论文信息:Deshpande, R., Mottes, F., Vlad, AD. et al. Engineering morphogenesis of cell clusters with differentiable programming. Nat Comput Sci (2025).

研究形态发生的四个步骤

生命从最初的受精卵到一个完整的,拥有复杂器官的生物的发育过程中究竟发生了什么?是什么样的规则,决定了海量的单个细胞在发育过程不同阶段的行为,进而生长出具有精美功能性的复杂结构?该问题一直位于生物学的核心,被称为“形态发生”(Morphogenesis)之谜。

要回答这个问题,科学家们通常需要走过几个关键步骤:

1. 观察与描述: 首先,科学家用显微镜和分子生物学工具(例如基因测序),细致入微地观察和记录胚胎发育的每一个瞬间——细胞在何时、何地分裂?它们如何移动?又分泌了哪些化学信号?

2. 建立假设: 基于观察,科学家们会提出假设:也许某个基因控制着细胞的分裂方向,也许某种化学物质的浓度梯度决定了器官的形状。这些假设试图将宏观的形态变化与微观的细胞行为联系起来。

3. 实验验证: 接着,通过基因敲除、药物干预等实验手段,去验证这些假设。如果敲掉某个基因,胚胎发育就停滞了,那么这个基因很可能就是关键“开关”。

4. 构建模型: 最后是将所有零散的知识整合起来,构建一个能够“从头到尾”模拟整个发育过程的计算模型。这个模型不仅要能重现已知的现象,更要能预测未知的结果,从而揭示出支配全局的“底层算法”。正是在这一层面,哈佛大学与洛桑大学的最新研究实现了突破:他们通过“可微分编程”,让形态发生的过程首次具备了可计算、可优化、可设计的可能。

可微分编程的建模和优化步骤

这项研究的方法学创新,如图1所述。研究者把每个细胞都看作一个能感知、能决策的“小智能体”。它们能探测周围环境——比如化学物质的浓度、受(shòu)到(dào)的(de)机(jī)械(xiè)压(yā)力(lì)——并(bìng)根(gēn)据(jù)这(zhè)些(xiē)信(xìn)号(hào),通(tōng)过(guò)内(nèi)部(bù)的(de)“调(diào)控(kòng)网(wǎng)络(luò)”决(jué)定(dìng)自(zì)己(jǐ)的(de)行(xíng)动(dòng):是(shì)否(fǒu)要(yào)分(fēn)裂(liè)、分(fēn)泌(mì)哪(nǎ)种(zhǒng)分(fēn)子(zi)、向(xiàng)哪(nǎ)个(gè)方(fāng)向(xiàng)移(yí)动(dòng)。这(zhè)种(zhǒng)方(fāng)法(fǎ),就(jiù)是可微分编程,在计算机中,它就是通过连续优化而非试错搜索来“学习规则”的方法。它能自动计算每一步调整对最终结果的影响,从而让复杂系统像神经网络一样被“训练”出来。

图1:每个细胞内模型的输入输出概述

而要理解这套“编程”系统如何运作,需要想象一下,细胞之间不能像我们一样说话,它们的“语言”是化学物质,这些分子并不会原地不动,而是像墨水滴入水中一样,在细胞集群所处的环境中扩散开来。

这种扩散遵循物理定律,最终会形成一个稳定的浓度梯度——距离化学物质的源头(图2中的黑点)越近,浓度就越高,距离越远,浓度越低(对应图2左图)。其他细胞就像一个个微型的“化学传感器”,通过感知自己周围环境中这些化学物质的浓度,就能“知道”附近有多少同类、它们在做什么,甚至能判断自己在组织中的“位置”。

图2:细胞如何分泌化学标志物和感知机械力

细胞不仅会“闻”,还会“摸”。把细胞想象成一个个柔软但有弹性的球。当两个细胞靠得太近时,它们会产生排斥力(图2右图中细胞距离曲线的左侧“REPULSIVE”区域),防止彼此重叠,这模拟了细胞膜的“排他性”。而当它们保持一个恰到好处的距离时,又会产生吸引力(图2右图中细胞距离曲线的右侧“ATTRACTIVE”区域),这模拟了细胞间的“粘附”性,让组织能保持完整而不散架。

有了“感知”(化学与机械)和“行动”(分裂与分泌),问题的关键就变成:细胞内部的“决策手册”——也就是基因调控网络——该如何编写?图3展示的,正是这一步的核心:用可微分编程来优化细胞的行为规则。

图3:梯度计算和优化示意图

在模型中,每个细胞的调控网络被设计成一个“黑箱”:输入是基因之间的连接强度(哪些基因彼此激活或抑制),输出则是整个细胞群最终长出的形态。系统的目标,是自动找到一组最佳参数,让模拟出来的形态尽可能接近目标——比如,让虚拟胚胎在计算机中长得像真实的胚胎一样。

传统方法往往靠(kào)“瞎猜和反复试错”,效率极低。而可微分编程的妙处在于:它能自动计算出一个“梯度”,也就是——如果我轻轻调整这个参数,结果会更接近目标,还是更远离目标?这个梯度就像一只指路的罗盘,告诉优化器(如 Adam 算法)应当沿哪个方向微调,才能让系统朝目标演化。

在这一研究中,科学家使用了一种名为 REINFORCE 的策略梯度算法。细胞分裂是带随机性的事件,无法直接求导。REINFORCE 的巧思是为每一次分裂打分(reward):若这次分裂让整个集群更接近目标形态,就给高分;反之则给低分。系统再根据这些分数调整控制网络的参数——经过成千上万次模拟,模型逐步“学会”了如何让细胞群通过最简单的局部互动,自发形成宏观上协调的结构。

图3中的“Policy Gradient”箭头,正象征着这一从结果反推原因的学习过程。它把宏观目标(我们希望看到的形态)与微观机制(单个细胞的规则)连接起来,在(zài)两(liǎng)者(zhě)之(zhī)间(jiān)搭(dā)建(jiàn)起(qǐ)一(yī)座(zuò)“因果之桥”。通过这座桥,研究者不仅能得到让细胞自组织的算法,还能进一步简化网络、突出核心机制——让系统在保持整体功能的同时,展现出最精炼的生命逻辑。

接下来,将会从三个挑战:如何让细胞像排队一样定向生长(轴向伸长);如何让不同类型的细胞保持平衡共存(组织稳态)以及如何让所有细胞在发育中“雨露均沾”(均匀生长)三部分,逐个讲述用可微分编程算法来在模拟环境下,实现“可编程物质”,并让我们离“重塑生命”的梦想又近了一步。

挑战1:破解蝾螈的再生之谜——通过正反馈实现定向生长

蝾螈是一种能够如同蚯蚓一样,在一定范围内具有断肢重生能力的生物。当因为意外失去一条腿的时候,它能重新长出一条功能完整、形态完美的新腿。

蝾螈的新腿要从无到有,首先要确定“往哪个方向长”。是向上?向下?还是向旁边?答案是:沿着原来腿骨的方向,笔直地向外生长。这就意味着向一个固定的方向生长。但蝾螈是怎么完成这一目标的,我们又如何用AI如何教会一群细胞“听话”,实现精准的轴向伸长呢?

符合直觉的方法是,假如(rú)想(xiǎng)要(yào)让虚拟细胞组成的聚簇向右边生长,可在当前右边放一些刺激生长的化学物质,但研究人员模拟得到的算法,却是细胞感知到的化学信号浓度越高,其分裂倾向越低(图4b)。

图4:向一个方向定向生长的虚拟细胞

具体来看,图4c中的“源细胞”(Source cells,红色)固定在集群左侧,持续分泌一种化学物质。随该物质在细胞集群中扩散,形成一个从左(高浓度)到右(低浓度)的稳定梯度。靠近源细胞(左侧)的细胞,感知到高浓度化学信号,其分裂被强烈抑制。远离源细胞(右侧)的细胞(bāo),感(gǎn)知(zhī)到(dào)低(dī)浓(nóng)度(dù)信(xìn)号(hào),抑(yì)制(zhì)解(jiě)除(chú),分(fēn)裂(liè)倾(qīng)向(xiàng)高(gāo),因(yīn)此(cǐ)快(kuài)速(sù)分(fēn)裂(liè)增(zēng)殖(zhí)。 发(fā)生(shēng)在(zài)右(yòu)侧(cè)的(de)增(zēng)殖(zhí)使(shǐ)集群(qún)向(xiàng)右(yòu)延(yán)伸(shēn),新(xīn)长出的细胞离源更远,感知到的信号更弱,分裂更活跃,从而形成了一个自我强化的正反馈循环,驱动集群持续向右(低浓度区)生长。最初生成的细胞集群,如图4d所示。

如此的结果,如图4a所示,其中左侧是当调控每个虚拟细胞的神经网络使用随机初始化参数,得出的模拟结果——细胞集群毫无章法地向各个方向膨胀,最终形成一个(gè)不(bù)规(guī)则(zé)的(de)、近乎球形的团块。而右侧是经过可微分编程“训练”后的结果——细胞集群精准地沿着水平方向(X轴)伸长,形成一个细长的棒状结构。

这种“远端生长、近端抑制”的模式,与脊椎动物肢体芽的发育机制存在相似性。在真实胚胎中,肢体也是从一个芽状结构开始,通过远端(顶端外胚层嵴,AER)分泌的生长因子(如FGF)促进远端细胞增殖来实现伸长。

一个是亿万年进化打磨出的自然奇迹,一个是人类用代码和算法“逆向工程”出的人工神经网络。它们采用的“分子语言”或许不同(一个是FGF刺激近端,一个是虚拟抑制剂抑制远端),但它们遵循的“空间定位+局部抑制”的核心逻辑,却惊人地一致。生命的奥秘或许蕴于简洁的规则之中。算法没有复刻自然,但它殊途同归的再现了自然的智慧。

这一实验的成功,直观地证明了通过优化细胞内部的基因调控网络参数,我们能够从发育过程的底层“编程”宏观形态。研究者不需要直接告诉细胞“往右长”,而可通过调整它们感知化学信号和决定分裂的规则,让“向右伸长”这一宏观目标(biāo)从(cóng)众(zhòng)多(duō)细(xì)胞(bāo)的(de)局(jú)部(bù)互(hù)动(dòng)中(zhōng)“涌(yǒng)现(xiàn)”出(chū)来(lái)。

与(yǔ)许(xǔ)多(duō)“黑(hēi)箱(xiāng)”AI模(mó)型(xíng)不(bù)同(tóng),这(zhè)项(xiàng)研(yán)究(jiū)的(de)成(chéng)果(guǒ)是(shì)高(gāo)度(dù)可(kě)解(jiě)释(shì)的(de)。研(yán)究(jiū)者(zhě)可(kě)以(yǐ)拿(ná)着(zhe)上(shàng)述的“正反馈+梯度感知”模型,去真实的生物系统(如果蝇、小鼠胚胎)中寻找功能上等价的分子通路。研究者也不再需要从海量的分子生物学数据中大海捞针般地猜测调控机制,而是可以先在简化模型中,类似产品设计中的“逆向工程“,先“计算”出可能的机制,再用实验去验证和细化。这极大地加速了我们对复杂生命过程的理解。

挑战2:骨骼里的“建设者”与“拆迁队”——负反馈实现细胞稳态

生物体不是由单一类型的细胞组成,而是多种类型的细胞通过分泌化学物质“互相喂养”并“自我抑制”,最终产生内稳态(homeostasis)。例如在你身体的每一块骨头里,都持续上演着“建设与拆迁”的双人舞。主角是两种细胞:成骨细胞(Osteoblasts)——“建设者”,和破骨细胞(Osteoclasts)——“拆迁队”。

如果只有“建设者”拼命盖楼,城市会变得臃肿不堪,结构失衡;如果只有“拆迁队”肆意破坏,城市又会变成一片废墟。健康的骨骼,需要两者数量和活性的完美平衡。这是如何达到的呢?

在真实生物体中, 当“建设者”(成骨细胞)在某个区域辛勤工作,建造新骨时,它们会分泌一种名为 RANKL 的化学信号。这个信号就像一封“邀请函”,飘向附近的“拆迁队”(破骨细胞),告诉它们:“嘿,这边新楼盖好了,有些旧材料可以拆了!”

之后“拆迁队”收到邀请,开始工作。在拆除旧骨的过程中,它们会释放出储存在骨头里的生长因子,比如 TGF-β。这些因子就像“感谢信”和“开工红包”,飘回给“建设者”,刺激它们在拆除后的空地上重建新骨。此外每种细胞都会分泌一些物质来抑制自己的过度增长。比(bǐ)如(rú),“拆(chāi)迁(qiān)队(duì)”工(gōng)作(zuò)得(de)太(tài)猛(měng)时(shí),会(huì)释(shì)放(fàng) OPG(RANKL的(de)诱(yòu)饵(ěr)受(shòu)体(tǐ)),把(bǎ)多(duō)余(yú)的(de)“邀(yāo)请(qǐng)函(hán)”拦(lán)截(jié)掉(diào),防(fáng)止自己被过度激活。“建设者”也有类似的自我抑制机制。

在模拟环境中,存在两类细胞:红色细胞(类型1) 和 蓝(lán)色(sè)细(xì)胞(类型2)。每种细胞都拥有一个专属的“化学语言”(图5a)每种细胞都能“听懂”对方的语言。如图5b所示:红色细胞不仅能分泌化学因子1,还能感知环境中化学因子2的浓度;同样,蓝色细胞不仅能分泌化学因子2,也能感知化学因子1的浓度。

图5:让两类(lèi)细(xì)胞(bāo)数(shù)量(liàng)稳(wěn)定(dìng)保(bǎo)持(chí)在(zài)1:1

而(ér)待(dài)优(yōu)化(huà)的(de)虚(xū)拟(nǐ)细(xì)胞(bāo)调(diào)控(kòng)网(wǎng)络(luò),其(qí)目(mù)标(biāo)是(shì)要(yào)让(ràng)两(liǎng)类(lèi)细(xì)胞(bāo)的(de)数(shù)量(liàng)之(zhī)比(bǐ)稳(wěn)定(dìng)保(bǎo)持(chí)在(zài)1:1。要(yào)实(shí)现(xiàn)这(zhè)一(yī)目(mù)标(biāo),需(xū)要(yào)两(liǎng)个(gè)机(jī)制(zhì),首(shǒu)先(xiān)是(shì)互(hù)惠(huì)共(gòng)生(shēng),即由蓝色细胞分泌的化学因子2会促进红色细胞的分裂;而由红色细胞分泌的化学因子1会促进蓝色细胞的分裂。这就像A族人越多,B族人就越有动力生孩子;B族人越多,A族人也越有动力生孩子。

而第二个机制则是自我抑制,即红色细胞分泌的化学因子1会抑制红色细胞自身的分裂;蓝色细胞分泌的化学因子2会抑制蓝色细胞自身的分裂。这就像A族人太多时,会主动“计划生育”;B族人太多时,也会主动控制增长。

具有上述两个机制,训练后的虚拟细胞调控网络能让两种细胞能够始终保持数量接近(图5c的右边),而若是没有经过训练(liàn)的(de)调(diào)控网络,则会出现某种细胞数占比上升的情况(图5c的左边)。

这样的内稳态是可持续的(图5d),在使用训练好的网络所进行的模拟中,无论模拟运行多久(从100次分裂到300次分裂),红色细胞的比例都稳定地维持在50% 附近,波动极小。且能够从多种初始条件(红色细胞占比20-80%)最终都收敛到目标的50%(图5e)

真实生物体的调控机制与模拟条件下经过可微分编程自发涌现出的细胞调控机制一致,说明了经由可微分编程,可把握掌管生命运作的简洁而普适的规律。其关键在于建立局部、双向、带自我抑制的反馈回路,我助你成长,你助我繁荣;但我们都需自律,方能长久共存。这不必依赖一个中央控制者。

将上述的互惠共生+自我抑制的机制,应用到生态系统乃至人造的工程系统中。将为人类设计更稳健、更智能的工程系统(从合成生物学到社会治理)提供宝贵的蓝图。

挑战3:感知压力的细胞——靠“挤压反馈”实现均匀生长

在果蝇翅膀的发育早期,中心区域充满生长因子(如 Dpp、Wingless),浓度高、分裂快。按理说,中心细胞应该越长越鼓,翅膀最终会鼓起一个“包”。但事实恰好相反——到了发育中后期,翅膀的生长速度在各处几乎一样,最终形成精确而平整的扇形。

果蝇是怎么做到这一点的?答案藏在细胞对机械力的感知中。当中心细胞分裂太快、密度过高时,它们会互相“挤压”,压力升高,进而激活名为 Hippo 的基因通路。该通路会抑制一个关键分子 Yorkie (Yki) ——这是细胞分裂的“油门开关”。一旦 Yki 被抑制,细胞分裂被“踩了刹车”,生长自然放缓。就这样,果蝇用力学反馈实现了化学信号无法完成的自我平衡。

图6:机械力与化学信号共同促成胚胎的均匀生长

这一机制与果蝇翅膀的真实发育过程高度吻合:核心都是通过“压力感知→分裂抑制”的负反馈实现生长均衡。更令人惊讶的是,这个“会感压”的调控网络还具备极强的泛化能力。无论是在生长因子扩散速度更快、分泌源变多,还是偏离中心的情况下,它都能保持生长的平衡(图6c–e)。

即使外界扰动,细胞也能凭借对压力的感知,自我修正形态,保证最终结构的完整性。这也解释了为什么生物体在受损或环境波动时,仍能发育出正常形态——生命并不需要一个上帝式的“绘图者”,它靠局部互动就能重建秩序。

而当研究者在模拟中“关闭”细胞的机械感知功能(图6d),系统立刻失衡:细胞过度分裂,组织紊乱,最终形态畸变。这一结果与真实实验完全一致——若敲除 Hippo 通路的关键基因,果蝇组织同样会出现肿胀、畸形甚至肿瘤。在最终的可视化结果中(图6e),细胞的“分裂倾向”(红线)与感知到的“机械应力”(绿线)呈负相关,像一场精妙的“削峰填谷”:哪里压力大,就放慢生长;哪里空间宽,就加速分裂。这种自动的平衡机制,正是自然界“自组织智慧”的写照——翅膀的形态,不是被画出来的,而是被挤出来的。

将胚胎发育的原则应用于智慧生产,对未来的脑洞畅享

当科学家将三条发育原则结合起来——定向生长、数量平衡与均匀分布——一个令人着迷的设想随之出现:如果把细胞换成无人机,把基因调控网络换成算法程序,会(huì)发(fā)生(shēng)什(shén)么(me)?设(shè)想(xiǎng)一(yī)条(tiáo)完(wán)全自(zì)动(dòng)化(huà)的(de)无(wú)人(rén)机(jī)生(shēng)产(chǎn)线(xiàn)。当(dāng)战(zhàn)场(chǎng)上(shàng)10点(diǎn)钟(zhōng)方(fāng)向(xiàng)出(chū)现(xiàn)步(bù)兵和装甲部队时,系统会像细胞感知化学梯度一样,通过“正反馈”与“生长因子”式的信息扩散,引导生产线在那个方向“生长”,集中制造对应型号的无人机。

算(suàn)法(fǎ)同(tóng)时(shí)会(huì)根(gēn)据(jù)敌(dí)军(jūn)比(bǐ)例(lì)自(zì)动(dòng)调(diào)节(jié)A型(xíng)与(yǔ)B型(xíng)无(wú)人(rén)机(jī)的(de)数(shù)量(liàng),维(wéi)持(chí)整(zhěng)体(tǐ)平(píng)衡(héng)。而(ér)当(dāng)生(shēng)产(chǎn)线(xiàn)某(mǒu)处(chù)过(guò)度(dù)拥(yōng)挤(jǐ)、机(jī)械(xiè)压(yā)力(lì)上升时,系统又会自动减缓产出,防止“过度增殖”。这样一个能自我调节、自动优化的生产线的生产线,将会使得未来的生产如同生命般高效而灵活。

上述只是笔者的一个科幻式的类比,而真正的科学图景可能更令人震撼。原论文作者,则是指出未来可将真实的时空成像数据(如器官芯片或类器官的延时摄影)和单细胞基因表达谱输入虚拟细胞发育的调控框架。如此科学家将不再是在“真空”中设计规则和优化目标,而是从真实的生命动态数据中学习和推断出其背后(hòu)的(de)调(diào)控(kòng)逻(luó)辑(ji)。

在(zài)这(zhè)样(yàng)的(de)图(tú)景(jǐng)中(zhōng),研究者将果蝇翅膀、小鼠胚胎、甚至人类器官的发育过程拍成电影,然后输入给可微分编程算法。算法会从海量的细胞行为中,自动“推理”出驱动各类生物发育的隐藏规则。同时模型不再像本研究这样,使用球形模拟细胞,忽略真实的细胞形状、极性、细胞骨架等复杂生物物理特性。这样的模型,无疑将加深我们对生物发育过程的理解。

该(gāi)研(yán)究(jiū)已(yǐ)经(jīng)开(kāi)源了对应代码,并呼吁将真实的实验数(shù)据(jù)注(zhù)入(rù)这(zhè)个(gè)框(kuāng)架(jià)。未(wèi)来(lái)有(yǒu)一(yī)天(tiān),生(shēng)物(wù)学(xué)家(jiā),或(huò)将(jiāng)不(bù)仅(jǐn)是(shì)实(shí)验(yàn)台(tái)前(qián)的(de)观(guān)察(chá)者(zhě),更(gèng)是(shì)训(xun)练(liàn)模(mó)型(xíng)的(de)“炼(liàn)丹(dān)师(shī)”;医(yī)生(shēng)也(yě)能(néng)用(yòng)“数(shù)字(zì)孪(luán)生(shēng)”器(qì)官(guān)预(yù)演(yǎn)治(zhì)疗(liáo)方(fāng)案(àn);而(ér)未(wèi)来(lái)的(de)工(gōng)程(chéng)师(shī),或(huò)许(xǔ)能(néng)设(shè)计(jì)出(chū)会(huì)“自(zì)愈(yù)”的(de)智(zhì)能(néng)材(cái)料(liào)。这(zhè)一(yī)切(qiè),都(dōu)始(shǐ)于我们今天对“细胞如何发育”的探索和建模。

作者:郭瑞东

审核:张江(jiāng) 北(běi)京(jīng)师(shī)范(fàn)大(dà)学(xué)系(xì)统(tǒng)科(kē)学(xué)学(xué)院(yuàn)教(jiào)授(shòu)

出(chū)品(pǐn):中(zhōng)国(guó)科(kē)协(xié)科(kē)普(pǔ)部(bù)

监(jiān)制:中国科学技术出版社有限公司、北京中科星河文化传媒有限公司










400-85643322
广东省广州市番禺区长沙路103号
PR:com@czzscl.com; Sales:ccm@czzscl.com
粤ICP备19042278号 | © 2025 汽车芯片科技有限公司官方网站【登录入口】. All rights reserved. | 网站地图