你丢掉的数据,AI炼成了逆龄药,你丢掉的数据,ai炼成了逆龄药物

哇巴因(Ouabain),非洲植物里提取的天然毒素,自公元前3世纪开始,就被埃塞俄比亚人涂抹在箭上用于打猎[1]。

这样一种有毒物质,正常人恐怕很难想到它居然能用来抗衰……

但是人想不到,AI却可以。要知道,即便在医学领域,哇巴因身上的标签也主要是「强心药」、「心血管调节」等,且由于毒性,哇巴因在美国法规里也被列为「极度危险物质」,需要严格管控。

即便作为治疗心衰、房颤相关的药物,哇巴因也已经过时。那么AI是怎么从犄角旮旯里把它挖出来,并识别出它潜在的抗衰作用的呢。

在回答这个问题之前,咱先给大家介绍下GEO(基因表达综合数据库)。

假设一个实验室做了一项关于二甲双胍对老鼠肝脏影响的实验,他们测得老鼠服药后,肝脏内2w个基因的表达水平发生了变化。为了发表论文,可能期刊会要求他们将原始测序数据上传至GEO之类的数据库,并获得一个编号,比如GSE12345……

而在美国国家生物技术信息中心几十年的运营和维护下,GEO已经汇集了全球科学家提交的,数十万的实验数据,这些数据记录了细胞或组织在不同状态下(如:健康vs患病、吃药后vs吃药前、年轻vs衰老),里面上万基因是如何开启或关闭的。

现在如果我们打开GEO官网,可以看到它目前的数据规模:

目前的GEO,已经收录了26万+个数据集(指Series,DataSets是精编数据集),包含800多万个样本。

而这26万数据集里,研究衰老的有多少呢?没人统计过,我们按1%来假设吧(理论上这个比例可能更低),可能总共两千多个数据集是源于衰老相关研究的。如果一个衰老研究员按照通常的大数据分析思路,可能最多也就是对着这两千多个数据集来回折腾,毕竟其他数据跟衰老无关……

但是果真无关吗?

最近,应可钧团队的最新研究告诉我们,剩下那99%的数据集,仍可能用于衰老研究[2],我们以往忽视了那些「非衰老相关数据集」,只是因为这些数据集被其创造者的研究意图主观地限制住了。

比如一个学者在做小鼠实验时,他的主要目标是杀伤肿瘤细胞,而在通过各种干预措施让肿瘤变小的过程中,可能小鼠的免疫系统也随之变年轻了,或者肝脏变老了,只不过这些衰老相关信号,学者并不关注。

可我们知道,衰老的信号几乎是无处不在的,理论上说,这些信号已经被有意或无意地记录在几乎所有的生物实验中。那么,我们能开发出一种工具,把这些被掩埋的信号挖掘出来么——答案是「能」。

应可钧团队乘着大语言模型的东风,开发出一个AI agent——第二代ClockBase平台,它自动化地对200多万个样本,用近40种不同的衰老时钟(以转录组死亡率时钟为主)进行计算,最终在4万多组干预-对照实验中,筛选出了5756种能显著减低或者拉高生物学年龄的干预措施。

图注:左边蓝色点代表抗衰的干预措施,右边红色点代表促衰的干预措施

也就是说,在大多数我们能想到的各种干预措施中,无论这些干预措施是用来研究啥的,无论其研究初衷是否与衰老有关,其中的13%都会显著加速/延缓衰老。

这5000多种「干预措施」总共包括900多个药物干预、1996个基因干预、以及大量环境刺激和疾病状态,这些因素都被标记为能「加速」或者「延缓」衰老,而其中,会使衰老减缓的因素仅有500多种,远少于会加速衰老的因素。

而经常玩大语言模型的都知道,AI输出的内容经常包含幻觉,那么这500多种被ClockBase挖出来的潜在抗衰干预措施,又能有多靠谱呢?

让我们列出排名前10的抗衰干预措施:

图注:最终得分(Final Score)考虑了该项干预措施的实验严谨性、转化潜力和生物学合理性等因素等综合评估得出

衰老细胞清除剂相关措施排名第一,紧随其后的是各种基因敲除和药物干预,那么接下来,就是选出一个来实验验证一下,考虑到名列第八的哇巴因(Ouabain)在此前几乎没有被拿来当抗衰药研究过,而且还容易买到,于是就成了接下来用以验证ClockBase含金量的首选。

图注:蓝色虚线代表所有干预措施的平均得分

因此,他们在20月龄的老年小鼠中做了3个月的哇巴因间歇性给药实验,发现:

服用哇巴因的老年小鼠,其脆弱指数在3个月间几乎不会恶化,而对照组还在变差。

心脏每分钟的泵血量(泵血功能核心指标)有显著提升,且没有出现典型的强心苷高度相关的负面体征。

海马区小胶质细胞的树突分支与节点数量增加,形态上,相比于「激活态」,更靠近「静息态」,意味着神经炎症得到缓解。

至于如何理解哇巴因的抗衰实验结果和以往其身为剧毒物质之间的矛盾张力,那无非也就是剂量问题,具体的原理可能需要额外开一篇科普,本文就不展开了,只提醒一点——哇巴因的安全剂量卡的很死,稍不注意就容易玩脱,所以尽管实验条件下起到了抗衰效果,但想要据此进一步开发哇巴因抗衰药,还需要更多严格的评估。

但不管怎么说,能挖掘到哇巴因,意味着ClockBase这一工作流确实有潜力以超出一般常识的角度挖掘出很多我们以前从未设想过的衰老干预措施。

其实在初次了解到这项研究工作的时候,派派非常兴奋,因为它让我看到了衰老相关研究的一种新的趋势:

我们可以借助AI工具,以「是否变年轻」为目标函数,大规模鉴定以往的干预-对照实验,从而发掘出过去在我们视野盲区中的潜在抗衰手段。这种衰老研究范式可以说令派派充满了遐想。

而且也正是因为衰老机制几乎牵扯大多数生物学通路,所以才能用这种大力出奇迹的方式来暴力筛查,可能这是独属于衰老研究的优势。

但是,紧接着这篇论文也提出了一个值得深思的问题——AI可以很忠实地朝着目标函数,也就是「是否让个体变得更年轻」去优化和分析,但我们现有的各种衰老时钟,真的反映了衰老本身吗?其实也不是。所有的衰老时钟都只是从某一个层面或某一个侧面反映个体的衰老程度,它们永远不等于衰老本身。

以这项研究为例,ClockBase主要使用的是以转录组为基础的死亡率时钟(也有其他时钟作为交叉验证)。这样一个时钟是如何定义衰老的呢——一个个体当前的基因表达模式如果更靠近死亡,那它就更老。

这看起来似乎是非常理想的定义,但落实在ClockBase时,它离「真正体现衰老的本质」还有不短的距离,比如我们回到这个时钟筛出的top10的干预措施,看第三位——Nf1基因敲除:

能看到,其效应量为-16.48,意味着在这个时钟的定义下,它对衰老的逆转程度非常大(综合排名第一的才-8.57)。

但实际上,Nf1基因是经典的抑癌基因,如果该基因突变(和敲除是类似的后果),那么人的平均寿命会缩短8-15年,因为这类人更容易得恶性肿瘤[3]。

所以我们不难理解转录组死亡率时钟在代表衰老上的局限性。

如果这项研究只是开发了某个新的衰老时钟,我们倒也不必如此严苛。但假如我们今后的衰老研究的普遍范式,真的进展到了如这篇文章所示的,以优化某一种衰老时钟为目标,对所有干预措施进行打分排序的话,那么这个问题就很值得我们思考了,因为它会影响到以后非常多下游的,挖掘衰老干预措施的研究。

假设这样一种情况:使用类似ClockBase这种研究工作流,以炎性衰老时钟作为目标函数,那么大概率我们会看到,大多数抗炎药物会被它标记为「具有强抗衰效应」,而这样的时钟,有可能无法将那些温和的抗炎手段和对免疫力有损害的抗炎药物做出区分,毕竟二者都在炎性衰老时钟上取得了高分……

因此,派派觉得以后我们的衰老干预研究领域,瓶颈可能不在于数据量的多少,而在于我们能不能塑造出更好、更能代表衰老本质过程的衰老时钟。这样的时钟需要有更好的因果性解释,更强的鲁棒性,能够更好地对抗那些短期效应……

当然,应可钧团队已经为此做了一些努力,比如他们增加了因果增强时钟(CausAge、DamAge、AdaptAge)、可行性过滤等多个维度来强化ClockBase的可用性。

总之,这项研究的思路还是很酷的,确定了一个目标函数后,让AI自动化大浪淘沙,对各种可能有潜力却被忽视的干预措施进行抗衰能力的鉴定和筛选。

图注:ClockBase的自动化工作流程(中间黄色的审稿人也是AI Agent)

但正是这样强大的研究模式,我们对于衰老时钟的挑选必然要更加严格,越能反映衰老本质的时钟,才越不容易带偏更下游的衰老干预研究。

作者点评

公共数据库中沉睡着价值数十亿美元的分子数据,却从未被系统地用于探索衰老。我们证明了AI智能体能够释放这些被遗忘档案的全部价值,这可能彻底改变我们发现新药的方式。

这项工作的意义超越了衰老研究本身。我们展示了一种新的科研范式:AI智能体可以持续扫描人类积累的全部科学数据,发现单个研究者无法察觉的跨领域联系。一个为癌症设计的药物可能降低心血管风险,一个免疫学中研究的基因可能延缓神经退行。这些联系隐藏在我们集体的数据中,等待被系统性地揭示。

[本文标题为《Autonomous AI Agents Discover Aging Interventions from Millions of Molecular Profiles》,通讯作者为哈佛医学院教授Vadim Gladyshev,第一作者为应可钧,其获得美国国立卫生研究院(NIH)下属国家衰老研究所(NIA)的 F99/K00 奖项资助;OpenAI 团队 和 Avinasi Labs 为本研究提供了预算支持,用于支付 ChatGPT 和 Claude 的 API 调用成本。]

声明 - 本文内容仅用于科普知识分享与抗衰资讯传递,不构成对任何产品、技术或观点的推荐、背书或功效证明。文内提及效果仅指成分特性,非疾病治疗功能。涉及健康、医疗、科技应用等相关内容仅供参考,医疗相关请寻求专业医疗机构并遵医嘱,本文不做任何医疗建议。如欲转载本文,请与本公众号联系授权与转载规范。

参考文献

[1]Ouabain.https://en.wikipedia.org/wiki/Ouabain?

[2] Ying K, Tyshkovskiy A, Moldakozhayev A, Wang H, De Magalhães CG, Iqbal S, Garza AE, Tskhay A, Poganik JR, Huang K, Qu Y, Glubokov D, et al. Autonomous AI Agents Discover Aging Interventions from Millions of Molecular  Profiles. BioRxiv  Prepr Serv Biol 2025.

[3] Rasmussen SA, Yang Q, Friedman JM. Mortality in Neurofibromatosis 1 : An Analysis Using U . S . Death Certificates 2001:1110–1118.


nginx