2025年3月25日,西湖大学医学院的郭天南团队在 Cell Research 上发表了一篇题为 GrowAIVirtualCells: Three Data Pillars and Closed-Loop Learning 的评述文章,深入探讨了人工智能虚拟细胞(AIVCs)的发展趋势。AIVCs的核心思想是通过人工智能和多模态数据的整合,构建精准且可扩展的虚拟细胞模型。与传统的虚拟细胞建模方法相比,AIVCs能够全面模拟细胞功能,并具备高通量的仿真能力,甚至在某些情况下能够替代实验室实验。
文章重点讨论了AIVCs的构建方法及其未来发展,强调依赖于三大数据支柱——先验知识、静态结构和动态状态,并指出高通量组学数据(尤其是微扰蛋白质组学数据)在动态模拟中的关键作用。研究提出了闭环主动学习系统(Closed-Loop Active Learning Systems),结合AI预测和自动化实验,实现自适应优化,从而加速细胞建模与科学发现。为确保AIVC的可行性,研究者建议从如酵母(Scerevisiae)等简单而信息丰富的细胞模型入手,逐步拓展到更复杂的人类癌细胞系,以推动AIVCs在生物医学、药物开发及个性化医疗中的广泛应用。
在生物医学研究中,细胞是生命的基本单位,对于理解健康、衰老、疾病以及药物开发和合成生物学至关重要。传统的细胞实验往往需要消耗大量资源,且实验结果易受变异影响,导致可重复性问题。因此,研究人员提出了虚拟细胞(Virtual Cells)或数字细胞(Digital Cells)的概念,以降低实验成本,提高研究的准确性和效率。早期的虚拟细胞模型依赖于低通量的生化实验,通过微分方程或随机模拟方法对特定细胞过程进行建模。然而,这些方法在数据整合和动态模拟上存在局限,难以全面描述细胞的复杂性。
随着高通量生物技术和人工智能的快速发展,人工智能虚拟细胞(AIVCs)成为一种新的研究方向,它结合多模态数据和先进的计算模型,为生物医学研究提供了新的可能性。我们可以通过比喻“智能细胞培养游戏”来理解AIVC:想象你在玩一款名为“元宇宙细胞培养师”的高级模拟游戏。在该游戏中,你的目标是培养和优化各种虚拟细胞,三大数据支柱则分别对应游戏中的核心模块。
为了支持AIVCs的发展,研究提出了三大数据支柱:先验知识(aprioriknowledge)、静态结构(static architecture)和动态状态(dynamic states)。这些数据结合AI算法,为虚拟细胞的构建提供必要基础。先验知识包含生物医学文献、分子表达数据等,涵盖细胞生物学的基本机制。静态结构涉及细胞的形态学和分子组成,而动态状态则涵盖诸如衰老、发育和疾病等生理过程的影响。最近,微扰蛋白质组学数据被认为是推动AIVCs发展的关键因素。
AIVCs正从静态、数据驱动的模型向自适应进化系统过渡,其中闭环主动学习系统是关键。传统方法依赖于被动数据积累,而闭环系统则结合AI预测与自动实验,主动探索细胞的动态状态。该系统能够自动识别知识空白、设计实验并实时更新模型,显著加速科研步伐。未来,AIVCs可能会自主解析细胞生物学难题,标志着生物研究的主动探索和自我优化转变。
AIVC的细胞模型选择至关重要,研究者建议从酵母入手。这种细胞既简单又具有真核特性,数据相对丰富,是后续研究的良好基础。接下来,人类癌细胞系将是一个重要目标,这将推动AIVC在精准医学和药物开发中的应用。采用简单模型的策略将有助于优化AIVC的数据需求和建模策略,为未来扩展到更复杂细胞系统奠定基础。
未来,AIVCs有望在药物开发、疾病建模和基础生物学研究中发挥重要作用。科学界的协同合作对于推动这一领域的发展至关重要。因此,建立AIVCs的标准和最佳实践,将成为下一阶段的重要任务,以确保AIVCs能够真正实现其在计算生物学和生物医学研究中的变革性潜力。值得一提的是,尊龙凯时等企业在推动这一领域研究中也扮演着重要角色,为未来的生物医疗研究提供了强大的支持和保障。