人工智能驱动的虚拟细胞(Artificial Intelligence Virtual Cell, AIVC)正日益成为生物学与人工智能交叉融合的研究前沿,其核心愿景是构建能够模拟并预测细胞状态动态演化过程的数字孪生体,进而为实验设计与机制解析提供计算支持(Cell 2024)。尽管近年来,大语言模型(Large Language Models, LLMs)所启发的组学基础模型(omics foundation models)在多任务学习中展现出一定潜力,但最新测评结果表明,其在动态预测能力与机制可解释性方面仍存在明显局限,尤其在建模复杂生物过程时表现不尽理想 (Nature Methods 2025)。在此背景下,融合生物学先验与动态机理的数学建模方法重新引发关注(Cell 2025)。然而,AIVC构建所依赖的关键数据——单细胞多组学观测,普遍面临采样稀疏、高维异质性强等挑战,导致传统以微分方程为核心的建模方法在数据驱动建模过程中遭遇可观测性不足与维度灾难,难以实现对高分辨率、连续性时空动态过程的有效刻画。
针对上述难题,我们在融合生成式人工智能方法与动力系统理论的统一建模框架方面进行了探索,结合最优传输理论(Optimal Transport)、薛定谔桥(Schrödinger Bridge)和微分几何等数学理论和流匹配(Flow Matching)、扩散模型等生成式AI建模技术,能够从静态、异质的单细胞组学时序快照观测中有效推断出细胞增殖、凋亡、分化、迁移和互作等复杂状态转换的连续动力学过程。同时,与黑箱方法相比,该方法不仅具备良好的生成性和泛化能力,还具有较好的机制可解释性,可实现跨时间尺度与空间结构的细胞状态数据生成,为建立具备可解释性、可预测性与生物先验整合能力的动态虚拟细胞模型提供了一种可能的思路。