近年来,人工智能(AI)已深度融入生命科学研究,尤其在基因组编辑领域,正引发一场从“预测”到“设计”的根本性变革。传统机器学习模型通过分析海量实验数据,显著优化了向导RNA(gRNA)选择、脱靶效应预测及编辑结果评估,提升了CRISPR系统应用的精准度。然而,生成式AI的兴起,将这一领域推向了更具创造性的新阶段。
2025年11月《自然·结构与分子生物学》的一篇评论文章,重点阐述了AI如何通过蛋白质从头设计,解决基因编辑工具长期存在的精度难题。其中,Lu团队的研究堪称典范。针对线粒体胞嘧啶碱基编辑器(DdCBE)编辑窗口过宽导致非靶向编辑的问题,他们利用生成式AI工具RFdiffusion,设计了一个全新的刚性“定向结构域”,用以精确固定DNA结合模块与脱氨酶催化模块的空间相对位置。由此诞生的TALE导向脱氨酶(TOD),成功将编辑窗口从14-18 bp大幅收窄至3 bp,并在大肠杆菌中将编辑效率提升4.5倍。冷冻电镜结构证实了设计结构的刚性。进一步优化的DdCBE–TOD系统在患者来源的MERRF综合征成纤维细胞模型中,实现了约41%的致病突变mtDNA校正,并成功恢复了细胞功能。这项工作首次展示了如何通过AI理性设计蛋白质三维结构,来精确控制酶功能,实现单碱基精度的编辑。
类似的突破性案例正在涌现。Profluent Bio公司利用蛋白质语言模型(PLM)生成了自然界中不存在的Cas9变体OpenCRISPR-1,其编辑效率与天然酶相当,但具有更佳的脱靶特异性。这证明AI能够探索远超自然进化范围的序列空间,直接交付功能蛋白。在先导编辑领域,研究人员结合RFdiffusion与AlphaFold 3,设计出一种能特异性破坏错配修复蛋白MLH1–PMS2相互作用的小结合子(PE-SB)。将其整合形成的PE7-SB2系统,在人类细胞中的编辑效率比前代工具大幅提升,为克服先导编辑的主要效率瓶颈提供了全新策略。
这些进展标志着AI在基因组编辑中的角色发生了根本性演变:它不再仅仅是分析数据、预测结果的“助手”,而是成为了能够主动“发明”全新蛋白质结构、创造新功能的“设计引擎”。基于结构的生成式AI(如RFdiffusion)和基于序列的蛋白质语言模型(如ESM3)共同构成了强大的设计工具箱,使研究人员能够突破天然蛋白质结构的限制,按需定制具有特定空间构象和功能特性的编辑工具。
当然,挑战依然存在,包括编辑效率的序列依赖性、体内递送难题以及潜在的免疫原性等。但未来前景广阔。AI有望进一步优化现有编辑器架构,并催生全新类别的编辑系统,例如更精准的表观基因组编辑器或更高效的靶向整合工具。人工智能与基因编辑的深度融合,正开启一个可按需设计、精准编程生命遗传信息的新时代。
2025-12-05 08:21:56
海森大数据