
OpenCRISPR-1的物理结构,这是一种由Profluent的AI技术创建的基因编辑器。图片来源:singularityhub.com
从内容创作到代码生成,生成式人工智能(AI)正以前所未有的深度与广度赋能千行百业,持续推动着技术革新的浪潮。
如今,这一浪潮已涌向生命科学的核心地带。近日,美国AI蛋白质设计公司Profluent宣布,其完全由AI自主设计的基因编辑器,已成功实现了对人类细胞DNA的精准编辑。这一里程碑式的进展,预示着未来疾病治疗将步入一个更精准、更高效的新纪元。
开创先河:首款AI原研基因编辑器问世
4月22日,初创公司Profluent正式启动了OpenCRISPR™开源计划,并宣布其通过AI生成的基因编辑器OpenCRISPR-1,成功编辑了人类DNA。该公司强调,这是“全球首款开源的、由AI从头设计的基因编辑器”。
Profluent的创新之处在于,其将海量生物数据投喂给大型语言模型(LLM),在经典CRISPR基因编辑技术的框架内,探索出了全新的编辑路径。其核心目标是构建出比天然生物机制更高效、更强大的基因编辑器,以增强生物体抵御疾病及各类病原体的能力。Profluent团队深信,已在多个领域证明其价值的AI,也必将在基因编辑领域大放异彩。
“利用AI设计的生物系统来编辑人类DNA,是一项重大的科学挑战,” Profluent联合创始人兼首席执行官阿里·马达尼表示,“我们的成功证明了AI未来能够精准设计出多样化的定制化疾病治疗方案。为了加速整个基因编辑领域的创新,我们决定将OpenCRISPR™计划的产品开源。”这意味着,OpenCRISPR-1编辑器将向个人、学术机构及企业开放,供其免费研究与使用。
强强联合:CRISPR与AI的“天作之合”
CRISPR基因编辑技术的灵感,源于细菌等原核生物为抵御病毒入侵而演化出的适应性免疫系统(CRISPR-Cas)。科学家通过解析并改造这一天然系统,开发出了诸如CRISPR-Cas9这样强大的基因编辑工具。
可以说,CRISPR是自然界历经数十亿年“试炼”(自然选择)沉淀出的精妙工具之一。然而,其设计空间之庞大超乎想象——大多数Cas9蛋白由超过1000个氨基酸构成,可能的序列组合总数高达20的1000次方,这甚至远超可观测宇宙中的原子数量。蛋白质的功能高度依赖于其精确的三维结构与氨基酸序列,单个关键位点的突变就可能导致其功能完全丧失。若仅依靠传统实验方法去穷尽所有可能的序列变异,可能需要数代科学家的努力。而现在,借助AI系统,在数小时内即可高效发掘出具有功能的新型基因编辑器。
Profluent公司采用了一种突破性的AI应用策略:他们并未局限于对现有CRISPR系统进行优化,而是利用大型语言模型,从零开始全新设计了CRISPR的核心组件。该模型与驱动ChatGPT和DALL-E的底层技术同源。
至此,人类DNA的编写与修订,正式迎来了AI这位新的“建筑师”。
AI赋能:语言模型“构想”新型CRISPR-Cas蛋白
训练能够生成蛋白质的大型语言模型,需要规模庞大且多样性丰富的天然蛋白质序列数据集。为此,Profluent构建了迄今为止最全面的CRISPR系统数据集,涵盖了510万个CRISPR-Cas蛋白质序列。研究人员利用该数据集训练AI模型,并引导其设计能够替代Cas9功能的全新蛋白质。
成果令人振奋。系统从400万个候选序列中筛选,最终鉴定出包括OpenCRISPR-1在内的新型蛋白质。实验测试表明,这些AI设计的蛋白质在编辑效率上与Cas9旗鼓相当,并在一个关键指标上表现尤为突出:其对非目标位点(脱靶效应)的影响降低了95%。这意味着其编辑精准度大幅提升,能够极大限度地避免对DNA链造成不必要的损伤。
总体而言,这项研究将潜在的Cas蛋白设计空间扩大了近5倍。这些AI生成的蛋白质展现出更广泛的功能适应性,能在不同的温度与分子环境中保持高活性。
目前,Profluent尚未将合成的基因编辑器推进至临床试验阶段,因此其最终效能是否能够媲美或超越现有CRISPR技术尚待验证。但这项概念验证研究已确凿证明,AI模型具备编辑人类基因组的潜力。
更重要的是,Profluent的平台具备持续生成大量新型基因编辑系统的能力,OpenCRISPR-1仅仅是其展现的“冰山一角”。
目前,相关研究论文已发表在预印本平台bioRxiv上,尚未经过正式的同行评审。该公司计划于下月在美国基因和细胞治疗学会年会上提交该论文。当然,OpenCRISPR-1及其变体是否能在植物、小鼠乃至人体等多种生物体中普遍适用,仍有待进一步证实。此外,技术的伦理与安全性问题也必须被审慎考量。但毋庸置疑的是,这一突破性成果为生成式AI开辟了一条激动人心的新赛道,必将对医学与健康领域产生深远影响,并有望在未来重塑人类的生命蓝图。
关于湖南元初生物:
湖南元初生物始终致力于将前沿人工智能技术与生命科学研究相结合,关注并探索AI在基因编辑、蛋白质设计、新药研发等领域的创新应用。我们相信,跨学科的融合创新是推动生命科学进步的关键动力,并将持续追踪与分享全球范围内的最新科研动态与技术突破。