作者:李木子 来源: 医学科学报 发布时间:2025-2-28
选择字号:
生物学领域最大规模AI模型发布

 

本报讯 近日,美国弧形研究所、英伟达公司和美国斯坦福大学等机构的研究人员共同开发的人工智能(AI)生物学模型Evo 2正式发布。

美国弧形研究所在其官网发布公报称,在前一代模型Evo 1的基础上,Evo 2已发展成为目前生物学领域规模最大的AI模型。Evo 2基于超过12.8万个基因组数据的9.3万亿个核苷酸进行训练。这些模型使机器能够“用核苷酸语言来读、写和思考”,而核苷酸是脱氧核糖核酸(DNA)的基本组成单位。

据《自然》报道,在过去几年里,科学家开发了日益强大的“蛋白质语言模型”,如美国互联网公司Meta开发的ESM-3模型。与这些模型不同,Evo 2的训练数据既包含指导蛋白质合成的“编码序列”,也包含可调控基因活动时空特征的非编码DNA。

为验证该模型解析复杂基因组的能力,美国弧形研究所的生物工程师Patrick Hsu团队使用Evo 2预测乳腺癌相关基因BRCA1中已知突变的影响。在相关测试中,Evo 2在预测哪些突变是良性突变、哪些是潜在致病突变方面均达到90%以上的准确率。

“在判断编码区变异是否致病方面,其表现接近最佳生物AI模型,已达到顶尖水平。”Hsu表示,Evo 2有助于识别患者基因组中难以解读的变异。

此外,该模型还可用于设计新的生物工具或治疗方法,且有助于节省大量用于细胞或动物实验的时间和研究资金,通过找到人类疾病的遗传原因加速新药研发。

公报强调称,考虑到潜在的伦理和安全风险,研究人员在Evo 2的基础数据集中已排除了感染人类和其他复杂生物的病原体,并确保该模型不会为这些病原体的相关查询提供有效答案。

(李木子)

《医学科学报》 (2025-02-28 第2版 要闻)
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
亚马孙森林砍伐让雨季更潮、旱季更旱 长砗磲和番红砗磲的相关研究获新进展
科学家成功描绘国产大豆时空图谱 超导量子计算原型机祖冲之三号研制成功
>>更多
 
一周新闻排行
 
编辑部推荐博文