欢迎光临
我们一直在努力
您的位置:首页>资讯 >

结构生物学中的人工智能将继续存在

“我不认为我们会在我有生之年走到这一步。”这就是结构生物学领域的一位研究负责人对上周发表的研究的回应,其中人工智能 (AI) 被用于预测 20,000 多种人类蛋白质的结构,以及 20 种模式生物产生的几乎所有已知蛋白质的结构如大肠杆菌、果蝇和酵母,还有大豆和亚洲大米。总共有大约 365,000 个预测1。

首次公开访问的数据于 7 月 22 日由 DeepMind 的研究人员在线发布,DeepMind 是一家位于伦敦的人工智能公司,由谷歌母公司 Alphabet 和欧洲生物信息学研究所,位于英国剑桥附近的欧洲分子生物学实验室 (EBI-EMBL)。

DeepMind 团队开发了一种名为 AlphaFold的机器学习工具。该团队在 DNA 序列上训练了该程序,包括它们的进化历史,以及由 EBI-EMBL 研究人员托管的公共访问蛋白质数据库中包含的数万种蛋白质的已知形状。一周前,DeepMind 还发布了 AlphaFold 的源代码并详细说明了它是如何构建的2,与此同时,来自西雅图华盛顿大学的研究人员公布了另一个蛋白质结构预测程序的细节——受 AlphaFold 启发——称为 RoseTTAFold3.

如果数据和方法不公开和免费提供,那么公布这个预测结构目录就不会是好消息。结构生物学家和其他研究人员已经开始使用 AlphaFold 为当前实验方法难以或不可能表征的蛋白质获得更准确的模型。

加速结构预测

自 1953 年发现 DNA 本身的结构以来,预测蛋白质折叠成的 3D 形状一直是生物学尚未解决的“重大挑战”之一。在人工智能之前,从序列中预测结构是一个非常耗时的过程,更不用说是劳动密集型的,而且几乎不能保证获得准确的结果。新数据仍需要验证和实验验证。但是人工智能工具可以在几分钟到几小时内准确预测蛋白质结构——相比之下,过去确定一两种蛋白质的结构需要几个月或几年的时间。这开辟了应用的可能性,例如在酶工程中分解微塑料等环境污染物。

上周的突破不仅取决于开放数据的共享,还取决于基础科学和技术的进步。自 1960 年代以来,结构生物学家一直致力于研究理解蛋白质折叠科学的平行方法。一种是通过理解潜在的物理力来拼凑蛋白质的结构。另一种尝试使用生物体的进化历史,通过与密切相关的蛋白质进行比较来预测形状。然后是成像技术的所有重要作用,从 X 射线晶体学开始,现在是低温电子显微镜。

在结构生物学的基础科学中,还有一些关键问题有待解决。尽管科学和技术中的人工智能擅长产生准确的结果,但它(至少目前)并没有解释这些结果是如何或为什么发生的。DeepMind、EBI-EMBL、华盛顿大学和其他地方的团队取得了重大突破,值得祝贺。但是,要解开关于蛋白质折叠方式和原因的科学——基本的生物学、化学和物理学,还有很多工作要做。

公立和私立

就重要性而言,一些人正在将最新进展与 20 年前的人类基因组序列初稿进行比较。确实需要进行比较。人类基因组计划和 DeepMind 的人类蛋白质结构预测目录都为他们的领域配备了一种旨在显着加速发现的工具。

人类基因组的初稿是种族的结果。解决蛋白质折叠问题也得益于一种竞争——一项名为“蛋白质结构预测关键评估”(或 CASP)的年度活动,这对于获得结果至关重要。

今天的研究团队——就像那些参与早期基因组测序的团队一样——需要开放数据访问。在向所有人公开数据和方法方面,DeepMind 现在设定了一个基准,这将使该领域的其他公司(例如 Facebook 和微软)更难继续争论专有数据。

那么,未来呢?过去一周,《自然》杂志采访了该领域的近十几名研究人员。人们的共识是,现在准确预测人工智能在生命科学中的应用会产生什么影响还为时过早,除非任何影响都将是变革性的。

准确预测人工智能将如何改变生物学需要良好的训练数据,而我们还没有。但在人工智能领域,结构生物学研究界及其在其他领域的合作者拥有大量新鲜数据。除了研究和数据之外,人工智能还为大学应该研究的研究组织和管理模型提供了一个窗口。对于今天的研究人员和后代来说,还有很多工作要做。

免责声明:本网站图片,文字之类版权申明,因为网站可以由注册用户自行上传图片或文字,本网站无法鉴别所上传图片或文字的知识版权,如果侵犯,请及时通知我们,本网站将在第一时间及时删除。