这是由克里斯托夫Zsolt Szalay.Kristóf是Turbine公司的创始人兼首席技术官。拥有分子生物学和生物信息学博士学位。咨询外部专家的投稿,请联系editorial@www.fgamus.com。
你能仅仅根据零部件的库存来预测一架飞机如何飞行吗?
这-与蛋白质-是本质的蛋白质折叠的挑战.
两周前,CASP蛋白折叠挑战的组织者刚刚宣布DeepMind的AlphaFold基本上解决了这一挑战——它的预测得分仅略低于实验误差。
事实上应该是可完成性已经为人所知有一段时间了——活细胞没有组装手册,所以部件编码部分必须也为程序集编写代码。我们甚至可以从薛定谔方程以及建设——唉,就目前而言,即使是地球上所有计算机的综合能力也不足以做到这一点。
DeepMind的AlphaFold成就
对于蛋白质来说,外表就是一切。
比如把钥匙和钥匙孔配对形状一个蛋白质定义了它的相互作用伙伴,反过来,它在组成细胞的20000种不同蛋白质的复杂机制中的位置和功能。
对于一些蛋白质,它们的形状可以通过实验来确定——这就是CASP的黄金标准最初形成的原因。其他的适应性很强,它们并没有明确的形状。虽然有其他研究方法可以查明特定蛋白质的功能,但AlphaFold应该有助于查明人体中有多少蛋白质在运作。在这方面,这一发现意义重大。
但这也可以在没有AlphaFold的情况下完成。尽管20000个蛋白质是个大数目,但我们最终能发现的数量有限。
然而,如果没有AlphaFold这样的工具,有大量的蛋白质是不可能被研究的。只有一种方法可以使蛋白质正确,但有很多方法可以使蛋白质错误。这样的突变体蛋白掩盖了许多重要的疾病最值得注意的是,癌症.
AlphaFold和它的继任者很可能是只有我们可以找到方法损坏的蛋白质看起来像它们,然后用药物瞄准它们。
为了了解这一突破的巨大规模,以下是《自然》杂志的一张图表,展示了过去15年蛋白质折叠预测的准确性:
它基本上停滞在40%左右,直到AlphaFold2出现,并在4年内主导了所有其他竞争方法的任务。
在如此重大的突破背后,肯定有一些开创性的科学见解,对吧?
在架构和计算方面的优势
这里有一个突破,只是不相关蛋白质.
AlphaFold2也是基于此构建的变压器机器学习建筑〇另一个突破生成式预训练变压器3 (GPT-3)- OpenAI语言模型,在很多情况下生成的文本与人类的书写没有区别。
变压器的设计目的是减少机器学习训练次数.这不是一种通过相同数量的参数产生更好或“更聪明”的结果的人工智能方法。相反,Transformer所做的是允许使用数十亿的变量同时,使用数十万个机器小时。
因此,AlphaFold2可以被认为是一个工程上的突破,而不是科学上的突破。自从DeepMind与谷歌合并后,他们就可以利用互联网基础设施提供的资源和方法。我从许多科学家那里听说,只要以“import谷歌”开头,即使AlphaFold2发布源代码也没有关系,这是一个巨大的竞争优势。
IBM的“深蓝”超级计算机1997年击败卡斯帕罗夫他被一些人指责没有真正掌握国际象棋,只是简单地将蛮力计算能力应用到一系列可能的走法和组合上。即使对人工智能持悲观态度的人也可以说,这一成就意义重大。
我们可能会说AlphaFold也是如此。它并没有“掌握”蛋白质折叠,只是利用了近乎无限的计算能力(尽管是以一种非常复杂的方式)来寻找组合,而如果没有DeepMind拥有的硬件和人工智能方法,这些组合可能需要数百万年才能计算出来。
和深蓝一样,AlphaFold没有改变药物发现- it改变科学。我们可以期待这些工程技术上的突破能在科学和工业领域的其他离散问题上取得进展,而且我们很可能会看到AlphaFold或类似gpt -3的应用在未来一年里出现在其他科学或工业领域。
对学术和私营部门研究团队的影响
我相信AlphaFold近期的主要影响将是一系列针对特定突变的新药,使患者多活许多年。
DeepMind在短短几年内就攻克了蛋白质折叠领域,这让蛋白质折叠科学家们感到震惊,但这适用于我们所有人。没有多少研究团队或研究所能够支付模型的培训费用,更不用说了招募或保留一个技术团队这可以改善它。
我们这些不在谷歌支持的公司工作的人可能仍然需要科学上的聪明,但我们必须锻炼肌肉,以便能够竞争。
学术研究不一定是命中注定的。然而,我也认为它需要改变以保持相关性。我想留下来的人会采用一种类似欧洲核子研究中心-大量的人在很大程度上为同一个目标工作,共享一个共同的基础设施,只是在其上运行不同的、相关的项目。
具有讽刺意味的是,COVID-19可能起到了作用。这种规模的远程科学合作是闻所未闻的,但现在我们更熟悉Zoom、Slack和它们的朋友,所以这可能是可能的。见鬼,我们有办法让成千上万的人一起远程编写代码,我们只是没有真正用于研究的相同系统。也许是时候着手解决了。
编者按:
私营部门公司可以通过学习DeepMind(谷歌)和OpenAI (OpenAI)等大型公司部署的架构、工具和培训方法获益。微软),但他们不可能在计算机上竞争。他们也不太可能竞争原始的ML工程人才。深度和狭隘的专业知识将更有可能支持大型科技公司之外的有利可图的发现和突破。