在这项研究中,科学家们进一步扩展了AI设计平台的应用范围,把目光转向了一类称为大环多肽(macrocyclicpeptides)的化合物。这些大分子与小分子药物相比,具有更大的表面积与靶点蛋白结合,从而能够靶向很多小分子不能影响的蛋白相互作用。与抗体相比它们的分子量更小,可能可以穿过细胞膜来靶向细胞内靶点,并且具有可以口服,并且穿越血脑屏障的潜力。不过,找到能够穿越细胞膜的大环多肽并不是一件容易的事。此前主要发现方式是通过建立包含上百万分子的化合物库,然后进行层层筛选。
而此次,研究人员则是基于这些大环多肽穿过细胞膜的结构特征,让AI来设计出化合物的序列——科学家们利用AI平台设计出184种由6-12个氨基酸组成的大环多肽。这些多肽包含着多种传统大环分子中不常见的化学修饰。重要的是,在设计的时候,AI平台就已经能够预测出它们最后的折叠形状。
人工智能展现出在制药业的优势和潜力,是其他技术无可比拟的。尤其是在AlphaFold诞生之后,2021年7月15日,AlphaFold2的论文发表,同时公开的还有免费的开源代码等信息,让业内的研究人员们可以打造属于自己的版本。一周后,DeepMind宣布已经用AlphaFold预测了人体内近乎所有蛋白质的结构,以及20个其他被大量研究的生物体的完整“蛋白质组”,其中包括小鼠和大肠杆菌,累计共有36.5万个结构。
今年,DeepMind还计划发布总计1亿多个结构预测——相当于所有已知蛋白的近一半,是蛋白质数据银行(PDB)结构数据库中经过实验解析的蛋白数量的几百倍之多。要知道,过去半个多世纪,人类一共解析了五万多个人源蛋白质的结构,人类蛋白质组里大约17%的氨基酸已有结构信息;而AlphaFold的预测结构将这一数字从17%大幅提高到58%;因为无固定结构的氨基酸比例很大,58%的结构预测几乎已经接近极限。
正如此次研究中,人工智能所展现的能力一样,AI不仅改变了科学家测定蛋白质结构的方式,一些研究人员还在利用这些工具打造全新的蛋白质。在人工智能的助力下,现在,跳过高通量筛选直接合成候选药物的策略不再遥不可及。