据介绍,正常一个人的基因组携带约9000个错义突变,也就是导致蛋白质的某个氨基酸出错的突变。致病性错义突变会严重破坏蛋白质功能,降低生物体适应性,引发囊状纤维化或癌症等疾病,或损害大脑发育,而良性错义突变则是无害的。
迄今已在人体中观测到的错义突变有约400万个,其中仅有2%被归类并定性为致病性突变或良性突变。给剩余未知的错义突变分类是人类遗传学领域一个重要挑战。不能准确预测更多此类突变也限制了罕见病的诊断以及相关针对性疗法的研发和应用。
与许多现有类似工具相比,谷歌旗下这款名为“阿尔法错义”的工具表现出了更优越的能力。它利用蛋白质序列数据库和变异结构背景来识别致病的错义突变。
人类蛋白质中可能出现的错义突变有约7100万个,“阿尔法错义”评估所有突变并给每个突变的致病性风险打分。根据分值,对其中89%的错义突变作出了预测,包括57%归类为良性,32%归类为致病性,只有剩下的11%归为不确定。这远高于目前人类可以确定的归类。
“深层思维”公司研究副总裁科利表示,这些发现是对“人工智能影响自然科学(发展)”的进一步认可。