对于少数基因变异,人们找出了它们与疾病的关联。比如BRCA1和BRCA2基因上的一些突变与升高乳腺癌和卵巢癌的风险有关,于是人们可以根据基因测序结果采取预防和治疗的手段。
然而,对于绝大部分已识别的基因变异——超过98%,我们还不清楚变异意味着什么:是会影响基因功能,导致疾病?还是不会对健康造成影响,无需担心?
图片来源:123RF
顶尖学术期刊《自然》今日在线发表的一篇研究论文中,来自哈佛医学院和牛津大学的科研人员合作展示了他们开发的一款人工智能(AI)模型。对于人类的基因变异是否意味着疾病,这款AI具有非凡的判断能力。
它不仅预测出了3200多个疾病相关基因中的3600万个致病突变,并且为256000个至今意义不明的基因突变是“致病”还是“良性”做出归类。研究人员希望,借助这款AI的预测,未来医生将可以更准确地诊断和治疗疾病。
这款AI使用一种复杂的机器学习,先检测了数十万来自其他物种的基因变异模式,然后根据自行学习归纳的结果,预测人类基因变异的含义。
研究人员解释说,演化倾向于保留一些对于生存十分重要的特征,这些特征在不同物种中共享,因此重复出现在不同物种中的氨基酸序列是一个重要的生物学标志,表明这种高度保守的序列一旦改变可能与疾病有关。而这款AI通过对这些序列变异在不同物种中的分布进行建模,学会预测哪些序列可能导致疾病。
▲这款AI的建模策略:对于每种蛋白质,都会比较它在多个物种中的序列数据(图片来源:参考资料[1])
由于综合了进化上很多其他物种的线索,研究人员将这款AI命名为Evolutionary model of Variant Effect,简称EVE。
经过2.5亿个蛋白质序列的训练后,EVE开始预测单个氨基酸变异会带来什么后果。为了确定EVE的预测是否准确,研究人员用意义明确的一些人类基因突变进行了检验,发现EVE给出的评分结果与临床数据非常一致。
研究人员将EVE应用于3219个疾病相关的人类基因,这些基因上出现的不同突变有一些是致病性的,还有一些是良性的。在与其他一些依据不同模型的工具进行比较后,研究人员说,EVE有着明显更高的预测准确性。
更严格的检验来自于实际临床实验,这是用于评估基因突变如何影响生理功能的金标准。研究团队选择了5个基因,包括BRCA1,TP53,PTEN,MSH2和SCN5A,这些基因经过充分的研究,已知其中一些变异与各种形式的癌症、心律失常等疾病相关。而EVE通过计算得到的预测结果与临床实验中的疾病风险结果有很大的重叠。
▲对几种疾病相关基因的不同变异是否具有致病性,EVE的计算预测结果(左侧)与实际临床实验结果(右侧)接近(图片来源:参考资料[1])
研究人员指出,EVE的预测有一个显著的优势是,对于基因变异它并非给出一个非黑即白的判断结果,而是会显示一个连续的分数。“这种突变意味着我的小拇指会痛,还是明天就会死?连续评分对于预测致病性高低非常重要。“研究作者Debora Marks教授解释说。
此外,这款AI在对每个基因变异给出预测分数时,还会提供一个置信度分数,告诉使用者——比如临床医生,在多大程度上可以相信EVE的判断。
展望未来,研究人员希望把AI对遗传变异的新认识转化为对临床医生的帮助。他们强调,EVE本身不是一种诊断测试工具,但它的计算能力可以增强现有的临床工具,帮助遗传学家和医生做出正确的诊断、预后和治疗决策,根据某些致病基因突变的存在来选择更精确的治疗方法。
“我们相信我们的方法可以用作当前临床评估的附加工具,并提供一种强大的新方法来减少不确定性和明确决策,尤其是在临床环境中,”Marks教授认为。
参考资料:
[1] Jonathan Frazer et al., (2021) Disease variant prediction with deep generative models of evolutionary data. Nature Doi: https://doi.org/10.1038/s41586-021-04043-8
[2] All about Eve. Retrieved Oct. 27, 2021 from https://www.newswise.com/articles/all-about-eve?sc=rsla