然而,由于患者隐私保护、高昂的数据标注成本等多种因素,要获得高质量、多样化的医学影像数据往往存在障碍。为此,近年来,研究者们开始探索使用生成式 AI 技术合成医学影像数据,以此来扩充数据。
为了解决这个问题,北京大学与温州医科大学的研究团队建立一种生成式多模态跨器官医学影像基础模型(MINIM),可基于文本指令以及多器官的多种成像方式,合成海量的高质量医学影像数据,为医学影像大模型的训练、精准医疗及个性化诊疗等提供有力技术支持。
该成果已于 12 月 11 日发表在国际权威期刊《自然・医学》上(IT之家附 DOI:10.1038 / s41591-024-03359-y)。
简单来说,MINIM 就像一个“图像生成器”,它可以通过 AI 技术,根据文字描述,自动合成出海量的医学影像数据,包括 CT、X 光、磁共振等等,涵盖了各种器官。
北京大学未来技术学院助理研究员王劲卓介绍说,“目前公开的医学影像数据非常有限,我们建立的生成式模型有望解决训练数据不够的问题。”
这些合成的影像数据有多逼真呢?研究团队利用多种器官在 CT、X 光、磁共振等不同成像方式下的高质量影像文本配对数据进行训练,最终生成海量的医学合成影像,其在图像特征、细节呈现等多方面都与真实医学图像高度一致。
实验结果表明,使用 MINIM 生成的合成数据,在医生主观评价和客观检测标准上都达到了国际领先水平。在真实数据的基础上,使用 20 倍合成数据在眼科、胸科、脑科和乳腺科的多个医学任务准确率平均可提升 12% 至 17%。
王劲卓还表示,MINIM 生成的合成数据应用前景广阔,既可以单独用来训练医学影像大模型,也可以和真实数据混合使用,从而提高模型在实际应用中的性能,推动 AI 在医学和健康领域更广泛的应用。
目前,在疾病诊断、医学报告生成和自监督学习等关键领域,利用 MINIM 合成数据进行训练已展现出显著的性能提升。