此前不少人认为,未来AI时代并不在于某个模型是否强大,而是在于人类是否能够更高效利用这些AI模型,完成特定任务。
这也诞生了“提示词工程师”概念,该工程师能够比普通人更能理解AI,能够提出更准确的提示词,从而让AI满足其要求输出。
而StabilityAI于2023年7月推出MindEye1,近日再次推出了MindEye2,让“提示词工程师”的价值大幅降低,该模型并不依赖于特定的提示词,而是直接基于用户脑电波生成,也就是说用户大脑想要什么,未来该模型就能生成什么。
MindEye直接从fMRI大脑活动中重建和检索图像,而且可以将二维图像转化为三维
视频。
功能磁共振成像(fMRI)是一种通过检测血流变化来测量大脑活动的神经成像技术。这项技术的作用是绘制大脑功能图,评估治疗神经系统疾病的潜在方法。
MindEye基于参与者在核磁共振成像扫描仪上观看一系列静态图像时的大脑活动记录数据集。研究团队训练该系统分析这些记录,并从候选库中检索原始图像(检索)或生成所查看图像的重建图像。
研究人员证明,MindEye在图像检索任务中的表现优于以往的方法,从候选图像中识别原始图像的准确率超过90%。在重建方面,MindEye使用预先训练好的生成模型。
MindEye可
应用于各个领域。在医疗领域,它从大脑活动中重建视觉感知的能力可用于诊断和评估方法,尤其是在病人难以沟通的情况下。MindEye的实时分析潜力有望改善脑机接口的性能。
研究小组强调了与数据收集有关的局限性,包括所需的冗长扫描时间,以及由于参与者移动或注意力不集中而可能产生的数据噪声。