近期,me
taAI部门宣布将为AR/VR开发全新的空间音频工具:AcousticSythesis,以增强虚拟内容的视听体验。据悉,该空间音频工具可对不同的视觉环境做出相应的声音反馈,从而提升环境/场景模拟的保真性和沉浸感。
me
ta表示:我们一直在研究人们与周围声音的互动感知,发现人们通常会根据声音的位置去预判听到的音效。比如,如果你站在洞穴里,可能会期待听到回声,而远处的声源可能会听的不清楚。也就是说,环境特征会影响声音,包括空间的结构、空间中物品的材质、麦克风和声源之间的距离。
目前,AI模型已经可以理解
视频中的图像场景,因此me
taAI希望在此基础上,开发一个多模态的AI环境理解模型,也就是说AI将不止能够视觉分析场景,还能理解不同场景中的声音。简单来讲,就是通过视觉提示来匹配目标场景坐标的声音,还可以融合虚拟和现实场景音,去除混响和噪音,强化虚拟音效,从而提升AR/VR观影、社交体验的沉浸感。