用户在微软 Teams 通话中的音频内容是通过本质上是 " 数据包 " 的方式发送。而这些数据包可能由于网络连接不畅而丢失,导致音频失真。
虽然微软不能真正解决用户的互联网连接问题,但该公司在 Teams 中利用 " 数据包丢失隐藏 "(PLC)的技术,人为让用户的声音在具有挑战性的网络环境中听起来更好。在非常高的水平上,PLC 使用人工智能模型来识别音频传输中丢失的数据包,然后通过预测来填补任何空白。
微软表示,使用了深度学习技术来完成这一改进。该公司声称,传统的模型可以填补 20-40 毫秒的空白,但其 PLC 模型对 Teams 来说明显更好,因为这可以填补高达 80 毫秒的音频空白。
IT 之家获悉,尽管微软在 600 小时的开源数据上训练了 PLC 模型,但引人注意的是,还收集了 " 数以百万计的匿名网络样本 ",或者是来自真实 Teams 呼叫的 " 痕迹 ",以测试其模型。在 PLC 模型发布后,网络条件差的参与者报告说,其性能提高了约 15%。
微软强调,其 Teams PLC 模型完全在本地运行,而且只在网络质量不佳的情况下运行。最近,Teams PLC 模型已经适用于 Windows 客户,目前正在 Mac 上进行测试,而且将很快就会进入移动端领域。