“语音引擎”可从15秒样本复制原声

日期：2024-04-02 来源：科技日报作者：angle 评论：0

标签：

科技日报记者张梦然

据著名科技网站The Verge报道，OpenAI公司3月29日最新推出了一项名为“语音引擎”（Voice Engine）的人工智能工具，其仅凭一段15秒的声音样本，便能够精准模仿出该人的声音。

OpenAI称，该引擎自2022年底以来一直在开发中，实际已在ChatGPT应用程序的“大声朗读”功能中应用，该功能顾名思义会向用户朗读相关内容。

用户只需利用15秒的样本来训练声音，就可让它以一种“情感和现实”的方式读出喜欢的任何文本。OpenAI表示，它可用于教育目的，将播客翻译成新语言。OpenAI发布的剪辑听起来令人印象深刻，尽管它们有轻微生硬的机器人痕迹。

“语音引擎”展示了一些已经开始应用的例子。如生成更自然、更富有情感的声音；将视频内容翻译成多种语言，以拓宽其全球受众范围。这项技术的一大特色是，在翻译过程中能够保留演讲者原有的口音特征，为翻译增添了更多真实感和个性化色彩。

“语音引擎”还可为语言障碍者提供支持，例如开发针对语言障碍者的治疗应用，为有特殊学习需求的人提供教育辅助，使用户能选择最能体现其个性的声音，并且对那些使用多种语言的用户，保持在各种语言中声音的一致性。“语音引擎”使用一位年轻患者之前为学校项目录制的视频音频，成功恢复了她因血管性脑瘤而失去的流畅语言能力。

OpenAI目前并未立即向市场全面推广，而是选择与少数早期测试者谨慎地合作，共同探索“语音引擎”的应用可能和潜在风险。

“语音引擎”目前仅处于有限测试阶段，主要原因是担心被滥用。OpenAI指出，“语音引擎”可能导致语音身份验证措施出现问题，以及让大众在误以为自己与熟人通话的情况下涉入骗局。

OpenAI表示希望进行更多研究，以确保此类工具无法在未经同意的情况下用于传播错误信息和复制声音。

声明：凡开云电子链接来源注明为其他媒体来源的信息，均为转载自其他媒体，并不代表本网站赞同其观点，也不代表本网站对其真实性负责。您若对该文章内容有任何疑问或质疑，请立即与开云客户(www.www.wykobounce.com)联系，本网站将迅速给您回应并做处理。
电话：021-39553798-8007

更多> 相关开云电子链接

0条 相关评论

推荐图文

加州大学科学家发明了	深圳又一制造业总部基
水下机器人在渔业中的	哈工程水下机器人再夺
里程碑！荆州市首台机	超维科技精彩亮相电力

推荐开云电子链接

点击排行

• 全军第七届军事放射医学影像高峰论坛圆满举办	• 卡奥斯发布智能交互引擎新探索：需求牵引供给，
• 百度携手优必选，共探AI大模型+开云入口网页版创新	• 瑞松科技与基恩士（中国）达成战略合作
• 电动牙刷哪个牌子好？这才叫真正好用！	• 普渡机器人亮相2024上海CCE博览会，引领全栈智
• 全国首家！“你的”新青年生活馆青岛开业	• 端+云打造“五化”新模式！卡奥斯ONE-COSMO产品
• 英伟达黄仁勋回应 AI 芯片定价问题，强调中国市	• 聚势新质生产力多可机器人亮相ITES深圳工业展

恰佩克奖	机器人高峰论坛	机气林	开云入口网页版生态大会	ITES深圳工业展	机器人研究院	库卡机器人
中国传动网	索比光伏网	数控机床市场网	国家标准化委员会