热搜： 佳士科技 irobot 开云电竞官网下载app 机器人 ABB 机器人产业联盟发那科机械手机器人展览码垛机器人

重大技术持续突破，科大讯飞SMART-TTS系统让机器人拥有喜怒哀乐

日期：2022-11-25 来源：3C毒物评论：0

标签： 科大讯飞机器人技术

　　如何让机器的声音媲美人类？这是AIGC领域需求量大、技术门槛高的难题。11月18日，2022科大讯飞全球1024开发者开幕，在平台新品发布会上，科大讯飞AI研究院副院长高建清表示，科大讯飞在语音合成技术领域取得重大突破，多风格多情感合成系统SMART-TTS，可以让语音合成从简单的信息播报，“变身”为具备喜怒哀乐情感的语音助手。

　　高建清表示，SMART-TTS系统充分利用了文本和语音的‘无监督预训练’，实现了从文本到声学特征、再到语音的端到端建模。SMART-TTS系统可提供“高兴、抱歉、撒娇、严肃、悲伤、困惑、害怕、鼓励、生气、安慰、宠溺”等11种情感，每种情感有20档强弱度不同的调节能力；也能提供声音的创造能力，如停顿、重音、语速等，可以根据自己喜好调节，真正实现了合成系统媲美具备个性化特点的真人表达能力。

　　比如当人们在林荫路漫步时， 机器人可以用字正腔圆的“播音腔”播报新闻；当人们结束一天工作准备入睡时，机器人可以用轻声细语朗读散文；当人们驱车上班时，机器人可以用最喜欢的歌手声音告诉大家走哪条路不堵车；当人们和家人一起观看纪录片时，机器人可以为片中不同人物配音。人机交互表达自然、情感饱满。目前，讯飞有声APP和讯飞开放平台都开放了SMART-TTS语音合成系统，开发者可以在讯飞有声直接下载体验，或在开放平台进行调用。同样隶属于AIGC范畴，在声音和虚拟形象生成技术方面，科大讯飞实现了语义可控的声音、形象生成，语义驱动的情感、动作表达。比如：当人们输入“一头长发”时，SMART-TTS系统智能生成温柔大方的女性形象，声音端庄又不失甜美；输入“英俊潇洒”，会生成有一些商务范的男生形象，声音略带磁性。此外，讯飞还实现了语音语义驱动的动作合成，通过对语音节奏、韵律体会和语义理解，虚拟人可以随时、流畅地切换动作，拥有更加自然的肢体语言。“与传统动作库相比，这套语义驱动的系统在动作拟人度及契合度方面，有明显的效果提升。”高建清表示。同时，2022年科大讯飞科大讯飞在交互系统的认知关键技术也取得突破性进展。

　　今年以来，依托科大讯飞建设的认知智能国家重点实验室相关团队在认知智能技术突破方面夺得3项国际冠军——在常识推理挑战赛Commo nsenseQA 2.0中刷新机器常识推理水平世界纪录，在科学常识推理挑战赛OpenBookQA中以准确率94.2%的绝对优势夺冠，在常识推理挑战赛QASC中以多模型准确率93.48%、单模型准确率92.07%夺冠，后两项比赛更是超越人类平均水平。随着核心源头技术创新和系统性创新的持续突破，AI拥有更加“智慧”的语义理解和对话生成能力。“好的人机交互系统，在开放式的场景下要具备深度理解能力，并能了解交互对象从而发起主动的对话。”高建清说，围绕认知智能技术，讯飞实现了于语义图网络的开放场景语义理解，基于事理图谱的对话管理，基于知识学习的可控对话生成。

声明：凡开云电子链接来源注明为其他媒体来源的信息，均为转载自其他媒体，并不代表本网站赞同其观点，也不代表本网站对其真实性负责。您若对该文章内容有任何疑问或质疑，请立即与开云客户(www.www.wykobounce.com)联系，本网站将迅速给您回应并做处理。
电话：021-39553798-8007

更多> 相关开云电子链接

0条 相关评论

推荐图文

加州大学科学家发明了	深圳又一制造业总部基
水下机器人在渔业中的	哈工程水下机器人再夺
里程碑！荆州市首台机	超维科技精彩亮相电力

推荐开云电子链接

点击排行

• 科大讯飞发布机器人超脑平台：推动人机协同进入	• 科大讯飞发布AI LAB模型云和机器人超脑平台：助
• AI驱动财务向新 \|\| 元年科技携手科大讯飞首次	• 科大讯飞拥抱机器人开发者能否诞生中国版“擎
• 科大讯飞多款“黑科技”：虚拟主播带你逛展，AI	• 迈入人机协同新时代：科大讯飞发布机器人超脑平
• 科大讯飞进军机器人—机器人领域又添新玩家	• 科大讯飞AI科博展探营，1200余款AI科技产品“炫
• 多功能四足机器狗引发围观讯飞超脑2030计划成	• 科大讯飞1024全球开发者节科博展开幕，你一定不

恰佩克奖	机器人高峰论坛	北大机器人	金属加工在线	AI中国网	机气林	工博会
赶考网	中国机床网	ITES深圳工业展	电气自动化网	高压电气网	人工智能机器人	亚洲工业网
二手设备网	工博士	上海机器人产业技术研究院	库卡机器人	中国传动网	索比光伏网	数控机床市场网
国家标准化委员会