百度人工智能又完成了一个“小目标”,这次弄了个语音转录应用

日期：2017-04-17 来源：爱范儿作者：liaiai 评论：0

标签：

　　自从百度把人工智能当做核心发展战略之后，这方面的进展也是神速。

　　3 月 13 日，百度宣布推出一款名为 SwiftScribe 的网页版应用，它能够利用人工智能技术把语音文件进行转录，感兴趣的可以去试试看。

　　长期以来，人们在转录语音文件时，常常需要通过手动逐字录入。但是 SwiftScribe 这款应用通过集成百度自主研发的语音识别技术以及功能简单的编辑工具，可以帮助人们实现语音文件快速、便捷的转录，提高生产效率。

　　据百度介绍，SwiftScribe 依托的核心技术来自百度的新一代深度语音识别系统—— Deep Speech 2。通过利用长达数千小时的标注语音数据进行“训练”，Deep Speech 2 可以不断“学习”从语音中识别特定的字或词。

　　此外，百度还通过直觉快捷键以及人机交互技术来解决语音录入的不连贯问题。

　　对于那些职业速录师来说，SwiftScribe 能成为他们的生产力利器。对于一段时长为一小时的语音文件来说，常规情况下需要 4-6 小时去进行人工转录，并且每分钟的转录成本约合 1 美元。如果使用 SwiftScribe 的话，所用时间能缩短差不多 40%。

　　不过，虽然人工智能可以提高生产力，短时间内还没办法完全取代人类。在 SwiftScribe 完成初步的语音转录后，还需要人工去检查大小写、标点符号、错别字等等。

　　据百度的项目经理吴甜介绍，SwiftScribe 目前仅支持一小时以内的语音文件转录，但团队还在对应用的功能进行进一步开发，以后可能会增加对视频文件的语音识别、支持更多文件格式以及自动添加标点符号等功能。

　　从第一代的 Deep Speech 到第二代的 Deep Speech 2，百度已经在深度语音识别技术上深耕多年。2016 年，百度推出了使用 Deep Speech 系统的 TalkType，为 Android 键盘添加语音录入功能。同年，百度的深度语音识别系统 Deep Speech 2 还入选了美国《麻省理工评论》的 2016 年十大突破技术。

　　如今，包括亚马逊、苹果、Google 和微软在内的多家互联网巨头都在布局语音识别技术领域，国内的科大讯飞、搜狗等企业也都在语音识别领域有所建树。

　　百度首席科学家吴恩达曾表示：

　　我认为语音识别技术已经发展到了非常可靠的程度，使用的时候甚至都不用去想它。最好的科技往往是看不见的，而语音识别正在变得更加可靠，我希望它能够退居幕后。

声明：凡开云电子链接来源注明为其他媒体来源的信息，均为转载自其他媒体，并不代表本网站赞同其观点，也不代表本网站对其真实性负责。您若对该文章内容有任何疑问或质疑，请立即与开云客户(www.www.wykobounce.com)联系，本网站将迅速给您回应并做处理。
电话：021-39553798-8007

更多> 相关专题

0条 相关评论

推荐图文

机器人当导购无人店	科沃斯机器人成立20周
ABB CEO建言人工智能	Uber 发生全球首例自

推荐专题

点击排行

• 优冈股份巨型CNC车床六轴数控车床 FAN系列	• 台湾福裕FSG-2448/64/80/120/160ADIV
• 格力 GR625-1700 开云电竞官网下载app 海博创自动化	• 台湾福裕 FSG-3A818 3A1224 全自动平面磨床
• 台湾福裕FSG-20+24 ADIV 2024CNC磨床	• AXE-B17 全局式三维扫描仪尖端3D扫描技术
• LEBE音响（乐耳贝声）专业扩声系统成功应用于福	• 河北省哈密市应急管理局选用乐耳贝声LEBESTEREO
• 台湾福裕FSG-20+24 ADIV 2024 CNC磨床	• LEBE（乐耳贝声）专业扩声系统成功应用于甘肃省

恰佩克奖	机器人高峰论坛	机气林	开云入口网页版生态大会	ITES深圳工业展	广西工博会	顺企网
优气压缩机（上海）有限公司	机器人研究院	库卡机器人	中国传动网	索比光伏网	数控机床市场网	国家标准化委员会
国际现代工厂/过程自动化技术与装备展览会