OpenAI 更新 ChatGPT：支持图片和语音输入

日期：2023-09-26 来源：IT之家评论：0

标签： 人工智能科技 AI

　　近日OpenAI宣布推出新版ChatGPT，增加了两项新功能：语音输入和图像输入。据OpenAI称，新功能将在未来两周内向ChatGPT Plus订阅用户推出，其他人也将“很快”能够使用这些功能。

　　语音输入功能类似于手机上的语音助手，用户只需按下一个按钮，说出自己的问题，ChatGPT就会将其转换为文本，然后生成答案，再将答案转换为语音，播放给用户。OpenAI表示，这样的交互方式更加自然和便捷，而且由于LLM的技术优势，答案的质量也会更高。OpenAI还开发了一种新的文本转语音模型，可以根据几秒钟的样本语音，生成与之相似的人声。用户可以从五种选项中选择ChatGPT的声音，而且这种模型还有更多的潜在用途。例如，OpenAI正在与Spotify合作，将播客翻译成其他语言，同时保留播客主持人的声音。不过，这种模型也存在一些风险，比如可能被恶意利用来冒充公众人物或进行诈骗。因此，OpenAI表示，这种模型不会被广泛开放，而是会受到严格的控制和限制。

　　图像输入功能则类似于Google Lens，用户可以拍摄自己感兴趣的事物，并上传到ChatGPT中。ChatGPT会尝试识别用户想要询问的内容，并给出相应的回答。用户还可以用应用中的绘图工具来帮助表达自己的问题，或者配合语音或文本输入来进行交流。ChatGPT的优势在于它可以进行多轮对话，而不是一次性搜索。如果用户对答案不满意或想要更多信息，可以继续向ChatGPT提问，从而得到更准确和全面的答案。当然，图像搜索也有一些潜在问题。例如，在处理人物图片时，OpenAI表示他们限制了ChatGPT对人物进行分析和直接评价的能力，既为了保证准确性，也为了保护隐私，这意味着上传一个人的照片就能知道他/她是谁还无法实现。

　　IT之家注意到，自从2022年初推出ChatGPT以来，OpenAI一直在努力为其 机器人增加更多功能和能力，同时避免造成新的问题出现。通过这次更新，该公司试图在这条界线上寻找平衡点，通过有意识地限制其新模型能做什么来实现这一目标。但是这种方法并不是长久之计，随着越来越多的人使用语音控制和图像搜索，以及ChatGPT逐渐成为一个真正的多模态、有用的虚拟助手，要保持安全和合理的边界会变得越来越困难。

声明：凡开云电子链接来源注明为其他媒体来源的信息，均为转载自其他媒体，并不代表本网站赞同其观点，也不代表本网站对其真实性负责。您若对该文章内容有任何疑问或质疑，请立即与开云客户(www.www.wykobounce.com)联系，本网站将迅速给您回应并做处理。
电话：021-39553798-8007

更多> 相关开云电子链接

0条 相关评论

推荐图文

加州大学科学家发明了	深圳又一制造业总部基
水下机器人在渔业中的	哈工程水下机器人再夺
里程碑！荆州市首台机	超维科技精彩亮相电力

推荐开云电子链接

点击排行

• 人工智能如何“接稳”方向盘？	• 北京国际设计周主题论坛热议“人工智能”
• 人工智能可海量预测有害基因突变	• 临港启动人工智能全球创新大赛，复旦校长金力谈
• 福州每年超百万元招引人工智能企业	• 人工智能何以赋能教育？乘“智”而上，顺“智”
• 人工智能软件解决方案丨小美AI城探索AI世界的无	• 国际最新研究：人工智能在创造性思维任务中或超
• Arm顶格定价IPO 能否抓住生成式AI浪潮？	• 美学者呼吁向中国学习监管AI：“中国颁布了一些

恰佩克奖	机器人高峰论坛	机气林	ITES深圳工业展	机器人研究院	API数据	库卡机器人
中国传动网	索比光伏网	数控机床市场网	国家标准化委员会