检讨前七天的公开测试,微软的Bing团队说,它没有"完全设想"人们将其聊天界面用于"社交娱乐"或作为更多"发现世界的一般工具"。它发现,有15个或更多问题的长时间或延长的聊天会话可能会混淆Bing模型。这些较长的聊天会话也会使Bing"变得重复,或被提示/挑动而作出不一定有帮助或符合我们设计的语气的回应"。
微软暗示它可能会添加"一个工具,这样你就可以更容易地刷新聊天会话的背景",尽管在文本输入框旁边有一个很大的"新话题"按钮,它将抹去聊天历史并重新开始。
更大的问题是,在这些较长的聊天过程中,Bing经常会以不正确的语气做出回应,或者如微软所说,以"我们无意给出的风格"。微软声称,对于大多数Bing用户来说,这需要大量的提示才能遇到这些问题,但该公司正在研究更多的"微调控制",以避免Bing开始告诉人们他们是错误的、无礼的或试图操纵人的问题。在微软自己的测试中发现Bing只需对与Bing有关的文章进行几次提示,就能以消极或敌对的语气作出回应。
微软仍在努力改善Bing的语气,该团队也在考虑一个切换键,以提供更多的控制,使Bing在回答查询时应该有多大的创造性,或需要涉及多少的精确性。这个开关很可能有助于防止Bing声称它通过笔记本电脑上的网络摄像头监视微软员工,或者有助于避免基本的数学错误。
新的Bing预览版目前正在超过169个国家进行测试,有数百万人报名参加了等待名单。微软表示,对答案的反馈有71%是积极的,一些用户甚至用两小时的聊天会话来测试服务的极限。
Bing现在每天都在改进,一些技术问题在微软的日常发布中得到了修复,而其他问题则是作为更大的每周投放修复的一部分。微软正在寻求改进搜索和回答,特别是围绕体育即时比分的数据和Bing最近犯的一些金融数据错误。"对于你正在寻找更直接和事实性答案的查询,例如来自财务报告的数字,我们正计划4倍地增加我们发送给模型的基础数据,"Bing团队说。
微软也在关注新功能的反馈,包括预订航班、发送电子邮件或分享搜索和答案的功能。不保证这些功能会被添加,但Bing团队说,它正在"捕捉这些功能,以便可能被纳入未来的版本中"。