继不久前因人工智能(AI)聊天
机器人Bard在回答相关问题时给出错误答案,导致其母公司Alphabet股价暴跌后,近日谷歌CEO桑达尔·皮查伊在公司内部发起了一项代号为"斗狗"的活动,要求全体员工每周花费2-4个小时来帮助测试和改进Bard。对此谷歌公司发言人表示,向员工寻求意见和建议以改进产品是公司文化的重要组成部分。
随后,谷歌负责搜索业务的副总裁PrabhakarRaghavan在一份内部邮件中指出,希望员工可利用自身的知识储备,修正Bard给出的答案。对此他表示,"Bard通过榜样学习效果最好,所以花时间深思熟虑地改写答案将大大有助于我们改进模式。"
据悉,在这份邮件中包含有一个"该做什么"和"不该做什么"的页面链接,向员工详细说明了在内测时应如何修正Bard给出的回答。其中在"该做什么"部分,谷歌方面要求员工要把Bard教得"有礼貌、随和、平易近人",并应让它"以第一人称"来回答问题,以及保持"无偏见、中立的语气"。而在"不该做什么"部分,谷歌则要求Bard的回答不能有刻板印象,并需避免根据种族、国籍、性别、年龄、宗教、政治意识形态等进行推测,同时还要求员工"不要把Bard描述成一个人,暗示情感,或声称有类似人类的经历"。
值得一提的是,为激励员工测试Bard并提供反馈,PrabhakarRaghavan透露,参与贡献者将获得"Moma徽章",并且这个徽章将记录在内部档案中。
据了解,除PrabhakarRaghavan外,Bard项目的产品主管JackKrawczyk也在内部邮件中指出,通过研究发现,为用户查询添加高质量的响应"显著"提高了该公司AI模型的质量,因此呼吁员工积极协助测试,修正Bard给出的答案。
具体而言,JackKrawczyk建议员工向Bard询问自己擅长的领域,例如最喜欢的兴趣爱好等,并对获得的答案进行评估,以确保这些答案的内容符合用户的期望,而且在内容长度和结构上也合理。JackKrawczyk指出,如果Bard给出的答案过于人性化、存在事实错误或者没有任何意义,员工可重写答案并提交给Bard的模型训练。
此外,英属哥伦比亚大学计算机科学助理教授VedShwartz也曾表示,谷歌要想持续改进Bard,可采取监督式学习和强化学习相结合的方式。其中,监督式学习是指该公司研究人员可以向Bard输入人类编写的查询和答案,直到它学会如何像人类那样回复。在此基础上,该公司可构建一个强化学习模型,并用员工写的答案来训练它,以帮助其理解该公司希望Bard的答案展现哪些价值观,并在结构、语气以及其他方面加以改进。
需要注意的是,除了因为失误导致公司股价暴跌外,此前曾有消息称,Bard的发布还引发了谷歌部分员工的不满,他们认为这款产品的发布"仓促"、"一团糟"和"不符合谷歌的特点(un-Googley)"。在该公司内部论坛Memegen中有人写到,"桑德尔·皮查伊等管理层该得到PerfNI(该公司绩效评级系统里最低的评级)。在追求‘更聚焦重点’的过程中,他们变得鼠目寸光,简直可笑,而且毫无谷歌风范。"。
在近日宣布希望全体员工更多地参与到Bard的测试中时,桑德尔·皮查伊表示,"我们现在能做的最重要的事情,就是专注于打造一个伟大的产品,并抱着负责的态度进行开发"。同时他还指出,"我们公司最成功的一些产品,并不是最先推向市场的。这些产品能取得势头,是因为它们建立在深刻的技术洞察力之上,解决了重要的用户需求",以及"AI经历了一轮轮冬去春来,如今又到春暖花开时。作为一家AI至上的公司,我们多年以来一直为此努力,随时做好准备。"