除了下围棋、写稿子，人工智能又来抢画家的饭碗了

日期：2018-04-08 来源：达芬奇的达作者：liaiai 评论：0

标签：

如果有人让你画一只小鸟，你大概得先线条起稿、补充细节，然后着色，整个过程也得个把小时。微软最近发布了一项新的人工智能项目，名为绘画机器人（drawing bot），可以将文字转换成图画（text-to-image）。

1

对抗生成网络

何晓东是微软深度学习技术中心的负责人，也是 text-to-image 项目的核心人员之一。他说，跟网络搜索得到的图片不同，绘画机器人给你的图案都是按照一定的指令一点一点画出来的，也有可能它画出来的东西这个世界上并不存在。

绘画机器人的核心技术是对抗生成网络（Generative Adversarial Network，即 GAN），听这个是不是感觉很难懂想溜，别急，微软亚洲研究院在知乎专栏里举了个很好的例子。

女生拉男票给自己拍照，拍完第一张，女生说：你要学一下谁谁谁的构图；

拍完第二张，女生又说，你要学一下谁谁谁的调色；

拍完第三张，女生再说，你要学一下谁谁谁的感觉；

……反复几次，女生才终于认可了男票拍出来的照片。

这个男友拍照血泪史就是生成对抗网络。生成对抗网络它有两个工作模型，一个负责根据文字生成图片（generator），另一个根据文字评判生成的图片（discriminator），这两个模型不断相互博弈、又相互学习，直到 discriminator 再也没有能力判断这个图形，「生成模型」就可以出师了。

2

研究历程

这个项目并不是最近新出的，何晓东与他的团队已经研究了 5 年了。

他们最早推出过一个 Captionbot，只要你上传一张图，这个人工智能就会自动为图片配一段文字；接着，他们又将这个技术进一步发展，你可以根据图片上的事物进行提问，人工智能会回答你提出的问题。这个时期的技术，有点像小学生的看图作文、看图回答问题。

早在 2017 年 1 月份，在 arXiv.org 上就何晓东团队登载了一篇介绍 text-to-image 的论文，这项技术名为生成对抗网络（Attentional ，简称 AttnGAN）。而最近微软正在进行的 text-to-image 项目，生成的图画质量将是以前的 3 倍。

与根据图片进行文字描述技术相比，text-to-image 的难点在于，绘画机器人要描绘出更多细节，而这些细节是文字叙述中所没有的，这就要求你的人工智能自动「脑补」。

研究绘画机器人有极大的科研意义，这是计算机视觉研究（computer vision）和自然语言处理（natural language）这两个研究领域的一次融合。怎么理解呢？计算机视觉研究的是机器如何去看，也就是说让机器像人眼一样去看待这个世界、并且进行图像处理；而自然语言处理，研究的就是人与人工智能之间如何用我们日常的语言进行交流。

3

绘画机器人的实际应用

绘画机器人虽然目前仍处在研究阶段，但是界内预测，它一旦出现，将会有极大的实际用途。

比如，它可以作为画家或者设计师的助理，甚至可以帮他们完成草图。

根据何晓东的想象，绘画机器人还可以帮助电影工作者，可以根据电影剧本直接生成影片，这可以节省大量的人力。电影从业人员莫哭。

人类为谋生奋斗了这么多年，没想到最大的竞争对手却是机器人。而何晓东表示，人类和人工智能共同生活在这个地球上，双方是需要找到一种沟通的方式的，而最好的沟通方式就是语言和图像。这话好像很顺耳，但是你有没有觉得有细思极恐的感觉？

更多> 相关开云电子链接

0条 相关评论

推荐图文

机器人赋能产业，智赢	机器人也会创造英国
2018年中国智慧机场行	智能工厂全面解读！
艾猫早教机器人亮相20	360智能硬件助力美国

推荐开云电子链接

点击排行

• 机器人产业将迎来“中国时代” 有什么利弊？	• 哈工大（深圳）Critical-HIT机器人队夺冠2021年
• 2021厦门工博会“黑科技”：可“上天”可“下地	• 微创医疗拟分拆微创医疗机器人赴港上市
• 工业自动化浪潮加速国产机器人崛起	• 深圳博铭维又一力作，管道周边地质灾害探测神器
• 北京启动建设国家人工智能创新应用先导区	• Project Loon前CEO已加盟自主机器人交付企业Sta
• 嘉定将试点打造机器人“智慧园区”	• 提高工效、节省人力！美空军用机器人给战机“洗

恰佩克奖	机器人高峰论坛	北大机器人	金属加工在线	AI中国网	埃森焊接展	机气林
工博会	赶考网	中国机床网	ITES深圳工业展	电气自动化网	高压电气网	人工智能机器人
亚洲工业网	二手设备网	展览会信息网	重庆房交汇网	VLAI未来四足机器人官网	中国传动网	华北机床网
数控机床市场网	国家标准化委员会