自从谷歌用于机器学习的Tensorflow工具去年底宣布开源以来,全世界各地的开发者运用Tensorflow进行人工智能方面的应用开发。尽管人工智能这一概念听上去十分高大上,但实际上运用人工智能的方案,能够帮助解决生活中一些看似最寻常的事情。
例如,在日本,一位名叫MakotoKoike的汽车行业工程师,便运用深度学习的方法,为种植黄瓜的父母搭建了一套自动分拣黄瓜的系统。
Makoto的父母从事黄瓜种植业,自家有着规模不小的黄瓜种植农场。但在享受到黄瓜收成的喜悦的同时,一桩烦恼也同期而至。由于黄瓜的长短、厚度、形状、颜色、质地各不相同,需要人工将黄瓜的质量进行分类,根据质量的高低,售价也各不相同。
Makoto与其父母在黄瓜园内
这是一项及其繁琐、细碎又耗时、费力的工作,在黄瓜收获的旺季里,Makoto的母亲平均每天要花费超过8小时来进行黄瓜的分拣工作。
有着多年汽车行业经验,见惯了汽车生产流水线上各种自动化工序的Makoto由此想到,何不建立一套黄瓜自动分拣系统来省去人工的麻烦。
但黄瓜的分拣并不是一桩容易的工作,即便从人的角度来说,要熟练这一技术,也需要花费相当长的培训期,更何况是机器。在日本,对蔬菜品类并没有统一的行业标准,而是由各个农场自主决定所产出的农作物优劣标准,Makoto父母的农场将自己产出的黄瓜的质量总共分成9个档次,Makoto说,自己也是最近才跟母亲学会如何精确分拣黄瓜的技术。
按照长度、形状、质地、颜色等要素被分为9个档次的黄瓜
考虑到分拣黄瓜的复杂度和精确度的要求,Makoto决定运用深度学习的方法来进行这一套自动系统的搭建,他说自己的这一灵感来自于谷歌前一段时间名声大噪的AlphaGo,Makoto认为,正是AlphaGo取得的成功启发了他通过深度学习技术来进行黄瓜分拣自动系统的搭建。
具体来看,Makoto的这一套系统运用了谷歌的开源系统Tensorflow,通过图像识别,并与硬件控制器相结合,最终实现分拣的过程。
黄瓜分拣自动系统深度学习系统流程
从图像识别这一过程来看,通过对训练数据集的学习,电脑能够知道图像中最重要的“元素”是哪些,然后根据重要性排序,从而实现分类。
完成后的黄瓜自动分拣系统
但这一套方法在实际运用中仍面临很多挑战。首先系统要求训练数据量足够多,为了训练这一系统,Makoto花费了3个月的时间输入了7000个已经被他母亲分类好的黄瓜的图像,但是这一数据量还远远不够,带来的问题是在实际运用中,分拣的准确度不够高。Makoto说,实际使用中的准确度仅为70%。
第二方面的挑战在于受到计算资源的限制,难以进行复杂度更高的实时运算。尽管Makoto的这套系统已经将黄瓜的图片训练数据转换成80*80的低分辨率图像,但依然花费了一台普通的Windows个人电脑2至3天的时间完成7000幅图片的模型训练。
基于上述限制,Makoto的自动分拣系统目前只能对黄瓜的形状、长度和曲度三个参数进行分拣识别,颜色、质地、表面皱褶等参数还无法纳入进来。
要突破这些障碍进行更大规模、更大深度的深度学习就需要用到更多的计算资源,这时对于普通开发者来说,就只能借助于云端服务器的帮助了。