我从1983年开始一直在使用计算机,高中上了第一次“商业机器”课,1994年参加第一个计算机科学课程,1997年进入硅谷加入思科,在IT部门工作了好几年。
在过去30年,技术上发生的令人难以置信的创新。 我很幸运在硅谷见证了这一切。我看到了各种各样的技术浪潮来来去去,我已经对大多数新技术持怀疑态度。虽然我认为人造智能在许多方面吹捧过度的,但我非常看好它的潜力。 有一个独特的因素组合,将使AI成为我们一生中最有影响力的技术。 是的,我已经中了AI的“毒”,但我认为这是有理由的。
在AI“流行”之前卖AI
随着人工智能在2011年开始兴起,我对此持谨慎乐观态度。 在AI之前,我在2010年创立了缩写为AI(Automated Insights)的公司。
在2012年,试图将AI作为一种能力进行销售是很难的。我的公司建立了自动化定量分析和报告流程的解决方案。 也就是说,我们自动化从前全靠手写的数据分析报告。我们服务的对象包括雅虎、美联社、bodybuilding.com。试图在2011年以“自动化写作”作为卖点,这就像亨利·福特试图向马车主出售汽车的感觉:怀疑、不相信、甚至觉得毫无必要。
短短四年后,事情发生了巨大变化。 Gartner的技术成熟度曲线(1995年发布)一直是围绕新兴技术的炒作、成熟周期。 看看2016年报告:
几个AI相关技术的出现,包括
智能机器人,自动驾驶汽车,对话用户界面,自然语言问答,以及在曲线最高点的机器学习。
我们经历了对AI普遍怀疑到,每个创业公司都把AI放到他们的融资幻灯片的过程。在之前,人工智能听上去很吓人,但现在如果你的解决方案和人工智能没关系,客户就会失望。 以前,在晚宴上结束对话的最快捷方法是提及AI,现在我的保险代理人告诉我有一个很酷很新的“AI助手”,他用来安排他的所有会议。
无论我们是否达到“AI顶峰”,绝大多数人,包括我退休妈妈,都已经听说过AI了。一个很大问题仍然存在:它能否达到人们的期望? AI与以前的技术相比有何潜力? 这个问题的答案让我对未来感到兴奋。
八次技术浪潮
在过去30年中,有八种广泛的技术,我觉得对比较有用。 我分析了每种技术发展的速度以及帮助或阻碍创新速度的因素。 并不只有这8个技术,但每个技术在高峰期对整体科技格局有重大影响。我的目的不是完整地经历每一次发生的技术浪潮,而是提供一个可以用来比较和对比的框架。
本文涵盖的八种技术包括桌面操作系统,Web浏览器,网络,社交网络,移动应用,物联网,云计算和人工智能。
决定技术潜力的两个因素
有两个因素是决定技术随着时间的推移能走有多远和多快的重要决定因素。
第一个因素是单一开发人员创造有用的东西的障碍。 如果开发人员有能力创建或调整自己实现开发,通过开发人员的贡献,可以快速、分散地进行大大小小的技术改进。
由于软件的复杂性,操作系统进入门槛较高。 一般来说,你不会看到大量的开发人员花费时间在周末尝试修改操作系统。 另一方面,只需要有限技术,移动应用程序很容易进行创建和发布(这有好有坏,后面我将解释)。
第二个因素是核心平台的开发是集中还是分散化。 一个公司或组织是否担任新版核心平台的守门人,还是任何人都可以做出贡献? 在社交网络领域,与网络相比,平台(Twitter,Facebook等)的所有者完全集中开发, RFC(请求注解)过程导致了一个广泛分布的贡献者群组。
具有低进入门槛和分散式平台开发的技术对未来的影响具有最大的潜力。 八种技术中除了人工智能以外,都不具备这两种特性,但是越往后的技术具备更多。
为了符合本文的目的,我主要关注创新的潜力,而不是创新是否或将要发生。 我所提到的两个因素并不是技术产生巨大影响所必须的。 云计算也有巨大的影响,虽然这一领域只有少数玩家。 但云计算的未来几乎完全依赖于拥有这些平台的公司。 如果市场统一或者对于主要参与者来说不那么具有吸引力,那么创新就会大大地停止或减少,这就是Web浏览器在二十世纪初所经历的故事。
以下是我对这两个因素对这8种技术的排名。 就像Gartner的技术成熟度曲线一样,在四个象限中的位置大部分是主观的。 我将详细介绍每种技术,但首先我将介绍每个象限代表什么。
低门槛+集中开发=有限创新
这种情况非常少见,因为开发人员可以轻松创建,但是平台开发是集中的。 创新仅限于平台所有者的想法。 开发人员必须在平台的范围内进行工作,影响整体方向的能力有限,因为它由单一的权威机构所拥有。 应用商店模型属于这个象限。
高门槛+集中开发 =专有创新
在这种情况下,开发只能由平台所有者完成。 开发者有很大的门槛,不能为平台做出贡献。 这是经典的专有模式,在产品开发中占主导地位。
高门槛+去中心化开发 =不兼容的创新
这个象限通常表示基于开源或已经开放(并且在许多情况下是可选的)标准的技术,但由于基于硬件或非常复杂的软件,开发人员创建的门槛是很高的。 结果可能是产生重大的创新,但解决方案不兼容,因为开发人员可以自由地纳入他们选择的“标准”。
低门槛+去中心化开发 =完全分布式创新
这在促进创新的环境方面是最佳的。 因为门槛很低个人开发商不仅可以无障碍入门,还可以建立自己的平台。 AI是在这个象限中唯一的技术,我将在下一节讨论原因。
八种技术概述
接下来,我将简要描述我将每种技术放在特定象限中的原因。
桌面操作系统
桌面操作系统已经被少数玩家所主宰。 从1981年IBM发布最早的PC开始,微软(和Sun的数量较少)在20世纪90年代,二十世纪二十年代是苹果。 Linux也参与其中,但在桌面/笔记本电脑上绝对不会成为主流。
操作系统有大量的软件,所以单个开发人员不会有太多的改进和重新分配核心平台。代码的复杂性和广度是进入门槛的重要原因。
除了Linux,其他流行的桌面操作系统是专有的。 这意味着,在大多数情况下,操作系统的创新已经集中在大公司内部。 即使是Linux,拥有一个仁慈的独裁者意味着所有的大决策都集中管理。 诸如操作系统之类的大而全的软件需要在某种程度上进行集中协调,以确保最终产品是一个完全集成和稳定的解决方案。
网络
思科1990年的IPO开启了十年网络公司的开始。各种公司出现,然后被收购或并购。 思科、朗讯和北电在互联网泡沫破裂之前将双腿摆脱了这个行业,成为最大的玩家。
自从第一个RFC于1969年发布以来,互联网协议已经进行了分散化开发过程,其中包含请求注释(RFC)。标准机构,如IETF,可以批准RFC作为官方标准。 虽然定义协议是去中心化的,但是使用这些协议(例如Cisco路由器)的核心平台仍然是专有和封闭的。
而且由于主要的网络供应商都有自己的硬件,因此个体开发者做出贡献的障碍很大。 虽然局外人有可能为协议规范做出贡献,但只有网络公司的开发人员才能将这些协议添加到其平台。
我在这个列表中涵盖的网络不是太多,不是因为它是一个主要的技术浪潮,而是因为它们独特的标准化过程。
网页浏览器
当操作系统的战争肆虐时,桌面上最重要的应用程序也经历了类似的战斗。 无论是20世纪90年代的Netscape和IE还是Chrome,IE和Firefox,浏览器一直是一个令人垂涎的应用程序,因为它是网络的前端。
虽然IE主流浏览器中唯一不开放源码或基于开放源码的,但入门的门槛仍然很高。 和操作系统一样,现代网络浏览器已经变得非常复杂的软件。 普通开发人员通常不会将浏览器分配给自己的公司来进行定制。 每个浏览器为扩展或插件提供不同的支持,但是这些扩展或插件在功能方面往往是非常有限的,并且往往是脆弱的。
鉴于一些浏览器的开放源码性质,核心平台上的开发是分散的,但在实践中,变化被密切监测。 鉴于浏览器的广泛用户群,浏览器所有者必须仔细检查每一个改变,以避免向数百万用户发送有缺陷的产品。
移动应用
我可以列出“移动”或“智能手机”,而不是移动应用程序,但我在桌面操作系统下描述的许多相同的问题将能够适用。移动应用程序对于我们的目的来说更有趣,因为它进入门槛较低。 当苹果公司推出在App Store时,它在移动计算中改变了一切。 移动应用程序类似于网页,但功能更丰富,迎来了消费者能力的新时代。
就开发者创造有用的东西而言,开发移动应用程序并没有容易得多。 有些人可能会认为入门的门槛太低,所以现在应用商店里全是垃圾。 如果创建起来有点困难,也许业余编程玩家和全世界的抄袭者都不会有贡献,但这是对所有人开放的权衡。 一小部分人将创造出优秀的应用程序,绝大多数都不会。
社交网络
无论是Facebook、Twitter还是Foursquare和LinkedIn,社交网络都是专有的,有限的标准化。 社交网络已经有一些开源的尝试,但没有一个获得足够的支持者。 这意味着几乎社交网络领域的的所有发展都来自少数公司。
关于开发人员创造有用的功能的能力,你可以通过以下两种方式之一来看待社交网络,这就是为什么在进入门槛上把社交网络放在中间水平。 的确,除非你是社交网络公司的员工,否则你无法为自己的平台做出贡献。 另一方面,社交网络并不像操作系统或网络浏览器那么复杂。 复杂性来自于试图将社交网络扩展到数百万(或数十亿)用户。 一个开发人员可以在一个周末里拼凑一个类似于Facebook或Twitter的网络应用程序。但能够为数百万用户提供服务是另一回事。
另一个社交网络进入障碍的问题是网络效应,如果你没有获得批量的用户,则网络的价值有限。不仅仅是制作移动应用程序,获取网络效应非常困难,这不是开发人员可以轻松地自己构建的东西。
云计算
亚马逊在采用AWS的云计算功能和新时代的定价方面做得非常出色,Google和微软紧随其后, 然而,由于硬件要求很高,云计算是一个非常资本密集型的企业,要在规模上取得成功。 这通常导致集中发展的核心平台。
云计算已被优化,以允许开发人员创造有趣的事情,所以创造的门槛是低的。 云计算已经实现了大量创新,但只有亚马逊,谷歌和微软认为值得投资,云计算才会持续下去。
物联网
在过去十年中,物联网(IoT)已经有所收获,并且几度失去了势头。 关于两个因素,IoT是一个混合的包。 就进入门槛而言,建立IoT设备的大多数软件(甚至硬件)构建块通常都是可用的,但是将商用IoT设备推向市场是一项重大任务 ,只需看看众筹项目的情况就知道了。
IoT已经受益于一些标准化,但它也是一个非常分散的空间。 它类似于我之前描述的网络环境。 只因为有“标准”并不意味着公司必须使用它们。 因此,你可能会在家庭或办公室中使用各种不同标准的IoT设备,或者设备间无法兼容。
人工智能
当我开始研究这一主题时,我首先意识到AI生态系统有所不同:LSTM,GAN,CNN,Seq-to-seq。 有很多新的研究出来了; 很难跟上。 至少说现在最新的技术和速度与最新的研究并驾齐驱是至关重要的。
看看这两个因素,首先,开发人员进入AI的门槛是低的。你需要的所有工具都是免费的。 这些门槛纯粹是自我驱动。 要做一些有趣的事情,你需要一个重要的数据集,另一个是你需要心理带宽来了解如何建立一个有用的模型。 这是最后一点,让我对许多公司表示怀疑,他们声称正在使用AI来做有趣的事情,特别是机器学习。 构建ML程序不像构建移动应用程序。 这更复杂。(尽管亚马逊已经大大简化了流程)。
关于核心平台,仍然处于早期阶段,就像我所涵盖的其他技术一样,没有重量级的平台定义AI的体验。 所有的机器学习和深度学习平台,如Tensorflow,PyTorch,Theano和Keras都是开源的,拥有充满活力的社区。
AI与其他大多数技术不同的关键是其强大的研究背景。 默认情况下,计算机科学领域一直是由学术会议标榜的开放社区,研究人员介绍了他们的最新发现。 AI世界的许多知名人士都是来自学术界的,他们也发表研究报告。 大多数研究都是基于几个月的工作和有限的代码,关键是要尽快将想法提交给社区,以便其他人可以进行改善。
这种生态系统最近看到的是我之前提到的互联网标准体系或开源运动,但AI在重要方面仍然有所不同。 在AI研究方面,没有任何理事机构批准新的进展。 IETF和其他组织变得臭名昭著,服务于在职者,并且在行业中拥有大量政治势力,强迫其代表以便他们以特定的方式指导标准组织。与研究界最接近的是在大型学术会议上提交论文,并提供最佳论文奖。虽然这些荣誉是好的,但它们不是你的新想法被研究人群所接受的必要条件。
谷歌,Facebook,亚马逊和百度都在找各种博士,重新培训机器学习员工,并投入数十亿美元,这是过去30年来少数几次,这其中的很多投资正在帮助推动整个行业向前,而不是只是一个特定的公司的议程。
AI的环境
我经常告诉创业者,大多数创业公司失败得太快。 他们必须活足够长的时间,等待大环境的改变。这也是我创业中遇到的情况。公司获得的多米诺骨牌效应导致我获得了巨大的回报。 也就是说,这对我来说是最令人不安的创业生活:你无法控制能让你成功的东西。 市场力量、技术转移、经济状况等都对创业公司都产生重大影响。
同样的事情也适用于技术。 尽管过去的尝试失败了,但目前的AI大潮正发生在正确的时候。 有各种因素助推其成功,包括:
我所讨论的完全分布式创新环境在整个AI领域产生了非常新的功能。
经过多年的大规模大数据热潮,从2000年代中期开始,到2010年和2011年,许多公司终于开始开发大数据基础设施。
多年来,企业关注的都是“什么”,而不是“为什么”,企业想在大数据投资中实现价值。解决大数据的问题不是终点,而是解决问题的一种手段。 被压抑的需求从大数据中获得解放,意味着公司可以使用新的方式使用其数据(进入AI阶段)。
在很大程度需要感谢游戏界,AI(以GPU的形式)的优化计算已经变得容易获得。 GPU执行矩阵乘法必须比传统CPU更快,这意味着机器学习和深度学习模型可以执行得更快。 GPU一线大厂Nvidia很高兴。
开发AI解决方案的进入门槛很低,但需要较高水平的技术知识。 这与移动应用程序的重要区别,移动应用程序开发的门槛也很小。但应用商店被许多糟糕的应用程序损坏,除非你是一个认真的开发人员,并且能够访问大量的数据,否则你将无法做机器学习。 因此,AI应用的平均质量将会更高。
AI是勒布朗·詹姆斯还是格雷·格奥登(被伤病毁掉的天才球员)
在这篇文章中,我已经描述了为什么AI未来创新的潜力与以前的主要技术浪潮中看到的不同。 但即使拥有世界上所有的潜力,也可以不去利于它。
由于我所描述的完全分布式创新模式,AI生态系统将具有很强的适应能力,但一些外部因素可能阻碍其发展。
过于专注于深度学习。 艾伦研究所的研究员去年在O'Reilly AI大会上发表了一个演讲,并分享了他对于深度学习吸引的关注的看法,我们可能过于关注深度学习,而不去探索其他更适合实现通用AI的方法。
没有足够好的大数据。 尽管许多公司在组织数据方面取得了进展,但仍有很长的路要走。 在自动化洞察中,我们看到成功项目的第一个障碍是缺乏足够的高质量数据。 大多数公司认为他们拥有更好的数据。
人类! 采用下一代自动化和AI技术的最大障碍将是我们自己。 作为一个社会,我们不会完全拥抱能够拯救数百万生命的类似自动驾驶这样的技术。 五级自主车的技术是可以实现的,但是社会和政治压力将使得全面实施需要更长的时间。
活过泡沫化的底谷期。Gartner为过去所有的新兴技术使用相同的技术成熟度曲线,但实际上每一种曲线都有不同的斜率。考虑到围绕AI已经出现了大量的炒作,这可能意味着“失望之谷”也可能更深,更难以脱离谷底。尤其是当早期的结果不如人们所希望的那样惊人的时候。
AI平台出现,使开发更集中化。 Tensorflow在ML社区获得了很大的牵引力。 它可以成为一个更重的平台,成为每个ML工程师必须使用的默认框架? 那么我们有可能必须采用更集中的创新模式。
最终,我相信Amara定律将适用于AI:我们倾向于高估一项新技术的短期效应,而低估它的长期影响。