ChatGPT的问世拉开了科技大爆炸的帷幕,比尔盖茨发文称人工智能时代已经开启。除了算法赋能之外,
机器人的大脑进化还需要哪些因素?以人类为代表的碳基生命的终点会是硅基生命吗?我们又将如何解码机器人实现高智商背后的投资逻辑?日前,安永大中华区数据智能咨询合伙人季昊接受采访,着重探讨了以上问题。
季昊表示,随着一系列大语言模型问世,我们好像突然进入了大语言模型时代。但进入大语言模型的门槛其实非常高,从投入成本上来看分几类:第一类是建设成本,第二类是训练成本,其他比如数据采集、数据标注、网络带宽、电力资源、平台运营等成本的费用都是以亿来估计。所以初创企业或没有任何经验的企业要进入这个赛道很难,往往前期具备深厚积累的大型科技公司才有资格进入赛道抢占先机。
除去大语言模型这一发展路径,虽然当下以ChatGPT为代表的AIGC技术也非常热,但季昊认为目前主流的2C2B2G市场还是以传统AI模型作为主要技术力量。传统AI模型容易开发和部署,投入小但也能满足业务需求,AIGC技术和传统AI领域进行深度融合还需要一个创新、验证和发展的过程。
针对人和AI的未来关系,季昊表示现在谈机器取代人类为时尚早。目前的AI模型训练都在遵循人类指定训练输入、指定模型结构、指定训练输出,无论是传统AI模型或者是AIGC模型都没有跳出这个规则。未来如果机器真的具有人的思维能力,一定是在人脑机理层面上有了比较大的突破,更多从机理层面获得AI模型,这时才可能有机器取代人一说。
数据、算力和算法是AI的三大核心要素,其中算力是算法和数据基础设施。随着国内外科技企业相继布局GPT类的大模型,算力需求面临爆发式的增长。算力源于芯片,季昊提出AI芯片未来的迭代方向主要有两个:一是随着数据量和模型复杂度不断提升,芯片性能和功耗需要进一步发展;二是随着AI技术在各个场景展开
应用,芯片需要满足日益增长的多元化需求。
目前全国各个算力中心遍地开花,整体算力特别是通用算力已经能满足现有需求,但GPU这种专用算力还是不足。随着人工智能算力爆发式增长,首先要预估算力增长大概的临界点和持续性,依据实际算力整体规划算力网络,评估能否实现算力弹性调度。整体算力问题还是得整体看,从国家层面、政府层面、企业整体规划层面来看。
此外针对数据这一要素,目前AI模型的数据标记和数据处理的发展情况如何呢?季昊表示数据标注这个产业其实在水下,往往不被公众所知。目前随着人工智能爆发,其市场规模在不断提升。但同时,数据标注产业也存在一系列问题。作为一个劳动密集型产业,往往公司接到订单后会逐层下包,导致数据标注工作在管理、质量、审核等方面存在一系列问题;另外还会涉及核心数据泄露,所以对于整个数据标注产业,规范和管理也是非常重要的。
2022年12月,中共中央国务院出台关于构建数据基础制度更好发挥数据要素作用的意见,要求建立数据资源的持有权、数据加工使用权、数据产品经营权三权分制的数据产权制度框架,探索一套可靠数据确权体系。对于数据确权,季昊认为目前最需要解决的是数据权属问题。数据在产生过程中可能涉及不同主体,同时数据沉淀之后的数据加工处理过程又会涉及一系列主体,各个主体在具体数据权属中占比多少、谁拥有这个数据,其实目前是存在分歧的。这个问题解决不了,政府和企业都不敢公布和流通自有数据。但另一方面,目前可以通过一些技术手段帮助建立确权体系,通过数据不出门、数据可用不可见等方式,包括使用区块链、隐私计算等一些技术,进行有效的技术支撑。
随着用户的增多,ChatGPT性能快速增长,今后其落地场景会有哪些,主要盈利方式又是怎样?季昊指出目前ChatGPT只是使用成本低,但其维护成本很高。OpenAI的投入能持续多少时间这是存疑的,所以对于ChatGPT来说一方面现有用户是否可以变成长期粘性用户,是未来长期持续发展的用户基础。另外一个层面是探索ChatGPT技术和业务场景如何结合,技术投入最终需要找到帮它买单的一方。前期可以烧钱,但从长久看一个技术才能长期存活发展需要找到相应的盈利模式。
季昊说,人工智能其实目前已经逐渐从幕后走向台前。原来是默默无闻支持千行百业,现在是成了整个科技的引领力量,所以说我们可以张开双臂迎接AI时刻的到来。