5月6日,在鲲鹏昇腾开发者峰会上,华为公布了最新的开发者生态成果:“目前鲲鹏和昇腾AI开发者已经超过350万,合作伙伴超过5600家,解决方案认证超过15500个,其中openEuler(欧拉操作系统)的商业装机量实现指数级增长。”
与此同时,华为昇腾计算业务总裁张迪煊还透露,昇腾AI基础软硬件平台已孵化和适配了30多个主流大模型。“大模型已经成为我们产业发展的趋势,中国原创的AI大模型一半都是基于昇腾开发的。”
在ChatGPT爆红后,大模型无疑成为核心竞争力的重要体现。据张迪煊介绍,华为围绕动态图、调试调优等制定了明确的目标和执行计划,目前取得阶段性的进展。“动态模型满足度从去年的30%提升到70%;数据采集从GB级别的大颗粒到现在MB级的小颗粒,采集由原来的数小时降低到现在的数分钟。”
将加大对“根技术”的投入
公开资料显示,鲲鹏芯片于2019年1月在华为深圳发布会上正式对外发布,它基于ARM架构开发,是华为继移动麒麟芯片、AI昇腾芯片后,第三款自研芯片,定位于服务器应用。近年来,为提高整个硬件生态的可用性,华为加大自研力度,推出了服务器操作系统openEuler和新型数据库GaussDB。同时也加强对外合作,进行广泛基础软件适配,包括中间件、办公软件、GIS等。
具体到鲲鹏生态方面,华为副总裁、ICT产品组合管理与解决方案部总裁马海旭介绍称,已有超过4500家合作伙伴,200多万名开发者加入鲲鹏,鲲鹏已经在政府、金融、电力、运营商等多个领域得到规模应用。
“鲲鹏本身是生态性的产业,在四年前基于鲲鹏的软件应用是非常少的,我们做的是鲲鹏计算,其实做的是鲲鹏的软件生态,从软件生态的迁移开始,当前有许多新应用已经是基于鲲鹏原生的。鲲鹏正在从‘迁移’走向‘原生’,从‘可用’走向‘好用’。”马海旭说道。
在马海旭看来:“数字化转型正向行业纵深发展,各种新的业务场景和新的应用层出不穷,数字世界和物理世界正走向更深度的交融,计算不断提升模拟、还原、增强物理世界的能力,算力需求也因此呈现出爆炸式增长。比如,在气象领域,随着台风预报的精度,从原来的9公里提升到1公里,甚至几百米,所需算力将会增加上百倍。这为鲲鹏计算产业带来巨大的发展机遇。”
面向广阔的市场前景,马海旭表示,一方面将持续加大对根技术的投入,围绕鲲鹏基础软硬件平台持续创新;另一方面,不断优化升级鲲鹏开发者所必备的开发套件DevKit和应用使能套件BoostKit,提升开发效率和应用性能。“产品要从最原始的底层操作系统、内核和上面的数据库全栈实现国产化,才能实现我们产品的竞争力,所以我们需要向下技术扎到根。”
芯片研发:国内企业突破垄断仍任重道远
如果说鲲鹏芯片主要面向通用计算领域,那么昇腾芯片则主要面向智能计算领域。
在昇腾生态方面,华为ICTMarketing总裁周军介绍称,目前已有超过150万的开发者加入昇腾,有25个城市基于昇腾构建人工智能计算中心,其中14个已经上线并饱和运行。
尤其是在火热的人工智能大模型领域,当前,鹏城云脑、“紫东太初”大模型等均是基于昇腾生态打造。中国工程院院士、鹏城实验室主任高文在会上表示,今年下半年将启动鹏城云脑III的建设,原型机将在2023年建成,鹏城云脑III预计2025年底前建成,它将是面向6G超宽带通信的云网合一智能化工具平台,提供预训练大模型底座。
大模型训练需要大规模的训练数据以及强大的计算资源。东方证券在日前发布的研报中将AI芯片领域玩家分为三类。“一种是以Nvidia(英伟达)、AMD为代表的实力强劲的老牌芯片巨头,这些企业积累了丰富的经验,产品性能突出;另一种是以Google、百度、华为为代表的云计算巨头,这些企业纷纷布局通用大模型,并自己开发了AI芯片、深度学习平台等支持大模型发展。如google的TensorFlow以及TPU,华为的鲲鹏昇腾等;最后是一些小而美的AI芯片独角兽,如寒武纪、壁仞等。”
长期以来,英伟达在高端GPU市场占据绝对主导地位,如今已量产的A100芯片相比前代产品性能显著提高,代表当今高端芯片水平,而最新一代H100芯片也已经亮相并即将量产。IDC数据显示,2021年中国加速卡的出货数量已经超过80万片,其中Nvidia占据了超过80%的市场份额;剩下的份额由AMD、百度、寒武纪、新华三、华为、Intel和赛灵思等品牌占据。
东方证券表示,芯片的研发周期较长,英伟达具有绝对先行优势,目前国内企业突破英伟达垄断仍然任重道远。寒武纪、华为AI芯片快速发展,有望逐步进行国产替代。
此外,生态的发展离不开众多开发者的支持。为激励更多开发者加入,华为还启动了鲲鹏应用创新大赛,设置了高校赛和科研赛等。