中国科学技术信息研究所所长、科技部新一代人工智能发展研究中心主任赵志耘发布此项报告时表示,以ChatGPT为代表的人工智能大模型引领新一轮全球人工智能技术发展浪潮,大模型相关新研究、新产品竞相涌现。目前,中国在大模型方面已建立起涵盖理论方法和软硬件技术的体系化研发能力,形成了紧跟世界前沿的大模型技术群,涌现出多个具有行业影响力的预训练大模型。
赵志耘在中关村论坛上发布报告。(受访单位供图)
报告显示,中国已有14个省区市在开展大模型研发,主要集中在北京和广东,其中北京38个、广东20个。在模型领域分布上,自然语言处理仍是目前大模型研发最活跃的重点领域,其次是多模态领域,在计算机视觉和智能语音等领域的大模型还较少。在研发主体分布上,大学、科研机构、企业等不同创新主体都在参与大模型研发,但学术界和产业界之间的联合研发仍不足。
此外,中国已有超过半数的大模型实现开源,北京、广东、上海三地在开源数量和开源影响力方面均居国内前三,高校及科研机构是开源主力。
报告指出,近几年来,大模型技术已在全球形成庞大技术群,衍生出涵盖各种参数规模、技术架构、模态和场景的大模型家族。从全球大模型发展态势来看,美国谷歌、OpenAI等企业机构不断引领大模型技术前沿发展,欧洲、俄罗斯、以色列等地的研发团队也投入到大模型研发中。从全球已发布的大模型分布来看,中国和美国大幅领先,超过全球总数的80%,美国的大模型数量居全球之首,中国自2020年起进入大模型快速发展期,整体增长态势与美国保持同步。
赵志耘表示,未来,我国还需加强资源和研发力量统筹,加快基础研究和技术创新,积极参与全球人工智能治理,以进一步促进大模型有序发展。同时,还应强化大模型发展中的场景牵引作用,打造金融、医疗、电力等领域的专业大模型,实现高质量
应用突破,并通过应用场景和应用数据促进大模型技术迭代升级。(记者魏梦佳、申峰)