今年行业掀起“百模大战”,据不完全统计国内已经上百个大模型,达到10亿参数以上的大模型达79个。大模型也成为本场论坛的讨论重点之一。
陈宁博士在谈话中提到,过去半年大模型获得了大量的追捧,而未来行业会越来越回归理性思考。未来,大模型还要解决
应用和成本的问题。大模型今天可能相当于是一个本科的全科毕业生,但是它到底在不同的行业怎么去应用,还是需要跟行业的知识去结合,通过行业大模型去真正推动落地。
云天励飞在今年7月的世界人工智能大会上公布了大模型的最新动态。据介绍,“云天天书”基础大模型架构包含三个层级:通用大模型、行业大模型、场景大模型。云天励飞基于算法开发平台和算法芯片化平台,并通过海量高质量数据预训练生产通用大模型;在通用大模型基础上,引入高质量行业数据,生产行业大模型;再在行业大模型基础上,通过细分场景数据微调研发场景大模型。通过这样的三级架构,让大模型为千行百业赋能。
陈宁博士还提到,应用场景和数据是中国发展人工智能的优势,建议定义场景开放标准,有效开放场景,通过“场景生产数据、数据训练算法、算法定义芯片、芯片赋能应用”的四位一体的闭环,推动中国人工智能产业不断进步。