作为全球顶级科技盛会,云栖大会被视为科技界的创新风向标,主论坛的话题尤为受关注,代表了最具前沿性、探索性和想象空间的科技方向。
2021年度,AI和Science是两个很有热度的词。AlphaFold2以深度学习技术在预测蛋白质结构上做出突破,这项计算工作展现出AI在科学领域解决问题的巨大潜力。从生物这一单一场景延展开来,在物理、化学、材料、地质等多领域,以深度学习为代表的AI与科学计算结合形成新的计算方法,可以产生怎样新的科学模型、新的实验方法、新的产业业态?
思潮之下,“AI+Science”也成为2021云栖大会讨论碰撞的焦点。
解决传统科学计算问题,AI的系统性机会在哪里
张林峰博士此次演讲的题目是“‘AI+Science’从科学愿景走向大规模工程化”。
令人关注的是,他所带领的深势科技团队引领的跨尺度建模技术成功应用了人工智能和高性能计算等能力,于2020年在世界上最大的超级计算机上将量子精度的分子动力学模拟推向了上亿个原子,革命性地提高了微观科学计算的尺度和精度。这一研究成果在全球范围内都处于领先位置,获美国计算机协会ACM公布的2020年戈登贝尔奖,并当选中国科学院、中国工程院主办,中国科学院院士和中国工程院院士评选的2020年中国十大科技进展。并被认为有望为力学、化学、材料、生物乃至工程领域解决实际问题发挥更大作用。
张林峰认为,长期以来我们对世界的认知遵循着两大范式:开普勒范式和牛顿范式。前者从数据中提取规律,后者寻求基本原理。两者都能用来解决实际问题。当代AI在CV/NLP等领域的应用是集前者之大成,而当代仿真模拟和工业设计软件则是后者的精华沉淀。开普勒范式面临的挑战是所谓“知其然不知其所以然”的问题,即模型的可解释性、可迁移性等;而牛顿范式面临的挑战是带来棘手又漫长的计算过程,即所谓“维度灾难”。“AI+Science”的本质实则是两种范式的结合。
由此,带来“AI+Science”的系统性机会。以机器学习为代表的AI具备复杂数据处理的能力,可以使得训练出来的物理模型兼具微观尺度的精度和宏观尺度的效率,能够真正有效解决科学计算中的“维度灾难”问题。以斩获戈登贝尔奖的Deep Potential方法为例,张林峰博士展示了AI和分子动力学模型的有效结合,在保证精度的同时,指数级地提升了物理模型的效率。以这套方法为代表的全新范式,可以系统性地解决药物设计、材料设计和化工设计等领域中的微观设计层面问题,实现“既快又准”的计算模拟。
事实上,AI+Science的应用场景远不止于微观层面设计,在宏观的飞机、汽车、火箭也将有丰富的应用。
“AI+Science”的工程化正当时
做Science(科学)是探索和理解未知的世界,而工程是还原到实践的过程。
谈到“AI+Science”的工程化,张林峰博士强调,“AI+Science”的工程化正当时!从规模、数据、性能三个维度的工程化来理解:对于AI+Science,“规模工程”将更加面向计算本身;“数据工程”,将需要面向物理、尊重物理约束;“性能工程”,将不再是软件对硬件的适配,而会是硬件对算法的定制。
“这样的工程化需要的是科学家、工程师以及各行各业共同的努力。“开源去中心的协同开发、在开发基础上快速地实现分布式评审,就是一种被验证且最佳的软件协同发展模式。张林峰指出打造“AI+Science”新一代基础设施的新思路——“开源协同”。
开源模式在过去的半个世纪给计算机领域带来了高速发展,在科学计算领域尚属新事物,但这种基于开放共享精神和同行评价机制的高效合作模式发展非常迅速。张林峰博士作为核心发起人并推动的DeepModeling开源社区之上,新一代的AI+Science体系正在建立:底层算力调度、各尺度物理引擎、数据库、面向各类计算需求的工作流都在快速迭代。基于DeePMD开源软件,来自世界各地的数千个材料、化学、生物等领域的研究组正在拓宽着他们的科研边界,也产生了很多优质的科研成果。
AI+Science的未来:解放科学研究与工业设计的生产力
张林峰博士最后强调,AI+Science的未来在于解放科学研究与工业设计的生产力。
他所带领的深势科技正在聚焦微观尺度,打造微尺度工业设计平台,用开源社区和Lebesgue科学计算平台解放科学家的生产力,用药物设计和材料设计两大平台解放这两个行业的研发生产力。为微观尺度的工业设计解决难题,这也是深势科技创立的初衷。
关于深势科技
深势科技有限公司(“深势科技”)是一家成立于2019年的科技公司,致力于以新一代分子模拟技术解决微观尺度工业设计难题。 以打造切实服务于药企、材料商和科研机构的模拟研发平台为主要业务方向,以解放研发工作者的生产力为主要业务目标。
深势科技具有强大的科研与产业落地能力。其新一代分子模拟算法在保持量子力学精度的基础上,将分子动力学的计算速度提升了至少五个数量级,且对算力的需求与体系的原子数量呈线性依赖;结合高性能计算,能够对数十亿原子规模的体系进行量子力学精度的计算模拟。团队核心成员获得2020年全球计算机高性能计算领域的最高奖项“戈登·贝尔奖”,相关工作当选2020年中国十大科技进展,以及2020年全球人工智能十大科技进展。
公司核心团队由中国科学院院士领衔,研发队伍由物理建模、数值算法、机器学习、高性能计算及药物和材料计算等多个领域的数十名优秀青年科学家和工程师构成。