2022国际开源节(IOSF)由OSTech联合中国信息通信研究院、Liux基金会亚太区发起策划,在ELEXCON深圳国际电子展暨嵌入式系统展落地,并聚集了包括中国科学院软件研究所、CNCF、LFAI&Data、LFOSSA、LF Edge、O3DF、OpenSSF、Hyperledger基金会等国际一流开源基金会和机构,GDG、开源中国等全球知名开发者社区,以及上海开源信息技术协会等权威开源机构的共建支持。
国际开源节旨在汇聚全球开源技术与项目,融合国际文化、开源社区生态和开源产业发展,构建“共创共赢”的开源文化,打造中国开源新生态。
活动回顾
2022国际开源节(IOSF)分论坛——机器学习中国峰会的活动已于11月6日下午结束,嘉宾们围绕机器学习,深度学习,AI、云、边融合等议题为我们带来非常精彩的分享。
开幕致辞
在活动伊始,首先由华为计算开源总经理,LF AI&DATA基金会董事主席堵俊平进行活动开场致辞,对本次活动进行了简单的阐述及预祝本次活动举办成功。
主题演讲
接下来由Linux基金会战略计划副总裁Ibrahim Haddad进行关于机器学习发展中存在的一些挑战、行业对于机器学习的需求,实时/保障/安全性的主题演讲。
关于他分享的内容做如下总结:
目前,数据呈现爆发式增长,算法模型也在更新迭代。AI框架作为智能时代的操作系统,是人工智能新基建的重要一环。昇思MindSpore为持续打造极致性能、极简易用的全场景人工智能平台,在各大城市都建立了计算中心,提升全流程的效率。MindSpore将继续参与行业与生态进展,汇聚行业、科研及开源力量,发展昇思MindSpore生态圈;努力打造MindSpore学术生态,繁荣中国人工智能生态;并且基于各地AI计算中心,孵化一系列原生AI大模型,构筑最强技术生态。
《GraphScope:人人可用的图计算》
徐静波-阿里巴巴达摩院智能计算实验室高级技术专家
徐静波-阿里巴巴达摩院智能计算实验室高级技术专家
关于他分享的内容做如下总结:
在现实生活中我们会遇到各种各样的图数据,比如网页链接图、生物结构图等多样化图类型,它的计算也是多种多样的,而且在现实生活图计算任务是一个复杂的工作流,一站式大规模图计算系统GraphScope正是希望解决这些问题。GraphScope可以支持一些动态调优或者动态负载均衡为Java图计算提供性能支持、基于静态图的端到端的均衡训练等。
《基于Ray的新一代AI开发生产平台》
卢亿雷-白海科技创始人兼CEO
卢亿雷-白海科技创始人兼CEO
本次活动卢老师分享的主要内容如下:
AI大规模应用的数据和算法模型日益复杂,计算量也呈现爆发式增长,但由于资源、工具、Kaiyun官方网站app登录 等诸多挑战导致AI落地困难。IDP通过插件式架构,以IDE为唯一入口,灵活便捷支持AI开发生产全流程。同时,IDP分布式计算可以支持高性能分布式计算并且提供更加精细化的资源管理,可实现计算性能8到10倍的提升,算力成本节约50%。
《联邦学习解锁数据价值,开源促进行业增效发展》
张海宁-FATE开源项目开发专委会主席、VMware中国研发中心技术总监
本次活动对张老师的分享做了如下总结:
AI的三大要素包含算法、算力、数据。大量的数据以及获得的算法成果构造了一个人工智能模型。隐私保护,泄漏风险等一系列数据问题,通常可以采用联邦学习的机制,通过隐私计算激励一些数据市场的生态建设,从数据中提取价值能够多方受益。全球首个工业级联邦学习开源框架FATE(Federated AI Technology Enabler)可实现了工业场景算法的全覆盖。FATE开源社区将正式成立开发专委会、运营专委会、安全专委会,并确定各专委会职责。
《DeepRec:大规模稀疏模型训练/预测引擎》
刘童璇-阿里巴巴高级技术专家
刘童璇-阿里巴巴高级技术专家
本次活动对刘老师的分享做了如下总结:
搜索推荐广告场景里的这些ctr模型等稀疏模型,存在着稀疏功能的缺失,训练/推理性能相对比较差,此外模型部署的支持也不完善。DeepRec在稀疏功能有动态弹性特征、特征淘汰及准入等;在训练性能有动态感知的内存显存分配器、自动切图及多图流水线等;在推理性能及模型部署上有模型量化、增量模型导出及加载等功能。DeepRec开源经过阿里核心搜推业务的锤炼,以及数十家外部公司参与使用及开发,形成了社区友好的合作开发模式。
《特征平台-feature store的前世今生》
谭中意-开放原子开源基金会TOC副主席,20年开源工作经验,开源技术深度爱好者
谭中意-开放原子开源基金会TOC副主席,20年开源工作经验,开源技术深度爱好者
本次活动对谭老师的分享做了如下总结:
特征平台是一个让多个团队共享、发现和使用经过高度定制的特征的一个平台,用在机器学习领域中。Feature Store能同时满足模型训练和预测的需求;解决特征处理在训练/预测阶段不一致的问题;解决特征处理的重用问题,避免浪费,高效共享。随着国内企业API应用场景的增加,feature store产品会得到越来越多的应用。
《从神经搜索到多模态应用》
王楠-Jina AI联合创始人兼CTO
王楠-Jina AI联合创始人兼CTO
本次活动对王老师的分享做了如下总结:在实践过程中神经搜索与多模态存在必然联系,尤其在工程实践上有很多相通之处。神经搜索是基于深度学习的信息检索技术,尤其适合处理多模态的非结构化数据。神经搜索是一个典型的多模态应用,Jina打造了一套针对多模态应用服务化以及云原生的部署工具,希望能够帮助大家节省更多的开发时间,让大家能专注于核心业务的开发,同时避免重复造轮子。