热搜: 佳士科技  irobot  开云电竞官网下载app   机器人  机器人产业联盟  ABB  发那科  机械手  码垛机器人  机器人展览 

百川智能发布 Baichuan 2 开源大模型,号称“文理兼备全面领先 LLaMA 2”

   日期:2023-09-07     来源:IT之家     评论:0    
标签: AI 科技 创新
   IT之家9月6日消息,百川智能今日召开主题为“百川汇海,开源共赢”的大模型发布会,正式开源微调后的Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat与其4bit量化版本,并且均为免费可商用。
 
  百川智能此次还开源了模型训练的Check Point,并宣布将发布Baichuan 2技术报告,详细介绍Baichuan 2的训练细节,IT之家附Baichuan 2下载地址:https://github.com/baichuan-inc/Baichuan2
 
  据百川智能官方介绍,Baichuan2-7B-base和Baichuan2-13B-base,均基于2.6万亿高质量多语言数据进行训练,两个模型在数学、代码、安全、逻辑推理、语义理解等能力有显著提升。
 
  其中Baichuan2-13B-base相比上一代13B模型,数学能力提升49%,代码能力提升46%,安全能力提升37%,逻辑推理能力提升25%,语义理解能力提升15%。

582679bf-1574-45ff-95e6-ee4a65b72f12
▲图源“百川智能”公众号,下同
 
  在MMLU、CMMLU、GSM8K等基准测试中,百川智能的两个模型都比LLaMA 2的分数要高一些,且在“中文通用”部分优势较大。
 
  Baichuan2-7B和Baichuan2-13B不仅对学术研究完全开放,开发者也仅需邮件申请获得官方商用许可后,即可以免费商用。腾讯云、阿里云、火山方舟、华为、联发科等企业均参加了本次发布会并与百川智能达成了合作。
 
 
声明:凡开云电子链接 来源注明为其他媒体来源的信息,均为转载自其他媒体,并不代表本网站赞同其观点,也不代表本网站对其真实性负责。您若对该文章内容有任何疑问或质疑,请立即与开云客户(www.www.wykobounce.com)联系,本网站将迅速给您回应并做处理。
电话:021-39553798-8007
更多>相关开云电子链接
0相关评论

推荐图文
推荐开云电子链接
点击排行