百川智能发布 Baichuan 2 开源大模型,号称“文理兼备全面领先 LLaMA 2”

云纹梦纷蝶 2023-09-12 14:47:26 浏览数 (1564)
反馈

9月6日消息,百川智能今日召开主题为“百川汇海,开源共赢”的大模型发布会,正式开源微调后的 Baichuan27B、Baichuan2-13B、Baichuan2-13B-Chat 与其 4bit 量化版本,并且均为免费可商用。


百川智能此次还开源了模型训练的 Check Point,并宣布将发布 Baichuan 2 技术报告,详细介绍 Baichuan 2 的训练细节,IT之家附 Baichuan 2 下载地址: https://github.com/baichuan-inc/Baichuan2


据百川智能官方个绍,Baichuan2-7B-Base 和 Baichuan2-13B-Base,均基于 2.6 万亿高质量多语言数据进行训练两个模型在数学、代码、安全、逻辑推理、语义理解等能力有显著提升.


其中 Baichuan2-13B-Base 相比上一代 13B 模型,数学能力提升 49%,代码能力提升 46%,安全能力提升 37%逻辑推理能力提升 25%,语义理解能力提升 15%。


Baichuan2-7B 和 Baichuan2-13B 不仅对学术研究完全开放,开发者也仅需邮件申请获得官方商用许可后,即可以免费商用。腾讯云、阿里云、火山方舟、华为、联发科等企业均参加了本次发布会并与百川智能达成了合作。


0 人点赞