9月6日消息,百川智能今日宣布正式开源微调后的Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat与其4bit量化版本,并且均为免费可商用;此外,百川智能还宣布开源模型训练的Check Point,并宣布将发布Baichuan 2技术报告,详细介绍Baichuan 2的训练细节,帮助大模型学术机构、开发者和企业用户更深入的了解其训练过程。


百川智能方面表示,Baichuan2-7B-Base和Baichuan2-13B-Base均基于2.6万亿高质量多语言数据进行训练,在保留了上一代开源模型的生成与创作能力、多轮对话能力以及部署门槛较低等特性基础上,两个模型在数学、代码、安全、逻辑推理、语义理解等能力有显著提升:Baichuan2-13B-Base相比上一代13B模型,数学能力提升49%,代码能力提升46%,安全能力提升37%,逻辑推理能力提升25%,语义理解能力提升15%。

百川智能宣布,Baichuan2-7B和Baichuan2-13B不仅对学术研究完全开放,开发者也仅需邮件申请获得官方商用许可后,即可以免费商用。

而百川智能宣布将公开的Baichuan 2技术报告,将详细介绍Baichuan 2训练的全过程,包括数据处理、模型结构优化、Scaling law、过程指标等。