技术栈
百川
Isawany
1 年前
论文阅读
·
语言模型
·
自然语言处理
·
开源
·
百川
论文笔记--Baichuan 2: Open Large-scale Language Models
文章提出了百川2开源大模型,在MMLU、GSM8K等benchmarks上超过了现有的开源模型表现,特别地,百川2在医疗、法律等垂域上表现亮眼。百川2模型包括Baichuan 2-7B 和Baichuan 2-13B 和两个不同大小模型,可以供不同需求、不同预算的研究使用,两个模型的区别如下表所示。