技术栈

百川

Isawany
2 年前
论文阅读·语言模型·自然语言处理·开源·百川
论文笔记--Baichuan 2: Open Large-scale Language Models文章提出了百川2开源大模型,在MMLU、GSM8K等benchmarks上超过了现有的开源模型表现,特别地,百川2在医疗、法律等垂域上表现亮眼。百川2模型包括Baichuan 2-7B 和Baichuan 2-13B 和两个不同大小模型,可以供不同需求、不同预算的研究使用,两个模型的区别如下表所示。