数学大模型MAmmoTH：通过混合说明调整建立数学通才模型

源代码杀手2025-01-25 19:09

向悦和陈文虎是该项目的主要作者。他们这个项目推出 MAmmoTH，这是一系列专为解决一般数学问题而定制的开源大型语言模型 (LLM)。 MAmmoTH 模型在 MathInstruct 上进行训练，MathInstruct 是我们精心策划的指令调整数据集。 MathInstruct 已编译来自 13 个具有中间原理的数学数据集，其中 6 个具有我们新整理的原理。它拥有思想链（CoT）和思想计划（PoT）基本原理的混合，并且还确保广泛的涵盖数学的不同领域。 CoT 和 PoT 的混合不仅可以释放工具使用的潜力，还可以针对不同的数学问题提供不同的思维过程。因此，MAmmoTH 系列实质上在所有规模的 9 个数学推理数据集上，其性能优于现有开源模型，平均准确度增益在 12% 到 29% 之间。值得注意的是，我们的 MAmmoTH-7B 模型在 MATH（竞赛级别）上达到了 35% 数据集），超过最好的开源7B模型（WizardMath）25%，MAmmoTH-34B模型在MATH上达到46%的准确率，甚至超过了GPT-4的CoT结果。我们的工作强调了多样化问题的重要性覆盖范围以及在开发高级数学通才模型时使用混合原理。

项目地址：https://tiger-ai-lab.github.io/MAmmoTH/

参考资料

https://www.aibase.com/zh/tool/34999