数学推理

Sherlock Ma8 天前
人工智能·深度学习·语言模型·自然语言处理·数学推理·deepseek
DeepSeek-Math-V2:自验证数学推理大模型(论文详解)DeepSeekMath-V2 是由 DeepSeek-AI 开发的、面向自验证数学推理的大语言模型,它针对传统基于最终答案奖励的强化学习(RL)在数学推理中存在 “正确答案不代表正确推理” 及无法适配定理证明的局限性,通过训练准确且可信的验证器(含元验证机制以减少虚假问题识别)和以验证器为奖励模型的证明生成器(结合自验证实现迭代优化),构建 “验证器 - 生成器” 协同循环(生成器推动验证器处理更难证明,验证器通过扩展计算自动标注数据提升自身),最终在竞赛中表现优异:在IMO 2025和CMO 2024
HyperAI超神经9 个月前
图像处理·人工智能·3d·数学推理·视频生成·对话语音生成·蛋白质突变
Stable Virtual Camera 重新定义3D内容生成,解锁图像新维度;BatteryLife助力更精准预测电池寿命在数字内容创作的激烈竞争中,Stability AI 正站在命运的十字路口。这家曾以 Stable Diffusion 引爆图像生成革命的公司,却因上层管理问题陷入了危机。近期,Stability AI 推出了 Stable Virtual Camera 模型,不知能否以一记重拳打破僵局。
Espresso Macchiato2 年前
llm·prompt tuning·prompt工程·math prompter·数学推理
文献阅读:MathPrompter: Mathematical Reasoning using Large Language Models这篇文章是今年3月份的时候微软提出的一篇工作,其核心的问题是优化了GPT模型在数学问题上的回答准确性。
我是有底线的