目录
12小时攻克42年数学难题:人机深度协作正式步入数学研究
1984年,一道关于经典优化算法收敛性的难题被提出,此后42年间无人给出明确答案。它静静悬挂在数学文献的一隅,不算划时代的猜想,却在相关领域留下无法绕开的障碍。然而2026年4月28日,它找到了归宿。不是在某家顶尖高校的学术报告厅,而是在一段持续三天、总计约12小时的人机对话中。OpenAI高级研究员Ernest Ryu在OpenAI播客里回忆,他反复对ChatGPT提出质疑,不断指出推理中的偏差,引导模型一次又一次修正路径。题目终于在连续追问中走向了完整的证明。Ryu感慨,若非借助这样的工具,只靠自己恐怕需要三个月乃至更久。
这一案例引发震动的不只是答案本身,更在于其证明方式。在过去,机器学习往往以"一次性答题"方式介入数学,能做对选择题或程式化证明题------但缺乏真正的持续的元认知,无法跨越大段逻辑的跨度。而19个月前Sébastien Bubeck参加的一场学术会议上,同样的话题仍让现场80%的专家不相信大语言模型能对数学前沿产生实质性帮助。而今已是另一番景象,模型不再仅仅是接受一个输入、生成一个输出,它的参与方式更像一个能够无限细化思路、接受反馈的助手。整个推导过程中充斥着大量的调优、阻断、补充条件与反查文献。多份报道指出,它在部分未开垦的研究问题上已能呈现空前创意,譬如将经典优化理论中彼此隔离的成果拼合成全新链条。许多研究者意识到,它本质上不是一个"变聪明"的单一模型,而是多模型能力叠加的爆发,尤其值得关注的是持续思考的问题:衡量AI能力的维度开始从简单的"准确率"转向"它能连续推理多久"。几秒、几分钟,数小时乃至数天的专注循环,才是触碰复杂世界的钥匙。
从12小时人机对话破解42年难题,到80分钟业余者联手GPT攻克60年神谜,再到AI自主完成十年以上学界难题------这种由人类掌控意图与判断、AI负责发力与重构的深度协作模式,正在成为破解长久悬案的全新土壤。过去只有数学圈内部能完成的那种串联、衔接、迂回翻越,如今在对话窗口里实现。数学家对此情感复杂:"AI让数学研究按了加速键,我们既兴奋又焦虑。"Ernest Ryu的那段复盘可以被视为一次标志性片段,预示着未来数学研究的标准化配置不再是"单人一桌",而将是"人类+AI"的协作界面。
格密码学的百年猜想首获"无假设"证明:韦伯猜想迎来突破性进展

格密码学被视为后量子时代最有望扛起安全大旗的技术路线,其核心安全假设------主理想问题的不可解性、整数环上模的自由性,以及Ring-LWE和Module-LWE的归约有效性------均扎根于1886年提出的韦伯猜想。如今该领域面临如此局面:对k≥9的情形,所有已有论证均需依赖广义黎曼假设,这种条件式信任构筑了密码体系的地基------但"如果GRH不成立呢"的不确定性始终如隐形的裂痕,推动着数论与密码学者砥砺前行。
2026年4月17日,一篇署名论文在arXiv上正式公开,以翔实的推演绕过了GRH带来的依赖陷阱。研究团队融合福田-小松计算筛法、分圆ℤ₂塔的归纳结构以及埃尔布朗定理,在无需任何未经证假设的前提下对k≤12全部情形成功验证韦伯猜想。这不仅是纯数论在猜想逻辑上的增益,更是对格密码安全性可靠性的重大注脚。R-LWE和M-LWE最坏情况到平均情况的归约紧致性由此获得一枚不受悬置条件约束的锚,将来在标准化协议中,它极可能进一步用于加固加密体制的实用化分析。
数学基础中的"悬赏难题"常常让人只看到圣杯的光环,但韦伯猜想的不依赖证明更像是齿轮中的一枚精密零件------它可能在普通公众视野外运转,却真实地支撑着数字世界的信任体系。从量子安全通信到金融加密交互,后量子时代看似遥远的技术路线图里,正因一次无条件的猜想验证,那最后一层安全疑虑也被剥离了一小片。
参考资料:
1,36氪,《12小时,42 年难题被攻克,AI 离 AGI 近了一步》,2026-04-29
2,科学网,《数学猜想能被AI破解,但数学直觉无可替代》,2026-04-30
3,arXiv,模格安全性第一部分:韦伯猜想在k≤12条件下的无条件验证,2026-04-17
4,澎湃新闻,《2026年科学突破奖揭晓8名数学家获奖》,2026-04-20
5,羊城晚报/科技日报,《女数学家王虹获得2026年突破奖》,2026-04-20