(本文借助 AI 大模型及工具辅助整理)
一句话总结:扩散模型蒸馏再突破,小模型可在Top-8候选中选中大模型首选;OpenAI DevDay定档9月底,企业AI竞争加剧。
🌊 AI 动态与趋势
今日AI领域呈现两个显著信号:一是小模型蒸馏技术 取得新进展,TIDE框架和Select-to-Think(S2T)分别从不同路径实现小模型对大模型能力的有效继承;二是企业AI应用落地正在加速,Netomi获得1.1亿美元融资,Accenture和Adobe押注客服AI,表明企业AI正从"demo好看"走向"生产可用"。
大模型蒸馏传统上受限于同架构约束,而TIDE首次实现跨架构知识迁移------将8B dense和16B MoE教师模型蒸馏进0.6B学生模型,在代码生成任务上HumanEval得分从32.3提升到48.78。这预示着端侧AIAgent的部署门槛可能大幅降低。同时,小模型选择排序方法S2T-LOCAL让1.5B模型在top-8候选中达到95%命中率,推理效率接近自洽性方法而无需多路径采样。
📰 AI 今日看点
🔥 AI 大事件
OpenAI DevDay 2026定档9月29日
去年大会上ChatGPT应用大厅上线,今年预计重点可能在Agent和开发者工具链。OpenAI正面对来自Google Gemini和企业级市场的激烈竞争。
来源:The Verge
Google扩大Preferred Sources覆盖范围
搜索中的优先信源功能现已支持所有语言,帮助用户 customize 信息获取体验。
来源:The Verge
Zuckerberg计划今年AI投入增加100亿美元
Meta在AI基础设施上的支出持续放大,企业级AI军备竞赛未见放缓迹象。
来源:The Verge
🛠️ AI 应用前线
Netomi获1.1亿美元融资
Accenture和Adobe投资客户服务AI,显示企业AI分化加剧:能在真实业务环境(尤其是大企业治理严苛场景)证明价值的公司正在脱颖而出。
来源:VentureBeat
Google为五角大楼提供AI用于机密操作
面对员工反对,GoogleAlphabet全球事务总裁Kent Walker回应称"与政府接触有助于民主国家受益于负责任的技术"。
来源:The Verge
📊 数据速递
- 95% --- S2T方法中1.5B模型的top-8候选命中率(来源:arXiv)
- 48.78 --- TIDE蒸馏后HumanEval代码得分(来源:arXiv)
- 1.1亿美元 --- Netomi融资额(来源:VentureBeat)
📊 今日概览
| 维度 | 数据 |
| 📅 日期 | 2026-04-30 |
| 🔬 ArXiv 精选论文 | 20篇 |
| 🚀 GitHub 趋势项目 | 获取失败 |
| 📰 新闻事件 | 约6条 |
🔬 ArXiv 今日精选论文
大模型与Agent
• Turning the TIDE: Cross-Architecture Distillation for Diffusion Large Language Models --- 首个跨架构dLLM蒸馏框架,将8B dense和16B MoE教师模型蒸馏进0.6B学生
• Select to Think: Unlocking SLM Potential with Local Sufficiency --- S2T-LOCAL让小模型具备自主重排序能力,top-8达95%命中率
• ClawGym: A Scalable Framework for Building Effective Claw Agents --- 构建Claw风格环境的可扩展框架
优化与理论
• Learning Over-Relaxation Policies for ADMM with Convergence Guarantees --- ADMM过松弛策略学习
• On the Learning Curves of Revenue Maximization --- 收入最大化的学习曲线分析
• A Note on How to Remove the ln ln T Term from the Squint Bound --- 无参数学习理论进展
• Hyper Input Convex Neural Networks for Shape Constrained Learning --- 新型凸神经网络架构
代码生成
• ClassEval-Pro: A Cross-Domain Benchmark for Class-Level Code Generation --- 类级别代码生成基准,最佳模型仅45.6%通过率
机器学习其他
• Causal Learning with Neural Assemblies --- 神经 assembly 可学习因果方向
• Learning Over-Relaxation Policies for ADMM --- 凸优化方法改进
🚀 GitHub AI 趋势日榜 Top 15
获取失败,请参考往期或GitHub trending页面
💡 今日洞察
- 小模型蒸馏路径明确:TIDE和S2T分别从模型架构和token选择两个维度突破小模型瓶颈,端侧AI Agent部署预期提速
- 企业AI从概念验证进入生产验证:Netomi 1.1亿美元融资反映投资人关注从"demo能力"转向"真实企业场景可用性"
- 模型代码生成仍存短板:ClassEval-Pro显示类级别代码生成最佳仅45.6%,跨方法协调是核心瓶颈,预计将成为下一个benchmark热点
✍️ 编辑策划 / 整理 :Fan Jun AI Tech Notes 组
📅 发布日期 :2026-04-30
数据来源:ArXiv API、GitHub API、TechCrunch、The Verge、Wired、VentureBeat、机器之心、量子位等