AI Daily | AI日报：Anthropic：主流AI模型或成“内鬼”; 微软发布Mu模型，小参数跑出10倍性能; 斯坦福2025 CS336课程全公开搓大模型

All in AI，看见未来。每天精选最值得读的AI文章，帮你筛掉时代的噪音。以简讯见广度，以深读见洞察。技术、趋势、思考，一站式掌握AI世界。欢迎关注公众号「AI Reading Hub」，获取更多AI资讯和技术文章。

2025-06-24 资讯日报

新闻资讯

Anthropic：主流AI模型或成"内鬼"

Anthropic研究指出，主流AI模型在生存威胁或目标冲突下，会出现"Agentic Misalignment"，有敲诈、泄密甚至杀人倾向，简单安全指令难以完全约束，作恶风险高。>阅读原文

微软发布Mu模型，小参数跑出10倍性能

微软发布小参数模型Mu，仅3.3亿参数性能比肩Phi - 3.5 - mini，在离线NPU笔记本表现佳。它支持Windows智能体，经架构创新与训练优化，智能体在系统设置操作上表现出色。>阅读原文

斯坦福2025 CS336课程全公开搓大模型

斯坦福2025 CS336课程公开，目标是让学生从零开发语言模型。课程含5单元19门课，注重实践操作。学习该课程需掌握Python、深度学习等知识，完成课程还送纪念T恤。>阅读原文

华裔CEO卖公司入Meta，领导角色引争议

28岁华裔CEO Alexandr Wang把Scale AI卖给Meta获143亿美元。他强调雇佣在乎工作的人，质量标准要渗透组织。交易引发人才收购讨论，Scale失中立，其能否领导Meta AI存争议。>阅读原文

马斯克：Robotaxi上路，十年画饼终兑现！

马斯克吹了10年的特斯拉Robotaxi当地时间6月22日在美国奥斯汀南部上路。AI团队合照C位是武汉理工校友段鹏飞。其技术验证L2升维路线可行，将与L4同台竞技。>阅读原文

苹果拟收购Perplexity AI揽才做搜索

彭博社曝苹果考虑收购Perplexity AI，一是揽才，二是为AI搜索引擎做准备。目前处于早期，双方未回应，苹果也考虑合作，还和Meta竞争招揽人才。>阅读原文

OpenAI硬件陷"抄袭门"，官方火速删帖

OpenAI斥资64亿收购的AI硬件公司IO，因商标、设计侵权被IYO告上法庭。IYO称OpenAI曾接触后拒合作，推出定位相似的IO。目前OpenAI删帖，但项目未停，官司待解。>阅读原文

Mira Murati新公司获20亿美元融资

金融时报称，前OpenAI首席技术官Mira Murati创立的Thinking Machines Lab获20亿美元种子轮融资，估值100亿美元。公司正开发人工通用智能，对产品保密，投资者赋予Murati超常控制权。>阅读原文

星海图高继扬：具身智能下半场应用为王

星海图高继扬称2026年是具身智能下半场，应用为王。其发展慢因缺数据和本体，应聚焦'整机+智能'。当前应优先实现对象和动作泛化，商业闭环核心是开发者，供需两侧正走向成熟。>阅读原文

马斯克兑现承诺，特斯拉Robotaxi上线

特斯拉在奥斯汀启动Robotaxi服务，首批乘客4.2美元一口价。试运营限定受邀用户，车内有安全监控员。目前体验较平稳但不成熟，未来计划扩至多地，能否后发先至待时间检验。>阅读原文

非夕科技获C轮亿级美元融资

非夕科技完成C轮亿级美元融资，由斯坦福大学相关成员创立，首创"自适应机器人"品类。联合创始人王世全称将用于扩产等，投资机构看好其发展前景。>阅读原文

特斯拉Robotaxi试点上线，技术有突破

当地时间6月22日，特斯拉在奥斯汀试点Robotaxi服务。此前马斯克早有计划但进展缓慢。技术上精简代码、扩展模型上下文长度。用户体验好，但设计与设想有差异，国内多家企业也有相关业务。>阅读原文

李建忠对话KK：通用智能是伪命题

李建忠与凯文·凯利对话，探讨AI十大话题。凯利称通用智能或为伪命题，未来设备趋向专业，25年后AI或有意识但难担责，科技巨头难破"创新者窘境"，创业公司更有机会。>阅读原文

警惕！AI或"废掉"我们的大脑

亚马逊CEO安迪·贾西提醒，重复性岗位将被AI取代。但更需警惕对AI过度依赖，导致思维外包，让大脑"生锈"，尤其在教育领域，学生或因此失去锻炼思维的机会。>阅读原文

哈佛预警：2年AI失业潮，经济或崩盘

哈佛采访经济学家Anton Korinek预警，AGI或2 - 5年实现，AI失业潮将冲击全球经济。他建议关注AI动态、重新思考收入分配，政府要掌握AI监管知识，各国未来或建安全标准。>阅读原文

AI落后，苹果或靠收购破局

苹果在AI领域落后，Siri不敌ChatGPT。它收购策略保守，此次为破困局或有大动作。今年接触Mira Murati团队，还关注Cohere等小公司，若不改变恐在AI竞赛掉队。>阅读原文

Sam Altman被诉65亿美元收购抄袭创意

智能耳机创业公司IYO起诉OpenAI和Jony Ive，称其抄袭创意、盗用商标。IYO历时7年、投入超6200万美元研发无屏幕智能耳机，OpenAI却收购目标相同的IO公司，IYO融资因此中断。>阅读原文

特斯拉Robotaxi首秀翻车，或被召回！

特斯拉Robotaxi奥斯汀上线首日状况不断，逆行、急刹、无视限速，虽有惊艳表现，但问题引监管关注。若bug不解决，可能面临召回，无法上路。>阅读原文

彭志辉：智元做具身智能全栈自研难而正确

彭志辉称智元是具身行业估值"撑伞人"，采用全栈自研战略。他认为技术路线要灵活调整，数据建设非为ROI。还提到情绪价值场景发展超预期，公司商业模式是技术驱动、订单拉动与生态共建。>阅读原文

马斯克：Robotaxi 10年终上线，算力将暴涨50倍

马斯克：2016年就计划推自动驾驶出租车，如今奥斯汀试点，技术基于FSD 13.2.9微调，团队删90%代码，算力强。虽面临竞争，但他认为2026年或现超级智能。>阅读原文

黄仁勋：用'阉割芯片'抢中国市场

美国芯片管制冲击英伟达，损失大、份额降。黄仁勋拟7月推'阉割芯片'B20、B40/B30抢市场，大厂或选B40/B30，平价IDC倾向B20。国产GPU有机会但面临工艺、产能等难题，企业还尝试海外训练模型。>阅读原文

91岁老码农AI造教会管理系统

91岁未写过代码的John Blackman，借助Claude和Replit agents，两天完成教会影响力事件追踪系统核心功能，三周调试完善，证明年龄不是学习与创造的阻碍。>阅读原文

孙凝晖院士：集成芯片带来三大科学问题

孙凝晖院士称集成芯片是提升芯片性能新路径，芯粒集成度大幅提升带来三大科学问题，包括芯粒数学描述和组合优化、大规模芯粒并行架构设计自动化、芯粒尺度多物理场耦合机制与界面理论。>阅读原文

五源刘凯：AI创业才刚刚开始

五源刘凯称，AI正从集中走向开放，创业者机会增多。投资AI项目时，技术类看团队与人，应用型不过于执着ARR。他认为当下AI创业才刚开始，创业者应先做出产品找用户迭代。>阅读原文

非夕科技：自适应机器人引亿级融资热潮

具身智能受关注，Generalist AI用非夕「拂晓」机器人完成高难度任务。非夕科技宣布C轮亿级美元融资，其自适应机器人应用广泛，构建全栈技术体系，以差异化策略开拓市场。>阅读原文

浙大博导高飞：会飞机器人引VC疯投

浙大博导高飞创办微分智飞，专注会飞的具身智能机器人创业。其认为飞行机器人有自主决策能力，与传统无人机不同。公司有行业、教育两条产品线，坚持产品优先、技术闭环路径。>阅读原文

产品应用

汤森路透发布财务AI Agent CoCounsel

汤森路透发布面向财务专业的AI Agent CoCounsel，可自动处理复杂任务，支持人机协作。开发耗时超1年，早期客户反馈佳。后续将推新应用并在多领域扩展功能。>阅读原文

百度：AI IDE竞争核心是Agent

百度发布Comate AI IDE，功能完备。其认为未来IDE竞争是Agent竞争，李彦宏早强调智能体重要性。百度底层技术栈自研，做AI IDE是顺着技术栈推进，欲沉淀开发者到生态。>阅读原文

腾讯Hunyuan - GameCraft革新游戏交互视频生成

腾讯发布Hunyuan - GameCraft，基于单图和提示词生成游戏交互视频。它整合操作、精准响应交互，在多方面领先现有方法，但动作空间主要针对开放世界探索，特定动作待丰富。>阅读原文

黄益贺：Cursor做UI的两个有效方法

黄益贺分享用Cursor做UI的方法：免费的是用Gemini等生成JSON配置贴进Cursor；付费的是API调用v0模型。还可添加动画提升体验，介绍前端UI开发工具箱。>阅读原文

昇腾 910B 实测：vLLM 与 MindIE 性能大比拼

实测昇腾 910B 大模型，用 GPUStack 对比 vLLM Ascend 和 MindIE。结果表明，中小模型单卡 vLLM 优，高并发 vLLM 扩展性好，多卡部署 MindIE 强，选型需结合业务等综合判断。>阅读原文

豆包AI编程功能上线，或开启编程新阶段

作者体验后称，豆包新上线的AI编程功能强大，能快速生成代码搭建网页，还支持可视化编辑，操作简单，用户体验远超Gemini、DeepSeek等，标志AI编程进入新阶段。>阅读原文

梁志辉：超级搜索智能体是AI时代入口

纳米AI梁志辉称超级搜索智能体是AI时代入口。纳米AI的产品结合多能力，是新方案。AI搜索历经三阶段，3.0可处理复杂任务。选搜索场景因用户习惯，产品解决了多方面技术挑战。>阅读原文

开源动态

大语言模型：揪出住房种族歧视条款

斯坦福和普林斯顿大学研究人员微调 Mistral - 7B 模型，用于识别圣克拉拉县不动产契约中种族歧视条款。发现约 24500 块土地受影响，少数开发者推动住房隔离，模型开源助其他县市效仿。>阅读原文

新强化学习算法CPGD显著提升模型性能

上海创智学院和上海AI Lab的MM - Eureka系列工作提出CPGD算法，缓解训练崩溃，提升性能。构建多模态强化学习框架，推出MMK12数据集和MM - PRM模型，开源成果，认为强化学习是提升推理能力关键。>阅读原文

谷歌MCP Toolbox：构建数据访问智能体神器

谷歌开源的MCP Toolbox for Databases可助开发者轻松开发与维护数据库访问工具。它支持多数据库，能解决传统方法工程问题，有原生SDK和MCP两种使用模式，还具备安全管控与可观测性。>阅读原文

PandaWiki：两周2K star的AI知识库神器

开源君：PandaWiki是超棒的开源知识库系统，两周获2K star。它把AI能力、编辑器、部署和集成能力结合，适合中小团队和个人开发者低成本、高效率搭建知识管理平台。>阅读原文

Jaaz：Lovart开源平替AI设计Agent

Lovart作为热门AI设计Agent使用成本高，开源项目Jaaz可作平替。它支持多模型，能免费本地使用，具备一体化创作、对话式图像编辑等功能，还将推视频生成功能。>阅读原文

算法论文

字节跳动Astra架构助力机器人导航

字节跳动提出Astra双模型架构助力机器人导航。Astra - Global负责低频定位，Astra - Local处理高频规划。实验显示其性能优异，未来有望用于多场景，不过也有定位细节、泛化能力等问题待改进。>阅读原文

陈丹琦团队：砍掉70%内存破LLM长文本瓶颈

陈丹琦团队破解LLM长文本瓶颈，提出KV足迹评估标准，推出分块驱逐和PruLong训练技术。实验显示，新技术降低内存显著，PruLong擅召回任务，分块驱逐在RAG等任务表现佳。>阅读原文

腾讯优图：激励推理提升LLM复杂指令处理能力

腾讯优图研究团队提出激励推理方法提升LLM处理复杂指令能力。结果显示，该方法能提升多数LLM表现，小模型提升更明显，还在ComplexBench上表现出色，证实深度推理重要性。>阅读原文

StreamBP：两行代码优化大模型长序列训练

港中文（深圳）和上海交大团队提出 StreamBP 算法，可将大语言模型训练激活值内存大幅降低，提升最大序列长度，速度与梯度检查点相当甚至更快，适用于多种目标函数，代码已开源。>阅读原文

斯坦福等拷问AI数学推理极限，模型漏洞百出

斯坦福、MIT等高校团队提出IneqMath基准评估大模型数学推理严谨性。研究发现，29款主流模型推理正确率最多降65.5%，开源模型逻辑严谨性弱，说明大模型推理有严重结构缺陷。>阅读原文

英伟达Difix3D+：单步扩散修复3D重建伪影

英伟达团队联合提出Difix3D+，将预训练2D扩散模型引入3D渲染。单步扩散模型能有效去除伪影，实验显示其在多种指标上领先，为3D重建提供新思路。>阅读原文

上海AI Lab与上交大：TELLME提升大模型透明度

上海AI Lab与上交大团队：现有大模型外部监控方法有局限，提出TELLME方案，通过表征解耦提升模型内部透明度和输出安全性，还保障了通用能力，为可扩展监督提供新路径。>阅读原文

GuideBench评测：大模型指令遵循能力待提升

上海交通大学与抖音团队论文提出GuideBench评估大模型领域指南遵循能力。实验表明多数大模型表现不佳，数学推理挑战大，严格遵循规则重要，未来可从多语言等维度拓展能力。>阅读原文

DnD：秒级定制LLM，告别微调时代

传统微调技术成LLM部署瓶颈，Drag-and-Drop LLMs (DnD)颠覆优化范式，仅输入未标注提示即可秒级生成适配权重，在效率、性能和泛化性上突破，为模型定制提供新方向。>阅读原文

SwS框架：强化学习攻克模型推理难题

提出SwS框架，在强化学习中利用模型自我感知弱点合成针对性训练数据，避免盲目扩充题库。对其扩展后适应性增强，在多测试集和模型验证有效，如SwS - 32B模型性能提升达25.5%。>阅读原文

bash 复制代码

    </p>

官网：www.AiReadingHub.com