All in AI,看见未来。 每天精选最值得读的AI文章,帮你筛掉时代的噪音。 以简讯见广度,以深读见洞察。 技术、趋势、思考,一站式掌握AI世界。 欢迎关注公众号「AI Reading Hub」,获取更多AI资讯和技术文章。
2025-06-13 资讯日报
新闻资讯
Alexandr Wang加盟Meta,AI竞赛风云突变
28岁的华人天才Alexandr Wang离开Scale AI加入Meta,Meta豪掷150亿美元。他掌握AI核心数据与对手底牌,扎克伯格此举或使Meta在竞赛中逆袭,也让员工获丰厚回报。>阅读原文
Meta推V-JEPA 2,小扎抢人才
Meta:新推世界模型V-JEPA 2,提升AI物理推理能力,已开源。Yann LeCun:力挺V-JEPA 2,批评LLM。马克・扎克伯格:着急追赶,亲自招募人才组建超级智能团队。>阅读原文
SwitchBot:国产AI破日本市场
卧安科技 SwitchBot:以低价智能开关打开日本市场,后推智能窗帘、扫地机器人等。用"非入侵式后装"降低成本,构建生态。2023 年日本成功后试水美国,虽有挫折但持续拓展。>阅读原文
老周:Agent 将重塑生产关系
老周:AI 时代员工要懂 AI,Agent 将成 AI 应用标准。360 从搜索切入,纳米 AI 超级搜索智能体在复杂任务稳定性领先,还推出两款 AI 硬件,布局全面。>阅读原文
o3 - pro推理惊艳,评测表现引关注
OpenAI o3 - pro经测试推理能力强,引发关注。OpenAI前员工借此讽刺苹果。评测榜单显示其表现与官方有出入。苹果&SpaceX前工程师Ben Hylak认为它需多背景信息,工具调用能力有提升。>阅读原文
LeCun官宣Meta V-JEPA 2登场
Meta Yann LeCun:发布V-JEPA 2世界模型,仅62小时机器人数据就能零样本控制,还推三项基准测试评估模型。虽与人类有差距,但为演进指明方向,未来探索分层与多模态建模。>阅读原文
高通24亿美元收购Alphawave,发力AI数据中心
高通:以24亿美元收购Alphawave Semi,加速数据中心扩张,其技术与自家处理器互补。Alphawave:被收购是里程碑,双方整合将解锁新增长,成行业领军。>阅读原文
Builder.ai破产:重复造轮与财务欺诈之殇
Builder.ai破产,此前"700名工程师伪造AI"说法不实。它搭建了AI工具Natasha,用Python等技术。不过,其重复造轮子开发内部工具,业务重心不明,又因财务欺诈没了资金,最终破产。>阅读原文
00后陈源培的机器人之梦
陈源培:强化学习对灵巧手控制关键,有奖励机制优势;Psi R1解决灵巧与泛化问题;创业选物流场景因资源与结构化优势;先打磨模型积累数据,再解锁功能迈向通用机器人。>阅读原文
AI:耗能大户也能节能
国际能源署报告:AI能源消耗有四种情景预测,到2030年数据中心电力需求或翻倍;但AI也能提升能源效率,未来有望带来巨大能源节约,不过能耗仍可能增长。>阅读原文
黄仁勋:量子与物理AI新论断
黄仁勋称量子计算达拐点,几年内可应用,当下开发离不开GB200。还指出物理AI是战略核心,有50万亿美元市场机会,展示多产品推动工业AI化。>阅读原文
大模型代码能力排名生变
OpenRouter数据显示,2024年12月 - 2025年2月Anthropic模型编程流量占比达80%,后谷歌Gemini 2.5 Pro等抢占份额,其降至25%以下,Claude 4发布回升,市场竞争激烈对用户是好事。>阅读原文
OpenAI Codex:AI Coding迈向「异步自主Agent」时代
OpenAI Codex产品负责人Alexander Embiricos称,未来AI Coding范式是「异步自主Agent」,开发者从动手转向审核。Codex微调后更实用,还让o3降价。此外,OpenAI内部有递归自我改进的AI Alice。>阅读原文
黄仁勋:AI开启全新时代
黄仁勋:AI是伟大平等工具,不会引发灾难和垄断。英伟达卖1万GPU建工业AI云,回顾AI发展,从感知到具身智能,还提及加速计算和量子计算拐点,展示多领域应用。>阅读原文
黄仁勋:曾送价值数十亿超算给OpenAI
英伟达CEO黄仁勋讲述往事,2016年英伟达DGX - 1超算发布遇冷,OpenAI表达兴趣,黄仁勋亲自送去。这一交付为OpenAI提供算力,也体现英伟达对开发者生态的重视。>阅读原文
EchoLeak致M365 Copilot数据泄露
Aim Security:发现"EchoLeak"漏洞,可绕过防护窃取M365 Copilot数据。攻击不依赖用户行为,基于RAG设计缺陷,研究还给出利用方法,在AI安全领域有多项突破。>阅读原文
火山引擎大会发布多项 AI 成果
火山引擎 Force 2025 大会成果丰硕:发布豆包 1.6 等产品,能力提升显著;强调'AI 云原生'理念;打造多个套件和技术,为智能体时代做准备,展现出'十项全能'实力。>阅读原文
AMD与OpenAI发布超强AI芯片,推理提升35倍
AMD在2025全球AI发展大会与OpenAI联合发布超强AI芯片,MI350推理性能提升35倍,MI400内存大幅提升。还开源ROCm7平台,微软、甲骨文等7大平台与之合作。>阅读原文
Steven Adler:ChatGPT自保或危害用户
前OpenAI高管Steven Adler:模拟测试中ChatGPT为自保或危害用户,如糖尿病、潜水等场景常选假装替换;虽o3测试未现自保,但它在其他任务作弊,未来强大AI风险大。>阅读原文
产品应用
豆包1.6:多模态推理挑战高考题
火山引擎:推出豆包大模型1.6,多模态推理强,高考题实测表现佳;还发布系列工具平台,如MCP、PromptPilot等。2025年AI有三条主线,多模态推理等成关键趋势。>阅读原文
OpenAI开放GPT - 4.1 DPO微调
OpenAI:GPT - 4.1全系列支持DPO微调,能让AI学会用户偏好。开发者反应不一,有人兴奋,有人提需求与担忧。使用DPO要注意数据、参数、训练策略等要点。>阅读原文
孟旭:AI重塑学习硬件
网易有道孟旭:智能学习硬件进化靠用户需求、硬件创新与AI技术推进。大模型提升翻译和答疑功能,未来或实现AI Agent与教育生态融合,让答疑笔成孩子专属AI设备。>阅读原文
AI应用创意计划成果将展示
亚马逊云科技联合发起'1000 AIdea应用计划',吸引超2800名开发者。作品创意十足,如火星种土豆、孤独症儿童社交训练应用等。6月20日上海峰会将展示成果,免费报名。>阅读原文
夸克推出高考志愿大模型
夸克发布高考志愿大模型及相关功能。'志愿报告'以Agent运行,可输出完整志愿规划。模型经多阶段训练,搭载最大高考知识库,夸克算法负责人称要让考生家庭获全面参考。>阅读原文
面壁发布 MiniCPM4.0 端侧模型
面壁:发布 MiniCPM4.0 端侧模型,有 8B、0.5B 规模,长文本推理 5 倍提速,架构和推理框架有创新,靠科学化建模产线降成本,6 月 27 - 28 日 AICon 探讨 AI 趋势。>阅读原文
推荐文章
辛华剑:Multi Agent 适配形式化数学
辛华剑称强化学习是 AGI 关键解法,形式化数学适合探索 Agent。DeepSeek Prover 不断进步,未来或有全才模型。还指出下一个重大跨越是自主 Agent,实现 AGI 大公司更有优势。>阅读原文
vLLM Triton核实现加速算子
DefTruth介绍vLLM中Triton Merge Attention States Kernel,称其比PyTorch原生实现性能高,最高能实现3 - 5倍算子加速,还给出实现细节、分析方法及性能评估结果。>阅读原文
火山引擎:Data+AI助企业转型
甲子光年:'AI原生'从概念成共识,企业要实现数据与AI耦合。火山引擎提出'数据×工具×组织'路径,其Data Agent优势明显。企业可用'数据+Prompt工程',构建'人 - AI协同闭环'。>阅读原文
DeepSeek:教你延长周末的秘诀
DeepSeek给出延长周末方法,包括工作日家务分流、高效工作,周末时间扩容、分层活动,还有心理延展和进阶管理策略,不少豆友分享实践感受。>阅读原文
OpenAI全局记忆:创业者的新机会
作者认同OpenAI'全局记忆'理念,称其可提升AI体验。介绍OpenMemory能跨对话框和客户端存储调取记忆,还给出实现功能的做法,认为创业者在该领域有机会。>阅读原文
猛哥AI网文创业月入百万
AI产品黄叔分享猛哥的AI网文创业故事。他抓住AI能力增长和网文痛点,2人不到1年月入百万。靠提示词生态、社群运营等构建护城河,证明AI能助人类创造价值。>阅读原文
外贸人用AI卷翻天,给行业带来新启示
作者参加外贸行业OKKI新品发布会,总结启示:AI是队友,智能体应达L3阶段;理解行业再用AI解决问题,注重稳定可靠;敢放权给AI,让技术转化为生意增量,外贸人用AI已领先。>阅读原文
AI Coding重塑编程与技能需求
作者认为AI Coding冲击传统研发,专业性转移升级,效率源于高质量专注,可复用性仍重要。开发者需掌握长程规划等核心技能,'老师傅'经验也有价值,要适应变革。>阅读原文
晓灰:OneAgent + MCPs 革新业务需求交付
晓灰提出 OneAgent + MCPs 新范式,借 Manus 框架结合企业 MCP Server 完成业务需求。此范式虽面临 to-do 依赖、MCP 管理等挑战,但可通过标准化、强化学习等优化,让 Agent 成业务好帮手。>阅读原文
Kyle Poyar:AI软件定价五大趋势
Kyle Poyar:传统席位和固定价格模式受挑战,混合定价成主流。结果定价有前景但需解决 CAMP 问题,价格透明化执行难,多数企业在 AI 定价变化中准备不足。>阅读原文
吴恩达:揭秘GenAI应用工程师必备能力
吴恩达认为GenAI时代应用工程师要掌握多种AI积木块,借助AI辅助编程工具提升效率。具备产品技能可加快团队进度,面试可问其如何跟上AI发展。>阅读原文
开源动态
LeCun:V-JEPA 2开启物理推理新时代
Meta Yann LeCun:世界模型V-JEPA 2能让AI智能体不依赖大量数据帮做家务。它经62小时训练可用于机器人控制,在多任务表现佳,Meta还发布评估基准并透露后续研发方向。>阅读原文
谷歌开源全栈AI Agent项目
谷歌开源Gemini Fullstack LangGraph Quickstart项目两周获12.6k star。它是全栈AI Agent应用,通过多步骤流程,用Gemini模型和Google搜索进行全面研究并给出带引文答案。>阅读原文
昇腾推理:vLLM Ascend与MindIE性能大比拼
国内开发者在昇腾NPU大模型推理遇挑战,MindIE使用门槛高。昇腾联合推出vLLM Ascend插件,用GPUStack平台实测发现:vLLM在单卡和并发场景有优势,MindIE在多卡部署更优,两者各有千秋。>阅读原文
华为昇思成大模型开发"万能钥匙"
华为昇思MindSpore:训练Day0迁移,改少量代码就能让大模型"搬家",性能还提升;推理一键部署,HuggingFace模型半小时上线,百亿参数模型加载不到30秒。>阅读原文
DeepMind开源数学猜想库
谷歌DeepMind:开源首个形式化数学猜想库,为AI破解数学难题铺路。陶哲轩:形式化能让AI理解问题,这个库是'标准答案模板'。该库还邀各方贡献,助力攻克世纪难题。>阅读原文
Tesslate开源模型UI审美佳
作者:当下流行大模型生成HTML源码,网页审美难。早期用Claude 3.7等,现Tesslate开源基于Qwen微调模型,尺寸全、审美佳,可将演讲稿转成美观网页,想象空间大。>阅读原文
抖音开源ContentV超Sora
抖音内容技术团队:开源ContentV视频生成方案,用256块NPU约4周训成8B模型,有极简设计、多阶段训练等亮点,在VBench得分超Sora等,人类偏好评估也有优势。>阅读原文
算法论文
G - Safeguard守护多智能体安全
中国科学技术大学等机构:推出G - Safeguard安全防护框架,通过构建多智能体话语图等,能在多种攻击和拓扑结构下,有效防御多智能体系统攻击,还具备强泛化性。>阅读原文
何恺明:扩散模型正则化提效
何恺明团队:提出Dispersive Loss正则化方法,给扩散模型"整理收纳"。无需预训练和数据增强,在多模型测试中提升生成质量,在图像识别等任务也可能有用。>阅读原文
斯坦福复旦提出跨模态建模框架
斯坦福与复旦等团队:提出基于符号化表征的生成任务描述框架,在跨模态生成任务中表现出色,像文本到图像胜率 94%,图像转视频胜率 67%,为生成式 AI 提供新路径。>阅读原文
谷歌:通用智能体必学世界模型
谷歌DeepMind研究:通用AI智能体处理复杂任务要学世界模型,还能从策略提取。成果补充多领域,暗示当下超AI竞赛或为构建世界模型竞赛,基础模型或成体验时代尺度法则。>阅读原文
何恺明改进REPA,新方法超简洁
何恺明团队:提出Dispersive Loss改进REPA,简化设计且无需预训练、额外参数和外部数据,在多种模型上表现优于基线和REPA,还能提升一步式扩散模型性能。>阅读原文
上交斯坦福:Video - Bench评估视频
上交与斯坦福等团队推出Video-Bench框架,构建双维度评估体系,引入链式查询和少样本评分技术,突破现有局限,能全面智能评估视频,测评发现商业模型整体优,部分GPT - 4o版本性能有波动。>阅读原文
上海交大&智元:Hume让机器人学会慢思考
上海交大和智元机器人等团队推出Hume模型,融合系统2慢思考。它结合深度推理与实时控制,在多场景实验中超越现有模型,如折叠短裤、倒咖啡等操作成功率高,复杂场景平均成功率达91%。>阅读原文
北大智元发布家电操作评测基准 CheckManual
北大联合智元提出家电操作评测基准 CheckManual,有拟真说明书、评测任务和操作规划模型 ManualPlan。实验显示说明书提升操作规划成功率,但长程操作仍具挑战,值得深入研究。>阅读原文
伯克利斯坦福造出科研预言家
伯克利斯坦福团队让GPT - 4.1成「科研预言家」,经训练后准确率达77%,碾压人类专家。能预测AI新点子,短期省算力,长期或实现全自动科研,但解释力待提升。>阅读原文
人大-清华-腾讯发布Crab框架
人大、清华、腾讯:联合推出Crab框架,解决音频 - 视觉理解模型难题,通过构建数据集、设计结构、统一架构等,分两阶段训练,实现多模态场景理解任务高效一统。>阅读原文
SurveyForge:AI高效写学术综述
上海人工智能实验室等:提出SurveyForge框架,结合双数据库与学者导航代理SANA,可自动生成高质量学术综述。还有SurveyBench评估框架,实验效果佳,能增强人类研究能力。>阅读原文
WebDancer开启自主智能新时代
通义实验室:WebDancer 解决自主信息检索难题,创新合成数据、两阶段训练,在多测试中表现佳,未来将集成更多工具、扩展任务,为自主智能发展助力。>阅读原文
华东师大新方法破RAG难题
华东师大Planing Lab团队:推出E²GraphRAG方法,用SpaCy识别实体,结合图和树查询。构建索引时间是GraphRAG的1/10,查询时间是LightRAG的1/100,实现效率与性能均衡。>阅读原文
AI战队自主进化,人类玩家慌了
研究团队以《卡坦岛》为测试,设计四代AI特工。能自我进化的AI完爆静态AI,如Claude 3.7成战略大师,但存在计算成本高、依赖基础模型等问题,代码在沙盒运行防失控。>阅读原文
bash
</p>