AI Daily | AI日报：2025中国AI算力大会6月将举办; 程鹏：大模型重塑人才选拔方式; 李飞飞：空间智能是AI核心组件

All in AI，看见未来。每天精选最值得读的AI文章，帮你筛掉时代的噪音。以简讯见广度，以深读见洞察。技术、趋势、思考，一站式掌握AI世界。欢迎关注公众号「AI Reading Hub」，获取更多AI资讯和技术文章。

2025-06-14 资讯日报

新闻资讯

2025中国AI算力大会6月将举办

2025中国AI算力大会6月26日举办，中昊芯英创始人杨龚轶凡、中科加禾创始人崔慧敏等将演讲。大会聚焦推理算力、异构混训等，设多论坛与展览区，门票报名中。>阅读原文

程鹏：大模型重塑人才选拔方式

阿里巴巴程鹏称，大模型在人才选拔与培养有颠覆价值，如提效、个性化、决策客观等。面试等场景各有挑战，可通过算法透明等平衡效率与公正，部分行业更适合落地，还给出实践建议。>阅读原文

李飞飞：空间智能是AI核心组件

李飞飞在访谈中重述World Labs愿景，指出语言模型描述3D世界有局限，空间智能是关键。公司已推出「世界生成」技术和开源Forge渲染器，随着算力等提升，攻关「世界模型」有了可能。>阅读原文

Transformer八岁，引发生成式AI革命

新智元报道：Transformer八岁，《Attention Is All You Need》被引超18万次。它催生众多产品，开启生成式AI时代。起初未受重视，如今影响深远，谷歌对其态度渐变，AI仍在其架构上发展。>阅读原文

谷歌训出AI台风预测模型，超越主流物理模型

谷歌团队推出交互式气象平台Weather Lab，共享AI天气模型。新模型在热带气旋路径预测上超越主流物理模型，还发明FGN方法。该模型兼顾路径与强度预测，谷歌将持续改进。>阅读原文

798双展：探讨算法下的艺术与生活

798艺术区有两个展览。郭城"虫"展追问技术理性双重性，连接技术与自然；蒲英玮"红色计算机"展探讨AI权力结构，用作品呈现科技与文明发展寓言，称人类文化属性会"增殖"。>阅读原文

120亿腾讯系AI独角兽明略科技冲刺港股IPO

明略科技冲刺港股IPO，北大数院校友创业19年获腾讯等投资。产品含营销、营运智能等三类，客户广。其认为中国数据智能市场前景好，企业应结合AGI与行业知识。>阅读原文

中国AI公司用"飞行硬盘箱"破美封锁

美国限制先进AI芯片对华出口，中国公司带硬盘到海外数据中心训练AI再带回结果。企业还通过国产替代、第三国走私等绕开限制，东南亚数据中心崛起，中东成新热点。>阅读原文

2025谷歌云等云厂同时宕机引关注

2025年6月12日，AWS、谷歌云等云厂同时宕机，谷歌云瘫痪3小时影响众多服务。Spotify、Cloudflare受牵连，Cloudflare股价跌5%。网友猜测宕机或因谷歌Chemist服务故障，还热议云厂商依赖问题。>阅读原文

2025谷歌研究学者计划名单揭晓

2025谷歌研究学者计划名单公布，吴佳俊、Albert Gu、Tri Dao等获奖。该计划为鼓励科研合作设，涉12领域，获奖者最高获6万奖金，华人学者在多领域崭露头角。>阅读原文

黄仁勋：GPU要和量子计算机"绑定"了

黄仁勋在VivaTech 2025会发布CUDA - Q平台。回顾英伟达CUDA - X套件贡献，认为量子计算迎"拐点"，未来超算是QPU与GPU协同，算法堆栈在新芯片加速。>阅读原文

韦东奕论文登顶刊，扩展散焦方程研究

韦东奕、章志飞、邵锋合作论文登数学顶刊，研究超临界散焦非线性波动方程。他们将爆破性研究扩展至d≥4，得出核心结论，方法绕过奇点处理难点，可推广到其他方程。>阅读原文

腾讯"薪酬不限"揽AI人才底气何来？

AI下半场竞争重心转变，需聚焦定义问题和构建评估体系。腾讯场景广、业务耦合强且有变现案例，契合人才成长。其青云计划"薪酬不限"，今年筛选更严，是AI人才好选择。>阅读原文

蒋涛：'码盲'消失，新程序员崛起

CSDN 创始人蒋涛称，AI 浪潮下要翻越美国'三座大山'，从 Global AI 走向 Local AI。他预言'码盲'会消失成新程序员，超级程序员价值放大，AI 还能重写硬件，中国制造业有优势。>阅读原文

Meta重金投资Scale AI，97后CEO跳槽

Meta以148亿美元收购Scale AI 49%股权。97后CEO Alexandr Wang将加入Meta，Scale由Jason Droege接任。Wang认为数据是AI生命线，此次投资是公司和个人发展新契机。>阅读原文

谷歌前CEO：AI、智能体将重塑世界

谷歌前CEO Eric Schmidt认为，2016年AlphaGo标志AI革命起点，如今正迈向多智能体系统。虽算力、安全等有挑战，但AI会在医疗、教育等领域带来变革，实现人机协同，不用AI将被淘汰。>阅读原文

CVPR25：华人学者斩获最佳论文奖

CVPR 2025奖项公布，谢赛宁、苏昊获青年学者奖。最佳论文《VGGT: Visual Geometry Grounded Transformer》性能突出。最佳学生论文及4篇荣誉提名论文也各有创新，在多领域有应用前景。>阅读原文

SakanaAI：一句话生成LoRA颠覆LLM微调

SakanaAI推出T2L，简化大模型微调流程，省却复杂步骤。其参数压缩率高，准确率损失小，零样本场景表现优，让非技术用户也能用自然语言定制模型。>阅读原文

苏妈联手OpenAI，AMD新品叫板英伟达

AMD在大会发布多款AI新品，MI355X性能超英伟达B200。明年将推MI400系列等。OpenAI CEO出席，称将用AMD芯片。全新软件栈ROCm 7.0性能提升，开发者云助力开发。>阅读原文

硅基流动获数亿融资，剑指 AI 开发平台

硅基流动完成数亿元 A 轮融资，阿里云领投。创始人袁进辉称业务爆发式增长，公司推出高性能推理引擎等产品，服务多行业，未来将深耕创新，推动 AI 技术深度应用。>阅读原文

研究：热门网站恶意链接可攻击智能体

哥伦比亚大学Ang Li团队发现，可在热门网站植入恶意链接攻击智能体。因智能体信任热门网站，易被诱导执行有害行为，设计防御系统能提升其安全性。>阅读原文

CVPR 2025：华人学子闪耀，最佳论文诞生

CVPR 2025大会成果丰硕，投稿量创新高，接收率22.1%。最佳论文来自牛津与Meta AI，提出的网络在三维任务表现出色。Hao Su、谢赛宁获年轻研究者奖，还有多论文和个人获其他奖项。>阅读原文

谷歌云等多平台同时宕机引关注

2025 年 6 月 12 日，AWS、谷歌云等多平台同时宕机，谷歌云服务瘫痪 3 小时，波及 Gmail 等众多产品。Spotify、Cloudflare 受影响，有人猜测是谷歌 Chemist 服务故障，也有人担忧云厂商相互依赖问题。>阅读原文

产品应用

花叔测评：豆包1.6构建旅行策划Agent

花叔测评豆包1.6，用其构建旅行策划Agent。豆包1.6推理、计价等方面表现佳，结合MCP完成任务，虽页面有不足但超预期，国内Agent开发生态成熟，推荐"AI云原生"开发范式。>阅读原文

火山引擎出击，破解 B 端 Agent 落地难题

作者指出 2025 年大模型竞争下半场 Agent 成热点。它在 2B 落地遇困境，火山引擎推出新开发范式，含 TRAE、升级豆包大模型等，助企业打破落地难题，推动产业走向生产力革命。>阅读原文

科大讯飞发布会：智能交互迈向新高度

科大讯飞发布会展现智能交互新成果。AIUI升级，实现全双工交互与情绪感知；机器人超脑平台赋能多款机器人；数字人制作量和交互次数大增。以AI交互贯穿全链，推动产业升级。>阅读原文

火山引擎AI开发"全家桶"升级，开发零门槛

火山引擎Force大会升级AI开发"全家桶"。推出DeerFlow等开源项目，提出AI云原生理念。MCP调用方便，PromptPilot优化提示词，还有豆包1.6等产品，助开发者降成本、提效率。>阅读原文

实测字节豆包1.6，AI云原生潜力无限

作者实测字节豆包1.6系列模型，用其完成落地页设计，还借助Trae、火山方舟MCP等实现AI Agent开发部署。测评表明豆包1.6多模态能力出色，处理复杂指令效果好，价格实惠，字节AI云原生生态潜力大。>阅读原文

扣子平台：开启Agent全生命周期进化

2025年被称Agent爆发元年，年初通用Agent产品Manus出现后受关注。火山引擎大会上，扣子升级为全生命周期平台，含开发、框架、调优等部分，未来将成Agent发展"基础设施"。>阅读原文

字节发布多主体视频生成神器MAGREF

字节：发布多主体视频生成神器MAGREF，基于单图生成主体一致视频，多人不串脸。采用三阶段流程和DiT架构，适配复杂任务，未来将向多模态生成系统演进。>阅读原文

阿里云方案：快速构建企业级数据分析 Agent

传统数据分析流程滞后低效，阿里云提出联合方案，基于 Hologres 和百炼，结合 Function AI 平台，借助 MCP 整合数据，实现端到端加速，提升企业决策效率。>阅读原文

科大讯飞升级平台，定义智能交互新生态

科大讯飞在智能交互领域大升级，AIUI融合多模态能力，儿童交互方案懂孩子、护成长；智能眼镜"三麦阵列"实用；机器人超脑、虚拟人交互等平台成果多，星辰Agent降低开发门槛。>阅读原文

PP - StructureV3升级，性能超越主流OCR

CourseAI称PP - StructureV3全新升级，能力追平Gemini2.5pro，超越MinerU等。它强化多项能力，更新PP - OCRv5提升准确率，超主流OCR方案，不过遇特殊情况泛化性欠佳。>阅读原文

开源动态

腾讯视频发布鸿蒙跨端开发框架

腾讯视频团队：基于Compose Multiplatform推出ovCompose框架，弥补其不支持鸿蒙等问题。还推出KuiklyBase助力鸿蒙适配。框架有高性能等优势，已开源，未来将在GC等方面持续优化。>阅读原文

FishAudio开源情感TTS模型OpenAudio S1登顶榜首

FishAudio推出OpenAudio S1 TTS语音模型，基于200万小时音频训练，荣登TTS - Arena榜首。它支持多语言、情感表达，有不同版本适配，适用于播客、有声书等场景。>阅读原文

腾讯开源混元3D 2.1，消费级显卡就能跑

腾讯：在CVPR宣布混元3D 2.1模型开源。相比前代，它优化几何与纹理，全链路开源且适配消费级显卡。此前版本下载量超180万，此次升级让AI 3D模型更逼真。>阅读原文

AutoDev Remote Agent 试运行，开启 AI 编程新玩法

AutoDev Remote Agent 进入试运行，可运行于服务器，辅助项目开发。它是开源的，代码能自由修改集成。选择它而非 IDE 有成本等原因，未来计划实现自举、完善工具和建立沙箱机制。>阅读原文

俞星凯：1200行代码复刻vLLM并反超

DeepSeek研究员俞星凯推出Nano - vLLM，用不到1200行代码复刻vLLM。在RTX 4070测试中略逊于vLLM，在H800硬件上反超，具备快速推理、代码简洁等特点。>阅读原文

MIT与加州联手推出TradingAgents交易框架

MIT和加州打造TradingAgents框架，模拟交易公司运作，分解交易任务到各专业角色。它将复杂任务专业化，含多团队协作决策，还介绍了安装、使用等内容，项目已开源。>阅读原文

MASLab 发布，统一多智能体方法并推新社区

上海交通大学等十机构联合推出 MASLab 代码库，统一 20 多种多智能体方法，具备多种特性。经大量实验刻画性能图谱，提出 MASLab - ReAct 方法，还发起 MASWorks 开源社区。>阅读原文

DeepSeek 工程师：1200 行代码开源轻量级 vLLM

俞星凯（DeepSeek 工程师）开源轻量级 Nano - vLLM，代码 1200 行。它具快速离线推理等功能，基准测试中吞吐量逼近原版 vLLM，项目已在 GitHub 获 200 多 Star。>阅读原文

尹良升：SGLang 助力大模型低成本部署

SGLang 推理引擎受行业巨头青睐，核心开发者尹良升称其优势是高性能与易二次开发。他还介绍 PD 分离等技术解决的痛点，指出配置调试易被忽视，鼓励用多 GPU 和并行策略部署。>阅读原文

俞星凯：1200行代码构建Nano - vLLM

DeepSeek AI俞星凯构建轻量级Nano - vLLM，代码仅1200行。它具备离线推理等功能，基准测试中吞吐量逼近原版vLLM，在GitHub获200多Star。>阅读原文

算法论文

西湖大学PiFlow：革新AI科学发现范式

西湖大学团队推出PiFlow框架，解决现有AI科研系统痛点。它基于信息论和科学原理，用Min - Max优化平衡探索与利用，多领域实验效果好，能加速材料、生物等领域科学发现。>阅读原文

蚂蚁GCA：实现16M长上下文精准理解

蚂蚁技术研究院胡翔、武威团队提出新注意力机制GCA，解决长文本建模难题。它能端到端学习，实现16M长上下文精准理解，有千倍长度泛化能力，Triton kernel已开源。>阅读原文

KRIS - Bench评测：图像编辑模型程序性推理差

东南大学等团队推出KRIS - Bench评测图像编辑模型。对10款模型测试发现，闭源GPT - Image - 1领先，开源BAGEL - Think有进步但仍落后，所有模型程序性推理等深层能力不足。>阅读原文

SafeKey框架：让大模型安全风险直降9.6%

加州大学等团队提出SafeKey框架，发现大模型"越狱"两大核心，即"关键句"现象和"沉睡的安全信号"。通过双通路安全头和查询遮蔽建模，提升模型安全，危险率降9.6%，核心能力还提升。>阅读原文

清华腾讯：Scene Splatter实现高保真3D生成

清华腾讯联合推出Scene Splatter，基于视频扩散模型和动量机制，解决单张图片恢复三维场景难题。它能生成高保真、一致的多视角视频，在不同场景和轨迹下表现出色。>阅读原文

RLSC：让大模型自教自练，数学能力飙升21%

论文提出RLSC，让大语言模型用自身答案置信度作奖励信号，摆脱人工标注和奖励模型。仅16个样本训练20步，数学能力飙升21%，还让模型学会快推理，但有模型对错误答案过度自信问题。>阅读原文

清华等首提SeReNet，加速光场三维重建

清华等团队提出SeReNet，实现毫秒级高分辨光场三维重建，摆脱标签数据依赖。它提升计算速度，应对复杂干扰，在多实验表现出色，为生物医学研究提供新助力。>阅读原文

GigaAI：Motion - R1让角色按指令动起来

GigaAI提出Motion - R1框架，融合"思维链"机制解决现有动作生成方法的问题，能提升动作可控性等。测试显示，它在分布内和分布外场景表现优于MotionLLM，但也存在一定局限。>阅读原文

bash 复制代码

    </p>

官网：www.AiReadingHub.com