AI Daily | AI日报:2025中国AI算力大会6月将举办; 程鹏:大模型重塑人才选拔方式; 李飞飞:空间智能是AI核心组件

All in AI,看见未来。 每天精选最值得读的AI文章,帮你筛掉时代的噪音。 以简讯见广度,以深读见洞察。 技术、趋势、思考,一站式掌握AI世界。 欢迎关注公众号「AI Reading Hub」,获取更多AI资讯和技术文章。

2025-06-14 资讯日报

新闻资讯

2025中国AI算力大会6月将举办

2025中国AI算力大会6月26日举办,中昊芯英创始人杨龚轶凡、中科加禾创始人崔慧敏等将演讲。大会聚焦推理算力、异构混训等,设多论坛与展览区,门票报名中。>阅读原文

程鹏:大模型重塑人才选拔方式

阿里巴巴程鹏称,大模型在人才选拔与培养有颠覆价值,如提效、个性化、决策客观等。面试等场景各有挑战,可通过算法透明等平衡效率与公正,部分行业更适合落地,还给出实践建议。>阅读原文

李飞飞:空间智能是AI核心组件

李飞飞在访谈中重述World Labs愿景,指出语言模型描述3D世界有局限,空间智能是关键。公司已推出「世界生成」技术和开源Forge渲染器,随着算力等提升,攻关「世界模型」有了可能。>阅读原文

Transformer八岁,引发生成式AI革命

新智元报道:Transformer八岁,《Attention Is All You Need》被引超18万次。它催生众多产品,开启生成式AI时代。起初未受重视,如今影响深远,谷歌对其态度渐变,AI仍在其架构上发展。>阅读原文

谷歌训出AI台风预测模型,超越主流物理模型

谷歌团队推出交互式气象平台Weather Lab,共享AI天气模型。新模型在热带气旋路径预测上超越主流物理模型,还发明FGN方法。该模型兼顾路径与强度预测,谷歌将持续改进。>阅读原文

798双展:探讨算法下的艺术与生活

798艺术区有两个展览。郭城"虫"展追问技术理性双重性,连接技术与自然;蒲英玮"红色计算机"展探讨AI权力结构,用作品呈现科技与文明发展寓言,称人类文化属性会"增殖"。>阅读原文

120亿腾讯系AI独角兽明略科技冲刺港股IPO

明略科技冲刺港股IPO,北大数院校友创业19年获腾讯等投资。产品含营销、营运智能等三类,客户广。其认为中国数据智能市场前景好,企业应结合AGI与行业知识。>阅读原文

中国AI公司用"飞行硬盘箱"破美封锁

美国限制先进AI芯片对华出口,中国公司带硬盘到海外数据中心训练AI再带回结果。企业还通过国产替代、第三国走私等绕开限制,东南亚数据中心崛起,中东成新热点。>阅读原文

2025谷歌云等云厂同时宕机引关注

2025年6月12日,AWS、谷歌云等云厂同时宕机,谷歌云瘫痪3小时影响众多服务。Spotify、Cloudflare受牵连,Cloudflare股价跌5%。网友猜测宕机或因谷歌Chemist服务故障,还热议云厂商依赖问题。>阅读原文

2025谷歌研究学者计划名单揭晓

2025谷歌研究学者计划名单公布,吴佳俊、Albert Gu、Tri Dao等获奖。该计划为鼓励科研合作设,涉12领域,获奖者最高获6万奖金,华人学者在多领域崭露头角。>阅读原文

黄仁勋:GPU要和量子计算机"绑定"了

黄仁勋在VivaTech 2025会发布CUDA - Q平台。回顾英伟达CUDA - X套件贡献,认为量子计算迎"拐点",未来超算是QPU与GPU协同,算法堆栈在新芯片加速。>阅读原文

韦东奕论文登顶刊,扩展散焦方程研究

韦东奕、章志飞、邵锋合作论文登数学顶刊,研究超临界散焦非线性波动方程。他们将爆破性研究扩展至d≥4,得出核心结论,方法绕过奇点处理难点,可推广到其他方程。>阅读原文

腾讯"薪酬不限"揽AI人才底气何来?

AI下半场竞争重心转变,需聚焦定义问题和构建评估体系。腾讯场景广、业务耦合强且有变现案例,契合人才成长。其青云计划"薪酬不限",今年筛选更严,是AI人才好选择。>阅读原文

蒋涛:'码盲'消失,新程序员崛起

CSDN 创始人蒋涛称,AI 浪潮下要翻越美国'三座大山',从 Global AI 走向 Local AI。他预言'码盲'会消失成新程序员,超级程序员价值放大,AI 还能重写硬件,中国制造业有优势。>阅读原文

Meta重金投资Scale AI,97后CEO跳槽

Meta以148亿美元收购Scale AI 49%股权。97后CEO Alexandr Wang将加入Meta,Scale由Jason Droege接任。Wang认为数据是AI生命线,此次投资是公司和个人发展新契机。>阅读原文

谷歌前CEO:AI、智能体将重塑世界

谷歌前CEO Eric Schmidt认为,2016年AlphaGo标志AI革命起点,如今正迈向多智能体系统。虽算力、安全等有挑战,但AI会在医疗、教育等领域带来变革,实现人机协同,不用AI将被淘汰。>阅读原文

CVPR25:华人学者斩获最佳论文奖

CVPR 2025奖项公布,谢赛宁、苏昊获青年学者奖。最佳论文《VGGT: Visual Geometry Grounded Transformer》性能突出。最佳学生论文及4篇荣誉提名论文也各有创新,在多领域有应用前景。>阅读原文

SakanaAI:一句话生成LoRA颠覆LLM微调

SakanaAI推出T2L,简化大模型微调流程,省却复杂步骤。其参数压缩率高,准确率损失小,零样本场景表现优,让非技术用户也能用自然语言定制模型。>阅读原文

苏妈联手OpenAI,AMD新品叫板英伟达

AMD在大会发布多款AI新品,MI355X性能超英伟达B200。明年将推MI400系列等。OpenAI CEO出席,称将用AMD芯片。全新软件栈ROCm 7.0性能提升,开发者云助力开发。>阅读原文

硅基流动获数亿融资,剑指 AI 开发平台

硅基流动完成数亿元 A 轮融资,阿里云领投。创始人袁进辉称业务爆发式增长,公司推出高性能推理引擎等产品,服务多行业,未来将深耕创新,推动 AI 技术深度应用。>阅读原文

研究:热门网站恶意链接可攻击智能体

哥伦比亚大学Ang Li团队发现,可在热门网站植入恶意链接攻击智能体。因智能体信任热门网站,易被诱导执行有害行为,设计防御系统能提升其安全性。>阅读原文

CVPR 2025:华人学子闪耀,最佳论文诞生

CVPR 2025大会成果丰硕,投稿量创新高,接收率22.1%。最佳论文来自牛津与Meta AI,提出的网络在三维任务表现出色。Hao Su、谢赛宁获年轻研究者奖,还有多论文和个人获其他奖项。>阅读原文

谷歌云等多平台同时宕机引关注

2025 年 6 月 12 日,AWS、谷歌云等多平台同时宕机,谷歌云服务瘫痪 3 小时,波及 Gmail 等众多产品。Spotify、Cloudflare 受影响,有人猜测是谷歌 Chemist 服务故障,也有人担忧云厂商相互依赖问题。>阅读原文

产品应用

花叔测评:豆包1.6构建旅行策划Agent

花叔测评豆包1.6,用其构建旅行策划Agent。豆包1.6推理、计价等方面表现佳,结合MCP完成任务,虽页面有不足但超预期,国内Agent开发生态成熟,推荐"AI云原生"开发范式。>阅读原文

火山引擎出击,破解 B 端 Agent 落地难题

作者指出 2025 年大模型竞争下半场 Agent 成热点。它在 2B 落地遇困境,火山引擎推出新开发范式,含 TRAE、升级豆包大模型等,助企业打破落地难题,推动产业走向生产力革命。>阅读原文

科大讯飞发布会:智能交互迈向新高度

科大讯飞发布会展现智能交互新成果。AIUI升级,实现全双工交互与情绪感知;机器人超脑平台赋能多款机器人;数字人制作量和交互次数大增。以AI交互贯穿全链,推动产业升级。>阅读原文

火山引擎AI开发"全家桶"升级,开发零门槛

火山引擎Force大会升级AI开发"全家桶"。推出DeerFlow等开源项目,提出AI云原生理念。MCP调用方便,PromptPilot优化提示词,还有豆包1.6等产品,助开发者降成本、提效率。>阅读原文

实测字节豆包1.6,AI云原生潜力无限

作者实测字节豆包1.6系列模型,用其完成落地页设计,还借助Trae、火山方舟MCP等实现AI Agent开发部署。测评表明豆包1.6多模态能力出色,处理复杂指令效果好,价格实惠,字节AI云原生生态潜力大。>阅读原文

扣子平台:开启Agent全生命周期进化

2025年被称Agent爆发元年,年初通用Agent产品Manus出现后受关注。火山引擎大会上,扣子升级为全生命周期平台,含开发、框架、调优等部分,未来将成Agent发展"基础设施"。>阅读原文

字节发布多主体视频生成神器MAGREF

字节:发布多主体视频生成神器MAGREF,基于单图生成主体一致视频,多人不串脸。采用三阶段流程和DiT架构,适配复杂任务,未来将向多模态生成系统演进。>阅读原文

阿里云方案:快速构建企业级数据分析 Agent

传统数据分析流程滞后低效,阿里云提出联合方案,基于 Hologres 和百炼,结合 Function AI 平台,借助 MCP 整合数据,实现端到端加速,提升企业决策效率。>阅读原文

科大讯飞升级平台,定义智能交互新生态

科大讯飞在智能交互领域大升级,AIUI融合多模态能力,儿童交互方案懂孩子、护成长;智能眼镜"三麦阵列"实用;机器人超脑、虚拟人交互等平台成果多,星辰Agent降低开发门槛。>阅读原文

PP - StructureV3升级,性能超越主流OCR

CourseAI称PP - StructureV3全新升级,能力追平Gemini2.5pro,超越MinerU等。它强化多项能力,更新PP - OCRv5提升准确率,超主流OCR方案,不过遇特殊情况泛化性欠佳。>阅读原文

推荐文章

Cursor CEO:AI编程未来,品味决胜!

Cursor CEO Michael Truell认为未来写代码会落后,AI将成问题解决者。指出AI瓶颈,称Cursor自建编辑器适配新工作流。还表示小众软件机会来,且AI不能替代人的品味,Cursor靠用户反馈形成飞轮。>阅读原文

郭炜:中国科技出海,新加坡或是首站

白鲸开源郭炜称,中国软件企业出海面临首站选择难题。中国市场是试炼场,美国市场机会与门槛并存。开源项目全球化需构建六层商业模型,新加坡可作出海跳板,逐步实现全球化。>阅读原文

数据老兵:AI 重塑工作与认知

数据老兵松子称,AI 改变游戏规则,编程 70%工作、数据分析师基础工作它都能做。填鸭式教育过时,认知结构是护城河。未来 AI 助手普及,人类应做决策,还介绍了 AI 在工作流程中的应用。>阅读原文

郭炜:传统数据仓库将被Agentic AI吞噬

白鲸开源郭炜认为,AI浪潮下传统数据仓库将被Agentic AI吞噬。随着Agent时代到来,数据仓库用户从人变为Agent,原有架构不再成立,Agentic Data Stack兴起是必然趋势,但仍需时间。>阅读原文

Agentic Browser:通用 Agent 下一站?

文章认为通用 Agent 发展受限,Agentic Browser 是新方向。它能让 Agent 主动行动,有上下文、本地控制和跨应用连接能力,未来或成新 AI 操作系统,催生定制硬件,还预测 OpenAI 相关产品秋季前发布。>阅读原文

除LLM外,这些模型你也得知道!

ully:AI时代不止大语言模型,复合AI系统成共识,掌握LLM、LCM等各类模型特点,对构建高质量AI应用很关键。>阅读原文

专家:AGI 或率先在 Coding 领域实现

拾象科技李广密、钟凯祺认为,做 Agent 可先从 Copilot 做起;AGI 或先在 Coding 环境实现,其可能拿走大模型产业 90%价值;AI 产品正从「工具」走向「关系」。>阅读原文

Lei Mao:CUDA kernel执行重叠解析

Lei Mao指出,有足够计算资源时CUDA kernel执行可重叠,不同blocks_per_grid值会影响并行化程度。隐式同步会阻碍重叠,可通过启用per-thread default Stream 解决。>阅读原文

LangChain:多智能体架构评测与选择

LangChain官方评测多智能体架构:复杂场景下单智能体性能差、成本高;Swarm和Supervisor表现好,且Swarm略优;Supervisor经优化可更好,扩展性、普适性强。>阅读原文

开源动态

腾讯视频发布鸿蒙跨端开发框架

腾讯视频团队:基于Compose Multiplatform推出ovCompose框架,弥补其不支持鸿蒙等问题。还推出KuiklyBase助力鸿蒙适配。框架有高性能等优势,已开源,未来将在GC等方面持续优化。>阅读原文

FishAudio开源情感TTS模型OpenAudio S1登顶榜首

FishAudio推出OpenAudio S1 TTS语音模型,基于200万小时音频训练,荣登TTS - Arena榜首。它支持多语言、情感表达,有不同版本适配,适用于播客、有声书等场景。>阅读原文

腾讯开源混元3D 2.1,消费级显卡就能跑

腾讯:在CVPR宣布混元3D 2.1模型开源。相比前代,它优化几何与纹理,全链路开源且适配消费级显卡。此前版本下载量超180万,此次升级让AI 3D模型更逼真。>阅读原文

AutoDev Remote Agent 试运行,开启 AI 编程新玩法

AutoDev Remote Agent 进入试运行,可运行于服务器,辅助项目开发。它是开源的,代码能自由修改集成。选择它而非 IDE 有成本等原因,未来计划实现自举、完善工具和建立沙箱机制。>阅读原文

俞星凯:1200行代码复刻vLLM并反超

DeepSeek研究员俞星凯推出Nano - vLLM,用不到1200行代码复刻vLLM。在RTX 4070测试中略逊于vLLM,在H800硬件上反超,具备快速推理、代码简洁等特点。>阅读原文

MIT与加州联手推出TradingAgents交易框架

MIT和加州打造TradingAgents框架,模拟交易公司运作,分解交易任务到各专业角色。它将复杂任务专业化,含多团队协作决策,还介绍了安装、使用等内容,项目已开源。>阅读原文

MASLab 发布,统一多智能体方法并推新社区

上海交通大学等十机构联合推出 MASLab 代码库,统一 20 多种多智能体方法,具备多种特性。经大量实验刻画性能图谱,提出 MASLab - ReAct 方法,还发起 MASWorks 开源社区。>阅读原文

DeepSeek 工程师:1200 行代码开源轻量级 vLLM

俞星凯(DeepSeek 工程师)开源轻量级 Nano - vLLM,代码 1200 行。它具快速离线推理等功能,基准测试中吞吐量逼近原版 vLLM,项目已在 GitHub 获 200 多 Star。>阅读原文

尹良升:SGLang 助力大模型低成本部署

SGLang 推理引擎受行业巨头青睐,核心开发者尹良升称其优势是高性能与易二次开发。他还介绍 PD 分离等技术解决的痛点,指出配置调试易被忽视,鼓励用多 GPU 和并行策略部署。>阅读原文

俞星凯:1200行代码构建Nano - vLLM

DeepSeek AI俞星凯构建轻量级Nano - vLLM,代码仅1200行。它具备离线推理等功能,基准测试中吞吐量逼近原版vLLM,在GitHub获200多Star。>阅读原文

算法论文

西湖大学PiFlow:革新AI科学发现范式

西湖大学团队推出PiFlow框架,解决现有AI科研系统痛点。它基于信息论和科学原理,用Min - Max优化平衡探索与利用,多领域实验效果好,能加速材料、生物等领域科学发现。>阅读原文

蚂蚁GCA:实现16M长上下文精准理解

蚂蚁技术研究院胡翔、武威团队提出新注意力机制GCA,解决长文本建模难题。它能端到端学习,实现16M长上下文精准理解,有千倍长度泛化能力,Triton kernel已开源。>阅读原文

KRIS - Bench评测:图像编辑模型程序性推理差

东南大学等团队推出KRIS - Bench评测图像编辑模型。对10款模型测试发现,闭源GPT - Image - 1领先,开源BAGEL - Think有进步但仍落后,所有模型程序性推理等深层能力不足。>阅读原文

SafeKey框架:让大模型安全风险直降9.6%

加州大学等团队提出SafeKey框架,发现大模型"越狱"两大核心,即"关键句"现象和"沉睡的安全信号"。通过双通路安全头和查询遮蔽建模,提升模型安全,危险率降9.6%,核心能力还提升。>阅读原文

清华腾讯:Scene Splatter实现高保真3D生成

清华腾讯联合推出Scene Splatter,基于视频扩散模型和动量机制,解决单张图片恢复三维场景难题。它能生成高保真、一致的多视角视频,在不同场景和轨迹下表现出色。>阅读原文

RLSC:让大模型自教自练,数学能力飙升21%

论文提出RLSC,让大语言模型用自身答案置信度作奖励信号,摆脱人工标注和奖励模型。仅16个样本训练20步,数学能力飙升21%,还让模型学会快推理,但有模型对错误答案过度自信问题。>阅读原文

清华等首提SeReNet,加速光场三维重建

清华等团队提出SeReNet,实现毫秒级高分辨光场三维重建,摆脱标签数据依赖。它提升计算速度,应对复杂干扰,在多实验表现出色,为生物医学研究提供新助力。>阅读原文

GigaAI:Motion - R1让角色按指令动起来

GigaAI提出Motion - R1框架,融合"思维链"机制解决现有动作生成方法的问题,能提升动作可控性等。测试显示,它在分布内和分布外场景表现优于MotionLLM,但也存在一定局限。>阅读原文

bash 复制代码
    </p>
    

官网:www.AiReadingHub.com

相关推荐
Java知识库7 小时前
2025秋招后端突围:JVM核心面试题与高频考点深度解析
java·jvm·程序员·java面试·后端开发
墨风如雪7 小时前
告别低效!Claude Code:你的代码库来了个“全能管家”
aigc
一只爱撸猫的程序猿7 小时前
创建一个基于Spring AI的智能旅行简单案例
spring boot·程序员·aigc
拖拖76513 小时前
让大模型真正”思考”:Reinforcement Pre-Training(RPT)论文解读与实践
人工智能·aigc
程序员岳焱14 小时前
Stream 流式编程在实际项目中的落地:从业务场景到代码优化
java·后端·程序员
l0sgAi14 小时前
EasyExcel读取多层嵌套表头数据
java·程序员
玄玄子18 小时前
JS Promise
前端·javascript·程序员
陈随易19 小时前
Bun v1.2.16发布,内存优化,兼容提升,体验增强
前端·后端·程序员
墨风如雪1 天前
告别“死记硬背”:Meta V-JEPA 2,让AI拥有“物理直觉”!
aigc