All in AI,看见未来。 每天精选最值得读的AI文章,帮你筛掉时代的噪音。 以简讯见广度,以深读见洞察。 技术、趋势、思考,一站式掌握AI世界。 欢迎关注公众号「AI Reading Hub」,获取更多AI资讯和技术文章。
2025-06-20 资讯日报
新闻资讯
摩尔线程冲刺国产GPU第一股
6月18日摩尔线程IPO辅导验收,其成立至今融资超45亿,估值255亿。若成国产GPU第一股或受追捧。当下英伟达受限,国产芯片替代空间大,相关企业有望增长。>阅读原文
KAIST公布HBM4关键特性及长期路线图
KAIST TERALAB公布HBM技术,HBM路线图从容量升级到计算存储融合。HBM4计划2026年推出,电气规格、封装冷却、架构创新显著,还引入AI设计工具,开启智能设计新时代,为AI算力革命提供硬件基础。>阅读原文
北京AIGC创投会推动文旅与AI融合
北京AIGC视听产业创新中心举办创投会,吸引多方参与。入围项目涉及AI数智文创等多赛道,提供创新视角。活动推动AI与文旅融合,征集项目并形成可复制经验,助力产业数字化升级。>阅读原文
Karpathy:AI时代给大模型做"服务"机会大
Karpathy称AI正改变软件定义等。他把软件分三个时代,认为LLM是新操作系统。指出使用LLM要了解其特点,AI时代机会是部分自主应用和构建Agent友好工具。>阅读原文
AI选数偏爱27,难逃人类文化宿命
Andrej Karpathy发现AI在1 - 50选数常选27,还会编造推理过程。不同AI也有选42等情况,这或源于人类文化偏见,AI难摆脱人类赋予的宿命。>阅读原文
英伟达前高管张建中:摩尔线程冲刺IPO
摩尔线程完成上市辅导,冲刺国产GPU第一股。其创始人张建中来自英伟达,公司产品多元。此外,燧原和壁仞去年也启动上市,随着大模型加持,国产芯片厂商IPO进展值得期待。>阅读原文
AI推理模型基准测试成本攀升
Artificial Analysis披露评估推理模型成本上升。模型生成"思维链"推高推理成本,新模型单价高、按需分配token也使成本更复杂,测试成本上升或让模型比较更难。>阅读原文
OpenAI档案曝光,奥特曼劣行被揭穿
奥特曼透露GPT - 5今夏发布,称未来模型版本界限或模糊。但「The OpenAI Files」曝光其劣行,如捏造身份、间接持股等,还揭示OpenAI在重组、诚信等方面存在的问题。>阅读原文
YC AI创业营:大佬分享AI创业观点
在YC AI创业营第二天,纳德拉称AI是工具,智能体将成新一代计算机;吴恩达强调执行速度和应用层机会;Cursor团队快速迭代,定位全流程开发自动化;Figma重视设计与人际连接。>阅读原文
Karpathy:软件3.0时代人人都是程序员
Andrej Karpathy 称软件正从 1.0 向 3.0 演变,软件 3.0 由 LLMs 驱动,自然语言可编程。他认为 LLMs 有公用事业等特性,开发部分自主应用是机遇,还强调要为 Agent 构建软件。>阅读原文
何恺明CVPR讲座PPT上线:探索生成模型新方向
何恺明在CVPR分享'走向端到端生成建模',回顾识别模型演进,指出生成模型当前类似逐层训练。他介绍MeanFlow方法,实验显示其远超同类,最后对生成模型发展提出展望和问题。>阅读原文
工程师:大模型重塑研发体系与核心竞争力
同程杨方伟、网易林香鑫、百度颜志杰表示,大模型让研发在编码、协作等方面变化大,能提升效率、优化分工。率先受益的工程师有积极学习等特点,未来应聚焦业务理解等核心竞争力,应对效率焦虑要持续学习。>阅读原文
MCP峰会:探讨AI新范式前沿成果
峰会汇聚微软、AMD等企业专家,探讨MCP协议驱动的AI新范式。卿毅称真AI要落地,苏震巍展示平台融合实践,罗聪分享实战案例并提供开源工具,各方助力MCP推动AI产业发展。>阅读原文
MIT:过度依赖ChatGPT让大脑功能萎缩
MIT研究发现,过度依赖ChatGPT会使大脑"认知破产",83.3%用户无法引用自己文章内容,神经连接减少47%。过度依赖者不使用AI时表现更差。应战略性使用AI,避免成其奴隶。>阅读原文
56岁大叔英国读博,AI学习市场可期
英国Bristol大学胡老师分享56岁大叔读博经历,大叔曾为钱搁置梦想,现子女毕业来逐梦。作者感慨普通人为生活妥协,也赞其勇气,还指出AI学习市场潜力大。>阅读原文
MIT:ChatGPT上瘾,大脑萎缩47%
麻省理工研究发现,长期用ChatGPT,学习能力下降、大脑受损,神经连接减少47%。AI提高效率或是误解,是用长期思维换短期效率。不过,原本思维强的人用AI,大脑神经连接度或提升。>阅读原文
Salesforce:LLM 智能体 CRM 测试成功率低至 35%
Salesforce 研究显示,LLM 智能体在 CRM 测试中成功率低,单步 58%,多步仅 35%,且保密意识差。其能力与企业需求差距大,企业应用需谨慎。>阅读原文
产品应用
Midjourney推V1视频模型,美学与性价比兼得
Midjourney推出V1视频模型,以高性价比、易上手为卖点。采用图像转视频工作流,有多种模式和设置。入门价10美元,任务成本低,未来或调价格,目标是打造实时交互开放世界模拟系统。>阅读原文
美团推出语音交互GUI智能体,性能领先
美团与浙大联合推出GUIRoboTron - Speech智能体,可处理语音指令,解决文本依赖局限。团队构建端到端代理,经多步骤研发,性能评估领先,还发布实习生招聘岗位。>阅读原文
MiniMax海螺02:国产视频模型超神了
MiniMax上新Hailuo 02视频生成模型,解决体操难题,能hold住复杂物理场景,文生、图生视频实测效果佳,成本创新低。本周MiniMax还有多项技术布局,实现全模态覆盖。>阅读原文
Midjourney:480P视频模型开启元宇宙之门
歸藏:Midjourney发布Video V1视频模型,只能图生视频,480P但采样率高。它美学表现好、生成快,不过在提示词理解等方面较弱。该公司目标是构建实时图像生成系统,有独特发展思路。>阅读原文
阿里云 Milvus:0 代码实现语义级图文互搜
面对非结构化数据检索难题,阿里云推出 Milvus 方案。它是全托管向量检索引擎,结合百炼模型服务,能实现文搜图、图搜图等,还可通过 Function AI 部署,降低成本,覆盖多业务场景。>阅读原文
Midjourney首个视频模型V1惊艳登场
Midjourney推出首个视频模型V1,视觉效果佳,能让图像动起来,成本低。提供多种模式与设置,还分享实时开放世界模拟的技术愿景,未来一年将完善相关模块。>阅读原文
MiniMax Hailuo 02:超越谷歌Veo 3的视频模型
MiniMax发布新一代Hailuo 02视频模型,ELO得分超谷歌Veo 3和快手Kling 2.0,成全球第二。它能处理复杂运动细节,重建底层架构提效,成本仅为Veo 3的1/9,后续还会更新。>阅读原文
推荐文章
Anthropic:Multi - Agent核心是Prompt设计
Anthropic分享多智能体研究系统实践,其架构用协调者 - 工作者模式,动态搜索信息。还给出8条提示工程与评估原则,如思考智能体行为、教协调者委派任务等,提升智能体性能。>阅读原文
Andrej Karpathy:AI 开启软件 3.0 时代
Andrej Karpathy 称 AI 开启软件 3.0 时代,编程范式从代码、神经网络权重到用提示词编程大模型。大模型有超能力也有缺陷,构建部分自主应用是趋势,对'2025 是 Agents 元年'观点表示担忧。>阅读原文
Bill Gurley:AI重塑一级市场结构
风投大佬Bill Gurley称,超级风投基金催生"僵尸独角兽",零利率让美国IPO和并购停滞,LP有流动性问题。AI浪潮打断市场修正,带来投资热和泡沫,多数AI企业靠算力转售营收,看好中国开源AI模型。>阅读原文
万字长文总结大模型推理优化技术
文章指出大模型推理成本高、资源需求大,需优化。介绍推理各阶段特点,提及模型并行、注意力机制等优化技术,如多查询注意力减少内存、FlashAttention 优化计算,还介绍模型服务的动态批处理与预测推理。>阅读原文
嘉宾热议:从 GPT 到 Agent 的技术与业务融合
AICon 直播嘉宾探讨大模型落地。李陈忠、张昊阳等认为 GPT 开启新时代,未来大模型如水电,应构建私域模型。还讨论通用 Agent、创业机会、产品难点及人才需从专精变复合。>阅读原文
ElevenLabs增长负责人分享营销秘诀
ElevenLabs增长负责人Luke Harries称,公司增长靠模型迭代与独特营销策略。建议搭建通才营销与前端增长工程师团队,视频营销价值大,创始人应避免过早付费营销,创业要耐心、把握时机。>阅读原文
开源动态
微软:Agent革新代码评测基准
微软发布SWE - bench - Live代码修复评测基准,引入新Issue,用REPOLAUNCH实现环境自动化构建与更新。实验显示传统基准存在过拟合,SWE - bench - Live评估更准确,已在GitHub和HuggingFace开放。>阅读原文
算法论文
ViLaSR:多模态推理画图提升空间推理能力
论文称文本难精准表达空间关系,现有LVLM空间推理弱。ViLaSR让模型边画边想,经三阶段训练,在多测试中吊打对手,还开源资源,有望破解AI落地痛点,实现机器认知升维。>阅读原文
港中文等:DPO与GRPO图像生成对比研究
港中文、北大等团队研究发现,DPO在域内任务表现优,GRPO域外泛化强;DPO对奖励模型更敏感;GRPO扩展采样图像数提升域内性能,DPO扩展域内数据能兼顾内外表现。>阅读原文
甄鼎丞:TransDiff图像生成新方法
甄鼎丞介绍图像生成新方法TransDiff,它结合AR Transformer与Diffusion,提出MRAR范式。实验显示其有语义编辑能力,在Benchmark有优势,还具连续帧生成潜力,将用于视频生成。>阅读原文
快手OneRec:重构推荐系统新范式
快手技术团队提出OneRec,以端到端生成式架构重构推荐系统。它提升推荐效果与算力效率,降低成本,在快手多场景表现佳,但推理、多模态桥接和奖励系统待完善。>阅读原文
NoWait:零成本重塑大模型推理路径
现代大模型推理时自我反思词致效率低。NoWait方法零成本,通过三步屏蔽反思词。在多模态任务表现佳,RL模型屏蔽后精度稳,蒸馏小模型精度暴跌,颠覆推理需自我反思认知。>阅读原文
超级平台或攻击AI智能体保地位
上海交通大学团队指出,AI智能体崛起冲击超级平台"守门人"地位。超级平台或采取自研、限制API、对抗攻击等策略应对,未来双方博弈将升级,需构建共赢生态。>阅读原文
研究:大模型不等式证明推理漏洞多
斯坦福等机构研究发现,大模型解决不等式证明常靠猜,推理不严谨。测试29个主流模型,发现参数大、思考久都不能提升推理质量。不过自我反思和定理线索策略可改善推理表现。>阅读原文
上交等提出LED - Merging,破模型融合难题
上海人工智能实验室等团队提出LED - Merging,解决模型融合中"安全 - 效用冲突"。它无需训练,能在不牺牲专业能力下提升安全性,在多模型实验中表现优异,展现跨模型、跨语言潜力。>阅读原文
田渊栋:连续思维链并行搜索更高效
田渊栋团队研究发现,连续思维链能并行搜索,比离散思维链更优。他们设计机制提升模型在图可达性任务的表现,实验显示连续思维链模型准确率近100%。此外,田渊栋业余还是科幻小说家。>阅读原文
bash
</p>