All in AI,看见未来。 每天精选最值得读的AI文章,帮你筛掉时代的噪音。 以简讯见广度,以深读见洞察。 技术、趋势、思考,一站式掌握AI世界。 欢迎关注公众号「AI Reading Hub」,获取更多AI资讯和技术文章。
2025-07-05 资讯日报
新闻资讯
Nature:超14%生物医学论文或由AI代写
Nature报道,2024年PubMed超20万篇生物医学摘要现LLM特征词,部分学科和国家AI辅助写作比例超20%。作者会规避痕迹,MGT检测器难准确判断,需完善AI影响量化分析。>阅读原文
Grok 4测试成绩优异,数据真实性引争议
API开发者曝光Grok - 4测试成绩优异,HLE达45%碾压o3和Gemini。不过成绩引发争议,有人质疑数据污染,也有人支持xAI。目前数据未证实,AI能力边界竞赛才刚开始。>阅读原文
李飞飞:攻克空间智能,为AGI补拼图
李飞飞称当前AI繁荣有局限,其公司World Labs将攻克空间智能。她回顾ImageNet项目推动AI发展,还建议博士做基础问题,创业招人看重思想无畏,认为读研需有强烈好奇心。>阅读原文
Altman:Meta 挖走的不是顶尖人才
AI 人才抢夺战中,Meta 招募引 OpenAI 不满。Altman 嘲讽 Meta 没挖到顶尖人才,还暗示评估薪酬。OpenAI 播客揭秘 ChatGPT 发展,提及模型问题应对及未来期待,如语音、视频等领域突破。>阅读原文
00后黄思铭:用AI小猫传递爱与陪伴
00后创业者黄思铭休学创业,他结合自身幸运经历,认为应借AI普及优质关系。2024年6月团队上线小喵希拉,这只电子小猫给予陪伴与爱,已获不少用户,未来还将探索更多关系与功能。>阅读原文
Meta高薪抢AI人才,薪资水涨船高
Meta招聘文件曝光薪资,软件工程师最高年薪48万美元,AI相关岗位起薪高。科技公司为抢AI人才高薪竞争,Meta激进,国内腾讯、华为等大厂也加入,人才流动频繁。>阅读原文
英伟达成历史第一股,老黄狂挖清华人才
英伟达以3.92万亿美元市值刷新全球纪录,超过苹果成历史第一股,黄仁勋身家达1388亿美元。其股价暴涨源于AI热潮和芯片技术突破,同时老黄还从清华系AI公司挖走不少人才。>阅读原文
Cluely靠"作弊"黑红,开源平替来势汹汹
Cluely以"AI作弊"宣传引争议,营收一周从300万飙到700万美元,获a16z 1500万美元投资。企业版受B端欢迎,但开源"平替"Glass上线,Cluely前途待察。>阅读原文
DeepSeek遇冷,'Token经济学'背后有玄机
SemiAnalysis:曾轰动全球的DeepSeek R1在自家平台遇冷、份额下滑,但在第三方平台使用量增近20倍。它为研发留算力,开源模型。Anthropic也因算力紧张,Claude Code速度下降。>阅读原文
ICONIQ:揭秘 AI 产品落地与企业发展现状
ICONIQ Capital 团队:2025 年度报告聚焦 AI 产品落地,将企业分 AI 原生和赋能两类并识别高增长企业。AI 原生公司初代产品发展更快,47%已规模扩张,赋能型仅 13%。>阅读原文
Jack Clark:美国AI政策强硬推手
科技评论撰稿人程天一剖析Jack Clark,他认可中国AI进展,却为美国遏制中国设计五层战略。他出身记者,人脉广泛,在政策建议上鹰派强硬,抓住算力关键,其行为引发对时代角色的思考。>阅读原文
印度工程师骗硅谷多家AI公司,现"上岸"新公司
印度工程师 Soham Parekh 同时在硅谷 10 多家 AI 公司任职被曝光。他称是为摆脱财务困境,每周工作 140 小时。如今他宣布入职新公司,大众对他看法不一,有人视其为骗子,有人认为他是"民间英雄"。>阅读原文
89年博士闫俊杰,率MiniMax冲击AI无人区
89年博士闫俊杰带领MiniMax崛起,早于ChatGPT布局大模型。在技术路线上多次做出非共识选择,推出多款模型和产品。现估值超30亿美元,"发布周"新品不断,还推出智能体,目标是成为全球AGI领先者。>阅读原文
扎克伯格烧钱搞AI,重蹈元宇宙覆辙?
扎克伯格为超级智能团队在硅谷天价挖人,引发争议,如逼得Ilya喊话。此前他的元宇宙计划投入600亿成果寥寥,如今他又砸钱搞AI,其AI愿景能否实现有待观察。>阅读原文
腾讯云联合发布Data+AI白皮书助力企业转型
腾讯云与Gartner发布白皮书,指出GenAI时代数据巨变,非结构化数据占比高。腾讯云打造DIaaS平台,多位技术大咖分享其在各行业实践,程彬称Data与AI融合价值放大,转型需技术与需求共振。>阅读原文
百度搜索十年最大改版,接入MCP与新模型
百度搜索十年来最大改版,搜索框成"智能框",支持超千字输入,多模态能力增强。接入MuseSteamer模型,AI助手升级,还接入1.8万+MCP,拓宽搜索能力边界。>阅读原文
产品应用
AI辅助预习课程,这些建议请收好
家长咨询用AI辅助孩子预习课程的问题,回复称没必要上传教材,能力强的模型把问题描述清楚就行,推荐Gemini和Khanmigo,建议家长引导孩子自主学习,让AI辅助写作。>阅读原文
MLMOVE:大模型玩《反恐精英》堪比职业玩家
动视暴雪等研究人员开发MLMOVE,用Transformer架构,借123小时职业玩家数据训练。它能学团队协作,提前预判移动,经测试评分高于其他机器人,效果提升16% - 59%。>阅读原文
谷歌:Gemini Agent Mode 集成 Android Studio
谷歌为 Android Studio 推出集成 Gemini 的 Agent Mode,能以项目为上下文直接修改项目、执行多步骤任务,还可通过 MCP 交互。不过预览版有不足,谷歌正积极解决。>阅读原文
全球首款实时生成游戏引擎Mirage发布
全球首款实时生成游戏引擎Mirage发布,借助AI世界模型实现UGC玩法。支持多类型游戏,相比其他成果优势明显,能让玩家动态创造全新游戏体验。>阅读原文
推荐文章
探究大语言模型推理之缓存优化
文章探究大语言模型推理缓存优化技术,介绍主流推理框架vLLM、SGLang的优化方法,如PagedAttention、RadixAttention等,还提及LMCache、DeepSeek的缓存技术,最后介绍MCP赋能可视化OLAP智能体应用。>阅读原文
2025年AI编程:提效与技术债并存
Phodal认为2025年AI编程有诸多趋势,如AI代理能力提升、编程模式转变等。但AI重构易致架构混乱,还会放大技术债,成功领导者需构建流程和工具链驯服AI。>阅读原文
Karpathy:上下文工程对 Agent 至关重要
Andrej Karpathy 强调「上下文工程」对 AI Agent 很重要,它为模型提供恰当信息,比提示词工程关键。文章介绍其概念、与提示词工程区别,还阐述写入、筛选等四种落地策略。>阅读原文
吴恩达:一小时AI做MVP开启项目
吴恩达:做MVP可将项目范围缩减到一小时内借助AI完成,像他做虚拟观众模拟器,能推动项目、积累经验、收集反馈,让创意不"胎死腹中"。>阅读原文
Pedro Tavares:LLM未解决软件开发根本瓶颈
Pedro Tavares指出,软件开发瓶颈不是写代码,而是"人类开销"。LLM虽让写代码变快,但理解、测试代码成本更高,团队理解代码成本才是真正瓶颈,不应忽视。>阅读原文
万字长文总结大模型LLM推理优化技术
文章指出大模型推理需优化成本与速度。介绍推理阶段、批处理、KV缓存等,还阐述多种优化技术,如模型并行可分散显存,注意力机制优化能减内存,模型优化可降内存占用,模型服务技术能并行处理请求。>阅读原文
吴恩达:AI应用先做"一小时版本"
吴恩达建议,若开发AI应用时间有限,就缩减项目范围。他以"观众模拟器"为例,将其精简后在短时间完成基础版本,获进展、提升技能、得反馈,还能判断项目价值。>阅读原文
2025企业级AI变现现状大揭秘
ICONIQ Capital报告显示,企业级AI模型选择多倾向OpenAI搭配其他模型。AI支出中人才成本前期高,后期基础设施成本上升。定价渐离订阅模式,合适AI人才不足,工具生态走向成熟。>阅读原文
八次"替代论"未终结程序员职业
文章指出,计算机技术发展中,"程序员末日论"多次出现,从编译器到AI。但每次新技术都催生新需求,未取代程序员,只是角色转变。未来程序员需靠业务理解等能力进化。>阅读原文
揭秘DeepSeek大规模与本地部署差异原因
文章指出AI推理有吞吐量和延迟权衡,受批处理大小影响。像DeepSeek-V3这类有多层的专家混合模型需大批次、高延迟,否则吞吐量低,而OpenAI和Anthropic的模型响应快或因架构高效、有技巧或多买GPU。>阅读原文
开源动态
Kyutai开源TTS模型,低延迟优势显著
法国Kyutai实验室开源Kyutai TTS模型,基于DSM框架,有流式输入、超低延迟等亮点。给出PyTorch、Rust、MLX三种使用方式,适用于实时语音助手、内容创作等场景。>阅读原文
Together AI:开源模型抛弃SFT纯靠RL训练
Together AI与Agentica推出DeepSWE - Preview,全开源且抛弃SFT纯用RL训练。200步RL训练使Pass@1成功率从23%到42.2%,结合TTS技巧性能达59%,为垂类Agent训练提供新范式。>阅读原文
Trae - Agent 开源,多 MCP 工具助力 AI 应用
Aitrainee介绍AI新动态,Trae - Agent开源可处理软件工程任务,Windows - MCP 操控电脑,Chrome MCP Server 让 Chrome 成智能助理,还提及 Gemini Cli、Claude 等工具使用。>阅读原文
Open Deep Research:AI研究报告生成器
Open Deep Research是AI驱动的研究报告生成器,借助Next.js 15等技术,能根据用户问题生成综合报告。介绍了其工作原理、克隆运行步骤及项目地址。>阅读原文
Tauri:重塑桌面App开发的开源利器
Tauri作为开源框架,将后端编译为Rust二进制,用系统WebView渲染前端。相比Electron,它体积小、性能高、安全强,功能亮点多,支持多平台打包,是开发跨平台桌面及移动应用的好选择。>阅读原文
野生DeepSeek R1T2火了,速度性能双优还开源
德国TNG公司推出「DeepSeek R1T2」模型,速度比R1快20%,融合官方三大模型,开源且开放权重。它平衡了智力与输出效率,受认可,但也存在推理能力不足等局限。>阅读原文
22岁开发者Scira项目获Groq青睐,用户破6万
22岁印度开发者Zaid Mukaddam开发Scira,解决搜索难题。项目流量激增致成本上升,得Groq等支持。如今用户超6万,其成功激励更多开发者投身创新。>阅读原文
中山大学&华为:SWE-Factory 革新代码评估数据集构建
中山大学与华为联合推出 SWE-Factory,通过 SWE-Builder 多智能体框架和基于退出码策略,解决传统代码评估数据集构建难题,高效低成本构建有效实例,还发现 Error2pass 现象待解决。>阅读原文
算法论文
苹果港大发布DiffuCoder,颠覆AI写代码逻辑
苹果与港大联合推出7B参数的DiffuCoder。该模型在代码生成上优势明显,性能提升4.4%,还提出耦合 - GRPO方法。不过,dLLM在指令微调阶段增益弱,后续需提升理解和执行复杂任务的能力。>阅读原文
上交大EEdit加速图像编辑入选ICCV 2025
上海交通大学EPIC Lab团队提出EEdit框架,解决扩散模型图像编辑时空冗余问题。它免训练,加速显著,支持多引导方式,在多数据集实验中表现优异,已入选ICCV 2025。>阅读原文
猫咪睡觉触发词让DeepSeek数学能力崩塌
新论文《Cats Confuse Reasoning LLM》显示,研究人员用CatAttack方法发现,与数学问题无关的触发词能让DeepSeek等推理模型错误率飙升、回答变长,威胁关键领域模型安全。>阅读原文
AgentDistill:零训练让小模型性能跃升48%
普林斯顿等高校提出AgentDistill,发现教师智能体任务中生成MCP,学生智能体复用工具包无需训练继承能力。在数学和生物医学任务中,小模型性能提升最高48%,降低部署门槛。>阅读原文
LensLLM:终结 LLM 选型"玄学"
弗吉尼亚理工大学团队:提出 LensLLM 框架,基于新理论揭示 LLM 微调"双相演进",能精准预测性能、降低成本,适用于资源受限部署、A/B 测试等场景,引领 LLM 应用新时代。>阅读原文
上交 MAS - GPT:一键生成多智能体系统
上海交通大学等联合推出 MAS - GPT,将设计 MAS 转为语言生成任务,解决现有 MAS 无适应性、成本高、泛化性低问题,实验证明其更准、更省、兼容性强,未来有望不断进化。>阅读原文
物理学家:AI创造力源于技术缺陷
物理学家朱利奥·比罗利等提出假设并验证,AI'创造力'是模型架构必然结果。以生物系统为参考,证明其是确定性过程,不过非利用局部性和等变性的AI创造力来源待解。>阅读原文
bash
</p>