AI Daily | AI日报：哈萨比斯：AI能建模所有进化事物; Anthropic 反杀 OpenAI，称霸企业 LLM 市场; 马斯克与LeCun激辩：研究者是否存在？

All in AI，看见未来。每天精选最值得读的AI文章，帮你筛掉时代的噪音。以简讯见广度，以深读见洞察。技术、趋势、思考，一站式掌握AI世界。欢迎关注公众号「AI Reading Hub」，获取更多AI资讯和技术文章。

2025-08-04 资讯日报

新闻资讯

哈萨比斯：AI能建模所有进化事物

谷歌DeepMind哈萨比斯称，任何能进化的事物都能被AI高效建模，经典计算机建模范畴不断超出预期。他预测2030年有50%可能实现AGI，认为发明新事物更难，主张谨慎乐观推进AI发展。>阅读原文

Anthropic 反杀 OpenAI，称霸企业 LLM 市场

Menlo Ventures 报告称，Anthropic 超越 OpenAI 成企业 LLM 市场新王。代码生成、强化学习、Agent 时代助力其崛起。企业重性能，开源采用率降，支出向推理倾斜，用户只选好用的。>阅读原文

马斯克与LeCun激辩：研究者是否存在？

马斯克称xAI不再区分研究员和工程师，只有工程师，认为'Researcher'是古董术语。支持者认为划分是为排除无博士学位者等，反对者如LeCun详细阐述两者差异，强调区分的重要性。>阅读原文

马斯克升级Grok AI，挑战谷歌Veo 3

马斯克更新Grok App，Grok Imagine功能向Grok Heavy用户推出。其生成的视频爆火，戴尔CEO等名人盛赞。它速度快，还将让原版Vine回归，与谷歌Veo 3正面竞争。>阅读原文

砺算科技GPU：团队稀缺融资难仍突围

Johnny强尼：砺算科技GPU团队核心源于S3 Graphics，多次人员流动衍生出多家企业。砺算团队稀缺但融资难，虽资金少仍做出显卡，短期难做算力，定位游戏显卡，市场空间也够。>阅读原文

Sam Altman晒图，GPT - 5发布倒计时

OpenAI的Sam Altman晒GPT - 5实测问答图，显示其或很快发布。虽此次回答平平，但爆料称它代码和商业化能力强，网友看法不一，还猜测其会颠覆SaaS行业。>阅读原文

奥特曼首晒GPT - 5实测，研发或遇难题

奥特曼晒GPT - 5实测引关注，虽对话简单但有官方实例。GPT - 5被曝重写编码规则，用上通用验证器，不过The Information爆料其研发遇数据不足等难题。>阅读原文

OpenAI IMO团队：AI解难题仍路漫漫

OpenAI IMO团队爆料，项目仅三人用两三月完成。模型证明风格独特，第六题拒绝作答体现知能力边界。解决千禧年大奖难题尚远，后续需解决评估瓶颈、让模型学会提问题等。>阅读原文

Anthropic CEO：未来AI月费或达10万美元

Anthropic CEO Dario Amodei称几年内将有月费10万美元、支持1亿词上下文窗口的AI模型。Google Research论文解释了模型不改变权重学习的原理，不过网友担忧AI会出现「阶级分化」。>阅读原文

奥特曼：GPT - 5惊喜多，验证器成关键线索

AI圈苦等GPT - 5，奥特曼称有惊喜。OpenAI通用验证器或成GPT - 5王牌技术，代表AI从'堆料'到架构突破时代。有博主用疑似GPT - 5创作，效果惊人，引发期待。>阅读原文

兔子蹦迪AI视频骗上亿人引恐慌

一段兔子蹦迪AI假视频获5亿播放量，骗了上亿人。因监控画面等特点难识破，随着AI进步，真假视频难辨，引发人们对区分虚拟与现实的担忧。>阅读原文

AI教父Hinton：从站着科研到坐下预警AI风险

AI教父Geoffrey Hinton因腰伤多年难落座，却在站着的日子里推动深度学习变革。如今他能坐下了，却离开谷歌提醒人们AI风险，称30年内AI致人类灭绝概率10 - 20%。>阅读原文

AI代码审查工具：提效还是添乱？

AI代码审查工具宣称提效300%，但实际表现引争议。业内形成'工具+AI+人工'协同审查模式。硅心科技专家认为，应结合传统工程流程把控风险，调整审查粒度，让AI支持自定义配置。>阅读原文

Salient：AI Agent贷款服务获4.3亿融资

Salient获6000万美元A轮融资，估值3.5亿美元。其为消费贷款打造AI agents平台，推出多种业务，能确保合规、提升效率。已与多家机构合作，付款完成率等指标提升明显。>阅读原文

产品应用

蚂蚁AlignXplore让AI自动懂你需求

蚂蚁团队提出AlignXplore方法，通过强化学习使AI从用户行为归纳偏好。训练分两阶段，支持流式推断，实验效果好，是大模型个性化新探索，有望解决AI情商和主观问题。>阅读原文

中国移动发布九天大模型3.0，性能飙升！

中国移动发布「九天」基础大模型3.0，架构、数据等多维度升级，复杂推理能力提35%，智能体调用效率提21%，还推专项大模型，多模态生成可控性强，8月6日有技术直播。>阅读原文

飞书OpenAPI MCP：AI代理与协作平台集成神器

文章介绍飞书OpenAPI MCP工具，可集成AI agent与飞书开放能力。其功能丰富、特点实用，以Trae为例说明安装使用步骤，还给出初始化表格、创建群聊等典型应用案例。>阅读原文

实测Qwen-MT翻译模型：又快又好

阿里云百炼Qwen-MT翻译模型开放，支持超92种语言互译，具专业功能。实测响应快、回译准，能调风格，200字文本2.5秒，不过领域提示语句暂仅支持英文。>阅读原文

万字评测：四款AI浏览器大比拼

作者评测Dia、Fellou、Comet、Edge四款AI浏览器。在Agent能力上Fellou和Comet较强；信息搜集与处理方面Edge和Comet较优；历史记录记忆Comet和Dia领先。各有特点，为用户选择提供依据。>阅读原文

MoonBit Pilot：推动自动化软件交付新范式

Moonbit推出的MoonBit Pilot代码智能体系统，突破传统编程助手局限，能从语言底层推动自动化软件交付。它速度快、能云端异步执行，架构和机制出色，或引领软件工业进入智能自动化时代。>阅读原文

智谱GLM - 4.5发布，押注Agent赛道

2025年大模型热度降，智谱受关注少。7月28日发布GLM - 4.5，专为Agent设计，性能佳。此前其人事、业务等有调整，虽C端受挫、B端承压，但押注Agent方向或给出破局思路。>阅读原文

开源动态

国产LLM爆发，Hugging Face热榜被承包

本周国产开源LLM大爆发，GLM - 4.5专为智能体打造，Qwen3多版本更新提升能力，Step3多模态推理模型开源，腾讯混元3D世界模型可生成3D场景，应用于多领域。>阅读原文

GitMCP：开源神器终结代码幻觉

痕小子介绍开源工具GitMCP，它能把GitHub仓库变成实时文档中心，让AI助手访问最新内容，消除"代码幻觉"。其功能强大、零配置，适用于多种场景，提升AI开发生产力。>阅读原文

开源包deepagents：解锁深度Agent架构技巧

文章提出做Deep Agent而非Shallow Agent。Claude Code等强大应用藏技巧，如用冗长提示词、规划工具等。还推出开源包deepagents，封装核心机制，助用户打造强大Agent。>阅读原文

2025年七大顶流大模型架构揭秘

新智元报道，2025年七大顶流大模型架构各有亮点。如DeepSeek V3用MLA和MoE提升效率；Kimi K2用Muon优化器；Qwen3有密集和MoE两种模型；Gemma 3用滑动窗口注意力降成本。>阅读原文

谷歌开源文本提取库LangExtract

谷歌开源 LangExtract，利用大语言模型从非结构化文本提取信息。它优势众多，如定位精确、输出可靠等，支持多模型，通过示例展示使用流程，从定义任务到可视化结果，还能处理长文档。>阅读原文

Coze Studio开源版GitHub增星1.2k超火！

Coze Studio是低代码、可视化AI Agent开发平台，有Apache‑2.0开源许可。它能解决多类开发痛点，功能亮点足，应用场景丰富，虽Star数略逊部分竞品，但适合企业和中小团队落地。>阅读原文

lightly-train：无标签简化计算机视觉模型训练

计算机视觉获取标记数据成本高，开源项目 lightly-train 用未标记数据自监督预训练，减少标注成本。它易集成、与多模型兼容，能在多场景助研发团队快速训练模型。>阅读原文

Eigent开源，AI Agent步入团战时代

CAMEL - AI开源Eigent，Manus推出类似的Wide Research。Eigent是开源本地部署的AI团队，有清晰架构、超200种MCP工具和容错机制，相比之下调度更好，或推动闭源产品创新。>阅读原文

LLMCloudHunter：开源大模型提取检测规则

以色列本古里安大学发布LLMCloudHunter框架，利用大模型从开源网络威胁情报生成检测规则。评估显示规则精确、召回率高，99.18%能编译成Splunk查询，软件已开源。>阅读原文

算法论文

团队升级架构，实现智能体React框架

作者团队基于大模型领域场景开发经历多阶段，现设计架构升级，选用层级指挥模式的React框架，实现单智能体工具调用反思规划，后续迭代多智能体协作，还会考虑上下文管理等工作。>阅读原文

浙大团队：GUI - G²显著提升GUI智能体定位性能

浙大团队唐飞、沈永亮等：现有 GUI Grounding 方法有缺陷，提出 GUI - G²新方案，将 GUI 元素建模为二维高斯分布，在三个基准测试中性能提升显著，证明科学空间建模机制有效。>阅读原文

伯克利GEPA架构：碾压传统RL优化LLM

UC Berkeley等机构论文提出GEPA优化器，将LLM执行轨迹转化为诊断信号。它用语言反馈替代标量奖励，计算量仅为传统方法1/35，性能最高提升19%，为AI系统优化开辟新范式。>阅读原文

图灵奖得主Sutton：强化学习或媲美深度强化学习

图灵奖得主Sutton称LLM靠「模仿人类」难创新，未来AI应从经验中学习，即强化学习。他将SwiftTD拓展到控制领域提出Swift - Sarsa，结合预处理或媲美深度强化学习。>阅读原文

阿里与南开发布视频大模型创新压缩法

阿里通义实验室与南开大学联合发布LLaVA - Scissor创新压缩方法，其核心SCC算法结合两步时空压缩策略，实验表明在多视频理解基准测试中，性能优于其他方法，低token保留率下优势明显。>阅读原文

ACL 2025 论文揭秘 LLM 对齐脆弱根源

ACL 2025 最佳论文揭示，预训练大模型有'抗对齐'的 Elasticity 现象。提出并量化该概念，包含 Resistance 和 Rebound 两大现象，用'压缩理论'刻画对齐，实验验证了正向对齐难、回弹与模型规模等正相关。>阅读原文

自进化Agents技术综述：迈向人工超级智能

研究者关注自进化Agents系统，因其能为人工超级智能铺路。文章围绕'什么要进化''何时进化''如何进化'回顾研究进展，为从静态模型到动态智能体系统发展提供指导。>阅读原文

谷歌CISC破LLM推理计算瓶颈

谷歌团队提出CISC，在自洽性解码基础上增加自我评估步骤，平均减少46%计算成本。研究表明LLM有同问题内自评估能力，且与人类评估对齐。>阅读原文

上海大学3D - R1：提升三维视觉语言推理

上海大学团队提出3D - R1模型，依赖Scene - 30K数据集和强化学习策略，在多任务三维理解表现领先，但合成数据、缺乏过程反馈和视角策略不灵活等问题待解决。>阅读原文

bash 复制代码

    </p>

官网：www.AiReadingHub.com