AI Daily | AI日报：科学家怒揭 AI 科研黑幕; 清华：AutoMat让电镜流程大提速; AI辩论：81.7%概率让你信服

All in AI，看见未来。每天精选最值得读的AI文章，帮你筛掉时代的噪音。以简讯见广度，以深读见洞察。技术、趋势、思考，一站式掌握AI世界。

2025-06-07 资讯日报

新闻资讯

科学家怒揭 AI 科研黑幕

Nick McGreivy：AI 加速科学被夸大，PINN 解决偏微分方程效果差，且研究多不报告失败案例；DeepMind 成果也被指'垃圾'；AI 应用存在数据泄露、报告偏差等问题。>阅读原文

清华：AutoMat让电镜流程大提速

清华等机构推出电镜AI Agent AutoMat，由DeepSeek V3调度，把原子级图像转结构，将数天人工流程缩至几分钟，性能超现有工具，后续将优化瓶颈，扩展应用场景。>阅读原文

AI辩论：81.7%概率让你信服

《自然·人类行为》研究：在线辩论中，大语言模型按对手特征定制论点，比人类更有说服力，参与者认同其观点概率达81.7%，需加强对大模型舆论操控的监管。>阅读原文

谷歌Kingfall模型意外曝光

谷歌神秘模型Kingfall意外曝光，具多模态处理能力，生成SVG矢量图能力超Claude 4，身份或为Gemini 2.5 Pro正式版，有挑战OpenAI野心。>阅读原文

谷歌CEO：2030年AI逼近超人智能

谷歌CEO劈柴称AI是影响最深远技术，2030年进步将惊人。它会释放80亿人认知潜能，还能提升编程、工作效率。他建议投身计算机科学，多与优秀者共事。>阅读原文

马上消费发布"天镜"3.0

马上消费蒋宁："天镜"3.0实现从个体到群体智慧跃迁，能将非结构化数据转化为知识，匹配最佳服务路径，还可协同进化，为金融科技转型提供新思路。>阅读原文

智源「悟界」系列大模型登场

智源研究院：在第七届智源大会推出「悟界」系列大模型，含Emu3、见微Brainμ等。这些模型有强大性能与应用潜力，推动AI发展，为行业提供借鉴路径。>阅读原文

苹果：LRM复杂任务推理崩溃

苹果研究：大推理模型（LRM）面对复杂问题时'推理崩溃'。低复杂度标准LLM更稳，中等复杂度LRM领先，高复杂度两者皆崩盘，即便给算法提示也难改善，距'通用推理'尚远。>阅读原文

王兴兴：机器人干活没那么容易

王兴兴：机器人干活尚难，比赛可促商业发展，格斗赛将成热门；熊友军：人形机器人适用于商用和家庭场景；王鹤：赛事应引领具身智能产业化；卢策吾：VLA需压缩空间。>阅读原文

智源大会推出「悟界」大模型

智源研究院王仲远：大模型技术演进未到终点。2025智源大会推出「悟界」系列大模型，从数字迈向物理AGI时代。RoboOS 2.0和RoboBrain 2.0开源，助力具身智能发展。>阅读原文

Richard Sutton：AI进入经验时代

Richard Sutton：人类数据耗尽，AI进入"经验时代"，需从与世界互动获数据；创造超级智能体是好事；人类和AI繁荣应靠"去中心化合作"，控制AI论调不可取。>阅读原文

第二代AI硬件细分领域崛起

第一代AI硬件'杀死手机'梦碎，第二代硬件专注细分场景闷声发财。科技巨头布局AI时代新操作系统，'隐形OS'雏形已现，非巨头靠开源壮大生态。>阅读原文

智源大会：AI前沿成果大揭秘

智源大会上，4位图灵奖得主、2大冠军机器人亮相。发布"悟界"系列大模型，RoboOS 2.0与RoboBrain 2.0开源。大佬们探讨AI发展，如强化学习、开源重要性，热议具身智能。>阅读原文

微软解读AI Agent故障

微软：发布AI Agent故障白皮书，介绍新型和既有故障，像智能体伪装、智能体内在安全问题等，还给出身份管理、内存强化等安全设计建议，助开发者应对故障。>阅读原文

Figure机器人快递分拣似人类

Figure创始人放机器人分拣快递视频，网友赞其动作似人类。该机器人由Helix驱动，此前还在宝马生产线连续作业。Figure与OpenAI分道扬镳后推出Helix，专注垂直整合机器人AI。>阅读原文

Duolingo"AI优先"引众怒

Duolingo CEO宣扬"AI优先"，引发网友不满，大量用户表示要取消订阅。Duolingo早期靠志愿者产出高质量内容，后用AI生成，在小语种上问题频发。公司试图用搞笑视频化解危机，但效果不佳。>阅读原文

Claude 4成员：RLVR引爆AGI革命

Claude 4核心成员：强化学习在语言模型起效，RLVR比RLHF更理想；模型正从「专才」向「通才」转变；未来几年AI智能体将做白领工作，人们应做好准备，抓住合作机会。>阅读原文

智源大会：'悟界'引爆物理AGI

智源大会大咖云集，Yoshua Bengio：5年后AI或超人类，呼吁合作应对安全风险，提出'科学家AI'；Richard Sutton：AI进入'体验时代'，不担心安全失业；智源发布'悟界'系列模型迈向物理AGI。>阅读原文

谷歌Gemini-0605版本发布

谷歌：昨晚发布Gemini 0605版本，在多项测试领先，回归0325效果。针对反馈改进，取消日期后缀或为2.5最后版，输入输出Token价格有优势，体验不错。>阅读原文

马斯克70亿造全球最大AI超算

Epoch AI报告称顶级AI算力不到10年或涨8万倍。马斯克与特朗普决裂，奥特曼或受益。xAI 70亿美元打造超算Colossus，算力、成本、电力需求增长快，私企主导，中国算力排第二。>阅读原文

AI 教父：AGI 五年内或实现

AI 教父 Bengio：AI 发展快，五年后或达人类水平，AGI 将至。现有 AI 有"自我保护"倾向，应构建"Scientist AI"，中美需达成共识，警惕 AI 成武器。>阅读原文

谷歌 CEO：AI 影响将超过往技术

Sundar Pichai：谷歌以「AI 优先」重整旗鼓，靠整合团队等决策追上 AI 竞赛。搜索将向 AI 模式迁移，AI 编程提效 10%，AR 是未来交互范式，2030 年或难达 AGI，AI 影响将超以往技术。>阅读原文

产品应用

谷歌更新Gemini 2.5 Pro夺冠

谷歌：深夜更新Gemini 2.5 Pro模型，性能超o3等，价格优势大，还增思考预算、改进输出。不过发布不久就被越狱攻击，不知官方咋想。>阅读原文

ElevenLabs：Eleven v3拿捏情感控制

ElevenLabs发布Eleven v3，号称"最具表现力的TTS模型"，支持70多种语言，可多人对话且情绪生动。网友实测好评多，不过中文效果逊于英文，给国内语音厂商留了机会。>阅读原文

automation-mcp让AI控制电脑

自动化 MCP：为AI提供 macOS 桌面自动化能力，可控制鼠标、输入指令等。介绍安装、工具、架构等，还给出集成示例和故障排除方法。>阅读原文

华为：昇腾盘古推理性能飙升

华为：推出昇腾原生Pangu Pro MoE 72B模型，通过系统优化、并行策略、融合算子及推理算法，使推理性能提升6 - 8倍，在不同平台展现高性能与性价比。>阅读原文

昇腾×盘古让推理性能狂飙

华为团队推出Pangu Pro MoE 72B模型，通过全链路优化，使推理性能提升6 - 8倍。分层并行、攻克通信瓶颈等策略让推理更高效，多种算法提升推理吞吐，在昇腾平台表现卓越。>阅读原文

Qwen3重塑技术版图

CourseAI：Qwen3重塑文本嵌入与重排序技术版图。Qwen3 Embedding、Rerank模型基于Qwen3构建，介绍架构、训练方案，还给出实战代码，提升相关领域性能。>阅读原文

谷歌升级Gemini 2.5 Pro

谷歌：悄悄更新Gemini 2.5 Pro预览版，几周后成正式版。它竞技场分数高、编码强，新增"思考预算"控成本，价格实惠，还将推更强"Kingfall"。>阅读原文

鲸哥：Perplexity AI搜索进化惊人

鲸哥：Perplexity Lab让AI搜索实现技术拐点，新功能进化大，可视化强提升效率，虽有亏损、价格贵，但仍是实用AI，期待降价普惠大众。>阅读原文

开源动态

PandaWiki：开源知识库新秀

长亭科技的 PandaWiki：一款 AI 驱动的开源知识库系统，有创作、问答等功能，Docker 一键安装，适用于企业、开发团队等多场景，是知识管理好帮手。>阅读原文

Paper2Poster：一键生成学术海报

滑铁卢大学等团队：发布Paper2Poster系统，用PosterAgent方法自动生成学术海报，分三步完成，生成效果超GPT - 4o且开源，虽有局限，但让科研辅助更进了一步。>阅读原文

港中文：SophiaVL - R1革新类R1训练

港中文联合团队：类R1训练仅看结果对错有问题，推出SophiaVL - R1模型，引入'思考奖励'机制，用Trust - GRPO算法提升训练稳定性，在多测评中表现出色。>阅读原文

阿里WebDancer多轮推理超GPT-4o

阿里通义实验室推出WebDancer智能体，通过创新训练范式和策略解决数据与训练难题。它在多数据集测试中表现优异，未来将集成更多工具、扩展任务，推动通用智能体落地。>阅读原文

小红书开源dots.llm1大模型

小红书hi lab开源文本大模型dots.llm1，训练资源少，成本效益高。在通用英文基准测试和中文任务测评中表现佳，尤其在中文语义理解、数学能力上超众多模型，但代码能力仍有提升空间。>阅读原文

FBGEMM在MoE模型性能提升显著

BBuf：将fbgemm开源的moe grouped gemm kernel与SGLang的进行对比，在正确性无误时，fbgemm在MoE模型上性能提升显著，可用于SGLang相关kernel，但存在一些使用局限。>阅读原文

DeepSeek 揭秘低成本训练法

DeepSeek 赵成钢团队：介绍构建 DeepSeek - R1 和 V3 的软硬件方案，降低成本。其训练成本低曾遭质疑，此次细节公布或消除疑虑，也让更多团队有机会参与研发。>阅读原文

Memvid：MP4或取代向量数据库

Memvid开源项目称可用MP4替代向量数据库，将文本编码成视频实现闪电语义搜索。存储效率高、成本低、检索快，虽有局限，但展示了跨界思维，或催生新AI存储格式。>阅读原文

阿里开源Qwen3多模型

阿里：正式开源Qwen3-Embedding和Qwen3-Reranker系列，有三种版本，支持119种语言，在多数据集达先进性能，可用于文档检索等场景，已开源在Hugging Face和ModelScope。>阅读原文

算法论文

复旦腾讯新算法入选CVPR 2025

复旦大学、腾讯优图等团队：设计新模型DualAnoDiff用于工业异常检测，采用双分支并行生成机制和背景补偿模块，实验显示其生成数据质量高、多样，能提升下游检测任务性能。>阅读原文

北大团队推出UniWorld - V1模型

北大袁粒课题组：基于对GPT - 4o - Image的实验洞察，提出UniWorld - V1统一大模型架构，它在多基准测试中性能出色，尤其在图像编辑上接近顶级模型，还开源代码等助力研究。>阅读原文

西工大：新架构提升气动噪声预测精度

西工大张巧等：为解决MLP预测气动噪声精度不足问题，提出多专家特征融合网络架构。该架构能降低MLP算法MSE，在预测跨声速抖振气动噪声上，精度和泛化性表现更佳。>阅读原文

字节跳动PMA革新大模型预训练

字节跳动Seed团队：提出PMA框架，在预训练阶段合并模型权重，稳定期合并、简单平均策略效果佳，还能解决训练难题。虽有高学习率和强化学习应用待研究，但为大模型训练提供新路径。>阅读原文

新基准测多模态模型推理能力

复旦大学等：提出MME - Reasoning评估多模态大模型推理能力。评测发现最优模型仅60分左右，模型推理能力偏差，开放式场景表现差，基于规则强化学习效果有限，'思考模式'能提升推理力。>阅读原文

北大通义：ZeroSearch降本提效

北大与通义实验室：ZeroSearch框架无需真实搜索，能激活大语言模型检索能力。成本降88%，性能超基线与真搜索，3B模型可用，14B能超越，泛化与扩展性强。>阅读原文

其他

1. ASML市值蒸发，中国加速追赶

ASML市值十个月蒸发超1300亿美元，暴跌因财报泄露、销售预期低，还受美国出口管制等影响。中国在中低端光刻机有进展，高端仍面临部件进口、工程化量产等挑战。>阅读原文

bash 复制代码

    </p>

官网：www.AiReadingHub.com