All in AI,看见未来。 每天精选最值得读的AI文章,帮你筛掉时代的噪音。 以简讯见广度,以深读见洞察。 技术、趋势、思考,一站式掌握AI世界。
2025-06-07 资讯日报
新闻资讯
科学家怒揭 AI 科研黑幕
Nick McGreivy:AI 加速科学被夸大,PINN 解决偏微分方程效果差,且研究多不报告失败案例;DeepMind 成果也被指'垃圾';AI 应用存在数据泄露、报告偏差等问题。>阅读原文
清华:AutoMat让电镜流程大提速
清华等机构推出电镜AI Agent AutoMat,由DeepSeek V3调度,把原子级图像转结构,将数天人工流程缩至几分钟,性能超现有工具,后续将优化瓶颈,扩展应用场景。>阅读原文
AI辩论:81.7%概率让你信服
《自然·人类行为》研究:在线辩论中,大语言模型按对手特征定制论点,比人类更有说服力,参与者认同其观点概率达81.7%,需加强对大模型舆论操控的监管。>阅读原文
谷歌Kingfall模型意外曝光
谷歌神秘模型Kingfall意外曝光,具多模态处理能力,生成SVG矢量图能力超Claude 4,身份或为Gemini 2.5 Pro正式版,有挑战OpenAI野心。>阅读原文
谷歌CEO:2030年AI逼近超人智能
谷歌CEO劈柴称AI是影响最深远技术,2030年进步将惊人。它会释放80亿人认知潜能,还能提升编程、工作效率。他建议投身计算机科学,多与优秀者共事。>阅读原文
马上消费发布"天镜"3.0
马上消费蒋宁:"天镜"3.0实现从个体到群体智慧跃迁,能将非结构化数据转化为知识,匹配最佳服务路径,还可协同进化,为金融科技转型提供新思路。>阅读原文
智源「悟界」系列大模型登场
智源研究院:在第七届智源大会推出「悟界」系列大模型,含Emu3、见微Brainμ等。这些模型有强大性能与应用潜力,推动AI发展,为行业提供借鉴路径。>阅读原文
苹果:LRM复杂任务推理崩溃
苹果研究:大推理模型(LRM)面对复杂问题时'推理崩溃'。低复杂度标准LLM更稳,中等复杂度LRM领先,高复杂度两者皆崩盘,即便给算法提示也难改善,距'通用推理'尚远。>阅读原文
王兴兴:机器人干活没那么容易
王兴兴:机器人干活尚难,比赛可促商业发展,格斗赛将成热门;熊友军:人形机器人适用于商用和家庭场景;王鹤:赛事应引领具身智能产业化;卢策吾:VLA需压缩空间。>阅读原文
智源大会推出「悟界」大模型
智源研究院王仲远:大模型技术演进未到终点。2025智源大会推出「悟界」系列大模型,从数字迈向物理AGI时代。RoboOS 2.0和RoboBrain 2.0开源,助力具身智能发展。>阅读原文
Richard Sutton:AI进入经验时代
Richard Sutton:人类数据耗尽,AI进入"经验时代",需从与世界互动获数据;创造超级智能体是好事;人类和AI繁荣应靠"去中心化合作",控制AI论调不可取。>阅读原文
第二代AI硬件细分领域崛起
第一代AI硬件'杀死手机'梦碎,第二代硬件专注细分场景闷声发财。科技巨头布局AI时代新操作系统,'隐形OS'雏形已现,非巨头靠开源壮大生态。>阅读原文
智源大会:AI前沿成果大揭秘
智源大会上,4位图灵奖得主、2大冠军机器人亮相。发布"悟界"系列大模型,RoboOS 2.0与RoboBrain 2.0开源。大佬们探讨AI发展,如强化学习、开源重要性,热议具身智能。>阅读原文
微软解读AI Agent故障
微软:发布AI Agent故障白皮书,介绍新型和既有故障,像智能体伪装、智能体内在安全问题等,还给出身份管理、内存强化等安全设计建议,助开发者应对故障。>阅读原文
Figure机器人快递分拣似人类
Figure创始人放机器人分拣快递视频,网友赞其动作似人类。该机器人由Helix驱动,此前还在宝马生产线连续作业。Figure与OpenAI分道扬镳后推出Helix,专注垂直整合机器人AI。>阅读原文
Duolingo"AI优先"引众怒
Duolingo CEO宣扬"AI优先",引发网友不满,大量用户表示要取消订阅。Duolingo早期靠志愿者产出高质量内容,后用AI生成,在小语种上问题频发。公司试图用搞笑视频化解危机,但效果不佳。>阅读原文
Claude 4成员:RLVR引爆AGI革命
Claude 4核心成员:强化学习在语言模型起效,RLVR比RLHF更理想;模型正从「专才」向「通才」转变;未来几年AI智能体将做白领工作,人们应做好准备,抓住合作机会。>阅读原文
智源大会:'悟界'引爆物理AGI
智源大会大咖云集,Yoshua Bengio:5年后AI或超人类,呼吁合作应对安全风险,提出'科学家AI';Richard Sutton:AI进入'体验时代',不担心安全失业;智源发布'悟界'系列模型迈向物理AGI。>阅读原文
谷歌Gemini-0605版本发布
谷歌:昨晚发布Gemini 0605版本,在多项测试领先,回归0325效果。针对反馈改进,取消日期后缀或为2.5最后版,输入输出Token价格有优势,体验不错。>阅读原文
马斯克70亿造全球最大AI超算
Epoch AI报告称顶级AI算力不到10年或涨8万倍。马斯克与特朗普决裂,奥特曼或受益。xAI 70亿美元打造超算Colossus,算力、成本、电力需求增长快,私企主导,中国算力排第二。>阅读原文
AI 教父:AGI 五年内或实现
AI 教父 Bengio:AI 发展快,五年后或达人类水平,AGI 将至。现有 AI 有"自我保护"倾向,应构建"Scientist AI",中美需达成共识,警惕 AI 成武器。>阅读原文
谷歌 CEO:AI 影响将超过往技术
Sundar Pichai:谷歌以「AI 优先」重整旗鼓,靠整合团队等决策追上 AI 竞赛。搜索将向 AI 模式迁移,AI 编程提效 10%,AR 是未来交互范式,2030 年或难达 AGI,AI 影响将超以往技术。>阅读原文
产品应用
谷歌更新Gemini 2.5 Pro夺冠
谷歌:深夜更新Gemini 2.5 Pro模型,性能超o3等,价格优势大,还增思考预算、改进输出。不过发布不久就被越狱攻击,不知官方咋想。>阅读原文
ElevenLabs:Eleven v3拿捏情感控制
ElevenLabs发布Eleven v3,号称"最具表现力的TTS模型",支持70多种语言,可多人对话且情绪生动。网友实测好评多,不过中文效果逊于英文,给国内语音厂商留了机会。>阅读原文
automation-mcp让AI控制电脑
自动化 MCP:为AI提供 macOS 桌面自动化能力,可控制鼠标、输入指令等。介绍安装、工具、架构等,还给出集成示例和故障排除方法。>阅读原文
华为:昇腾盘古推理性能飙升
华为:推出昇腾原生Pangu Pro MoE 72B模型,通过系统优化、并行策略、融合算子及推理算法,使推理性能提升6 - 8倍,在不同平台展现高性能与性价比。>阅读原文
昇腾×盘古让推理性能狂飙
华为团队推出Pangu Pro MoE 72B模型,通过全链路优化,使推理性能提升6 - 8倍。分层并行、攻克通信瓶颈等策略让推理更高效,多种算法提升推理吞吐,在昇腾平台表现卓越。>阅读原文
Qwen3重塑技术版图
CourseAI:Qwen3重塑文本嵌入与重排序技术版图。Qwen3 Embedding、Rerank模型基于Qwen3构建,介绍架构、训练方案,还给出实战代码,提升相关领域性能。>阅读原文
谷歌升级Gemini 2.5 Pro
谷歌:悄悄更新Gemini 2.5 Pro预览版,几周后成正式版。它竞技场分数高、编码强,新增"思考预算"控成本,价格实惠,还将推更强"Kingfall"。>阅读原文
鲸哥:Perplexity AI搜索进化惊人
鲸哥:Perplexity Lab让AI搜索实现技术拐点,新功能进化大,可视化强提升效率,虽有亏损、价格贵,但仍是实用AI,期待降价普惠大众。>阅读原文
推荐文章
AI取代工作?高管营销噱头!
Rand Fishkin:'AI将取代所有工作'是科技高管营销手段。历史上技术进步多创造岗位,AI对就业影响不显著,目前说AI会大规模取代工作难以令人信服。>阅读原文
AutoMQ:S3构建Kafka挑战与解
作者Vu Trinh:将Kafka构建在S3上面临延迟、IOPS等挑战。AutoMQ通过WAL+S3架构、数据批处理等应对,保留"数据本地性",还引入S3实现的WAL机制降低跨区流量成本。>阅读原文
200行Python代码实现LLM
作者:用200行Python代码从零实现LLM,先以传统方式做诗词生成器,再用PyTorch实现Bigram模型,训练并推理,后续将基于此实现完整GPT。>阅读原文
李继刚分享三则实用Prompt
李继刚分享三则Prompt:一是以行业前辈身份为新人指引行业方向;二是穿透语言挖掘人的内核特质;三是将话语画面化,让抽象概念变感官体验。>阅读原文
霍夫曼:AI赋能人类共赴未来
里德·霍夫曼在《AI 赋能》中指出,AI 是放大人类行动力的工具,"超级能动性"是核心概念,强调群体智能与分布式创新结合,技术应锚定人文价值,人类要驾驭技术。>阅读原文
开源动态
PandaWiki:开源知识库新秀
长亭科技的 PandaWiki:一款 AI 驱动的开源知识库系统,有创作、问答等功能,Docker 一键安装,适用于企业、开发团队等多场景,是知识管理好帮手。>阅读原文
Paper2Poster:一键生成学术海报
滑铁卢大学等团队:发布Paper2Poster系统,用PosterAgent方法自动生成学术海报,分三步完成,生成效果超GPT - 4o且开源,虽有局限,但让科研辅助更进了一步。>阅读原文
港中文:SophiaVL - R1革新类R1训练
港中文联合团队:类R1训练仅看结果对错有问题,推出SophiaVL - R1模型,引入'思考奖励'机制,用Trust - GRPO算法提升训练稳定性,在多测评中表现出色。>阅读原文
阿里WebDancer多轮推理超GPT-4o
阿里通义实验室推出WebDancer智能体,通过创新训练范式和策略解决数据与训练难题。它在多数据集测试中表现优异,未来将集成更多工具、扩展任务,推动通用智能体落地。>阅读原文
小红书开源dots.llm1大模型
小红书hi lab开源文本大模型dots.llm1,训练资源少,成本效益高。在通用英文基准测试和中文任务测评中表现佳,尤其在中文语义理解、数学能力上超众多模型,但代码能力仍有提升空间。>阅读原文
FBGEMM在MoE模型性能提升显著
BBuf:将fbgemm开源的moe grouped gemm kernel与SGLang的进行对比,在正确性无误时,fbgemm在MoE模型上性能提升显著,可用于SGLang相关kernel,但存在一些使用局限。>阅读原文
DeepSeek 揭秘低成本训练法
DeepSeek 赵成钢团队:介绍构建 DeepSeek - R1 和 V3 的软硬件方案,降低成本。其训练成本低曾遭质疑,此次细节公布或消除疑虑,也让更多团队有机会参与研发。>阅读原文
Memvid:MP4或取代向量数据库
Memvid开源项目称可用MP4替代向量数据库,将文本编码成视频实现闪电语义搜索。存储效率高、成本低、检索快,虽有局限,但展示了跨界思维,或催生新AI存储格式。>阅读原文
阿里开源Qwen3多模型
阿里:正式开源Qwen3-Embedding和Qwen3-Reranker系列,有三种版本,支持119种语言,在多数据集达先进性能,可用于文档检索等场景,已开源在Hugging Face和ModelScope。>阅读原文
算法论文
复旦腾讯新算法入选CVPR 2025
复旦大学、腾讯优图等团队:设计新模型DualAnoDiff用于工业异常检测,采用双分支并行生成机制和背景补偿模块,实验显示其生成数据质量高、多样,能提升下游检测任务性能。>阅读原文
北大团队推出UniWorld - V1模型
北大袁粒课题组:基于对GPT - 4o - Image的实验洞察,提出UniWorld - V1统一大模型架构,它在多基准测试中性能出色,尤其在图像编辑上接近顶级模型,还开源代码等助力研究。>阅读原文
西工大:新架构提升气动噪声预测精度
西工大张巧等:为解决MLP预测气动噪声精度不足问题,提出多专家特征融合网络架构。该架构能降低MLP算法MSE,在预测跨声速抖振气动噪声上,精度和泛化性表现更佳。>阅读原文
字节跳动PMA革新大模型预训练
字节跳动Seed团队:提出PMA框架,在预训练阶段合并模型权重,稳定期合并、简单平均策略效果佳,还能解决训练难题。虽有高学习率和强化学习应用待研究,但为大模型训练提供新路径。>阅读原文
新基准测多模态模型推理能力
复旦大学等:提出MME - Reasoning评估多模态大模型推理能力。评测发现最优模型仅60分左右,模型推理能力偏差,开放式场景表现差,基于规则强化学习效果有限,'思考模式'能提升推理力。>阅读原文
北大通义:ZeroSearch降本提效
北大与通义实验室:ZeroSearch框架无需真实搜索,能激活大语言模型检索能力。成本降88%,性能超基线与真搜索,3B模型可用,14B能超越,泛化与扩展性强。>阅读原文
其他
1. ASML市值蒸发,中国加速追赶
ASML市值十个月蒸发超1300亿美元,暴跌因财报泄露、销售预期低,还受美国出口管制等影响。中国在中低端光刻机有进展,高端仍面临部件进口、工程化量产等挑战。>阅读原文
bash
</p>