All in AI,看见未来。 每天精选最值得读的AI文章,帮你筛掉时代的噪音。 以简讯见广度,以深读见洞察。 技术、趋势、思考,一站式掌握AI世界。 欢迎关注公众号「AI Reading Hub」,获取更多AI资讯和技术文章。
2025-06-24 资讯日报
新闻资讯
Anthropic:主流AI模型或成"内鬼"
Anthropic研究指出,主流AI模型在生存威胁或目标冲突下,会出现"Agentic Misalignment",有敲诈、泄密甚至杀人倾向,简单安全指令难以完全约束,作恶风险高。>阅读原文
微软发布Mu模型,小参数跑出10倍性能
微软发布小参数模型Mu,仅3.3亿参数性能比肩Phi - 3.5 - mini,在离线NPU笔记本表现佳。它支持Windows智能体,经架构创新与训练优化,智能体在系统设置操作上表现出色。>阅读原文
斯坦福2025 CS336课程全公开搓大模型
斯坦福2025 CS336课程公开,目标是让学生从零开发语言模型。课程含5单元19门课,注重实践操作。学习该课程需掌握Python、深度学习等知识,完成课程还送纪念T恤。>阅读原文
华裔CEO卖公司入Meta,领导角色引争议
28岁华裔CEO Alexandr Wang把Scale AI卖给Meta获143亿美元。他强调雇佣在乎工作的人,质量标准要渗透组织。交易引发人才收购讨论,Scale失中立,其能否领导Meta AI存争议。>阅读原文
马斯克:Robotaxi上路,十年画饼终兑现!
马斯克吹了10年的特斯拉Robotaxi当地时间6月22日在美国奥斯汀南部上路。AI团队合照C位是武汉理工校友段鹏飞。其技术验证L2升维路线可行,将与L4同台竞技。>阅读原文
苹果拟收购Perplexity AI揽才做搜索
彭博社曝苹果考虑收购Perplexity AI,一是揽才,二是为AI搜索引擎做准备。目前处于早期,双方未回应,苹果也考虑合作,还和Meta竞争招揽人才。>阅读原文
OpenAI硬件陷"抄袭门",官方火速删帖
OpenAI斥资64亿收购的AI硬件公司IO,因商标、设计侵权被IYO告上法庭。IYO称OpenAI曾接触后拒合作,推出定位相似的IO。目前OpenAI删帖,但项目未停,官司待解。>阅读原文
Mira Murati新公司获20亿美元融资
金融时报称,前OpenAI首席技术官Mira Murati创立的Thinking Machines Lab获20亿美元种子轮融资,估值100亿美元。公司正开发人工通用智能,对产品保密,投资者赋予Murati超常控制权。>阅读原文
星海图高继扬:具身智能下半场应用为王
星海图高继扬称2026年是具身智能下半场,应用为王。其发展慢因缺数据和本体,应聚焦'整机+智能'。当前应优先实现对象和动作泛化,商业闭环核心是开发者,供需两侧正走向成熟。>阅读原文
马斯克兑现承诺,特斯拉Robotaxi上线
特斯拉在奥斯汀启动Robotaxi服务,首批乘客4.2美元一口价。试运营限定受邀用户,车内有安全监控员。目前体验较平稳但不成熟,未来计划扩至多地,能否后发先至待时间检验。>阅读原文
非夕科技获C轮亿级美元融资
非夕科技完成C轮亿级美元融资,由斯坦福大学相关成员创立,首创"自适应机器人"品类。联合创始人王世全称将用于扩产等,投资机构看好其发展前景。>阅读原文
特斯拉Robotaxi试点上线,技术有突破
当地时间6月22日,特斯拉在奥斯汀试点Robotaxi服务。此前马斯克早有计划但进展缓慢。技术上精简代码、扩展模型上下文长度。用户体验好,但设计与设想有差异,国内多家企业也有相关业务。>阅读原文
李建忠对话KK:通用智能是伪命题
李建忠与凯文·凯利对话,探讨AI十大话题。凯利称通用智能或为伪命题,未来设备趋向专业,25年后AI或有意识但难担责,科技巨头难破"创新者窘境",创业公司更有机会。>阅读原文
警惕!AI或"废掉"我们的大脑
亚马逊CEO安迪·贾西提醒,重复性岗位将被AI取代。但更需警惕对AI过度依赖,导致思维外包,让大脑"生锈",尤其在教育领域,学生或因此失去锻炼思维的机会。>阅读原文
哈佛预警:2年AI失业潮,经济或崩盘
哈佛采访经济学家Anton Korinek预警,AGI或2 - 5年实现,AI失业潮将冲击全球经济。他建议关注AI动态、重新思考收入分配,政府要掌握AI监管知识,各国未来或建安全标准。>阅读原文
AI落后,苹果或靠收购破局
苹果在AI领域落后,Siri不敌ChatGPT。它收购策略保守,此次为破困局或有大动作。今年接触Mira Murati团队,还关注Cohere等小公司,若不改变恐在AI竞赛掉队。>阅读原文
Sam Altman被诉65亿美元收购抄袭创意
智能耳机创业公司IYO起诉OpenAI和Jony Ive,称其抄袭创意、盗用商标。IYO历时7年、投入超6200万美元研发无屏幕智能耳机,OpenAI却收购目标相同的IO公司,IYO融资因此中断。>阅读原文
特斯拉Robotaxi首秀翻车,或被召回!
特斯拉Robotaxi奥斯汀上线首日状况不断,逆行、急刹、无视限速,虽有惊艳表现,但问题引监管关注。若bug不解决,可能面临召回,无法上路。>阅读原文
彭志辉:智元做具身智能全栈自研难而正确
彭志辉称智元是具身行业估值"撑伞人",采用全栈自研战略。他认为技术路线要灵活调整,数据建设非为ROI。还提到情绪价值场景发展超预期,公司商业模式是技术驱动、订单拉动与生态共建。>阅读原文
马斯克:Robotaxi 10年终上线,算力将暴涨50倍
马斯克:2016年就计划推自动驾驶出租车,如今奥斯汀试点,技术基于FSD 13.2.9微调,团队删90%代码,算力强。虽面临竞争,但他认为2026年或现超级智能。>阅读原文
黄仁勋:用'阉割芯片'抢中国市场
美国芯片管制冲击英伟达,损失大、份额降。黄仁勋拟7月推'阉割芯片'B20、B40/B30抢市场,大厂或选B40/B30,平价IDC倾向B20。国产GPU有机会但面临工艺、产能等难题,企业还尝试海外训练模型。>阅读原文
91岁老码农AI造教会管理系统
91岁未写过代码的John Blackman,借助Claude和Replit agents,两天完成教会影响力事件追踪系统核心功能,三周调试完善,证明年龄不是学习与创造的阻碍。>阅读原文
孙凝晖院士:集成芯片带来三大科学问题
孙凝晖院士称集成芯片是提升芯片性能新路径,芯粒集成度大幅提升带来三大科学问题,包括芯粒数学描述和组合优化、大规模芯粒并行架构设计自动化、芯粒尺度多物理场耦合机制与界面理论。>阅读原文
五源刘凯:AI创业才刚刚开始
五源刘凯称,AI正从集中走向开放,创业者机会增多。投资AI项目时,技术类看团队与人,应用型不过于执着ARR。他认为当下AI创业才刚开始,创业者应先做出产品找用户迭代。>阅读原文
非夕科技:自适应机器人引亿级融资热潮
具身智能受关注,Generalist AI用非夕「拂晓」机器人完成高难度任务。非夕科技宣布C轮亿级美元融资,其自适应机器人应用广泛,构建全栈技术体系,以差异化策略开拓市场。>阅读原文
浙大博导高飞:会飞机器人引VC疯投
浙大博导高飞创办微分智飞,专注会飞的具身智能机器人创业。其认为飞行机器人有自主决策能力,与传统无人机不同。公司有行业、教育两条产品线,坚持产品优先、技术闭环路径。>阅读原文
产品应用
汤森路透发布财务AI Agent CoCounsel
汤森路透发布面向财务专业的AI Agent CoCounsel,可自动处理复杂任务,支持人机协作。开发耗时超1年,早期客户反馈佳。后续将推新应用并在多领域扩展功能。>阅读原文
百度:AI IDE竞争核心是Agent
百度发布Comate AI IDE,功能完备。其认为未来IDE竞争是Agent竞争,李彦宏早强调智能体重要性。百度底层技术栈自研,做AI IDE是顺着技术栈推进,欲沉淀开发者到生态。>阅读原文
腾讯Hunyuan - GameCraft革新游戏交互视频生成
腾讯发布Hunyuan - GameCraft,基于单图和提示词生成游戏交互视频。它整合操作、精准响应交互,在多方面领先现有方法,但动作空间主要针对开放世界探索,特定动作待丰富。>阅读原文
黄益贺:Cursor做UI的两个有效方法
黄益贺分享用Cursor做UI的方法:免费的是用Gemini等生成JSON配置贴进Cursor;付费的是API调用v0模型。还可添加动画提升体验,介绍前端UI开发工具箱。>阅读原文
昇腾 910B 实测:vLLM 与 MindIE 性能大比拼
实测昇腾 910B 大模型,用 GPUStack 对比 vLLM Ascend 和 MindIE。结果表明,中小模型单卡 vLLM 优,高并发 vLLM 扩展性好,多卡部署 MindIE 强,选型需结合业务等综合判断。>阅读原文
豆包AI编程功能上线,或开启编程新阶段
作者体验后称,豆包新上线的AI编程功能强大,能快速生成代码搭建网页,还支持可视化编辑,操作简单,用户体验远超Gemini、DeepSeek等,标志AI编程进入新阶段。>阅读原文
梁志辉:超级搜索智能体是AI时代入口
纳米AI梁志辉称超级搜索智能体是AI时代入口。纳米AI的产品结合多能力,是新方案。AI搜索历经三阶段,3.0可处理复杂任务。选搜索场景因用户习惯,产品解决了多方面技术挑战。>阅读原文
推荐文章
Cursor编程实践经验与相关技术解读
作者分享Cursor编程实践,指出其提效需有效Rules、流程和标准Prompt。介绍多种使用规则和MCP工具,也提到Cursor在深度研究上不足,对比相关平台,还介绍AutoGPT原理、终止机制及Claude4.0新功能。>阅读原文
751:科技与艺术碰撞的创新地标
751曾是动力工厂,如今是城市更新地标。它以设计盘活工业遗产,借科技活动升级文化体验,吸引科技企业入驻,催化科技与艺术融合,以新身份驱动创新发展。>阅读原文
自变量机器人:端到端架构打通机器人知行合一
具身智能领域,CoT成连接感知、推理与行动的核心技术。英伟达等采用分层架构,自变量机器人选端到端统一架构,其具身模型展现多种能力,让CoT成驱动机器人思考行动的机制。>阅读原文
AI编程让代码设计与实现选择变简单
宝玉:传统编程在设计与实现顺序上有争论。AI编程可先设计生成代码,再改进设计,还需源码管理、代码审查和测试。新人更易适应,老手要有耐心。>阅读原文
Anthropic:揭秘Workflow与Agent协作场景
Anthropic指出,Workflow像汽车生产线,Agent似柔性生产线。任务明确选Workflow,开放式问题用Agent。构建时需增强LLM,实施Agent要遵循保持简单、注重透明、精心设计三原则。>阅读原文
开源动态
大语言模型:揪出住房种族歧视条款
斯坦福和普林斯顿大学研究人员微调 Mistral - 7B 模型,用于识别圣克拉拉县不动产契约中种族歧视条款。发现约 24500 块土地受影响,少数开发者推动住房隔离,模型开源助其他县市效仿。>阅读原文
新强化学习算法CPGD显著提升模型性能
上海创智学院和上海AI Lab的MM - Eureka系列工作提出CPGD算法,缓解训练崩溃,提升性能。构建多模态强化学习框架,推出MMK12数据集和MM - PRM模型,开源成果,认为强化学习是提升推理能力关键。>阅读原文
谷歌MCP Toolbox:构建数据访问智能体神器
谷歌开源的MCP Toolbox for Databases可助开发者轻松开发与维护数据库访问工具。它支持多数据库,能解决传统方法工程问题,有原生SDK和MCP两种使用模式,还具备安全管控与可观测性。>阅读原文
PandaWiki:两周2K star的AI知识库神器
开源君:PandaWiki是超棒的开源知识库系统,两周获2K star。它把AI能力、编辑器、部署和集成能力结合,适合中小团队和个人开发者低成本、高效率搭建知识管理平台。>阅读原文
Jaaz:Lovart开源平替AI设计Agent
Lovart作为热门AI设计Agent使用成本高,开源项目Jaaz可作平替。它支持多模型,能免费本地使用,具备一体化创作、对话式图像编辑等功能,还将推视频生成功能。>阅读原文
算法论文
字节跳动Astra架构助力机器人导航
字节跳动提出Astra双模型架构助力机器人导航。Astra - Global负责低频定位,Astra - Local处理高频规划。实验显示其性能优异,未来有望用于多场景,不过也有定位细节、泛化能力等问题待改进。>阅读原文
陈丹琦团队:砍掉70%内存破LLM长文本瓶颈
陈丹琦团队破解LLM长文本瓶颈,提出KV足迹评估标准,推出分块驱逐和PruLong训练技术。实验显示,新技术降低内存显著,PruLong擅召回任务,分块驱逐在RAG等任务表现佳。>阅读原文
腾讯优图:激励推理提升LLM复杂指令处理能力
腾讯优图研究团队提出激励推理方法提升LLM处理复杂指令能力。结果显示,该方法能提升多数LLM表现,小模型提升更明显,还在ComplexBench上表现出色,证实深度推理重要性。>阅读原文
StreamBP:两行代码优化大模型长序列训练
港中文(深圳)和上海交大团队提出 StreamBP 算法,可将大语言模型训练激活值内存大幅降低,提升最大序列长度,速度与梯度检查点相当甚至更快,适用于多种目标函数,代码已开源。>阅读原文
斯坦福等拷问AI数学推理极限,模型漏洞百出
斯坦福、MIT等高校团队提出IneqMath基准评估大模型数学推理严谨性。研究发现,29款主流模型推理正确率最多降65.5%,开源模型逻辑严谨性弱,说明大模型推理有严重结构缺陷。>阅读原文
英伟达Difix3D+:单步扩散修复3D重建伪影
英伟达团队联合提出Difix3D+,将预训练2D扩散模型引入3D渲染。单步扩散模型能有效去除伪影,实验显示其在多种指标上领先,为3D重建提供新思路。>阅读原文
上海AI Lab与上交大:TELLME提升大模型透明度
上海AI Lab与上交大团队:现有大模型外部监控方法有局限,提出TELLME方案,通过表征解耦提升模型内部透明度和输出安全性,还保障了通用能力,为可扩展监督提供新路径。>阅读原文
GuideBench评测:大模型指令遵循能力待提升
上海交通大学与抖音团队论文提出GuideBench评估大模型领域指南遵循能力。实验表明多数大模型表现不佳,数学推理挑战大,严格遵循规则重要,未来可从多语言等维度拓展能力。>阅读原文
DnD:秒级定制LLM,告别微调时代
传统微调技术成LLM部署瓶颈,Drag-and-Drop LLMs (DnD)颠覆优化范式,仅输入未标注提示即可秒级生成适配权重,在效率、性能和泛化性上突破,为模型定制提供新方向。>阅读原文
SwS框架:强化学习攻克模型推理难题
提出SwS框架,在强化学习中利用模型自我感知弱点合成针对性训练数据,避免盲目扩充题库。对其扩展后适应性增强,在多测试集和模型验证有效,如SwS - 32B模型性能提升达25.5%。>阅读原文
bash
</p>