快讯|DeepSeek Engram论文详解存算分离,华为SWE-Lego开源轻量级代码智能体全栈方案,

🐾 具身智能赛道,架构革新、巨头合纵、芯片突围的戏码接连上演,热度从没降过,好了,让我们直接发车。

📜政策风向

1. 八部门联合发文,养老服务机器人获明确政策支持

民政部、工信部等八部门联合印发《关于培育养老服务经营主体 促进银发经济发展的若干措施》。文件明确,要加大养老服务机器人研发力度,并推进人形机器人、健康监测等产品在家庭、社区等场景的规模化应用。这意味着,一个需求明确、受人口结构支撑的庞大市场,获得了国家层面的清晰政策指引。它为机器人技术从实验室走向真实、复杂的生活场景提供了宝贵的"练兵场"。

据悉,行业内在该场景的探索已开始落地,例如灵心巧手 正与合作伙伴在养老机构中,共同实验基于智能轮椅平台集成其Linker Hand灵巧手的组合方案,以测试在辅助老人抓取物品、进行简单交互等场景下的实际表现。这类前沿探索,正是响应政策号召、将尖端技术转化为切实照护能力的具体实践。

🌟 重磅速递

2. DeepSeek抛出Engram"记忆外挂",大模型架构战开打新维度

就在这两天,DeepSeek和北大联合发布的论文,把一个叫 Engram(记忆印迹) 的新模块推到了聚光灯下。这玩意儿想解决的事儿挺本质:大模型处理"戴安娜王妃"这种事实知识,为啥还得劳师动众动用好几层网络去"推理"?

Engram的思路是"存算分离 ",专门造个"外置知识硬盘"来存静态知识,模型推理部分(MoE)就专注干复杂的逻辑活儿。需要的时候,直接用哈希"查表",又快又省。实测下来,挂载千亿参数知识库到CPU内存,对GPU推理速度的影响不到3% 。这可不只是小优化,这是动底层架构的刀子。如果传闻2月发布的V4用上它,那竞争的焦点可就从"谁参数大"转向"谁架构更聪明"了。看来,拼完算力之后,真正的效率战争刚刚打响。

3. 苹果谷歌"复合",OpenAI移动端入口遭遇重击

北京时间的深夜,苹果和谷歌抛出了一枚重磅炸弹:双方达成多年深度合作,谷歌Gemini将成为下一代苹果基础模型和Siri的云脑核心

这远不止是给Siri接个API那么简单,是Gemini要住进苹果AI的"地基"里。对比两年前苹果和OpenAI的高调牵手,这次OpenAI的彻底"出局"显得格外扎眼。背后逻辑其实很商业:面对一个亿级用户的"算力吞金兽",拥有从芯片到数据中心全栈能力的谷歌,比起依赖微软云的OpenAI,是更稳妥的基建伙伴;同时,OpenAI自己搞硬件的动作,估计也让苹果嗅到了竞争的味道。这笔交易重新划定了移动AI的势力范围,也告诉我们,巨头游戏里,没有永恒的盟友,只有对"入口"和"地基"的永恒争夺

🔧 产业脉动

4. 英特尔1.8nm芯片量产,给"混合AI"与端侧智能添了把猛火

英特尔在CES上终于亮出了基于 Intel 18A(1.8纳米级)工艺 的第三代酷睿Ultra处理器(Panther Lake)。这不只是一次制程迭代,更是其RibbonFET晶体管和PowerVia背面供电 两大赌注性技术的成功量产。性能数据很猛,多线程提升60%,整机AI算力更是堆到了180 TOPS

英特尔喊出的"混合AI"口号,目标很明确:把更多AI推理从昂贵、有延迟的云端,拽回你的个人设备上来。这对于那些需要快速响应、注重隐私的具身智能和机器人应用来说,意味着本地的"小脑"可以更强大、决策更迅捷。芯片底层的突破,正在为上层应用的爆发铺设硬件跑道。

5. Meta启动"Meta Compute"计划:算力军备竞赛进入"能源绑定"新阶段

扎克伯格宣布了"Meta Compute"计划,目标直指在2030年前自建数十吉瓦(GW)级别 的算力基础设施。配套动作更值得玩味:锁定6.6 GW的核电 供应。这传递的信号再清晰不过:顶尖科技公司判断,未来AI发展的终极瓶颈,将不再是算法或模型设计,而是最基础的电力与计算基础设施。这场军备竞赛已经进入了"能源绑定"的新维度,谁掌握了稳定、巨量的"燃料",谁才有资格跑完下一场马拉松。

6. 华为开源"代码智能体"秘籍,轻量化路线挑战复杂训练范式

华为开源了软件工程智能体 SWE-Lego ,它证明了一条不太一样的路:仅用监督微调(SFT) ,加上高质量数据和精巧的训练技巧(如步骤级错误掩码、课程学习),就能在代码任务上达到顶尖水平,无需昂贵复杂的强化学习(RL)。这等于给行业,特别是中小团队,递上了一本"降本增效"的实战手册,把基础功夫做扎实同样能出奇效,降低了AGI智能体的研发门槛。

🎙️ 人物声音

7. 王小川交卷:百川医疗大模型夺冠,手握30亿瞄准严肃医疗

沉寂一段时间的王小川,带着百川智能的医疗大模型 Baichuan-M3 重回视野,并在权威评测中取得了领先成绩。他明确公司已彻底转向严肃医疗赛道,并透露账上仍有30亿资金 ,可能于2027年启动IPO。在通用模型公司扎堆上市的喧嚣后,百川选择深耕医疗这条"重"赛道。它的探索,将成为检验大模型在高专业度、高合规性垂直领域究竟能创造多大商业价值的试金石。


(本资讯由AI猫站长精选自公开信息,仅供参考,不构成任何投资建议。热潮之下,不妨多看看那些在为技术"夯地基"、为应用"找场景"的公司。喵~)

相关推荐
红头辣椒2 小时前
AI赋能全流程,重塑需求管理新生态——Visual RM需求数智化平台核心能力解析
人工智能·设计模式·软件工程·需求分析·用户运营
东方佑2 小时前
思维自指:LLM推理架构的维度突破与意识雏形
人工智能·架构
CoookeCola2 小时前
从人脸检测到音频偏移:基于SyncNet的音视频偏移计算与人脸轨迹追踪技术解析
数据仓库·人工智能·目标检测·计算机视觉·数据挖掘
keven-wang2 小时前
嵌入式-POCO C++开源库
开发语言·c++·开源·poco
linmoo19862 小时前
Langchain4j 系列之二十一 - Language Models
人工智能·语言模型·自然语言处理·langchain·指令微调·langchain4j·languagemodel
ai_top_trends2 小时前
2026 年 AI 生成 PPT 工具推荐清单:测评后给出的答案
人工智能·python·powerpoint
程序新视界2 小时前
“提供溢出的情绪价值”是AI产品极具可能性的方向
人工智能·后端·产品
努力犯错2 小时前
GLM-Image:首个开源工业级自回归图像生成模型完全指南
机器学习·数据挖掘·回归·开源
xixixi777772 小时前
AGI-Next前沿峰会——对于唐杰教授提到的AI下一步方向的“两条思路一次取舍”的思考(思路分析+通俗易懂解释)
人工智能·ai·大模型·agi·通用人工智能·asi