技术栈
语言模型
Jump 不二
20 分钟前
人工智能
·
语言模型
·
系统架构
Memory-os 7 层记忆架构深度解析:让 Hermes Agent 真正 “记住并使用“ 知识
久等啦,最近实在是有点忙,好久没更新,今天带新的干货来啦~最近在 Github 上看到一个给 Hermes-Agent 专门做的记忆升级系统 memory-os,三天648星,这个增速还是相当可观的。
龙侠九重天
3 小时前
开发语言
·
人工智能
·
语言模型
·
自然语言处理
·
大模型
·
agent
·
智能体
C# 构建 AI Agent 系统 — 我的实践笔记
📝 写在前面:这是一篇学习日记+实战笔记。我最近在研究如何用 C# 和 .NET 8 从零构建一个 AI Agent 系统。整个过程踩了不少坑,也积累了很多实战经验。于是我把整个学习过程和代码实现记录下来,分享给同样对 C# AI 开发感兴趣的同学。
zhangfeng1133
4 小时前
人工智能
·
深度学习
·
语言模型
·
架构
·
机器人
·
gpu算力
·
芯片
把权重写死在芯片的架构 Taalas(HC1)芯片:车载 GPU / 智能驾驶 / 机器人 / 算力卡适配总结
Taalas 不是通用GPU,是模型硬连线ASIC专用推理芯片(一芯片绑定一个固定大模型,HC1原生固化Llama3.1-8B),细分场景高度适配、全场景无法替代通用车载GPU,分三大场景拆解:
lifallen
5 小时前
人工智能
·
ai
·
语言模型
·
agi
第五章 从 Tool 到 Skill:认知复用如何发生
上一章讨论的是连续性:系统怎样把一次任务里的局部结果、上下文和状态接起来,避免每一轮都从零开始。连续工作一旦真的出现,新的压力很快也会跟着出现。memory 能保存这次发生过什么,却不能自动回答下一次该怎样做。它更像库存,保存的是结果、线索和局部经验;可当同一类任务反复出现时,系统真正想复用的已经不只是某条结论,而是到达结论的方法。
MartinYeung5
5 小时前
人工智能
·
学习
·
语言模型
[论文学习]网路知识产权面临风险:防止大型语言模型未经授权即时检索
核心问题与动机(Core Problems & Motivations)论文直指当前网络生态最迫切的系统性风险:大型语言模型(LLM)具备即时网络检索(real-time retrieval / RAG-like)能力后,悄无声息地大规模「消费」原创网页内容,却未给予内容创作者任何补偿、归属或控制权。
硅谷秋水
19 小时前
人工智能
·
机器学习
·
计算机视觉
·
语言模型
·
机器人
世界模型:架构、方法、推理与应用的综述(下)
26年6月来自Augusta大学、U Georgia、NJIT、哈佛医学院、德州Arlington、James Madison大学、Lehigh 大学、悉尼大学、纽约大学、加州希望之城国家医疗中心和亚利桑那州Mayo诊所的论文“World Models: A Comprehensive Survey of Architectures, Methodologies, Reasoning Paradigms, and Applications”。
硅谷秋水
19 小时前
人工智能
·
机器学习
·
计算机视觉
·
语言模型
世界模型:架构、方法、推理与应用的综述(上)
26年6月来自Augusta大学、U Georgia、NJIT、哈佛医学院、德州Arlington、James Madison大学、Lehigh 大学、悉尼大学、纽约大学、加州希望之城国家医疗中心和亚利桑那州Mayo诊所的论文“World Models: A Comprehensive Survey of Architectures, Methodologies, Reasoning Paradigms, and Applications”。
zhangfeng1133
19 小时前
人工智能
·
深度学习
·
语言模型
·
gpu算力
·
芯片
2021-2026 年全球 传统厂家AI 算力卡 GPU 前沿技术研究报告
由ai生成,内容不一定准确(以下是基于上述三轮审稿意见修改后的完整报告)我已完成三轮审读。以下是详细的审稿意见,随后提供修改后的全文。
温九味闻醉
1 天前
人工智能
·
语言模型
·
自然语言处理
八股-大语言模型基础
zhangfeng1133
1 天前
人工智能
·
语言模型
·
矩阵
·
架构
·
transformer
·
芯片
光驱动的 AI 算力卡,也就是光子计算(Photonic Computing)芯片,用光子(光)代替电子来做矩阵乘法和数据传输
光驱动的 AI 算力卡,也就是**光子计算(Photonic Computing)**芯片,用光子(光)代替电子来做矩阵乘法和数据传输。它的核心优势是:光速传播、零电阻发热、天然并行、能耗极低,理论上能打破电子芯片的"功耗墙"和"内存墙"。
Zlzzz.
1 天前
语言模型
·
tau-bench
Tau2-bench + vLLM本地部署调用
近期在运行 Tau2-bench 进行模型推理基准测试时,发现其 GitHub 仓库的部署文档较为简略,特别是缺少与 vLLM 框架结合进行本地模型部署的详细教程。因此,本文旨在记录并分享在实际部署过程中遇到的典型问题与解决方案,为有类似需求的开发者提供一份实用的踩坑指南。
zhangfeng1133
1 天前
语言模型
·
架构
·
transformer
·
芯片
定制化,面向大语言模型的GPU,Etched 把 Transformer 架构直接“烧“进硅片
您指的应该是 Etched 这家美国公司。它可能是当前硅谷最"极端"的 AI 芯片创业公司——不做通用 GPU,而是把 Transformer 架构直接"烧"进硅片,造出一颗只能跑 Transformer 大模型的 ASIC。
hhzz
1 天前
语言模型
·
多智能体
·
openclaw
OpenClaw中文案例精选:多智能体内容工厂
在内容生产场景中,无论是内容创作者批量产出推文、职场人撰写工作报告,还是企业批量制作产品文案,往往面临“效率低、重复劳动多、质量不稳定”的痛点——从素材收集、主题提炼,到内容撰写、校对排版,每个环节都需要手动干预,耗时耗力且易出错。而 OpenClaw 作为开源本地优先的 AI 智能体框架,其强大的多智能体协作能力,恰好能解决这一核心痛点,帮我们搭建【多智能体内容工厂】,实现“素材输入→分工处理→成品输出”的全自动化,让 AI 替我们完成重复劳动,聚焦更有价值的创意工作。
zhangfeng1133
1 天前
人工智能
·
语言模型
·
架构
·
transformer
·
gpu算力
ai算力卡,Tenstorrent 公司Jim Keller 和 Ljubisa Bajic的故事,taals公司
这里有一个常见的误解需要澄清:Jim Keller 和 Ljubisa Bajic 并没有"一起成立"公司。Tenstorrent 是 Bajic 创立的,Keller 是后来加入的第一个投资人和高管。
zhangfeng1133
1 天前
人工智能
·
语言模型
·
transformer
·
gpu算力
·
芯片
非传统架构 AI 算力卡前沿研究报告:技术痛点、破局路2021-2026
我已完成三轮审核(事实核查、逻辑结构、语言规范),发现原文存在1处重大事实错误、多处数据存疑、若干术语及格式问题。以下是修改后的完整报告:
东方佑
2 天前
人工智能
·
学习
·
语言模型
可学习破坏策略:实现大语言模型二倍推理加速的统一自洽框架
自回归生成是当前大语言模型(LLM)推理延迟的根本瓶颈。基于 Jacobi 迭代的解码方法可将自回归过程转化为并行修正,理论上能将生成步数从序列长度 nnn 压缩至约 n/2n/2n/2,实现近 2 倍加速。现有工作(如 CLLMs)通过一致性训练让模型学会从任意含噪状态直接映射到完整序列,从而加速收敛。然而,这些方法中施加于训练数据的破坏策略(mask/噪声类型、位置、比例)均由手工规则设计,无法针对模型内部能力自适应调整。本文提出一种完全自适应的训练框架——Self-Masked Consistenc
清辞853
2 天前
大数据
·
人工智能
·
学习
·
语言模型
入门大模型工程师第四课----通过RAG增强大模型原本无法回答的问题
学完这节课后,你将能够:了解什么是 RAG,以及它的实现原理通过实践案例和动手实验,掌握 RAG 应用的构建方法
kylin-运维
2 天前
语言模型
·
voxcpm
VoxCPM 2.0 离线部署
GitHub 地址https://github.com/OpenBMB/VoxCPM使用版本 v2.0.3
F_D_Z
3 天前
人工智能
·
语言模型
·
自然语言处理
扩散大语言模型新框架TraceRL
扩散概率模型在图像生成领域取得了显著成功,近年来研究者开始探索其在语言建模中的潜力。扩散大语言模型采用迭代去噪的生成机制,与传统的自回归模型形成本质区别。然而,如何有效地对扩散语言模型进行后训练,特别是引入强化学习以提升推理能力,仍然是一个开放性问题。
jeffer_liu
3 天前
java
·
人工智能
·
后端
·
spring
·
语言模型
Spring AI 生产级实战:记忆管理
我们平时使用 ChatGPT、通义千问、DeepSeek 等大模型时,经常会感觉模型“记得”前面聊过的内容。