语言模型

Jump 不二20 分钟前
人工智能·语言模型·系统架构
Memory-os 7 层记忆架构深度解析:让 Hermes Agent 真正 “记住并使用“ 知识久等啦,最近实在是有点忙,好久没更新,今天带新的干货来啦~最近在 Github 上看到一个给 Hermes-Agent 专门做的记忆升级系统 memory-os,三天648星,这个增速还是相当可观的。
龙侠九重天3 小时前
开发语言·人工智能·语言模型·自然语言处理·大模型·agent·智能体
C# 构建 AI Agent 系统 — 我的实践笔记📝 写在前面:这是一篇学习日记+实战笔记。我最近在研究如何用 C# 和 .NET 8 从零构建一个 AI Agent 系统。整个过程踩了不少坑,也积累了很多实战经验。于是我把整个学习过程和代码实现记录下来,分享给同样对 C# AI 开发感兴趣的同学。
zhangfeng11334 小时前
人工智能·深度学习·语言模型·架构·机器人·gpu算力·芯片
把权重写死在芯片的架构 Taalas(HC1)芯片:车载 GPU / 智能驾驶 / 机器人 / 算力卡适配总结Taalas 不是通用GPU,是模型硬连线ASIC专用推理芯片(一芯片绑定一个固定大模型,HC1原生固化Llama3.1-8B),细分场景高度适配、全场景无法替代通用车载GPU,分三大场景拆解:
lifallen5 小时前
人工智能·ai·语言模型·agi
第五章 从 Tool 到 Skill:认知复用如何发生上一章讨论的是连续性:系统怎样把一次任务里的局部结果、上下文和状态接起来,避免每一轮都从零开始。连续工作一旦真的出现,新的压力很快也会跟着出现。memory 能保存这次发生过什么,却不能自动回答下一次该怎样做。它更像库存,保存的是结果、线索和局部经验;可当同一类任务反复出现时,系统真正想复用的已经不只是某条结论,而是到达结论的方法。
MartinYeung55 小时前
人工智能·学习·语言模型
[论文学习]网路知识产权面临风险:防止大型语言模型未经授权即时检索核心问题与动机(Core Problems & Motivations)论文直指当前网络生态最迫切的系统性风险:大型语言模型(LLM)具备即时网络检索(real-time retrieval / RAG-like)能力后,悄无声息地大规模「消费」原创网页内容,却未给予内容创作者任何补偿、归属或控制权。
硅谷秋水19 小时前
人工智能·机器学习·计算机视觉·语言模型·机器人
世界模型:架构、方法、推理与应用的综述(下)26年6月来自Augusta大学、U Georgia、NJIT、哈佛医学院、德州Arlington、James Madison大学、Lehigh 大学、悉尼大学、纽约大学、加州希望之城国家医疗中心和亚利桑那州Mayo诊所的论文“World Models: A Comprehensive Survey of Architectures, Methodologies, Reasoning Paradigms, and Applications”。
硅谷秋水19 小时前
人工智能·机器学习·计算机视觉·语言模型
世界模型:架构、方法、推理与应用的综述(上)26年6月来自Augusta大学、U Georgia、NJIT、哈佛医学院、德州Arlington、James Madison大学、Lehigh 大学、悉尼大学、纽约大学、加州希望之城国家医疗中心和亚利桑那州Mayo诊所的论文“World Models: A Comprehensive Survey of Architectures, Methodologies, Reasoning Paradigms, and Applications”。
zhangfeng113319 小时前
人工智能·深度学习·语言模型·gpu算力·芯片
2021-2026 年全球 传统厂家AI 算力卡 GPU 前沿技术研究报告由ai生成,内容不一定准确(以下是基于上述三轮审稿意见修改后的完整报告)我已完成三轮审读。以下是详细的审稿意见,随后提供修改后的全文。
温九味闻醉1 天前
人工智能·语言模型·自然语言处理
八股-大语言模型基础
zhangfeng11331 天前
人工智能·语言模型·矩阵·架构·transformer·芯片
光驱动的 AI 算力卡,也就是光子计算(Photonic Computing)芯片,用光子(光)代替电子来做矩阵乘法和数据传输光驱动的 AI 算力卡,也就是**光子计算(Photonic Computing)**芯片,用光子(光)代替电子来做矩阵乘法和数据传输。它的核心优势是:光速传播、零电阻发热、天然并行、能耗极低,理论上能打破电子芯片的"功耗墙"和"内存墙"。
Zlzzz.1 天前
语言模型·tau-bench
Tau2-bench + vLLM本地部署调用近期在运行 Tau2-bench 进行模型推理基准测试时,发现其 GitHub 仓库的部署文档较为简略,特别是缺少与 vLLM 框架结合进行本地模型部署的详细教程。因此,本文旨在记录并分享在实际部署过程中遇到的典型问题与解决方案,为有类似需求的开发者提供一份实用的踩坑指南。
zhangfeng11331 天前
语言模型·架构·transformer·芯片
定制化,面向大语言模型的GPU,Etched 把 Transformer 架构直接“烧“进硅片您指的应该是 Etched 这家美国公司。它可能是当前硅谷最"极端"的 AI 芯片创业公司——不做通用 GPU,而是把 Transformer 架构直接"烧"进硅片,造出一颗只能跑 Transformer 大模型的 ASIC。
hhzz1 天前
语言模型·多智能体·openclaw
OpenClaw中文案例精选:多智能体内容工厂在内容生产场景中,无论是内容创作者批量产出推文、职场人撰写工作报告,还是企业批量制作产品文案,往往面临“效率低、重复劳动多、质量不稳定”的痛点——从素材收集、主题提炼,到内容撰写、校对排版,每个环节都需要手动干预,耗时耗力且易出错。而 OpenClaw 作为开源本地优先的 AI 智能体框架,其强大的多智能体协作能力,恰好能解决这一核心痛点,帮我们搭建【多智能体内容工厂】,实现“素材输入→分工处理→成品输出”的全自动化,让 AI 替我们完成重复劳动,聚焦更有价值的创意工作。
zhangfeng11331 天前
人工智能·语言模型·架构·transformer·gpu算力
ai算力卡,Tenstorrent 公司Jim Keller 和 Ljubisa Bajic的故事,taals公司这里有一个常见的误解需要澄清:Jim Keller 和 Ljubisa Bajic 并没有"一起成立"公司。Tenstorrent 是 Bajic 创立的,Keller 是后来加入的第一个投资人和高管。
zhangfeng11331 天前
人工智能·语言模型·transformer·gpu算力·芯片
非传统架构 AI 算力卡前沿研究报告:技术痛点、破局路2021-2026我已完成三轮审核(事实核查、逻辑结构、语言规范),发现原文存在1处重大事实错误、多处数据存疑、若干术语及格式问题。以下是修改后的完整报告:
东方佑2 天前
人工智能·学习·语言模型
可学习破坏策略:实现大语言模型二倍推理加速的统一自洽框架自回归生成是当前大语言模型(LLM)推理延迟的根本瓶颈。基于 Jacobi 迭代的解码方法可将自回归过程转化为并行修正,理论上能将生成步数从序列长度 nnn 压缩至约 n/2n/2n/2,实现近 2 倍加速。现有工作(如 CLLMs)通过一致性训练让模型学会从任意含噪状态直接映射到完整序列,从而加速收敛。然而,这些方法中施加于训练数据的破坏策略(mask/噪声类型、位置、比例)均由手工规则设计,无法针对模型内部能力自适应调整。本文提出一种完全自适应的训练框架——Self-Masked Consistenc
清辞8532 天前
大数据·人工智能·学习·语言模型
入门大模型工程师第四课----通过RAG增强大模型原本无法回答的问题学完这节课后,你将能够:了解什么是 RAG,以及它的实现原理通过实践案例和动手实验,掌握 RAG 应用的构建方法
kylin-运维2 天前
语言模型·voxcpm
VoxCPM 2.0 离线部署GitHub 地址https://github.com/OpenBMB/VoxCPM使用版本 v2.0.3
F_D_Z3 天前
人工智能·语言模型·自然语言处理
扩散大语言模型新框架TraceRL扩散概率模型在图像生成领域取得了显著成功,近年来研究者开始探索其在语言建模中的潜力。扩散大语言模型采用迭代去噪的生成机制,与传统的自回归模型形成本质区别。然而,如何有效地对扩散语言模型进行后训练,特别是引入强化学习以提升推理能力,仍然是一个开放性问题。
jeffer_liu3 天前
java·人工智能·后端·spring·语言模型
Spring AI 生产级实战:记忆管理我们平时使用 ChatGPT、通义千问、DeepSeek 等大模型时,经常会感觉模型“记得”前面聊过的内容。