语言模型

官能3 天前
人工智能·语言模型
从 ReAct 到 LangGraph:房产 Agent 的工作流升级复盘上周我用 ReAct Agent 搭建了房产推荐系统。这周我发现了瓶颈:复杂查询需要多步操作,顺序执行太慢。我用 LangGraph 重构了整个工作流,性能提升 40%,代码也更清晰了。
小马过河R3 天前
人工智能·机器学习·语言模型·agent·openclaw·智能体记忆机制
OpenClaw 记忆系统工作原理前篇文章《初探来会会OpenClaw这只龙虾》我们介绍了OpenClaw 的整体原理和基本运行。作为一个合格的AI助理Agent,必然具备对用户的习惯了解技能。今天我们就对其用户行为记忆的机制进行简单的探究,也是可以作为我们实现各种服务类型的Agent智能体的长期记忆机制的方案借鉴,比如客服系统、问答系统对用户特征、用户习惯的记录以及一对一风格服务等等。
硅谷秋水4 天前
深度学习·机器学习·计算机视觉·语言模型·机器人
从机制角度看视频生成作为世界模型:状态与动态26年1月来自港科大(广州)、同济大学和快手公司的论文“A Mechanistic View on Video Generation as World Models: State and Dynamics”。
摘星编程4 天前
人工智能·语言模型·自然语言处理
大语言模型(Large Language Models,LLM)如何颠覆未来:深入解析应用、挑战与趋势大型语言模型(LLM)正以惊人的速度重塑技术格局。本文将从技术原理、行业应用、核心挑战和未来趋势四个维度,深度解析这场AI革命。你将了解Transformer架构的工程精妙之处,掌握LangChain等工具的实战应用,看清数据隐私与伦理问题的解决路径,并预判多模态融合的技术走向。文中包含5个可直接运行的代码案例、3个架构图解和行业应用对比表,助你在AI浪潮中建立系统认知框架。
zhangfeng11334 天前
人工智能·chrome·语言模型
快速验证哪个文件坏了 模型文件损坏或不完整大语言模型开发 .llm这个错误:发生在加载第 6/8 个分片时(进度 75%),几乎 100% 是因为模型文件损坏或不完整(corrupted / incomplete download)。
nudt_qxx4 天前
语言模型·transformer
讲透Transformer(六):FlashAttention 1→4 进化史:从在线Softmax到硬件极致利用FlashAttention 系列算法是近年来Transformer加速领域最重要的突破之一。它通过IO感知(IO-Awareness)的设计理念,将注意力计算的速度提升了数十倍,同时将内存占用从 O ( N 2 ) O(N^2) O(N2) 降低到接近 O ( N ) O(N) O(N)。本文将详细解析 FlashAttention V1 到 V4 的核心原理、数学推导、技术演进以及性能对比。
Olivia_0_0_4 天前
人工智能·语言模型
【大语言模型系列】MCP——大模型工具调用的“统一接口”前言:在大模型工具调用的实践中,“各家格式不统一”是开发者绕不开的痛点。今天我们就从 Function Call 是什么 讲起,一步步理解 MCP(Model Context Protocol) 是如何解决这个问题的。
~kiss~4 天前
人工智能·语言模型·vllm
高性能大语言模型推理与服务框架(推理引擎)vLLMvLLM 不是一个大模型本身,而是一个高性能大语言模型推理与服务框架(推理引擎),专门解决大模型在 GPU 上速度慢、显存占用高、并发能力差的问题vLLM
renhongxia14 天前
人工智能·深度学习·安全·语言模型·机器人·知识图谱
THINKSAFE:推理模型的自生成安全对齐大型推理模型(LRM)通过在推理任务上利用强化学习(RL)生成长思维链(CoT),从而实现了卓越的性能。
shangjian0074 天前
人工智能·学习·语言模型
AI-大语言模型LLM-LangChainV1.0学习笔记-OpenAI类和ChatOpenAI类为避免一学就会、一用就废,这里做下笔记在 langchain-openai 库中,OpenAI 和 ChatOpenAI 是两个完全不同的类,它们的核心区别在于针对的模型类型和输入输出格式。简单来说:OpenAI 是“古典派”,ChatOpenAI 是“现代派”。
yzx9910134 天前
学习·机器学习·语言模型
从单一到融合:机器学习、多模型学习与大语言模型的全面综述机器学习作为人工智能的核心分支,在过去十年经历了从专用模型到通用基础模型的范式转变。本文旨在系统梳理机器学习的核心概念,并深入探讨“多模型学习”这一新兴范式,特别是大语言模型如何在其中扮演核心角色。文章首先回顾机器学习的基础分类与深度学习的基本原理,进而详细阐述多模型学习的几种主要形式:集成学习、多任务学习、多模态学习以及模型合并。随后,本文重点剖析大语言模型的Transformer架构、缩放法则及其思维链能力,并介绍从GPT系列到DeepSeek-R1的代表性模型。最后,文章探讨模型合并技术在构建统一多
shangjian0074 天前
人工智能·学习·语言模型
AI-大语言模型LLM-LangChainV1.0学习笔记-模型不同调用方式的差异在LangChain 1.0版本中,调用DeepSeek-R1模型的四种方式各有特点。下面我将从使用方式、实现原理、功能支持三个维度进行深入对比,并解释为什么它们之间存在差异。
量子-Alex4 天前
人工智能·语言模型·架构
【大模型智能体】大型语言模型的智能体能力:架构、习得、安全性与未来路径Agent Skills for Large Language Models: Architecture, Acquisition, Security, and the Path Forward 大型语言模型的智能体能力:架构、习得、安全性与未来路径
kebijuelun5 天前
人工智能·深度学习·算法·语言模型
GLM-5:从 Vibe Coding 走向 Agentic Engineering 的全栈路线图这篇论文最重要的信号只有一句话: GLM-5 不是单纯把参数放大,而是通过 DSA 稀疏注意力 + 异步 RL 基建 + 代理式环境扩展,系统性解决了“长上下文 + 长链任务 + 真实软件工程”三大瓶颈。整套路线把“能写代码”推进到了“能做工程”。
小龙报5 天前
人工智能·语言模型·自然语言处理·性能优化·数据分析·知识图谱·需求分析
【Coze-AI智能体平台】Coze 工作流 = 智能体的 “流程管家”?一文解锁自动化落地新玩法🔥小龙报:个人主页 🎬作者简介:C++研发,嵌入式,机器人方向学习者 ❄️个人专栏:《coze智能体开发平台》 ✨ 永远相信美好的事情即将发生
aiAIman5 天前
人工智能·语言模型·开源
OpenClaw 使用和管理 MCP 完全指南OpenClaw(原名 Clawdbot)是一款开源的本地 AI 智能体框架,在 GitHub 上拥有超过 180K 星标。MCP(Model Context Protocol)是由 Anthropic 推出的一种开放标准协议,旨在让 AI 模型通过统一接口连接各种外部工具和数据源。通过配置 MCP,OpenClaw 可以直接访问本地文件系统、数据库、GitHub 仓库,甚至 Google Drive 和 Slack 等服务。
Loo国昌5 天前
人工智能·后端·python·语言模型·自然语言处理·prompt
【AI应用开发实战】06_向量存储与EmbeddingProvider设计一句话摘要:深入解析RAG系统中向量存储与Embedding提供者的设计实现,涵盖FAISS内积索引原理、本地哈希向量与远程Embedding对比、维度适配与归一化处理、批处理优化等核心技术。
武汉庞小锋6 天前
语言模型
gemma3开始干活了从最开始怀疑AI写代码能力,到现在让大模型直面需求,前后也没几天时间。刚开始gemma3喜欢输出英文,查了下原来是没做角色设定,和一般软件的设置差不多。
梦想画家6 天前
语言模型·大模型
2026开年大模型最新对比解析及场景落地指南2026年春节前后,国内大模型领域迎来旗舰级产品密集发布热潮,字节跳动、阿里巴巴、智谱AI等头部厂商纷纷推出新品。本轮发版彻底告别传统参数竞赛,核心聚焦原生Agent能力、工程化落地、长文本处理及成本优化四大方向,全面转向实用价值深耕。本文精简梳理6款2026年1-2月最新发版模型,系统解析各产品核心更新、核心优势及适配场景,通过横向对比明确差异点,为开发者与企业提供高效、精准的选型参考,兼顾专业性与阅读便捷性。
Loo国昌6 天前
人工智能·后端·python·语言模型·自然语言处理·金融·知识图谱
【AI应用开发实战】05_GraphRAG:知识图谱增强检索实战一句话摘要:本文深入解析 GraphRAG(Graph Retrieval-Augmented Generation)技术原理,基于 StockPilotX 项目实战,讲解如何通过 Neo4j 图数据库和内存图存储实现知识图谱增强检索,构建三元组关系模型,并通过子图查询和关系推理提升金融分析的准确性和可解释性。