llm

装不满的克莱因瓶23 分钟前
人工智能·python·ai·langchain·llm·agent·chatmodel
了解 LangChain 中的 LLM 与 ChatModel 的差异目录前言一、LLM 与 ChatModel 的概念1. LLM2. ChatModel二、核心差异对比
颜酱40 分钟前
langchain·llm
LangChain 工具调用:从原理、入门到落地在大模型应用开发中,纯文本LLM无法解决实时计算、外部数据查询、API交互等落地场景问题。LangChain 工具调用能力,核心是将自定义Python函数、外部能力封装为大模型可识别、可自主调度的标准化工具,让LLM自主判断何时调用工具、传递什么参数,最终结合工具输出结果生成精准回答。
swipe40 分钟前
后端·面试·llm
做多轮对话 Agent,为什么我建议把短期记忆放到 Redis做 Agent 系统时,大家最先关注的往往是模型、Tool、工作流和 Prompt,但真正把系统跑到线上之后,最先暴露问题的通常不是模型,而是上下文。
swipe1 小时前
面试·langchain·llm
别再把关系库和向量库拆开了:PostgreSQL 搭建 AI 长期记忆层实战这两年做 AI 应用,很多团队最先搭起来的是模型调用链路,最后最容易失控的却是数据层。一开始,大家通常只把 PostgreSQL 或 MySQL 当成“普通业务库”:用户表、订单表、会话表、消息表,该怎么建还怎么建。等产品开始要求“记住用户说过什么”“能从历史对话里找回相似上下文”“支持长期记忆”和“支持知识增强”时,问题就来了。
元Y亨H4 小时前
大数据·llm
大数据转大模型(LLM)进阶学习路线图大数据工程师习惯于 Row/Column 的处理,大模型则基于 Tensor(张量)。这是所有现代大模型的“底座”,必须做到能从零手写核心代码。
小lan猫8 小时前
前端框架·llm·agent
用 AI Agent 让购物更便捷:LumiGlow 电商网站实践最近在学习agent相关的落地,思考来源:“如何通过自然语言帮我们在传统电商网站下单?”,基于这个问题延展出了如下的落地设计思路:
meilindehuzi_a8 小时前
人工智能·llm
全栈进阶:告别 Node 繁琐配置,用下一代运行时 Bun 丝滑构建 AI Agent 客户端在全栈开发的世界里,JavaScript 凭借其极低的门槛让无数人欲罢不能。但随着项目规模的扩大,特别是步入 AI Agent 时代后,大模型交互对运行时的性能、数据严谨性与响应速度提出了前所未有的苛刻要求。
sg_knight8 小时前
llm·copilot·agent·claude·code·codex·claude-code
Claude Code、Cursor、Copilot、openCode,到底怎么选ChatGPT 能聊天,Copilot 能补全,Cursor 能重构,Claude Code 能改文件,openCode 能跑任务——这五款工具你大概率都听说过,但真到用的时候,很多人还是懵的。
程序员三明治10 小时前
人工智能·llm·知识库·元数据·rag·java后端
RAG 元数据的作用与管理:让知识库回答可追溯、可过滤、可维护上一篇我们聊了 RAG 中的文本分块(Chunking):如何把长文档拆成适合检索的小块。分块解决的是“长文本如何变成可检索单元”的问题,但它没有回答另一个关键问题:这些文本块从哪里来、属于哪个业务范围、当前是否生效、谁可以查看、出了问题怎么回溯。
冬奇Lab20 小时前
人工智能·开源·llm
每日一个开源项目(第126篇):turbovec - 向量索引的内存杀手,1千万文档从31GB压到4GB"1千万文档的向量索引,31GB 内存只是个起点——如果你用的是 float32。"这是"每日一个开源项目"系列的第126篇文章。今天的主角是 turbovec——一个让向量索引占用内存缩小 8 倍、搜索速度还比 FAISS 更快的开源库。
冬奇Lab21 小时前
人工智能·llm·agent
Agent 系列(17):Harness Engineering——给自主 Agent 装上安全护栏一个 Agent 可以读文件、写代码、调 API、发邮件。当你给它一个任务,它会自主决定做什么、怎么做、做多少。
MELF晓宇1 天前
llm·agent
多模态向量对齐:从 Embedding 到多模态大模型过去很长时间里,人工智能系统大多专注于处理单一类型的数据。例如:这种方式推动了很多技术突破,但随着应用场景越来越复杂,仅依赖单一模态已经难以满足需求。
龙骑士baby1 天前
ai·大模型·llm·prompt·skill
重建 AI 认知第 4 篇:Skill——提示词的系统化封装摘要: 你跟 AI 的每一次对话,都是在临时培训一个新员工——教会了,下次又得重来。Skill 就是把"培训手册"固定下来,让 AI 每次上岗都知道按你的方法来。它不只是省时间,更关键的是它的结构会逼你把"说不清楚的要求"一条条补齐。这篇讲清楚 Skill 是什么、为什么它比 Prompt 多了一层价值,以及怎么开始拥有自己的 Skill。
爱听歌的周童鞋1 天前
llm·agent·multi-agent·claude code·comprehensive
Learn-Claude-Code | 笔记 | Multi-Agent Platform | s20_new Comprehensive Agentlearn-claude-code 项目目前有两条教程线,一条是之前的 s12 章节的,另一条是最近更新的 s20 章节的,大家如果刚学习这个项目的话推荐直接看最新的 s20 章节的教程即可,由于博主之前学习过 s12 章节的内容,因此打算把 s20 章节中新增章节的内容给补充学习,内容重复的章节博主这边就跳过了。
codefan※1 天前
大模型·llm·向量数据库·rag
Reranker 模型实战:让 RAG 检索精度再提升 20%如果你做过 RAG(Retrieval-Augmented Generation)项目,一定遇到过这个痛点:**向量检索召回了 20 条文档,但真正相关的只有前 3 条,后面全是噪音。**这些噪音不仅浪费 Token,还会干扰 LLM 的推理,导致生成结果质量下降。
王小义笔记2 天前
llm·transformer·cuda
CUDA 版本下 Transformers 报错排查与解决办法最近在学习和训练多模态大模型时,执行训练脚本:程序启动后立即报错:随后引发:很多同学第一反应会认为是 CUDA 版本不兼容,实际上问题往往出在 PyTorch 与 Transformers 版本不匹配。
冬奇Lab2 天前
人工智能·llm·agent
Agent 系列(16):工具链设计——让 LLM 用对工具的五个原则你有没有写过这样的工具文档:这对人类来说是糟糕的文档,对 LLM 来说更糟——它不知道这个工具做什么、什么时候调它、传什么参数。
AndrewHZ2 天前
人工智能·深度学习·大模型·llm·微调·预训练·rlhf
【LLM技术全景】预训练与微调:大模型如何“学习“摘要:本文是《LLM技术全景:从Token到部署》系列第四篇。大语言模型之所以强大,核心在于"预训练+微调"的两阶段范式。预训练让模型在海量无标注文本中学习语言的一般规律,微调则让模型学会遵循指令、匹配人类偏好。本期将深入解析预训练的技术原理(Next Token Prediction、语料选择、训练动态)、SFT有监督微调的核心技巧,以及RLHF/DPO等对齐技术的工作机制。配图将展示大模型训练的完整pipeline,帮助读者理解从"语言模型"到"助手"的技术跃迁。
leeyi2 天前
llm·agent
多租户隔离:一条 RLS 策略怎么防数据串系列「企业级 AI Agent 实现拆解」第十一篇。上一篇讲了长期记忆,这篇看多租户数据隔离怎么做。最直觉的多租户隔离方案是:每个查询手动加 WHERE tenant_id = ?。问题在于,这个"每个"很容易出漏网之鱼。
leeyi2 天前
llm·agent
长期记忆:Agent 怎么“记住“用户系列「企业级 AI Agent 实现拆解」第十篇。上一篇讲了知识库检索,这篇看记忆系统怎么让 Agent 越用越聪明。