llm

带刺的坐椅4 小时前
java·ai·llm·cli·soloncode
SolonCode CLI 的心智记忆功能:让 AI 编程助手越用越懂你很多 AI 编程工具,但大多数都有一个共同的痛点:每次对话都要重新交代背景。说实话,这个痛点困扰了我很久。你跟 AI 说"我项目用的是 MyBatis-Plus",它说"好的,记住了"。结果第二天开个新会话,它又开始给你写 JPA 的代码。你跟它说"我们团队的命名规范是驼峰式",它在同一次对话里记住了,下次又忘了。
紫洋葱hh8 小时前
人工智能·python·ai·langchain·llm·agent·大模型应用开发
LangChain 结构化输出详解:彻底告别大模型文本手动解析日常开发中调用大模型,相信大家都踩过同一个坑:调用模型返回一大段自由文本,人看着通俗易懂,但程序根本没法直接用。
梦想不只是梦与想20 小时前
llm·智能问答·rag·reranker·embedding model
构建智能问答或RAG系统:三个关键组件“大模型”通常指的是大语言模型(Large Language Model, LLM)‌,而“大预言、嵌入模型、重排序模型”并不是大模型本身的三种类型,而是‌在构建智能问答或检索增强生成(RAG)系统时,常协同使用的三个关键组件‌。它们各自承担不同角色,共同提升系统整体性能。
小马过河R1 天前
人工智能·python·算法·ai·llm·rag·问答
RAG检索优化策略:系统性四层框架解析RAG在今天已经不是什么稀奇玩意了,懂或不懂的多多少少都会讲出点门道。小马之前也介绍过相关的文章链接: 《RAG检索增强生成:通过重排序提升AI信息检索精准度》。至于RAG的具体原理小马再次就不做赘述了。然而在实际的真实场景中,往往会面临着真实效果的上限问题,通用的RAG似乎都无法满足特定化的业务场。于是,我们往往需要针对其做特定业务的召回优化(专属)。
数据智能老司机1 天前
llm
大语言模型:那些硬核难题——面向安全性的 LLM 评估如果你上错了火车,第一站就下车。你待得越久,回程的代价就越高。 ——日本谚语请注意,本章会讨论有害提示词,例如询问 LLM 如何制造炸弹,以及不安全的模型行为,目的在于评估和缓解安全风险。必要时,示例会被缩写或抽象化处理。
数据智能老司机1 天前
llm
大语言模型:那些硬核难题——第一性原理:在开始用 LLM 构建之前,我们需要考虑什么自由这种东西,如果不用,就会死去。 ——亨特·S·汤普森大语言模型(LLM)代表了一个真正的拐点:它改变了软件能够做什么,也改变了我们构建应用的方式。LLM 能够理解上下文,识别文档之间的模式,生成连贯的解释,并且在没有脆弱规则集或海量训练数据的情况下,适应细微复杂的请求。这些能力非常惊人,而开源工具又让任何规模的组织、任何预算水平的个人,都能够接触到这项技术。本书的目标,是让读者掌握开源框架,以便成功落地这项技术,并避开那些容易让我们走偏的常见陷阱。
swipe1 天前
后端·langchain·llm
Agentic RAG:用 LangGraph 构建会路由、会纠错、会收敛的闭环 RAG很多团队第一次做 RAG,思路都差不多:这套流程能不能跑通?当然能。但真正上线以后,问题也会很快暴露出来。
冬奇Lab1 天前
人工智能·llm
RAG 系列(十八):Conversational RAG——多轮对话中的代词陷阱前面十七篇都在处理同一种问题:给一个独立的问题,返回一个答案。但真实的对话不是这样的。用户在问完"RAGAS 是什么"之后,自然会接着问:
nujnewnehc1 天前
人工智能·llm·agent
第一次接触 agent 概念分享之前做 ae 插件, 想让应用表达式的时候调参数更方便.代码是 ai 写的, ai 直接把表达式写上了, 于是我就想是不是可以在这里直接调用 ai, 让 ai 直接应用表达式, 才接触到了 agent 开发.
Wilber的技术分享1 天前
人工智能·面试·职场和发展·大模型·llm·agent·智能体开发
【大模型面试八股 2】Function Call、MCP、Skill的区别🔹 本质 LLM API 层面的原子交互机制,用于让模型在对话过程中结构化地请求执行外部函数。🔹 工作原理 开发者通过 JSON Schema 声明函数名、参数类型、描述。 模型在推理时判断是否需要调用,并输出结构化指令:
深度学习机器1 天前
人工智能·llm·agent
从RAG到LLM Wiki:用AI构建持续进化的个人知识库自从大模型诞生以来,我们主动或者被动接收到的信息越来越多,信息爆炸是我们每个人必须面对的问题。如果想提升自己的效率,就得从这些信息中精确筛选出有用的部分,避免自己被淹没在信息的海洋里。试想一下,比如你现在看到一篇文章,随手点了收藏,以为过后就会仔细去阅读,但是很多时候往往进了收藏夹之后就会吃灰。就算哪天真的想起来要看一下收藏夹的文章,如果收藏夹中已经有了大量的文章,且杂乱无序,这时候整理起来也费劲,往往会让人没有想看的欲望。
树獭非懒1 天前
人工智能·llm·ai编程
AI大模型小白手册 | Function Calling-大模型与真实世界交互的桥梁2023 年之前,大模型是"关在笼子里的天才大脑"——它能写诗、能编程、能回答问题,但它的世界止步于训练数据的截止日期。你不知道今天的天气,查不了实时的股票,动不了数据库里的一行记录。
熊猫钓鱼>_>1 天前
人工智能·python·架构·大模型·llm·machine learning·q-learning
Q-Learning详解:从理论到实战的完整指南摘要:Q-Learning是强化学习领域最经典的算法之一,以其简洁优雅的思想和强大的学习能力闻名。本文将深入剖析Q-Learning的理论基础、算法实现、收敛性证明,并通过多个实战案例展示其应用价值。
iskyseraph1 天前
llm·agent·skill
开源 Skills 全生命周期创造平台作者:SkySeraph 日期:2026-05-02 原文:SkillNexus Intro 开源:SkillNexus
若苗瞬1 天前
llm·llama·cpp·gemma·mtp·ik_llama·dflash
记一次失败的本地部署 LLM MTP 模型的过程先说结论:如果显卡没有24GB+的显存,确实没必要折腾。 显存容量决定体验上限,MTP不是“免费加速”,而是用更多显存换 decode 加速。
熊猫钓鱼>_>2 天前
人工智能·llm·强化学习·rl·马尔可夫·mdp·决策过程
强化学习与决策优化:从理论到工程落地的完整指南摘要:强化学习(Reinforcement Learning, RL)作为人工智能领域的重要分支,正在从游戏场景走向工业现场。本文将深入讲解RL的核心原理、主流算法,并通过桥梁智能设计的具体案例,展示如何将RL技术落地应用于工程决策场景。
冬奇Lab2 天前
人工智能·llm·源码
RAG 系列(十七):Agentic RAG——让 Agent 主导检索过程前面十几篇一直在优化一件事:怎么让检索结果更好。更好的分块、更精准的排序、更聪明的问法、CRAG 纠偏、Graph RAG 关系遍历……
Zeeland2 天前
llm·openai·agent
Rudder:让人类与 AI Agent 像真正的团队一样协作过去一年,AI Agent 的能力正在快速提升。它们可以写代码、整理文档、研究资料、分析需求、生成计划,甚至帮助推进复杂项目。但当 agent work 从一次简单 prompt 变成持续性的真实工作时,一个新的问题开始出现:
冬奇Lab3 天前
人工智能·llm
RAG 系列(十六):Graph RAG——用知识图谱解决多跳关系问题前面几篇从各个角度优化了检索质量:更好的分块、Rerank 重排序、查询改写、CRAG 纠偏。但有一类问题,这些方法都帮不上多少忙: