llm

小新同学^O^2 小时前
人工智能·学习·llm·指令微调
简单学习 --> 指令微调预训练阶段的基座模型(Base Model)本质上是一个基于概率的“下一个词预测器”(Next Token Predictor)。它吸收了海量的互联网语料,拥有了庞大的世界知识和语言规律,但它的交互逻辑仅仅是“续写”。它不理解什么是“提问”,什么是“回答”,什么是“执行指令”。指令微调(Instruction Tuning)是对基座模型进行的一次认知重塑,让它从无意识的文本生成器,转变为能理解人类意图的交互系统。
swipe2 小时前
后端·langchain·llm
混合检索 RAG 的工程化实践:不是多查几路,而是把召回、重排和上下文预算管好混合检索 RAG 的核心价值,不是把 Elasticsearch 和向量数据库都查一遍,然后把结果粗暴塞给大模型。真正有工程价值的做法是:用多路召回尽量扩大候选集,用稳定的文档 ID 做合并去重,用重排模型把不同召回通道的结果拉到同一个相关性尺度上,再用上下文预算控制把少量高质量证据交给 LLM。
创世宇图3 小时前
ai·llm·agent·claude·ai工程化
Claude Opus 4.8 深度实测:动态多 Agent 协同、Effort Control 与幻觉抑制的工程化解析目录1. 前言:Opus 4.8 解决了什么工程痛点?2. 核心技术更新与工程解读2.1 幻觉抑制:从 RLHF 到结构化 Honesty
lhxcc_fly5 小时前
ai·langchain·llm·流式传输
2.LangChain--聊天模型之流式传输当我们进行传统的LLM调用时,终端会在等待响应时间过后给出我们最终的结果。当我们使用网页版AI调用大模型,再关闭思考模式时,其会给用户以字流的形式给出答案,而不是等待后直接给出所有答案。
隐层漫游者8 小时前
llm
深度解密LangChain与RAG:从零构建智能衣答系统,掌握大模型本地知识库的终极奥义大家好,我是你们的技术伙伴。👋在2026年的今天,大模型(LLM)已经渗透到我们生活的方方面面。但在实际业务中,我们经常面临一个痛点:如何让通用的大模型精准地理解特定领域的“黑话”? 比如,在电商卖衣服时,客户问“我170高,140斤穿什么码?”,模型如果不懂你的库存尺码表,回答就是胡扯。
文歌子8 小时前
llm·mcp
MCP 协议:AI 地学工具链的通用胶水理解 Model Context Protocol 如何串联 TorchGeo、DeepEarth、EVE 和 SciAssistant,打通数据到报告的完整链路。
lhxcc_fly9 小时前
langchain·llm·messages
3.LangChain组件--消息消息结构一般都是由角色和内容组成,以及因 LLM 的不同⽽不同的附加元数据。上面展示的消息类型我们之前的文章都提到过,它们都是 LangChain BaseMessage 的⼦类,全部是作为 LangChain 聊天模型的输⼊和输出
虾..9 小时前
人工智能·llm·rag
大模型认识我们平常日常使用的豆包,千问,deekseep,chatgpt其实都是大语言模型。例如我们想学会⼀⻔外语,但没有⽼师给出题和批改。怎么办?
千桐科技1 天前
大模型·llm·工作流·qknow·智能体构建平台
qKnow 智能体构建平台开源版 2.1.1 正式发布!优化非结构化抽取、知识库召回,全面升级系统稳定性与交互体验在企业AI智能体与知识治理落地过程中,系统稳定性、数据检索精准度、交互流畅度直接决定数字化作业效率。基于海量线上真实业务场景的反馈,qKnow 正式推送 v2.1.1 精细化迭代版本!
还有多久拿退休金1 天前
前端·llm
LLM应用开发二:让AI学会"翻书"——RAG检索增强从踩坑到跑通摘要:大模型什么都懂?别逗了,它连你公司上个季度的财报都没见过。RAG(检索增强生成)就是给AI配一个"私人图书馆",让它回答问题之前先翻资料,而不是一本正经地胡说八道。但理想很丰满,现实很骨感——Embedding API返回404、向量库需要C++编译、HuggingFace被墙下载不了……这篇文章记录了我从零实现RAG的全过程,包括四次连续翻车和最终跑通的方案。
Aiden_SHU1 天前
llm·knowledge base·code base
Agent knowledge-base & Code-basellm_wikillm-wikigraphifyhttps://github.com/safishamsi/graphify
OpenBayes贝式计算1 天前
人工智能·深度学习·llm
教程上新丨单卡即可爆改,面壁智能等开源MiniCPM-V-4.6,1.3B端侧模型支持图像理解/视频理解/OCR/多轮多模态对话过去几年,整个 AI 行业几乎都笼罩在 Scaling Law 的叙事之下。参数越大、训练数据越多,模型似乎就越接近「通用智能」。从千亿到万亿参数,大模型不断刷新人们对推理能力与世界知识的想象,也让「堆算力、卷规模」成为行业默认的发展路径。
codefan※1 天前
运维·docker·容器·大模型·llm·本地部署·ollama
一键部署私人 LLM:Ollama + Docker 极简指南10 分钟本地跑起大模型,支持 Windows / Mac / Linux,无需代码基础想用 GPT-4 级别的大模型,但不想每次都担心隐私泄露、API 费用爆表?
龙骑士baby1 天前
ai·大模型·llm·prompt
重建 AI 认知第 3 篇:Prompt Engineering——怎么让 AI 听懂你的话你是一家 软件公司的产品经理,正在评估"要不要做智能提醒功能"。你问 AI:"帮我做一份竞品分析,评估这个功能值不值得做。"
城管不管1 天前
android·java·数据库·语言模型·llm·prompt
什么是Prompt?上一章你已经搞清楚了大模型的底层逻辑:它是一个超级助理,你通过 messages 列表把内容传给它,它根据你给的上下文预测并生成回答。
猫先生Mr.Mao1 天前
人工智能·架构·大模型·llm·transformer
一文梳理主流 LLM 架构技术演进经典文章回顾:写在前面 【从零走向AGI】旨在深入了解通用人工智能(AGI)的发展路径,从最基础的概念起,逐步构建完整的知识体系。
dy_Alley1 天前
llm
从输入到决策:意图识别在 AI 架构中的定位与应用 — 第三章《意图分类》意图分类是整条链路的核心决策点。分类结果直接决定请求走哪条业务线路,分错了后面全错。写代码之前,第一件事是和业务团队一起定义"用户到底有哪些意图"。这个体系决定了:
还有多久拿退休金1 天前
前端·llm
LLM应用开发一:给失忆的大模型装上"脑子"——LangChain.js对话记忆从零实战摘要:你有没有遇到过这种情况——跟大模型聊了半天,它下一秒就不认识你了?这不是大模型高冷,是它真的"失忆"。大模型每次被调用都像刚睡醒,完全不记得上一秒你们聊了啥。本文带你用LangChain.js手搓一个对话记忆系统,让大模型从"金鱼脑"进化成"靠谱秘书"。我们踩过的坑、填过的雷,全部奉上。
艾利克斯冰1 天前
ai·llm
2026最新大数据完整学习路线当下互联网、金融、电商、政企各行各业,早已离不开大数据技术。 大数据岗位缺口大、薪资高、稳定性强,是零基础转行、在校生提升、职场人加薪的优选方向。 很多人想学大数据,却苦于没有系统路线,盲目自学、杂乱刷题,耗时费力还学不精,最终半途而废。 今天给大家整理2026最新零基础大数据完整学习路线,从入门到实战、从就业到进阶,层层递进,简单易懂,普通人也能稳步吃透! 一、为什么优先选大数据? 1. 门槛友好:不用高深编程基础,零基础可从零起步,适配学生、转行上班族 2. 就业面广:覆盖大数据开发、数仓分析、数据运
谢白羽1 天前
llm·agent
PlugMem 论文解读:把 Agent 经历抽象成可复用知识图的插件式记忆模块一句话定位:PlugMem 是 ICML 2026 的任务无关 Agent Memory 模块,把原始 episode 轨迹抽象成 propositional knowledge(事实命题)和 prescriptive knowledge(行动处方),再组织成知识中心记忆图,作为插件接到任意 LLM Agent 外部。