llm

大模型教程13 小时前
程序员·llm·ollama
LM Studio本地部署Qwen3本文较长,建议点赞收藏。更多AI大模型开发学习视频籽料, 都在这>>Github<<LM Studio 是一款桌面应用程序,用于在您的计算机本地开发和实验 LLM。
大模型教程13 小时前
程序员·llm·mcp
dify+MCP多应用,构建灵活的AI应用生态系统本文较长,建议点赞收藏。更多AI大模型开发学习视频籽料, 都在这>>Github<<前面几篇文章写很多MCP应用,基本上一个dify工作流使用一个MCP应用。那么一个dify工作流,同时使用多个MCP应用,是否可以呢?答案是可以的。
RainbowSea13 小时前
llm·ai编程·mcp
LLM ,MCP协议,A2A协议,RAG,智能体(AI Agent) 图解详细讲解@[toc]两个互联网领域的重大挑战:Agent 需要调用外部工具和 API,访问数据库,执行代码等MCP 协议解决
AI大模型1 天前
程序员·llm·agent
SwanLab入门深度学习:Qwen3大模型指令微调本文较长,建议点赞收藏。更多AI大模型开发学习视频籽料, 都在这>>Github<<Qwen3是通义千问团队的开源大语言模型,由阿里云通义实验室研发。以Qwen3作为基座大模型,通过指令微调的方式实现高准确率的文本分类,是学习大语言模型微调的入门任务。
AI大模型1 天前
程序员·llm·agent
Anything LLM+LM Studio+SearXNG实现私有模型开启联网功能本文较长,建议点赞收藏。更多AI大模型开发学习视频籽料, 都在这>>Github<<一个全栈应用程序,使您能够将任何文档、资源或内容转换为上下文,任何LLM都可以在聊天过程中将其用作参考。此应用程序允许您选择要使用的LLM或矢量数据库,并支持多用户管理和权限。
量子位1 天前
llm·ai编程
稚晖君新大招:机器人二次开发0门槛了!好你个稚晖君,居然搞突袭,一脚踹飞了机器人二次开发的高门槛。在智元机器人首届合作伙伴大会上,智元机器人联合创始人、CTO 稚晖君_(彭志辉)_,发布了机器人动作与表达创作平台灵创平台 (LinkCraft)。
聚客AI1 天前
人工智能·langchain·llm
📚LangChain框架下的检索增强:5步构建高效智能体系统本文较长,建议点赞收藏,以免遗失。文中我也会放一些实战项目,帮助各位更好的学习。检索增强智能体技术正在重塑AI应用的开发范式,它巧妙地将大语言模型的推理能力与结构化知识检索相结合,解决了传统智能体在处理动态信息时的局限性。今天我将根据实际开发中的痛点:如何设计高效、灵活的智能体系统?深入探讨三大集成模式(工具模式、预检索模式和混合模式)的实战选择,解析RAG(检索增强生成)组件链的构建细节,并分享高级技术如上下文压缩和混合检索的优化技巧。
京东零售技术1 天前
llm
大模型工具的 “京东答案”随着大模型技术的迅猛发展,AI工具已成为重要的辅助生产力工具和工作伙伴。它能够显著提升工作效率、帮助解决业务痛点,甚至能通过知识延展与智能协同,帮助团队突破传统认知边界。掌握大模型工具的应用能力,正成为现代职场人提升价值产出的关键竞争力。
深度学习机器1 天前
llm·nlp·agent
LangExtract:基于LLM的信息抽取框架|附项目解析与实战代码在处理海量的非结构化文本时,如何高效且准确地提取结构化信息(如实体、关系、属性)一直是一个棘手的问题。传统方案如正则表达式或基于规则的解析器虽然简单,但往往缺乏灵活性、难以适应复杂语境,且维护成本居高不下。随着大型语言模型的兴起,利用其自然语言理解能力进行信息抽取,正在成为主流的新范式。 LangExtract正是基于这一背景诞生的一个Python框架。它并非仅仅是对 API 的简单封装,而是围绕 “Schema 驱动抽取”思想构建的,具备高度可扩展性和生产级能力的解决方案。
用户84913717547162 天前
llm·agent
为什么大模型都离不开SSE?带你搞懂第2章〈大模型流式应用场景〉本章导读: 深入分析大模型时代下SSE技术的核心应用场景,通过典型案例展示流式处理如何提升AI应用的用户体验,并提供场景选择和技术实施的实用指南。
Baihai_IDP2 天前
人工智能·llm
RAG 文档解析工具选型指南编者按: 当你需要为 RAG 系统选择文档解析工具时,面对 GitHub 上数百个开源项目和各种商业解决方案,你是否感到无从下手?
大模型教程2 天前
程序员·llm·agent
一文带你快速入门:大模型工作流都在用的RAG和GraphRAG技术本文较长建议点赞收藏。更多AI大模型开发 学习视频/籽料/面试题可参考>>Github<<RAG(Retrieval - Augmented Generation,检索增强生成 )技术最早可追溯至2020年被正式提出。如今,伴随大模型技术的飞速迭代与应用场景的持续拓展,RAG技术已经深度融入大模型工作流,成为一种被广泛认可且极具影响力的范式。
pepedd8642 天前
前端·llm·trae
LangChain:大模型开发框架的全方位解析与实践LangChain实现了标准化接口,实现了很多AI厂商的接入sdk,这里以deepseek为例,使用LangChain接入并调用一个简单工具
AI大模型2 天前
程序员·llm·mcp
企业RAG之构建 FastMCP 服务:基于模型上下文协议的智能服务体系搭建实践本文较长,建议点赞收藏。更多AI大模型开发学习视频籽料, 都在这>>Github<<在企业级的RAG系统落地过程中,如何构建一个高效、可扩展、智能化的服务调度体系成为了关键挑战。
AI大模型2 天前
langchain·llm·agent
万字长文!从 0 到 1 搭建基于 LangGraph 的 AI Agent本文较长,建议点赞收藏。更多AI大模型开发学习视频籽料, 都在这>>Github<<我们将迈出关键一步,引入当前 Agent 生态中非常热门的框架——LangGraph。它基于“有向图”模型,将 Agent 的运行流程抽象为“节点 + 状态流转”,具备结构清晰、易扩展、原生支持多工具/多轮调用等显著优势。通过与手写 Agent 的对比学习,你将切实体会到:借助 LangGraph,我们可以用更高效、更优雅的方式构建复杂智能体系统。
Baihai_IDP2 天前
开源·llm·openai
OpenAI 开源模型 gpt-oss 是在合成数据上训练的吗?一些合理推测编者按: OpenAI 首次发布的开源大模型 gpt-oss 系列为何在基准测试中表现亮眼,却在实际应用后发现不如预期?
智泊AI2 天前
llm
手撕LLM | 从0开始讲解AI大模型底层技术原理1.机器学习机器学习(Machine Learning,ML)是实现人工智能的核心方法,是从有限的观测数据中“学习”(or“猜测”)出一个具有一般性的规律,并利用这些规律对未知数据进行预测的方法。
聚客AI2 天前
人工智能·深度学习·llm
🧠深度解析模型压缩革命:减枝、量化、知识蒸馏本文较长,建议点赞收藏,以免遗失。更多AI大模型应用开发学习视频及资料,尽在聚客AI学院。本文系统拆解深度学习中模型剪枝、量化、知识蒸馏三大核心压缩技术,帮助各位实现16倍模型压缩与4倍推理加速。如果对你有所帮助,记得点个小红心。
CodeDevMaster2 天前
llm·ai编程·claude
Claude Code Router:一键接入多种AI模型的智能路由器Claude Code Router是一款革命性的开源代理工具,专为解决AI模型平台锁定问题而生。它作为Claude Code CLI与各大AI模型供应商之间的智能中介,让开发者无需Anthropic官方API即可享受Claude Code的优秀体验。支持Gemini、Ollama、Deepseek、OpenRouter等多种模型,提供智能路由、成本优化和高度可定制化功能,真正实现AI模型的自由切换与灵活部署。
302AI2 天前
llm·ai编程·deepseek
编程能力超越 Claude Opus 4?DeepSeek V3.1最新版本实测DeepSeek 19 日晚在 Hugging Face 发布了其最新升级模型 DeepSeek-V3.1-Base。这次更新并没有任何预热宣传,甚至没有放上模型卡。唯一已知的信息是:上下文窗口从原有的64k扩展至128k,从网页、App、小程序都可体验这一模型。从上传的模型版本看,模型尺寸达 685B,支持 BF16、F8_E4M3、F32 等张量类型,平衡模型的计算精度和效率。