llm

lxd_派派38 分钟前
llm·claude
把个人知识库做成了可"对话检索"的 MCP 服务一句话:pip install 一个包,你的 Markdown 笔记就能被 AI 助手自动检索并引用。
AAI机器之心2 小时前
人工智能·macos·langchain·llm·知识库·大模型部署
在 macOS 上本地部署 Ollama + LLaMA3(附教程)在 macOS 上本地部署 Ollama + LLaMA3 非常简单,以下是完整步骤:一、系统要求1.macOS 12+
new【一个】对象2 小时前
python·llm·agent·rag
RAG详解原理:在构建大语言模型智能体时,有时需要给大模型提供外部文本资料。需要将待查询文本,切片后存储进向量数据库。通过余弦相似度匹配,找到与用户问题语义最接近的文本片段。
薛定谔的猫3692 小时前
ai·llm·agent·mcp·modelcontextprotocol
深入浅出 Model Context Protocol (MCP):连接 AI 与外部数据的桥梁随着大语言模型(LLM)能力的提升,如何让模型安全、高效地访问外部工具和数据成为了 AI Agent 开发的核心痛点。Model Context Protocol (MCP) 作为一个开放标准,为这种连接提供了统一的***
独断万古他化12 小时前
大模型·llm·api·sdk
大模型接入指南:API、本地部署与 SDK 三种接入如果需要自己写一个AI应用来实现相关AI行为,则需要自行接入LLM。 常见的原生LLM(不经过第三方平台或复杂的代理层,直接与大语言模型提供方进行交互的方法)接入方式有三种:【API远程调用】、【开源模型本地部署】和【SDK和官方客户端库】
qcx2314 小时前
人工智能·ai·llm·agent
【AI Agent通识九课】02 · Agent 的“思考回路“长啥样?AI Agent 通识课 · 第 2 篇 / 共 9 篇一句话记住:Agent = 大脑 + 工具 + 循环。ReAct 是那个"循环"。
CoderJia程序员甲21 小时前
ai·大模型·llm·github·ai教程
GitHub 热榜项目 - 日榜(2026-05-03)生成于:2026-05-03共发现热门项目: 8 个榜单类型:日榜Token赞助:siliconflow
knight_9___1 天前
人工智能·python·深度学习·面试·职场和发展·llm·agent
LLM工具调用面试篇5MCP 支持两种主要的传输方式,分别适用于不同场景。本地场景用 stdio,Client 把 Server 作为子进程启动,通过标准输入输出通信,延迟极低,不用开端口,也没有网络安全问题,我用 Claude Desktop 接本地工具走的就是这种方式。
feasibility.1 天前
人工智能·科技·llm·边缘计算·量化·cv·压缩
量化:LLM与CV模型的极致压缩艺术2023年,GPT-4的参数量传闻超过1.8万亿;2024年,Llama 3.1 405B开源;2025年,Qwen3-VL-2B试图在手机上运行多模态推理。模型规模的指数级增长与硬件资源的线性增长之间,横亘着一道名为推理成本的鸿沟。
树獭非懒1 天前
人工智能·程序员·llm
LangChain 不是框架,而是一把瑞士军刀你第一次用 OpenAI API 时,几行代码就让模型开口说话了——那一刻你觉得 AI 开发不过如此。
冬奇Lab1 天前
数据库·人工智能·llm
RAG 系列(六):向量数据库——存储与检索的基础设施前面五篇文章,我们搞清楚了怎么切分文档、怎么生成 Embedding。现在这些向量存在哪里?怎么被高效地检索出来?
冬奇Lab1 天前
人工智能·llm·aigc
RAG 系列(五):Embedding 模型——语义理解的核心前面四篇文章,我们搞定了 Pipeline 搭建、参数调优和分块策略。但有一个问题一直没细说:你的文档被切成 Chunk 之后,是怎么变成向量的?
SkySeraph2 天前
llm·agent·skill·skillnexus
SkillNexus:开源 Skills 全生命周期创造平台作者:skyseraph 日期:2026-05-02 原文:SkillNexus Intro 开源:SkillNexus
wj3055853782 天前
llm·llama
Ollama Cloud 与直接使用 API 的对比Ollama Cloud 的核心价值不是“比 API 更强”,而是:把云端大模型接入到 Ollama 现有工作流里,让云端模型像本地 Ollama 模型一样使用。
无糖可乐没有灵魂2 天前
ai·llm·prompt·agent·mcp·skills
AI Agent结构图例和工作流程描述一句话概括工作流程:用户提问 → Agent 构造上下文 → LLM 判断是否用工具 → Agent 执行工具 → 结果回注 → LLM 生成最终答案
冬奇Lab3 天前
人工智能·llm·源码
RAG 系列(四):文档处理——从原始文件到高质量 Chunk前面三篇文章,我们搭好了 RAG Pipeline,也调对了核心参数。但如果你仔细看过召回结果,可能会发现一个奇怪的现象:
Clark113 天前
llm
十年 C++ 后端 GAP 六个月,写了一个近 3 万行的LLM-TFFInfer推理框架项目解析(三)-模型加载# 十年 C++ 后端 GAP 六个月,写了一个近 3 万行的LLM-TFFInfer推理框架项目解析
Cosolar3 天前
人工智能·llm·github
封神级 TTS!VoxCPM2 凭连续表征,玩转多语言合成 + 创意音色 + 无损声纹克隆VoxCPM2 是 OpenBMB(面壁智能)联合清华大学深圳国际研究生院人机语音交互实验室(THUHCSI)等机构推出的开源 TTS(Text-to-Speech)模型,是 VoxCPM 系列的最新大版本。
岛雨QA3 天前
人工智能·llm·ollama
🎉Token自由-Ollama部署本地大模型超详细操作指南Ollama是一个专为macOS设计的开源工具,让你能在自己的Mac上轻松运行各类大语言模型。它最大的特点是“极简”--无需复杂的Python环境配置,无需CUDA驱动,只要一条命令就能完成模型的下载、安装和运行。
SkySeraph3 天前
llm
大模型套餐深度分析:国内外主流平台全景对比作者:skyseraph 日期:2026-04-30 原始链接:llm 数据截至 2026-05-01