llm

knight_9___1 小时前
人工智能·python·深度学习·面试·职场和发展·llm·agent
LLM工具调用面试篇5MCP 支持两种主要的传输方式,分别适用于不同场景。本地场景用 stdio,Client 把 Server 作为子进程启动,通过标准输入输出通信,延迟极低,不用开端口,也没有网络安全问题,我用 Claude Desktop 接本地工具走的就是这种方式。
feasibility.2 小时前
人工智能·科技·llm·边缘计算·量化·cv·压缩
量化:LLM与CV模型的极致压缩艺术2023年,GPT-4的参数量传闻超过1.8万亿;2024年,Llama 3.1 405B开源;2025年,Qwen3-VL-2B试图在手机上运行多模态推理。模型规模的指数级增长与硬件资源的线性增长之间,横亘着一道名为推理成本的鸿沟。
树獭非懒2 小时前
人工智能·程序员·llm
LangChain 不是框架,而是一把瑞士军刀你第一次用 OpenAI API 时,几行代码就让模型开口说话了——那一刻你觉得 AI 开发不过如此。
冬奇Lab4 小时前
数据库·人工智能·llm
RAG 系列(六):向量数据库——存储与检索的基础设施前面五篇文章,我们搞清楚了怎么切分文档、怎么生成 Embedding。现在这些向量存在哪里?怎么被高效地检索出来?
冬奇Lab14 小时前
人工智能·llm·aigc
RAG 系列(五):Embedding 模型——语义理解的核心前面四篇文章,我们搞定了 Pipeline 搭建、参数调优和分块策略。但有一个问题一直没细说:你的文档被切成 Chunk 之后,是怎么变成向量的?
SkySeraph1 天前
llm·agent·skill·skillnexus
SkillNexus:开源 Skills 全生命周期创造平台作者:skyseraph 日期:2026-05-02 原文:SkillNexus Intro 开源:SkillNexus
wj3055853781 天前
llm·llama
Ollama Cloud 与直接使用 API 的对比Ollama Cloud 的核心价值不是“比 API 更强”,而是:把云端大模型接入到 Ollama 现有工作流里,让云端模型像本地 Ollama 模型一样使用。
无糖可乐没有灵魂1 天前
ai·llm·prompt·agent·mcp·skills
AI Agent结构图例和工作流程描述一句话概括工作流程:用户提问 → Agent 构造上下文 → LLM 判断是否用工具 → Agent 执行工具 → 结果回注 → LLM 生成最终答案
冬奇Lab2 天前
人工智能·llm·源码
RAG 系列(四):文档处理——从原始文件到高质量 Chunk前面三篇文章,我们搭好了 RAG Pipeline,也调对了核心参数。但如果你仔细看过召回结果,可能会发现一个奇怪的现象:
Clark112 天前
llm
十年 C++ 后端 GAP 六个月,写了一个近 3 万行的LLM-TFFInfer推理框架项目解析(三)-模型加载# 十年 C++ 后端 GAP 六个月,写了一个近 3 万行的LLM-TFFInfer推理框架项目解析
Cosolar2 天前
人工智能·llm·github
封神级 TTS!VoxCPM2 凭连续表征,玩转多语言合成 + 创意音色 + 无损声纹克隆VoxCPM2 是 OpenBMB(面壁智能)联合清华大学深圳国际研究生院人机语音交互实验室(THUHCSI)等机构推出的开源 TTS(Text-to-Speech)模型,是 VoxCPM 系列的最新大版本。
岛雨QA2 天前
人工智能·llm·ollama
🎉Token自由-Ollama部署本地大模型超详细操作指南Ollama是一个专为macOS设计的开源工具,让你能在自己的Mac上轻松运行各类大语言模型。它最大的特点是“极简”--无需复杂的Python环境配置,无需CUDA驱动,只要一条命令就能完成模型的下载、安装和运行。
SkySeraph2 天前
llm
大模型套餐深度分析:国内外主流平台全景对比作者:skyseraph 日期:2026-04-30 原始链接:llm 数据截至 2026-05-01
稚枭天卓2 天前
llm
大模型评测网站合集特点:全球开源大模型的核心 "打榜" 阵地,自动化评估模型在知识、推理、常识等多个维度的表现,覆盖 MMLU(57 个学科的通用知识评测)、ARC、TruthfulQA 等核心基准。
怪我冷i2 天前
golang·llm
如何在VsCode中安装Golang插件在VS Code中安装Go插件是进行Go语言开发的基础配置,以下是完整的安装和配置指南:安装VS Code:从官网下载并安装最新版Visual Studio Code
钟智强2 天前
ai·架构·llm·deepseek
DeepSeek-R1 V3.2 V4架构训练推理性能实测分析,企业私有化部署选型对照表当前开源大模型产业迭代正式迈入高质量精细化深度发展新阶段,行业整体已经彻底告别早期粗放式参数盲目堆叠、同质化功能复刻以及市场营销驱动的虚假版本迭代发展路径。随着企业私有化落地需求爆发、科研高阶推理研究常态化、Agent智能体工程化落地规模化,市场对于大模型的核心评判标准,已经从单纯参数体量比拼,转向底层架构稳定性、高阶逻辑推理能力、长文本计算运行效率、私有化部署成本可控性、行业业务场景适配度五大核心硬核指标。DeepSeek-AI作为国内专注基础大模型底层自研与技术持续演进的核心团队,依托体系化、连贯性、
研究点啥好呢3 天前
python·面试·llm·求职招聘·笔试·高德
高德多模态算法工程师面试题精选:10道高频考题+答案解析题目背景: 这是高德面试中出现频率极高的一道题,面试官通常会追问Swin Transformer和ViT的区别,以及如何用在街景理解中。
程序设计实验室3 天前
ai·llm
用本地大模型驱动中文输入法,我做了一个实验性的项目你有没有用输入法时遇到这样的情况:打了一段话,下一个词的候选列表里,排第一的偏偏不是你想要的那个,但你知道那个词一定在后面几位,因为你刚才已经用过它了。
怪我冷i3 天前
golang·llm·多租户·skill
多租户管理系统,用户表,IsSuperAdmin,IsTenantAdmin,IsCompanyAdmin,IsDeptAdmin需要吗?这是一个非常好的问题。加上 IsTenantAdmin(租户管理员)确实是一个更好的设计。虽然理论上可以通过赋予特定用户一个拥有所有权限的“角色”来实现租户管理员的功能,但在实际的系统架构中,保留一个硬标志位通常比纯 RBAC(基于角色的访问控制)更安全、性能更好且逻辑更清晰。
测试员周周3 天前
llm·ai编程·测试
【AI测试系统】第2篇:拒绝盲目 AI:规则引擎 10ms 自动生成 36 条测试用例实战(附源码)很多人一听"AI测试"就以为所有用例都是大模型生成的。实际上我们跑下来的经验是:规则引擎出基础用例,AI 做精细打磨,两者配合效率最高。