llm

养肥胖虎3 小时前
大模型·llm·学习路线
完整学习LLM(二):大模型到底是什么好家伙,上一篇算是把这个系列开了个头.我当时给自己定了一个目标:那今天就从最基础的问题开始:这个问题看起来简单.
Fleshy数模6 小时前
数据库·人工智能·大模型·llm
基于 CSV 数据分析的课堂教学问题诊断与改进建议系统在教育数字化转型的背景下,通过量化数据分析课堂教学行为、评估教学质量已成为提升课堂效率的重要手段。本文将分享一个基于 Python 实现的课堂教学问题诊断系统,该系统能够读取 CSV 格式的课堂评估数据,对比待测课与优质课的各项指标占比,借助大语言模型自动生成问题分析报告和改进建议。
格桑阿sir8 小时前
ai·大模型·llm·部署·agent·qwen·本地部署
05-大模型智能体开发工程师:本地部署开源小模型实战系列文章导航:AI系列文章导航目录-持续更新中📝 本文摘要:本文指导在本地部署开源模型,包括硬件需求评估(显存估算)、Ollama一键部署方案(安装、运行、API调用)、量化技术(FP16/INT8/INT4及GGUF格式质量对比)、HuggingFace+transformers灵活方案、vLLM生产级加速(PagedAttention/连续批处理),以及从HuggingFace下载原始权重自行加载的完整实操(理解config.json/model.safetensors/tokenizer三大核心文
格桑阿sir8 小时前
深度学习·ai·架构·llm·transformer·agent·智能体
02-大模型智能体开发工程师:Transformer架构核心原理系列文章导航:AI系列文章导航目录-持续更新中📝 本文摘要:本文从RNN的局限性出发,详解Transformer的核心架构:输入表示层(Token Embedding + 位置编码)、Transformer Block(多头自注意力 + FFN + 残差连接 + 层归一化)、输出层;重点拆解了Self-Attention计算过程、多头注意力、FFN的"升维-激活-降维"本质(模式匹配+知识检索)、MoE演进、以及Encoder-only vs Decoder-only的分野和KV Cache加速原理。
小脑斧1239 小时前
llm·提示词·特征工程·ai提示词
提示词极简艺术:用最少 Token,榨干 LLM 极限输出能力AI 提示词不再是随便写一句话,而是用极简 Token、精准意图定义,撬动大模型输出专业、结构化、可直接落地的内容。本文结合 CSDN「AI 提示词极限赛」核心理念,拆解极简 Prompt 设计底层逻辑、通用模板、业务场景落地技巧、Token 压缩方法论,附带可直接复用的万能精简提示词模板,帮助开发者告别长篇啰嗦指令,用最少输入拿到顶级输出效果。关键词:AI 提示词极限赛;Prompt 工程;Token 优化;LLM 极简调用;大模型高效交互
格桑阿sir10 小时前
人工智能·ai·llm·agent·智能体·发展史
01-大模型智能体开发工程师:AI与大模型发展简史系列文章导航:AI系列文章导航目录-持续更新中📝 本文摘要:本文梳理了AI三次浪潮(符号主义→专家系统→深度学习)及从Transformer(2017)到大模型的关键时间线,重点讲解了涌现能力、预训练、微调、对齐(RLHF)和自回归生成等核心概念,帮助理解大模型"为什么是这样设计的"。
威化饼的一隅10 小时前
大模型·llm·agent·强化学习·智能体·agentic rl·旅游智能体
【大模型LLM学习】Agentic RL—基于Qwen3-4b训练Travel Planning Agent通义千问的deepresearch系列最新的一篇,高德公开了旅行规划助手的训练方法,论文为《ArenaRL: Scaling RL for Open-Ended Agents via Tournament based Relative Ranking》,并且这种方法不只是可以用于旅行规划助手,还可以扩展到其他Open-ended生成任务,解决开放生成任务里面llm-as-judge打分太随机把奖励信号淹没的问题。   在这篇中记录尝试训练本地的旅行规划助手,需要使用到高德的地理API接口,阿里百炼的Qwe
swipe10 小时前
面试·langchain·llm
Elasticsearch 全文检索工程教程:倒排索引、IK 分词器与 BM25 从原理到落地很多人第一次做 RAG 或知识库检索时,会直接想到向量数据库:把文本切块,生成 embedding,写入 Milvus、Qdrant、pgvector 或其他向量存储,然后用向量相似度召回内容。这条链路当然重要,尤其适合处理“语义相近但字面不完全一致”的问题。
JouYY11 小时前
llm·agent
Agent记忆进阶——从一个实际例子学习知识图谱各位好久不见,我是久愿Y,自从上次换工作,已经很久没有更新文章了,现在技术圈一天一个样子,新技术层出不穷,希望能通过写文章的方式,让自己能吸纳更多知识,也欢迎一起交流。
冬奇Lab12 小时前
人工智能·llm·agent
Agent系列(三):Plan-and-Solve——先想清楚,再动手上一篇我们说 ReAct 的贪心策略——每一步只看当前状态,决定下一个行动。大多数情况下这很好用,但有一类任务会让它步履蹒跚。
冬奇Lab12 小时前
人工智能·深度学习·llm
每日一个开源项目 #110:ai-engineering-from-scratch - 从零构建 AI 工程全栈能力ai-engineering-from-scratch 是一个极度硬核且完整的 AI 工程课程体系。它不只是教你如何调用 OpenAI 的接口,而是带你从底层的数学原理开始,一步步构建出分词器(Tokenizer)、反向传播(Backprop)、注意力机制(Attention),直到最后的自主智能体集群。
格桑阿sir13 小时前
ai·大模型·llm·openai·agent·ai agent·智能体
03-大模型智能体开发工程师:主流大模型家族与演进系列文章导航:AI系列文章导航目录-持续更新中📝 本文摘要:本文梳理了三大模型阵营(OpenAI闭源标杆、开源阵营LLaMA/Mistral/DeepSeek/Qwen、其他闭源Claude/Gemini),详解各系列演进路线和核心创新(如DeepSeek的MLA和细粒度MoE、R1纯RL推理、Claude的Constitutional AI、Gemini的原生多模态、Qwen的MoE+思考模式),并提供2026年模型选型速查表。
feasibility.13 小时前
人工智能·深度学习·计算机视觉·llm·图像分割·多模态·vlm
Qwen3-VL-Seg 深度解读:当多模态大模型学会“像素级精准手术“论文: Qwen3-VL-Seg: Unlocking Open-World Referring Segmentation with Vision-Language Grounding
codefan※14 小时前
前端·react.js·ai·llm·prompt·prompt工程·思维链
7 个Prompt 框架汇总:从 Chain of Thought 到 ReAct + PoT作者:AI 开发者社区 标签:#Prompt工程 #CoT #ReAct #AI技巧 #思维链 阅读时长:13 分钟
swipe1 天前
后端·langchain·llm
从本地开发到生产部署:用 Docker Compose 跑通 NestJS、MySQL 与 Milvus本文不是一篇只介绍 Docker 概念的笔记,而是一篇围绕真实项目展开的部署教程。我们会基于当前项目 nest-dockerfile-test 的实际源码,讲清楚如何用 Docker Compose 提升本地开发效率,以及如何把 NestJS 服务、MySQL 数据库一起编排成一套可运行的生产环境。
Cosolar1 天前
人工智能·面试·llm
收藏备用!2026 年所有主流 RAG 开源项目都在这里了本文按核心框架、向量数据库、嵌入模型、文档处理、检索增强、评估工具、GraphRAG、低代码平台、Agentic RAG九大维度,整理2026年RAG技术生态的主流开源项目,便于快速选型与落地。
阿牛大牛中1 天前
llm·推荐算法·生成式推荐
多模态生成式推荐技术脉络-MQL4GRec-MACRec-SynGRMQL4GRec、MACRec 和 SynGR 构成了一条很清楚的多模态生成式推荐演化线:MQL4GRec 先把文本和图像 item 内容翻译成统一 quantitative language,让推荐进入多模态 token generation 范式;MACRec 随后发现两套 SID 在量化阶段仍然各学各的,于是把跨模态交互前移到 RQ-VAE residual quantization,并在生成模型里继续做隐式和显式对齐;SynGR 再进一步指出 alignment 不等于 synergy,模型即使拿
AIDF20261 天前
服务器·llm·prompt·agent
动态大模型 Prompt 生成技术解析在大模型应用开发的实际过程中,你可能也遇到过这样一个令人哭笑不得的尴尬场景:比如在 Cherry Studio、Dify 或 Coze 等智能体平台上,我们通常会为 Agent 配置两个最基本的规则通道:user(用户输入)+ system(系统提示词/角色设定)。
Fleshy数模1 天前
python·llm
课堂教学质量评估系统:基于加权欧氏距离的评分实现在教育数字化转型的背景下,课堂教学质量的量化评估成为提升教学水平的关键环节。本文将分享一套基于加权欧氏距离算法的课堂教学质量评分系统实现方案,该方案通过多维度数据采集与权重计算,实现对课堂教学质量的客观、精准评估。
_山海1 天前
python·langchain·llm
用langchain 通过text-embedding-3-small生成embeddingOpenAIEmbedding提供了两个主要方法: