大语言模型

deephub2 天前
人工智能·深度学习·大语言模型·agent·rag
高级 RAG 技术:查询转换与查询分解检索增强生成(RAG)的基础流程是用户查询转换为向量嵌入,从向量数据库中取回相似文档,再将这些文档作为上下文送入大语言模型(LLM)生成答案。
深瞳智检3 天前
人工智能·笔记·学习·自然语言处理·llm·大语言模型
lesson-01 NLP 概述学习笔记 & 学习心得lesson-01 NLP 概述学习笔记 & 学习心得学习笔记1. 什么是 NLP2. NLP 的发展历程
deephub4 天前
人工智能·python·大语言模型·agent
多智能体系统的三种编排模式:Supervisor、Pipeline 与 Swarm多智能体系统是 2026 年主流构建方式,Claude 的智能体团队功能、OpenAI 的 Swarm 框架、LangGraph 的编排层以及 CrewAI都指向同一个结论:复杂任务需要协调配合的专家,而非一个万能通才。
rgb2gray4 天前
人工智能·python·llm·大语言模型·需求分析·多模态·maup
论文详解 | HDAM:破解 MAUP 的城市出行需求分析新方法,实现关键驱动精准识别原文:Unveiling the key drivers of travel demand via hotspot analysis: a new approach to mitigate the modifiable areal unit problem
ErizJ5 天前
llm·大语言模型·training
LLM | 训练与推理过程现代 LLM(如 GPT、LLaMA、Claude)均基于 Transformer 架构,核心是自注意力机制(Self-Attention)。
deephub6 天前
人工智能·python·深度学习·大语言模型·agent
LangGraph vs Semantic Kernel:状态图与内核插件的两条技术路线对比多数关于 LangGraph 和 Semantic Kernel 的比较文章已经过时。过去六个月里,两个框架分别进行了重大的更新,所以本文将梳理的是实际发生的变化、当前的代码形态,以及如何进行技术选型。
七牛云行业应用7 天前
人工智能·chatgpt·大语言模型·ai agent·mcp协议
GPT-5.4能力前瞻:解析原生电脑操控(Computer Use)原理与Agent架构构建人工智能领域的发展速度往往让预测显得保守,但当我们把目光投向即将到来的 GPT-5 时代,特别是传闻中的 GPT-5.4 版本时,两个关键词显得格外耀眼:原生电脑操控(Computer Use)与深度 Thinking 模式。这不再仅仅是关于“更聪明的聊天机器人”,而是关于 AI 如何从“对话者”进化为真正的“操作者”。
仰望尾迹云21 天前
node.js·大语言模型·ai聊天·实时对话
Chandra AI与Node.js集成:实时聊天应用开发全攻略市面上的AI聊天工具大多以网页形式存在,点开就能用,但这种便利背后藏着不少实际问题。比如,企业内部系统需要嵌入聊天功能时,直接调用第三方API会面临数据安全顾虑;又或者,开发者想在自己的产品里加入智能对话能力,却发现现有方案无法灵活定制上下文管理逻辑。这时候,Chandra AI的价值就凸显出来了——它不是另一个云端聊天框,而是一套能装进你电脑、服务器甚至老旧笔记本里的AI对话系统,从模型运行到界面交互,全部发生在你自己的设备上。
大傻^22 天前
机器人·llm·大语言模型·强化学习·urdf·ppo·奖励设计
强化学习与大模型融合:从理论到机器人实践全解析导读:本文系统梳理了强化学习(RL)与大语言模型(LLM)融合的前沿技术,涵盖从理论基础、算法架构到机器人仿真实践的完整链路。基于最新学术讨论与实验案例,深入剖析如何利用大模型优化奖励设计、解决多智能体协作难题,并提供完整的开发环境搭建指南。
deephub22 天前
人工智能·大语言模型·rag·检索
RAG 中分块重叠的 8 个隐性开销与权衡策略RAG 分块重叠提升了召回率但增加了隐藏成本,比如说索引膨胀、Embedding 开销、延迟、重排序负载和评估漂移。
深刻如此24 天前
大语言模型·文本生成·vllm·chainlit
Qwen2.5-7B-Instruct实战教程:Chainlit集成WebSocket实时通信增强你可能已经听说过通义千问系列,但Qwen2.5-7B-Instruct这个新名字,代表的不只是版本更新,而是一次能力跃迁。它不是简单地把参数调大、训练时间拉长,而是从知识覆盖、逻辑推理、结构化理解到多语言支持,做了系统性升级。
deephub24 天前
人工智能·ci/cd·大语言模型·aiagent
并行多智能体系统的协调测试实战:从轨迹捕获到CI/CD的六个步骤多智能体系统一旦从顺序执行走向并行,测试的需求就更严格了。单个智能体的输出可能都是对的,但多个智能体并行决策、彼此影响时,集体行为可能违反系统级约束,而传统的单元测试和输出断言对这类问题完全无能为力。
deephub1 个月前
人工智能·python·大语言模型·rag
深入RAG架构:分块策略、混合检索与重排序的工程实现把一个RAG系统从Demo做到生产,中间要解决5个问题。最初的版本就是标准版:全量文档 embedding,向量检索,LLM生成。演示没出过问题,但是翻车发生在数据留存政策的时候,因为系统召回了两段2废弃条款和一段聊"员工留存"的HR文档,然后把这三段内容揉成了一个看似完整实则全错的回答。
背离赤道逆光而行1 个月前
大语言模型·qwen·api网关·clawdbot
Clawdbot部署实操:解决‘gateway token missing’授权问题的完整步骤Clawdbot 是一个统一的 AI 代理网关与管理平台,它的核心目标很实在——让开发者不用反复折腾模型对接、权限配置和会话管理,就能快速把自主AI代理跑起来、管起来、用起来。
leniou的牙膏1 个月前
大语言模型·qwen·api网关·文本交互
Clawdbot部署教程:解决‘gateway token missing’授权问题的完整步骤Clawdbot 是一个统一的 AI 代理网关与管理平台,专为开发者设计,目标很实在:让你不用反复折腾配置、写胶水代码、搭中间层,就能快速构建、部署和监控自己的自主 AI 代理。
程序员爱德华1 个月前
大语言模型·知识蒸馏
深度学习模型最基础的神经网络,用于简单分类、回归擅长图像、语音、时序等网格数据传统序列模型,处理文本、时间序列ResNet / DenseNet:图像分类backbone ViT(Vision Transformer):用Transformer做视觉 YOLO / Faster R-CNN:目标检测 U-Net:医学图像分割 GAN / StyleGAN:图像生成 Stable Diffusion / Flux:文生图、图生图扩散模型
deephub1 个月前
人工智能·深度学习·大语言模型·rag·检索
RAG 文本分块:七种主流策略的原理与适用场景检索是 RAG 系统的搜索引擎,分块则是这个搜索引擎的基础。分块太长、太短、有噪声、切错了位置——随便犯哪个错LLM 都会有问题。行业里有句话流传很广:“分块决定了 RAG 质量的 70%。”
deephub1 个月前
人工智能·prompt·大语言模型
LLM创造力可以被度量吗?一个基于提示词变更的探索性实验大语言模型在demo阶段总是看起来很惊艳。但一旦进入到生产环境很多问题就暴露了:不稳定、不可预测,甚至直接不可用。
司南OpenCompass1 个月前
人工智能·大语言模型·多模态模型·大模型评测·司南评测
Gemini-3-Pro-Preview登顶,大模型迈入Agent元年丨大语言模型1月最新榜单揭晓进入 2026 年,全球大模型技术持续加速演进,新一轮模型发布不断刷新能力边界。行业关注重点从基础能力指标,转向模型在真实复杂场景中的综合表现。各类模型持续强化智能体相关能力,在编程、推理、工具调用与信息检索等关键方向不断提升,全面增强解决实际问题的能力。与此同时,中国大模型在全球舞台上持续受到关注,越来越多模型在海外社区引发热议,展现出中国在大模型日益增强的技术实力与创新活力。
zhangfeng11331 个月前
python·大语言模型
GitHub博主hiyouga与LlamaFactory项目研究报告本研究聚焦于GitHub知名博主hiyouga及其明星项目LlamaFactory,旨在全面了解该博主的技术影响力,并深入分析其核心项目的技术价值。