大语言模型

仰望尾迹云10 分钟前
node.js·大语言模型·ai聊天·实时对话
Chandra AI与Node.js集成:实时聊天应用开发全攻略市面上的AI聊天工具大多以网页形式存在,点开就能用,但这种便利背后藏着不少实际问题。比如,企业内部系统需要嵌入聊天功能时,直接调用第三方API会面临数据安全顾虑;又或者,开发者想在自己的产品里加入智能对话能力,却发现现有方案无法灵活定制上下文管理逻辑。这时候,Chandra AI的价值就凸显出来了——它不是另一个云端聊天框,而是一套能装进你电脑、服务器甚至老旧笔记本里的AI对话系统,从模型运行到界面交互,全部发生在你自己的设备上。
大傻^8 小时前
机器人·llm·大语言模型·强化学习·urdf·ppo·奖励设计
强化学习与大模型融合:从理论到机器人实践全解析导读:本文系统梳理了强化学习(RL)与大语言模型(LLM)融合的前沿技术,涵盖从理论基础、算法架构到机器人仿真实践的完整链路。基于最新学术讨论与实验案例,深入剖析如何利用大模型优化奖励设计、解决多智能体协作难题,并提供完整的开发环境搭建指南。
deephub1 天前
人工智能·大语言模型·rag·检索
RAG 中分块重叠的 8 个隐性开销与权衡策略RAG 分块重叠提升了召回率但增加了隐藏成本,比如说索引膨胀、Embedding 开销、延迟、重排序负载和评估漂移。
深刻如此3 天前
大语言模型·文本生成·vllm·chainlit
Qwen2.5-7B-Instruct实战教程:Chainlit集成WebSocket实时通信增强你可能已经听说过通义千问系列,但Qwen2.5-7B-Instruct这个新名字,代表的不只是版本更新,而是一次能力跃迁。它不是简单地把参数调大、训练时间拉长,而是从知识覆盖、逻辑推理、结构化理解到多语言支持,做了系统性升级。
deephub3 天前
人工智能·ci/cd·大语言模型·aiagent
并行多智能体系统的协调测试实战:从轨迹捕获到CI/CD的六个步骤多智能体系统一旦从顺序执行走向并行,测试的需求就更严格了。单个智能体的输出可能都是对的,但多个智能体并行决策、彼此影响时,集体行为可能违反系统级约束,而传统的单元测试和输出断言对这类问题完全无能为力。
deephub5 天前
人工智能·python·大语言模型·rag
深入RAG架构:分块策略、混合检索与重排序的工程实现把一个RAG系统从Demo做到生产,中间要解决5个问题。最初的版本就是标准版:全量文档 embedding,向量检索,LLM生成。演示没出过问题,但是翻车发生在数据留存政策的时候,因为系统召回了两段2废弃条款和一段聊"员工留存"的HR文档,然后把这三段内容揉成了一个看似完整实则全错的回答。
背离赤道逆光而行6 天前
大语言模型·qwen·api网关·clawdbot
Clawdbot部署实操:解决‘gateway token missing’授权问题的完整步骤Clawdbot 是一个统一的 AI 代理网关与管理平台,它的核心目标很实在——让开发者不用反复折腾模型对接、权限配置和会话管理,就能快速把自主AI代理跑起来、管起来、用起来。
leniou的牙膏6 天前
大语言模型·qwen·api网关·文本交互
Clawdbot部署教程:解决‘gateway token missing’授权问题的完整步骤Clawdbot 是一个统一的 AI 代理网关与管理平台,专为开发者设计,目标很实在:让你不用反复折腾配置、写胶水代码、搭中间层,就能快速构建、部署和监控自己的自主 AI 代理。
程序员爱德华7 天前
大语言模型·知识蒸馏
深度学习模型最基础的神经网络,用于简单分类、回归擅长图像、语音、时序等网格数据传统序列模型,处理文本、时间序列ResNet / DenseNet:图像分类backbone ViT(Vision Transformer):用Transformer做视觉 YOLO / Faster R-CNN:目标检测 U-Net:医学图像分割 GAN / StyleGAN:图像生成 Stable Diffusion / Flux:文生图、图生图扩散模型
deephub12 天前
人工智能·深度学习·大语言模型·rag·检索
RAG 文本分块:七种主流策略的原理与适用场景检索是 RAG 系统的搜索引擎,分块则是这个搜索引擎的基础。分块太长、太短、有噪声、切错了位置——随便犯哪个错LLM 都会有问题。行业里有句话流传很广:“分块决定了 RAG 质量的 70%。”
deephub13 天前
人工智能·prompt·大语言模型
LLM创造力可以被度量吗?一个基于提示词变更的探索性实验大语言模型在demo阶段总是看起来很惊艳。但一旦进入到生产环境很多问题就暴露了:不稳定、不可预测,甚至直接不可用。
司南OpenCompass13 天前
人工智能·大语言模型·多模态模型·大模型评测·司南评测
Gemini-3-Pro-Preview登顶,大模型迈入Agent元年丨大语言模型1月最新榜单揭晓进入 2026 年,全球大模型技术持续加速演进,新一轮模型发布不断刷新能力边界。行业关注重点从基础能力指标,转向模型在真实复杂场景中的综合表现。各类模型持续强化智能体相关能力,在编程、推理、工具调用与信息检索等关键方向不断提升,全面增强解决实际问题的能力。与此同时,中国大模型在全球舞台上持续受到关注,越来越多模型在海外社区引发热议,展现出中国在大模型日益增强的技术实力与创新活力。
zhangfeng113313 天前
python·大语言模型
GitHub博主hiyouga与LlamaFactory项目研究报告本研究聚焦于GitHub知名博主hiyouga及其明星项目LlamaFactory,旨在全面了解该博主的技术影响力,并深入分析其核心项目的技术价值。
SunnyRivers13 天前
人工智能·大语言模型
理解人工智能与大语言模型(LLMs)学习什么是大语言模型(LLMs)、它们的工作原理,并比较最新的 AI 模型,如 GPT-4.1、Claude 4、Gemini 2.5 和 Llama 4。本教程全面覆盖初学者在 2025 年需要了解的所有 AI 基础知识。
deephub14 天前
人工智能·microsoft·langchain·大语言模型·agent·强化学习
Agent Lightning:微软开源的框架无关 Agent 训练方案,LangChain/AutoGen 都能用Agent 搭建起来之后怎么让它真正变得越来越好?搭建完成后的优化就很少有人认真说过。Agent Lightning 号称能把任何 AI Agent 变成"可优化的猛兽",而且几乎不用改代码。那问题来了,市面上 Agent 框架满天飞这个凭什么就不一样呢?
deephub15 天前
人工智能·python·软件工程·大语言模型·ai智能体
软件工程原则在多智能体系统中的应用:分层与解耦ChatGPT 发布之后,AI 智能体的概念就一直牵动着整个行业的想象力。它描绘的场景很诱人:给 AI 系统一个目标,让它自行拆解问题、调用工具、收集信息,最终综合出结果。
prog_610318 天前
笔记·大语言模型·agent·cursor
【笔记】思路分享:各种大模型免费当agent后台虽然有cursor协助,但是还是得居安思危,先准备好没有cursor的时候该用什么,然后继续思考如果没有大模型,能用什么做替代。不想得过远,我们先想想如果cursor没有了该怎么办。
deephub19 天前
人工智能·深度学习·大语言模型·推理时计算
LLM推理时计算技术详解:四种提升大模型推理能力的方法2025年LLM领域有个有意思的趋势:与其继续卷模型训练,不如在推理阶段多花点功夫。这就是所谓的推理时计算(Test-Time / Inference-Time Compute):在推理阶段投入更多计算资源,包括更多Token、更多尝试、更深入的搜索,但不会改动模型权重。
北京地铁1号线22 天前
大数据·人工智能·深度学习·大语言模型
4.2 幻觉抑制策略目录第一部分:理解幻觉第二部分:通过Prompt引导抑制幻觉(事前干预)1. 提高输入信息质量2. 结构化Prompt工程
中杯可乐多加冰23 天前
人工智能·大模型·llm·大语言模型·rag·检索增强生成
RAG 深度实践系列(七):从“能用”到“好用”——RAG 系统优化与效果评估在 RAG 深度实践系列的前几篇文章中,我们已经完成了从理论架构到动手搭建,再到企业级平台部署的全过程。RAG(Retrieval-Augmented Generation,检索增强生成)技术,作为连接大语言模型(LLM)与企业私域知识的桥梁,无疑是当前 AI 领域最具潜力的应用范式之一。