大模型

laplace01232 小时前
架构·大模型·llm·agent·rag
claude code架构猜测总结Claude Code 本质 =「LLM 驱动的 Tool-Calling 循环」+「逐层外置的认知结构」 模型是 Agent,本体代码只负责:约束、反馈、隔离、注入知识。
xueyongfu4 小时前
大模型·dpo·偏好学习·offline rlhf
Offline RLHF-DPO/KTO/ORPO/SPO等偏好学习方法Offline RLHF 以 DPO 为代表,进一步发展出一系列 xPO 方法。相关工作在目标设计上做了多种改动:例如移除目标函数中的 reference 约束、引入长度惩罚项、或显式利用偏好数据中的偏好强度信息等。近期研究更多聚焦于在高噪声偏好数据下提升训练稳健性,以缓解分布漂移带来的性能退化;同时,也有工作开始系统分析 xPO 方法的退化现象,并通过对 logits/策略更新施加约束来稳定优化过程。
KG_LLM图谱增强大模型5 小时前
人工智能·大模型·知识图谱
知识图谱+大模型“驱动的生物制药企业下一代主数据管理:Neo4j知识图谱与GraphRAG及GenAI的深度整合制药行业主数据管理(MDM)面临数据复杂性和关系互联的挑战。本文探讨将Neo4j知识图谱与GraphRAG和生成AI整合的创新框架,提升数据准确性、一致性和可访问性。通过图谱数据库捕捉药物、患者和临床试验间的复杂关系,结合向量嵌入和检索增强生成,实现精准查询和模式发现。实验显示,该方法显著优于传统关系数据库,推动制药决策智能化。
韦东东9 小时前
大模型·知识库·工业隐患
27s→1.3s:“小模型 + 知识库”的工业隐患识别技术复盘(全链路)大模型只是通用推理引擎,私有知识库才是垂直场景 AI 应用的护城河。这句话我在之前的文章里也提过,这个隐患识别项目很好地验证了这个观点。
模型启动机9 小时前
人工智能·ai·大模型
一个模型统一4D世界生成与重建,港科大One4D框架来了来自香港科技大学(HKUST)的研究团队提出 One4D,一个统一的 4D 生成与 4D 重建框架。本文第一作者密振兴,香港科技大学计算机科学与技术学院人工智能方向博士生,研究方向是多模态理解与生成,视频生成和世界模型,目前正在寻找工业界全职职位。
laplace012311 小时前
算法·langchain·大模型·agent
智能体经典范式构建这张主要介绍了三种经典的智能体范式 首先是==ReAct架构,他主要分为三个部分,第一步是thought(思考),这个是llm分析当前情况,分解当前任务,制定下一步计划或者反思之间返回来的上一步结果 然后就是action==,这个是根据thought的结果去调用外部工具(function calling/mcp)执行具体动作
前端程序猿之路11 小时前
人工智能·python·学习·语言模型·大模型·prompt·ai编程
30天大模型学习之Day3:高级 Prompt 工程今天学习后,你能写出: 企业级、可落地、可控、高稳定性的 Prompt很多公司面试官会直接要求你写这些内容。
星云数灵1 天前
人工智能·机器学习·大模型·大模型考试题库·阿里云aca·阿里云acp大模型考试题库·大模型高级工程师acp
大模型高级工程师考试练习题881题使用 Qwen 模型 API 进行对话时,若需实现多轮对话的上下文关联,以下哪种做法正确?A. 每次调用 API 仅传入当前用户查询,无需携带历史对话
_小苔藓_1 天前
深度学习·开源·大模型·微调·多模态
混合Token与LoRA结合Qwen3-VL高效微调(代码开源)代码在自己的一个关于多模态大模型与Multi Agent的开源小项目中,如果喜欢可以点个star~https://github.com/xi029/Qwen3-VL-MoeLORAhttps://github.com/xi029/Qwen3-VL-MoeLORA
万事可爱^1 天前
人工智能·笔记·学习·langchain·大模型
LangChain v1.0学习笔记(4)—— 核心组件Models要学习 LangChain 躲不过的就是它的几大核心组件,这些组件撑起了 LangChain 框架的重要功能,今天我们看一下 Models,这个组件到底应该如何应用,这也算是 LangChain 的功能起源了,调用大模型一般都是在这个组件下面,下面就让我们一起来看一看。
QiZhang | UESTC1 天前
大模型·强化学习·rl4llm
RL4LLMRL4LLM 这是新的学习方向,已经抛弃了rec(_)。具体的学习资源推荐(包括必学资源、选学资源)、项目实践清单,见学习路径文档。
R.X. NLOS1 天前
大模型·大厂面试·扩散模型·ddpm·数学原理
知识点1:DDPM数学原理及理解注1:本文系"视觉方向大厂面试·硬核通关"专栏文章。本专栏致力于对多模态大模型/CV领域的高频高难面试题进行深度拆解。本期攻克的难题是:DDPM(去噪扩散概率模型)的数学原理与推导。
喜欢吃豆1 天前
人工智能·中间件·架构·langchain·大模型
LangChain 架构深度解析:从中间件机制到人机协同 SQL 智能体实战报告随着大语言模型(LLM)技术的飞速发展,AI 应用开发范式正经历从简单的线性“链(Chain)”向复杂的自主“智能体(Agent)”演进。这一转变虽然极大地扩展了 AI 解决复杂问题的能力,但也引入了非确定性输出、资源消耗不可控、安全风险增加等严峻挑战。LangChain 作为行业领先的编排框架,通过引入中间件(Middleware)架构与人机协同(Human-in-the-Loop, HITL)机制,为构建高可靠性、可观测且安全的企业级智能体提供了标准化的系统级解决方案。 本深度技术报告将基于 Lang
Study9961 天前
人工智能·ai·语言模型·自然语言处理·大模型·llm·agent
大语言模型的详解与训练随着2022年底 ChatGPT 再一次刷新 NLP 的能力上限,大语言模型(Large Language Model,LLM)开始接替传统的预训练语言模型(Pre-trained Language Model,PLM) 成为 NLP 的主流方向,基于 LLM 的全新研究范式也正在刷新被 BERT 发扬光大的预训练-微调范式,NLP 由此迎来又一次翻天覆地的变化。从2022年底至今,LLM 能力上限不断刷新,通用基座大模型数量指数级上升,基于 LLM 的概念、应用也是日新月异,预示着大模型时代的到来。
谷哥的小弟1 天前
服务器·数据库·人工智能·sqlite·大模型·源码·mcp
SQLite MCP服务器安装以及客户端连接配置SQLite MCP Server是一种基于“模型上下文协议”(MCP)开发的中间件或服务。它的核心使命是在AI助手(例如Claude、Cursor内的AI功能)和SQLite数据库之间搭建一座标准化、安全的桥梁。简单来说,它把数据库操作“翻译”成AI能够理解和安全执行的指令,从而让AI可以直接与数据库进行交互。目前社区中存在几种不同的实现版本,它们各有侧重。最常见的是基于Node.js或Python的实现,它们功能全面,允许AI执行完整的数据查询、修改以及查看数据库结构。另一些用Rust编写的版本则更侧
模型启动机1 天前
人工智能·ai·大模型·ocr
DeepSeek-OCR是「长文本理解」未来方向?中科院新基准VTCBench给出答案中科院自动化所等推出 VTCBench 基准测试,评估模型在视觉空间中的认知极限,包括信息检索、关联推理和长期记忆三大任务。
谷哥的小弟1 天前
服务器·人工智能·大模型·file system·mcp·ai项目
File System MCP服务器安装以及客户端连接配置File System MCP Server是一种基于模型上下文协议(Model Context Protocol,简称MCP)构建的标准化服务。其主要功能是为AI助手提供一套安全、受控的接口,使其能够与宿主计算机的文件系统进行交互。
huazi-J2 天前
语言模型·大模型·tokenizer·datawhale
Datawhale 大模型基础与量化微调 task0:Tokenizer假设一个分词路径由一个词语序列组成,将其表示为 w 1 , w 2 , . . . , w n w_1, w_2, ..., w_n w1,w2,...,wn,其中 w i w_i wi 代表序列中的第 i 个词。那么这条路径的概率可以近似为:
少林码僧2 天前
人工智能·ai·数据分析·大模型
2.9 字段分箱技术详解:连续变量离散化,提升模型效果的关键步骤分箱是将连续变量离散化的过程,是特征工程中的关键步骤。好的分箱可以提升模型效果,增强模型稳定性。本文将详细介绍各种分箱方法,并提供完整的实现代码。
AI情报挖掘日志2 天前
大模型·aminer·大模型研究
AGI-Next前沿峰会「沉思报告」——中国AGI背后的产业逻辑与战略分野本文借助「AMiner沉思」GLM-4.6能力对AGI-Next峰会相关资讯进行多轮检索完成。 本报告旨在对2026年1月10日于北京举行的“AGI-Next前沿峰会”闭门会议进行一次系统性、深度的研究与分析。 该峰会汇聚了中国人工智能(AI)领域最具影响力的四位产业领袖——智谱AI的唐杰、月之暗面的杨植麟、阿里云通义千问的林俊旸,以及腾讯的姚顺雨,并邀请了张钹院士、杨强教授等学界泰斗参与圆桌讨论。会议的核心议题聚焦于通用人工智能(AGI)的下一代技术范式、产业落地路径以及中国在全球竞争格局中的战略选择。