大模型

星云数灵4 小时前
人工智能·机器学习·大模型·大模型考试题库·阿里云aca·阿里云acp大模型考试题库·大模型高级工程师acp
大模型高级工程师考试练习题881题使用 Qwen 模型 API 进行对话时,若需实现多轮对话的上下文关联,以下哪种做法正确?A. 每次调用 API 仅传入当前用户查询,无需携带历史对话
_小苔藓_4 小时前
深度学习·开源·大模型·微调·多模态
混合Token与LoRA结合Qwen3-VL高效微调(代码开源)代码在自己的一个关于多模态大模型与Multi Agent的开源小项目中,如果喜欢可以点个star~https://github.com/xi029/Qwen3-VL-MoeLORAhttps://github.com/xi029/Qwen3-VL-MoeLORA
万事可爱^5 小时前
人工智能·笔记·学习·langchain·大模型
LangChain v1.0学习笔记(4)—— 核心组件Models要学习 LangChain 躲不过的就是它的几大核心组件,这些组件撑起了 LangChain 框架的重要功能,今天我们看一下 Models,这个组件到底应该如何应用,这也算是 LangChain 的功能起源了,调用大模型一般都是在这个组件下面,下面就让我们一起来看一看。
QiZhang | UESTC7 小时前
大模型·强化学习·rl4llm
RL4LLMRL4LLM 这是新的学习方向,已经抛弃了rec(_)。具体的学习资源推荐(包括必学资源、选学资源)、项目实践清单,见学习路径文档。
R.X. NLOS7 小时前
大模型·大厂面试·扩散模型·ddpm·数学原理
知识点1:DDPM数学原理及理解注1:本文系"视觉方向大厂面试·硬核通关"专栏文章。本专栏致力于对多模态大模型/CV领域的高频高难面试题进行深度拆解。本期攻克的难题是:DDPM(去噪扩散概率模型)的数学原理与推导。
喜欢吃豆7 小时前
人工智能·中间件·架构·langchain·大模型
LangChain 架构深度解析:从中间件机制到人机协同 SQL 智能体实战报告随着大语言模型(LLM)技术的飞速发展,AI 应用开发范式正经历从简单的线性“链(Chain)”向复杂的自主“智能体(Agent)”演进。这一转变虽然极大地扩展了 AI 解决复杂问题的能力,但也引入了非确定性输出、资源消耗不可控、安全风险增加等严峻挑战。LangChain 作为行业领先的编排框架,通过引入中间件(Middleware)架构与人机协同(Human-in-the-Loop, HITL)机制,为构建高可靠性、可观测且安全的企业级智能体提供了标准化的系统级解决方案。 本深度技术报告将基于 Lang
Study9968 小时前
人工智能·ai·语言模型·自然语言处理·大模型·llm·agent
大语言模型的详解与训练随着2022年底 ChatGPT 再一次刷新 NLP 的能力上限,大语言模型(Large Language Model,LLM)开始接替传统的预训练语言模型(Pre-trained Language Model,PLM) 成为 NLP 的主流方向,基于 LLM 的全新研究范式也正在刷新被 BERT 发扬光大的预训练-微调范式,NLP 由此迎来又一次翻天覆地的变化。从2022年底至今,LLM 能力上限不断刷新,通用基座大模型数量指数级上升,基于 LLM 的概念、应用也是日新月异,预示着大模型时代的到来。
谷哥的小弟8 小时前
服务器·数据库·人工智能·sqlite·大模型·源码·mcp
SQLite MCP服务器安装以及客户端连接配置SQLite MCP Server是一种基于“模型上下文协议”(MCP)开发的中间件或服务。它的核心使命是在AI助手(例如Claude、Cursor内的AI功能)和SQLite数据库之间搭建一座标准化、安全的桥梁。简单来说,它把数据库操作“翻译”成AI能够理解和安全执行的指令,从而让AI可以直接与数据库进行交互。目前社区中存在几种不同的实现版本,它们各有侧重。最常见的是基于Node.js或Python的实现,它们功能全面,允许AI执行完整的数据查询、修改以及查看数据库结构。另一些用Rust编写的版本则更侧
模型启动机9 小时前
人工智能·ai·大模型·ocr
DeepSeek-OCR是「长文本理解」未来方向?中科院新基准VTCBench给出答案中科院自动化所等推出 VTCBench 基准测试,评估模型在视觉空间中的认知极限,包括信息检索、关联推理和长期记忆三大任务。
谷哥的小弟10 小时前
服务器·人工智能·大模型·file system·mcp·ai项目
File System MCP服务器安装以及客户端连接配置File System MCP Server是一种基于模型上下文协议(Model Context Protocol,简称MCP)构建的标准化服务。其主要功能是为AI助手提供一套安全、受控的接口,使其能够与宿主计算机的文件系统进行交互。
huazi-J12 小时前
语言模型·大模型·tokenizer·datawhale
Datawhale 大模型基础与量化微调 task0:Tokenizer假设一个分词路径由一个词语序列组成,将其表示为 w 1 , w 2 , . . . , w n w_1, w_2, ..., w_n w1,w2,...,wn,其中 w i w_i wi 代表序列中的第 i 个词。那么这条路径的概率可以近似为:
少林码僧1 天前
人工智能·ai·数据分析·大模型
2.9 字段分箱技术详解:连续变量离散化,提升模型效果的关键步骤分箱是将连续变量离散化的过程,是特征工程中的关键步骤。好的分箱可以提升模型效果,增强模型稳定性。本文将详细介绍各种分箱方法,并提供完整的实现代码。
AI情报挖掘日志1 天前
大模型·aminer·大模型研究
AGI-Next前沿峰会「沉思报告」——中国AGI背后的产业逻辑与战略分野本文借助「AMiner沉思」GLM-4.6能力对AGI-Next峰会相关资讯进行多轮检索完成。 本报告旨在对2026年1月10日于北京举行的“AGI-Next前沿峰会”闭门会议进行一次系统性、深度的研究与分析。 该峰会汇聚了中国人工智能(AI)领域最具影响力的四位产业领袖——智谱AI的唐杰、月之暗面的杨植麟、阿里云通义千问的林俊旸,以及腾讯的姚顺雨,并邀请了张钹院士、杨强教授等学界泰斗参与圆桌讨论。会议的核心议题聚焦于通用人工智能(AGI)的下一代技术范式、产业落地路径以及中国在全球竞争格局中的战略选择。
程序员黄老师1 天前
数据库·大模型·向量·rag
主流向量数据库全面解析随着大语言模型(LLM)的快速发展,RAG(检索增强生成)技术成为解决模型“幻觉”、提升专业领域回答精度的核心方案,而向量数据库则是RAG技术的底层支撑。向量数据库专门用于存储、管理和检索高维嵌入向量(Embedding),通过高效的相似度匹配算法,快速从海量数据中找到与查询向量最相关的结果。
何中应1 天前
ai·大模型·智能体开发
快速上架第一个智能体Coze(官网:https://www.coze.cn/home),是字节跳动出品的,一个 AI Agent 开发平台,在该平台上可以将自己调试完成,开发好的智能体上架到他们的商店,分享给其他人使用,也可以使用其他开发者上架的智能体。
victory04311 天前
深度学习·学习·大模型
大模型学习阶段总结和下一阶段展望1个月内学会大模型预训练微调强化学习基本原理,做一个github项目然后找到大模型强化学习或者agent应用等实习,在农历春节之前。 2026年1月5日-1月11日 总结当前进展,明确下周方向 1月12号-1月16号
谷哥的小弟1 天前
搜索引擎·大模型·spring ai·mcp·brave search
Brave Search MCP服务器安装以及客户端连接配置Brave Search 是一个由开发隐私浏览器 Brave 的公司推出的独立搜索引擎,其核心特点是专注于用户隐私保护,承诺不追踪用户的搜索历史或个人数据。与依赖谷歌、必应等第三方索引的传统搜索引擎不同,它主要基于自己构建的独立网络索引(约92%的查询来自自有索引)来提供结果,确保了技术自主性。该搜索引擎可通过网页端 search.brave.com 访问,并深度集成于Brave浏览器中作为默认引擎,其商业模式主要依靠与搜索词相关、而非基于用户追踪的广告。除了基本搜索,它还提供特色功能如允许用户自定义结果
星云数灵1 天前
数据库·大模型·阿里云acp·大模型工程师·大模型考试题库·阿里云aca·大模型工程师acp
大模型高级工程师考试练习题771题在 RAG 系统中,若发现模型生成的答案与检索到的文档内容无关,大概率是哪个环节出现了问题?A. 文本切片时的字符长度设置过长
星云数灵2 天前
人工智能·大模型·大模型工程师·阿里云大模型aca·阿里云大模型工程师acp·大模型acp考试题库·acp认证
大模型高级工程师考试练习题661题使用 LlamaIndex 构建 RAG 应用时,若需提升检索结果的精准度,以下哪种方案最有效?
索木木2 天前
大模型·sft·强化学习·思维链
强化学习与思维链一. 强化学习1.SFT与强化学习2.RM(奖励模型)ORM(结果奖励):标注困难,成本高PRM(过程奖励): 简单, 但存在结果对, 过程错的情况。