技术栈
大模型
星云数灵
4 小时前
人工智能
·
机器学习
·
大模型
·
大模型考试题库
·
阿里云aca
·
阿里云acp大模型考试题库
·
大模型高级工程师acp
大模型高级工程师考试练习题8
81题使用 Qwen 模型 API 进行对话时,若需实现多轮对话的上下文关联,以下哪种做法正确?A. 每次调用 API 仅传入当前用户查询,无需携带历史对话
_小苔藓_
4 小时前
深度学习
·
开源
·
大模型
·
微调
·
多模态
混合Token与LoRA结合Qwen3-VL高效微调(代码开源)
代码在自己的一个关于多模态大模型与Multi Agent的开源小项目中,如果喜欢可以点个star~https://github.com/xi029/Qwen3-VL-MoeLORAhttps://github.com/xi029/Qwen3-VL-MoeLORA
万事可爱^
5 小时前
人工智能
·
笔记
·
学习
·
langchain
·
大模型
LangChain v1.0学习笔记(4)—— 核心组件Models
要学习 LangChain 躲不过的就是它的几大核心组件,这些组件撑起了 LangChain 框架的重要功能,今天我们看一下 Models,这个组件到底应该如何应用,这也算是 LangChain 的功能起源了,调用大模型一般都是在这个组件下面,下面就让我们一起来看一看。
QiZhang | UESTC
7 小时前
大模型
·
强化学习
·
rl4llm
RL4LLM
RL4LLM 这是新的学习方向,已经抛弃了rec(_)。具体的学习资源推荐(包括必学资源、选学资源)、项目实践清单,见学习路径文档。
R.X. NLOS
7 小时前
大模型
·
大厂面试
·
扩散模型
·
ddpm
·
数学原理
知识点1:DDPM数学原理及理解
注1:本文系"视觉方向大厂面试·硬核通关"专栏文章。本专栏致力于对多模态大模型/CV领域的高频高难面试题进行深度拆解。本期攻克的难题是:DDPM(去噪扩散概率模型)的数学原理与推导。
喜欢吃豆
7 小时前
人工智能
·
中间件
·
架构
·
langchain
·
大模型
LangChain 架构深度解析:从中间件机制到人机协同 SQL 智能体实战报告
随着大语言模型(LLM)技术的飞速发展,AI 应用开发范式正经历从简单的线性“链(Chain)”向复杂的自主“智能体(Agent)”演进。这一转变虽然极大地扩展了 AI 解决复杂问题的能力,但也引入了非确定性输出、资源消耗不可控、安全风险增加等严峻挑战。LangChain 作为行业领先的编排框架,通过引入中间件(Middleware)架构与人机协同(Human-in-the-Loop, HITL)机制,为构建高可靠性、可观测且安全的企业级智能体提供了标准化的系统级解决方案。 本深度技术报告将基于 Lang
Study996
8 小时前
人工智能
·
ai
·
语言模型
·
自然语言处理
·
大模型
·
llm
·
agent
大语言模型的详解与训练
随着2022年底 ChatGPT 再一次刷新 NLP 的能力上限,大语言模型(Large Language Model,LLM)开始接替传统的预训练语言模型(Pre-trained Language Model,PLM) 成为 NLP 的主流方向,基于 LLM 的全新研究范式也正在刷新被 BERT 发扬光大的预训练-微调范式,NLP 由此迎来又一次翻天覆地的变化。从2022年底至今,LLM 能力上限不断刷新,通用基座大模型数量指数级上升,基于 LLM 的概念、应用也是日新月异,预示着大模型时代的到来。
谷哥的小弟
8 小时前
服务器
·
数据库
·
人工智能
·
sqlite
·
大模型
·
源码
·
mcp
SQLite MCP服务器安装以及客户端连接配置
SQLite MCP Server是一种基于“模型上下文协议”(MCP)开发的中间件或服务。它的核心使命是在AI助手(例如Claude、Cursor内的AI功能)和SQLite数据库之间搭建一座标准化、安全的桥梁。简单来说,它把数据库操作“翻译”成AI能够理解和安全执行的指令,从而让AI可以直接与数据库进行交互。目前社区中存在几种不同的实现版本,它们各有侧重。最常见的是基于Node.js或Python的实现,它们功能全面,允许AI执行完整的数据查询、修改以及查看数据库结构。另一些用Rust编写的版本则更侧
模型启动机
9 小时前
人工智能
·
ai
·
大模型
·
ocr
DeepSeek-OCR是「长文本理解」未来方向?中科院新基准VTCBench给出答案
中科院自动化所等推出 VTCBench 基准测试,评估模型在视觉空间中的认知极限,包括信息检索、关联推理和长期记忆三大任务。
谷哥的小弟
10 小时前
服务器
·
人工智能
·
大模型
·
file system
·
mcp
·
ai项目
File System MCP服务器安装以及客户端连接配置
File System MCP Server是一种基于模型上下文协议(Model Context Protocol,简称MCP)构建的标准化服务。其主要功能是为AI助手提供一套安全、受控的接口,使其能够与宿主计算机的文件系统进行交互。
huazi-J
12 小时前
语言模型
·
大模型
·
tokenizer
·
datawhale
Datawhale 大模型基础与量化微调 task0:Tokenizer
假设一个分词路径由一个词语序列组成,将其表示为 w 1 , w 2 , . . . , w n w_1, w_2, ..., w_n w1,w2,...,wn,其中 w i w_i wi 代表序列中的第 i 个词。那么这条路径的概率可以近似为:
少林码僧
1 天前
人工智能
·
ai
·
数据分析
·
大模型
2.9 字段分箱技术详解:连续变量离散化,提升模型效果的关键步骤
分箱是将连续变量离散化的过程,是特征工程中的关键步骤。好的分箱可以提升模型效果,增强模型稳定性。本文将详细介绍各种分箱方法,并提供完整的实现代码。
AI情报挖掘日志
1 天前
大模型
·
aminer
·
大模型研究
AGI-Next前沿峰会「沉思报告」——中国AGI背后的产业逻辑与战略分野
本文借助「AMiner沉思」GLM-4.6能力对AGI-Next峰会相关资讯进行多轮检索完成。 本报告旨在对2026年1月10日于北京举行的“AGI-Next前沿峰会”闭门会议进行一次系统性、深度的研究与分析。 该峰会汇聚了中国人工智能(AI)领域最具影响力的四位产业领袖——智谱AI的唐杰、月之暗面的杨植麟、阿里云通义千问的林俊旸,以及腾讯的姚顺雨,并邀请了张钹院士、杨强教授等学界泰斗参与圆桌讨论。会议的核心议题聚焦于通用人工智能(AGI)的下一代技术范式、产业落地路径以及中国在全球竞争格局中的战略选择。
程序员黄老师
1 天前
数据库
·
大模型
·
向量
·
rag
主流向量数据库全面解析
随着大语言模型(LLM)的快速发展,RAG(检索增强生成)技术成为解决模型“幻觉”、提升专业领域回答精度的核心方案,而向量数据库则是RAG技术的底层支撑。向量数据库专门用于存储、管理和检索高维嵌入向量(Embedding),通过高效的相似度匹配算法,快速从海量数据中找到与查询向量最相关的结果。
何中应
1 天前
ai
·
大模型
·
智能体开发
快速上架第一个智能体
Coze(官网:https://www.coze.cn/home),是字节跳动出品的,一个 AI Agent 开发平台,在该平台上可以将自己调试完成,开发好的智能体上架到他们的商店,分享给其他人使用,也可以使用其他开发者上架的智能体。
victory0431
1 天前
深度学习
·
学习
·
大模型
大模型学习阶段总结和下一阶段展望
1个月内学会大模型预训练微调强化学习基本原理,做一个github项目然后找到大模型强化学习或者agent应用等实习,在农历春节之前。 2026年1月5日-1月11日 总结当前进展,明确下周方向 1月12号-1月16号
谷哥的小弟
1 天前
搜索引擎
·
大模型
·
spring ai
·
mcp
·
brave search
Brave Search MCP服务器安装以及客户端连接配置
Brave Search 是一个由开发隐私浏览器 Brave 的公司推出的独立搜索引擎,其核心特点是专注于用户隐私保护,承诺不追踪用户的搜索历史或个人数据。与依赖谷歌、必应等第三方索引的传统搜索引擎不同,它主要基于自己构建的独立网络索引(约92%的查询来自自有索引)来提供结果,确保了技术自主性。该搜索引擎可通过网页端 search.brave.com 访问,并深度集成于Brave浏览器中作为默认引擎,其商业模式主要依靠与搜索词相关、而非基于用户追踪的广告。除了基本搜索,它还提供特色功能如允许用户自定义结果
星云数灵
1 天前
数据库
·
大模型
·
阿里云acp
·
大模型工程师
·
大模型考试题库
·
阿里云aca
·
大模型工程师acp
大模型高级工程师考试练习题7
71题在 RAG 系统中,若发现模型生成的答案与检索到的文档内容无关,大概率是哪个环节出现了问题?A. 文本切片时的字符长度设置过长
星云数灵
2 天前
人工智能
·
大模型
·
大模型工程师
·
阿里云大模型aca
·
阿里云大模型工程师acp
·
大模型acp考试题库
·
acp认证
大模型高级工程师考试练习题6
61题使用 LlamaIndex 构建 RAG 应用时,若需提升检索结果的精准度,以下哪种方案最有效?
索木木
2 天前
大模型
·
sft
·
强化学习
·
思维链
强化学习与思维链
一. 强化学习1.SFT与强化学习2.RM(奖励模型)ORM(结果奖励):标注困难,成本高PRM(过程奖励): 简单, 但存在结果对, 过程错的情况。