llm

To_OC19 小时前
人工智能·llm·agent
数据集划分不是随便切:手把手切分大众点评情感数据集昨天跑中文情感分类 baseline,一上来就栽在数据集上了。本来想着从魔搭拖个现成的大众点评数据集,加载完直接喂模型,结果 MsDataset.load 下来一看,整份数据全塞在 train 里,连个验证集测试集都没给分好。盯着控制台输出的单条样本愣了半分钟,得,自己动手切吧。
想要成为糕糕手1 天前
llm·agent
深入理解AI Agent工具调用:从原理到代码实现翻了不少文章,讲 AI Agent "能做什么"的多,讲"怎么做到的"少。 我第一次看 SDK 文档时有个疑问:LLM 没联网、没权限,它是怎么调用工具的? 跑完代码才发现——它根本没调。tool_calls 只是 LLM 输出的一段 JSON 格式文本,你的代码读到它之后,才真正去执行对应函数。整个过程 LLM 只做了一件事:写字。 这篇文章用一段不到 100 行的 Node.js 代码,把 Tool Calling 拆开给你看:
yLDeveloper1 天前
llm·nlp
从矩阵乘法到多模态大模型 - LLM 篇这篇是关于植入 CLIP-ViT Encoder 训练多模态视觉前对 Text-Only 基座从零开始的训练,包含 分词器、预训练、SFT,不包含多模态部分。
前端君1 天前
llm·agent·claude
Claude Code 如何配置本地Ollama模型或别的模型(Deepseek等)个人使用场景 claude 模型实在是太贵了,想使用 Claude Code 默认只支持 Anthropic 的接口格式,所以本文记录了如何把本地模型或者其他模型(Deepseek等)接入 Claude Code 使用的方法。
Darling噜啦啦1 天前
llm
LLM 数据工程实战:从数据集划分到交叉验证——大模型智能的根基本文深入解析 LLM 智能的三大来源(数据、算力、算法),系统讲解数据集划分(训练集/验证集/测试集)、交叉验证(k折交叉验证)的核心原理,并基于 ModelScope 平台实战演示数据加载与划分——带你理解"在模型之上,是数据的艺术;在模型之下,是数据的地基"。
HjhIron1 天前
llm·agent
工具调用:当LLM学会使用"武器",AI Agent的底层逻辑拆解一个只能预测下一个词的模型,是怎么突破物理限制,去调用API、操作电脑的?你有没有想过一个问题:大模型本质上是个"词语接龙"游戏。
Hyyy2 天前
llm·ai编程
Few-shot、Chain-of-Thought、ReAct模式是什么在讲解具体方法前,先明确两个基础认知,理解这三类技术的诞生逻辑:Few-shot(少样本学习)是指在提示词中提供少量「输入 - 输出」的完整示例,让模型从范例中自主学习任务规则、输出格式与边界标准,再执行真实任务的提示方法。提供 1 个示例称为 1-shot,3 个称为 3-shot,以此类推;与之相对、不提供任何示例的方式称为 Zero-shot(零样本)。
Darling噜啦啦2 天前
llm·agent
Tool Use 底层原理:当"缸中大脑"遇上物理世界——LLM 工具调用的认知哲学与技术实现LLM 本质上只是被困在服务器里的"词语接龙机器",看不见屏幕、摸不到键盘。那么,它是如何突破物理限制,去调用 API、读取数据库、操作物理世界的工具的?本文从技术哲学的视角,深入解析 Tool Use 的三大核心机制。
不好听6132 天前
架构·llm·agent
拆解 LLM Tool Use 的完整机制:从缸中大脑到 Agent 觉醒你用过 ChatGPT 的联网搜索,用过 Claude 分析 Excel 表格,用过豆包查询实时天气。你可能会觉得:这些 AI 真厉害,什么都会。
拾年2752 天前
javascript·人工智能·llm
我用 30 行代码,搞懂了大模型是怎么"读"中文的💡 你知道吗?你发给 ChatGPT 的每一句话,它其实根本看不懂。它看到的是一串数字,而你看到的文字,在它眼里只是"Token"。
Hyyy3 天前
llm·ai编程
什么是结构化 Prompt 设计在讲解具体角色前,先明确两个核心认知,这是理解结构化 Prompt 设计的基础:结构化 Prompt 设计是一种将提示词按功能职责进行分层组织的工程化方法。它借鉴对话系统的参与者职责划分,把原本混杂在一起的身份规则、任务需求、输出范例,拆解为三个独立的角色层级,让模型精准识别不同信息的作用,大幅提升输出的稳定性、可控性与可维护性。
冬奇Lab3 天前
人工智能·开源·llm
Skill 系列(04):Skill 指标体系——L1/L2/L3 三层监控,让质量下降有据可查Skill 变差了,你怎么知道?有了指标,质量下降可以在用户感知之前被发现。三层依赖关系:L3 是基础,L2 是中间层,L1 是最终目标。报警时从 L3 往上排查,比从 L1 往下倒推快得多。
Lkstar3 天前
人工智能·llm
A2A协议深度解析|Agent2Agent通信标准,智能体互联网的"HTTP"当你的 LangGraph Agent 要和另一个 CrewAI Agent 协作,当你的客服 Agent 需要把计费问题交给第三方财务 Agent—— 谁来定义它们之间怎么对话、怎么分发任务、怎么实时同步进度?Google 联合 50+ 厂商在 2025 年 4 月给出的标准化答案:A2A(Agent2Agent)协议。发布仅两个月,该协议便完整捐赠至 Linux 基金会;到 2026 年 4 月发布满一周年时,项目收获 22000+ GitHub Stars,落地覆盖 150 + 企业生产组织。本文系
Darling噜啦啦3 天前
llm
LLM 分词与向量化:大模型是如何"读懂"文字的?——Tokenization × Embedding 原理与实战本文深入解析 LLM 的两大底层机制:Tokenization(分词)与 Embedding(向量化)。从为什么必须分词,到 js-tiktoken 的编码解码实战,再到阿里百炼 Embedding API 调用与余弦相似度计算——彻底搞懂大模型"读懂"文本的背后原理。
ZzT3 天前
llm·ai编程
LLM 编排 vs 多 Agent 编排:拆解 Sakana Fugu6 月 22 日,东京的 Sakana AI 发布了 Fugu。它没有训练任何一个前沿大模型,而是把一池现成的模型编排起来,对外表现得像单个模型,并且自报在一些硬基准上能和 Fable 5 比肩。这件事值得拆一拆,因为它顺手把「多模型编排」和「多 agent 编排」这两件常被混为一谈的事,照得很清楚。
柒和远方3 天前
llm·agent
LLM 的底层语言:从分词到向量化,搞懂 AI 是怎么"读"文字的v029 搞懂了 Agent 的四块基石——LLM 是大脑,Tools 是手脚,Reasoning 是思考过程,Context 是记忆。
把你拉进白名单3 天前
人工智能·llm·agent
8.OpenClaw源码解析——三层洋葱重试上节课我们学习了可靠消息投递,当大模型回复完消息之后,会将消息进行chunk切分(这里主要还是防止消息过长)并写入tmp.json, 之后后台会启一个线程,并扫描特定文件夹下的*.json文件,再发送,如果成功则删除该临时JSON文件。 但是如果大模型本身就有问题怎么办? 比如API Key被限流,Key失效,上下文超长,请求超时等。 今天我们来讲三层洋葱重试,他是保障OpenClaw能够正常调用的机制。 分别使用了key轮换, 压缩上下文和agent执行。
To_OC4 天前
人工智能·llm·agent
搞懂 Token 和 Embedding 后,我终于明白大模型是怎么 "读" 文字的说实话,之前写了不少调用大模型 API 的代码,但一直停留在 "传 prompt、等结果" 的黑盒阶段。我知道大模型处理的是数字,也听过 token、embedding 这些词,但它们到底在整条链路里扮演什么角色,为什么缺一不可,脑子里始终是一团浆糊。
Hyyy4 天前
llm·ai编程
Temperature 与 Top-p:控制模型输出的两个参数在理解两个参数前,先要搞懂大语言模型的生成本质,这是所有采样参数的底层前提:Temperature 作用于模型输出层 Softmax 的概率分布,控制概率分布的"尖锐程度" :
Darling噜啦啦4 天前
llm
LLM 无状态本质与上下文工程:从 Prompt 到 Context 的进化——为什么 AI 总是"失忆"?本文深入解析 LLM 的无状态(Stateless)本质,揭示为什么每次调用 API 都是"全新的开始",并系统讲解从 Prompt Engineering 到 Context Engineering 再到 Loop Engineering 的进化路径,助你构建真正"有记忆"的 AI 应用。