llm

创世宇图3 小时前
人工智能·ai·llm·token
【AI入门知识点】LLM 原理是什么?为什么 ChatGPT 看起来像“会思考”?为什么 ChatGPT 能聊天、写代码、写文章? 为什么 AI 好像“懂人话”? 为什么一句 Prompt,就能生成完整方案? 为什么它有时候又会“一本正经地胡说八道”?
创世宇图6 小时前
人工智能·ai·llm·functioncalling
【AI入门知识点】Function Calling 是什么?为什么 AI 开始会“调用工具”了?为什么 ChatGPT 能查天气、查数据库、执行代码? 为什么 AI 开始不只是聊天,而是真的“会做事”? 为什么很多人说: Function Calling 是 Agent 的核心能力? 为什么现在的大模型越来越像“操作系统”?
BeforeEasy9 小时前
llm·agent·工具调用·function_call·tool_use
关于大模型工具调用技术的总结大模型**工具调用(Function Call / Tool Use)**是一种让语言模型能够主动调用外部API、函数或工具来完成其自身无法执行任务的技术机制,通过"推理-行动-观察"(ReAct)的循环模式,将大模型的文本理解能力与外部世界的执行能力无缝连接。
龙骑士baby9 小时前
深度学习·ai·大模型·llm·ai生态
重建 AI 认知第 1 篇:基础认知——一张地图看懂 AI Landscape先解决一个最基础、但也最容易混淆的问题:AI、ML、DL、GenAI、AGI,它们到底是什么关系?很多人以为它们是并列的,或者是一个路线上的几个阶段。其实不是,它们是套娃结构:
龙侠九重天10 小时前
人工智能·深度学习·数据挖掘·大模型·llm·embedding·聚类
Embedding 模型深度使用——语义搜索与聚类Embedding(嵌入)是一种将离散、高维的符号数据映射到连续、低维向量空间的技术。在自然语言处理领域,Embedding 将文字、句子或文档转换为数值向量,使得语义相近的内容在向量空间中拥有相似的位置关系。
吴佳浩13 小时前
人工智能·llm
炸裂!一家创业公司声称打破了 Transformer 七年魔咒AI 深度观察12M token 上下文 · 算力降低 1000 倍 · 融资 2900 万美元 这是真正的架构革命,还是又一次 AI 营销泡沫?
冬奇Lab1 天前
人工智能·llm
RAG 系列(二十三):多模态 RAG——图片、表格也能检索上传一份年报 PDF,里面有营收走势图、产品对比表格、架构示意图。传统 RAG 怎么处理?问题是:营收走势图是一张图片,PDF 解析器只会把它的 alt text(通常是空的)或者图片文件名提取出来。数字在图里,不在文本里,RAG 永远找不到。
Cosolar1 天前
人工智能·面试·llm
RAG语义丢失?全链路优化通关宝典✅很多候选人在简历中写了“主导工业级 RAG 落地”,但在真正有经验的面试官面前,往往几句深入的链路追问就会暴露出“只会工具调用,缺乏全链路工程思维与语义保障意识”的短板 。以下是字节、京东等大厂真实面试中最高频、最致命的 3 个核心提问、错误应答与技术本质拆解 :
带娃的IT创业者1 天前
人工智能·llm·ai编程·基准测试·技术趋势·ai代理
LLM半年巨变:从模型混战到AI代理“爪“时代的崛起时光如白驹过隙,站在2026年5月的节点回望,过去半年的大模型领域发展之迅猛,足以让任何试图总结的人感到眩晕。这不仅仅是模型参数的堆叠或基准测试分数的攀升,更是一场关于交互范式、开发体验乃至人机关系的深刻变革。
xrz5785pixel1 天前
llm
▎ 让本地模型在 Codex 里调用工具:我把两个不兼容的 API 翻译了▎ 让本地模型在 Codex 里调用工具:我把两个不兼容的 API 翻译了**Codex CLI 支持本地 Ollama 模型了,但一用就报 unsupported call。我写了一个 800 行的 Python 代理,把 /v1/responses 翻译成 /v1/chat/completions,让 qwen3:14b、huihui4-8b 都能在 Codex 里执行 shell 命令了。代码开源,论文已发。
花千树-0101 天前
java·langchain·llm·agent·langgraph·subagent·harness
SubAgent 基础:拥有自主工具的子代理标签:Java SubAgent 子代理 自主工具 McpAgentExecutor j-langchain 前置阅读:Skill Agent:把子工作流封装成可复用的 Tool 适合人群:已掌握 Skill 用法,希望构建拥有自有工具的独立子代理的 Java 开发者
qcx231 天前
人工智能·llm·agent·daily
【AI Daily】每日AI日报今天 AI 工程最值得关注的是 AI 方向的基础设施化:单人用Claude攻破墨西哥政府窃取150GB数据、HKUDS/CLI-Anything、tech-leads-club/agent-skills 代表能力正在从模型层下沉到工具链和工作流。
qcx232 天前
人工智能·llm·agi·arxiv
【AI Daily】每日Arxiv论文研读Top5 | 2026-05-19(周2)🔗 https://arxiv.org/abs/2605.05600 定位:AI时代 UX 评估框架系统性重构——传统 SUS/NPS 等指标在 AI 产品中的假设已被打破,本文提出统计视角下的新评估体系。 关键数据/结论:传统 UX 指标(如任务完成时间、满意度量表)在 AI 驱动产品中存在结构性偏差;AI 的非确定性输出使可重复性测试失效,需要概率性评估框架替代。 为什么重要:这是2026年5月最新arXiv论文,直接回应产品团队"AI产品怎么评估好坏"的核心困惑,是做AI产品决策的方法论基础。
冬奇Lab2 天前
人工智能·llm
RAG 系列(二十二):长上下文 vs RAG——要不要 RAGGemini 1.5 Pro 支持 100 万 token 上下文,Claude 3.5 支持 20 万 token,GPT-4 Turbo 12.8 万 token。一部小说大约 15 万字,约 20 万 token,直接塞进去就能问。有人问:RAG 还有必要吗?
冬奇Lab2 天前
人工智能·llm
RAG 系列(二十一):性能优化——又快又省钱一次 RAG 请求做了什么:每次请求至少 2 次 API 调用。在高并发场景下,这两项会快速累积:这四种优化分别针对这条链路的不同位置:
DigitalOcean2 天前
llm·aigc·agent
实战指南:AI调用成本降71%——利用“推理路由”告别大模型胡乱开销大多数 AI 应用在刚开始时,都会在代码中硬编码一个模型。对于原型开发来说,这运行得很好,但一旦单个端点需要处理多个复杂的任务类别,这种模式就会分崩崩离析。分类、紧急程度评分、面向客户的草稿以及长篇总结,这些任务由于成本、延迟或质量要求各不相同,都能够从不同的模型选择中获益。
厚国兄2 天前
人工智能·安全·llm·prompt·agent
Agent 工程化系列 · 第 13 篇_Agent安全与可靠性如何保障Agent 最危险的不是回答错,而是执行错前面我们已经讲过:LLM 是能力核心,Agent 是执行系统;Function Call 让模型能够调用工具;MCP 负责连接工具生态;A2A 负责 Agent 之间协作;Memory 让 Agent 具备连续上下文。
Mr.朱鹏2 天前
python·gpt·langchain·大模型·llm·rag
9-检索增强生成RAG详解**RAG (Retrieval-Augmented Generation,检索增强生成) **是目前大模型应用的核心技术。
星浩AI2 天前
人工智能·深度学习·llm
(三)一文看懂 Transformer:从 Token 到预测下一个字本文用 「春眠不觉」→ 补全「晓」 走通 Transformer 从输入到输出的完整链路。文首流程图用 4 字输入演示各步;后文示例多用整句 「春眠不觉晓」。示例模型为 uer/gpt2-chinese-cluecorpussmall(GPT-2 结构,层数、维度以 config.json 为准)。
qcx232 天前
人工智能·ai·llm·论文·agent·arxiv
【AI Daily】每日Arxiv论文研读Top5-2026-05-18📊 今日概览🔥 五篇精读速报① Understanding Multi-Agent LLM Frameworks: A Unified Benchmark(arXiv 2602.03128) 🔗 https://arxiv.org/abs/2602.03128 问题定位:现有 multi-agent 框架(LangGraph、AutoGen、CrewAI 等)缺乏统一基准,开发者凭口碑选型而非实证。 关键数据:引入 MAFBench 基准,实验表明框架层设计决策单独可导致 latency 增加 30