llm

冬奇Lab13 小时前
人工智能·llm·agent
Agent 系列(23):Web Agent——让 Agent 真正浏览网页LLM 的知识有截止日期。你问它"LangGraph 最新版本是多少",它只能告诉你训练数据里的版本。Web Agent 解决这个问题:让 Agent 真正上网查,拿到实时数据再回答。
冬奇Lab13 小时前
人工智能·开源·llm
每日一个开源项目(第135篇):codebase-memory-mcp - 给 AI Agent 一张代码库的知识图谱"AI Agent 探索代码库时读取每一个文件,消耗 412,000 个 token。换成知识图谱查询,只需要 3,400 个 token。"
黄忠1 天前
python·llm
大模型之LangGraph技术体系适用版本:LangGraph 1.0+(兼容 0.3.x 核心 API) 技术栈:Python 3.10+ / LangGraph / LangChain / SQLite / Redis 定位:聚焦图结构工作流设计与生产级实践
不好听6131 天前
llm·agent
Tool:让大模型长出手脚上一篇文章我们讲了 Agent 的三要素:LLM 是大脑,Tools 是手脚,Messages 是记忆。
Lei活在当下1 天前
人工智能·llm·openai
【AI手记系列-2026/6/18】iSparto & Harness,Caveman 以及AI时代的生存指南原文链接:mp.weixin.qq.com/s/YhsmIXdIv…这篇文章是一名独立开发者的 Harness Engineering 实践记录。作者使用 Claude Code,设计出一套不同角色的 Agent Team,并通过这套 Team 真正完成了 iOS App "勇芽" 的开发与上线。我认为,文中最值得借鉴的是一种组织设计思路:围绕最终目标,为不同任务设置独立角色,再把这些角色组装成一个多职能团队。
冬奇Lab2 天前
数据库·人工智能·llm
每日一个开源项目(第134篇):Zvec - 阿里开源的嵌入式向量数据库,向量搜索界的 SQLite"向量数据库的 SQLite——嵌进应用里跑,不需要外部服务器。"这是"每日一个开源项目"系列的第134篇文章。今天的主角是 Zvec——阿里巴巴通义实验室开源的进程内向量数据库。
得物技术2 天前
大数据·llm·ai编程
从埋点需求到规则资产:Hermes Agent 重构得物数仓工作流在埋点和指标需求里,最消耗数据承接方的往往是 把分散的信息重新拼起来:需求文档里的动作到底要不要采集,历史上有没有类似点位,指标口径有没有被下游使用,新增字段要改哪几层表,发布前又该由谁确认。 我们选择Hermes Agent而不是OpenClaw是因为它具备持续在线、持久记忆和技能沉淀能力。对数据团队来说,下面几个原生能力正好对准了这类流程痛点:
AINative软件工程2 天前
llm
AI Agent 的 Tool Schema 设计工程实践:函数签名写差了,调用成功率能差 30%Mastra 团队在 2025 年测试了 12 个主流模型(涵盖多家国内外大模型厂商)对 30 种 JSON Schema 约束的支持情况,最终把 tool calling 错误率从 15% 压到 3%。核心结论只有一个:Schema 写法不一样,同一个工具在不同模型上的成功率可以相差 5 倍。
柒和远方2 天前
langchain·llm·agent
LangGraph 深度解析:从增强型 LLM 到生产级 Agent你用过 withStructuredOutput,也写过 bindTools,但一旦业务变复杂——多轮工具调用、条件分支、并行请求、人在回路——光靠链式调用就开始力不从心。LangGraph 就是为这个而生的。
冬奇Lab3 天前
人工智能·llm·agent
Agent 系列(21):Harness 测试工程——45 个测试怎么设计,以及它发现了什么 bug普通业务逻辑测试覆盖"应该发生什么",Harness 测试还要覆盖"不应该发生什么":这类负向测试用业务逻辑测试框架很难自然写出来;专门的 Harness 测试套件才是第一公民。
harykali3 天前
人工智能·llm
Hello-ROCm:Gemma4微调 #Datawhale #AMDev这一篇文章是Datawhale Hello-ROCm的课程笔记,主要记录了了Gemma4微调的过程简单来说,我们这次的目标是微调把Gemma4从一个通用模型调整(Fine-Turning)为一个可以准确识别情绪的崔志领域模型,或者更加概括的来说也可以说是通过微调让Gemma4猜得更加准确一些,具体的实现形式上我们会输入一个句子,然后预测这个句子中所包含的情绪
DigitalOcean3 天前
llm·aigc·agent
砍掉 60% AI 推理成本:深度解构 DigitalOcean 推理路由器的 MoE 门控与智能分流机制这是刚打到你们生产 API 的一个请求:一个语法检查。答案是:没有,没问题。任何 $0.10/百万 token 档次的模型都能在一秒内正确回答。
羞儿3 天前
llm·调试·显存·构建
llm-algo-1涵盖了 Attention 机制原理、PyTorch Profiling 性能分析、显存优化 以及 数值调试技巧。这四个模块并非孤立存在,它们共同构成了 “LLM 底层系统工程” 的基石。要从“学会知识点”进阶到“构建体系化能力”,需要将这四块内容重组为一条 “正确性 → 可观测性 → 效率上限” 的工程闭环。以下是循序渐进认知与实践框架:
AndrewHZ3 天前
人工智能·语言模型·大模型·llm·cot·思维链·icl
【LLM技术全景】大模型能力探秘:In-Context Learning与思维链(CoT)摘要:本文是《LLM技术全景:从Token到部署》系列第七篇。为什么大模型"看几个例子就能举一反三",而无需任何参数更新?为什么只是加上"Let’s think step by step",数学推理准确率就能翻倍?本文深度解析两大神秘能力——In-Context Learning(上下文学习)与Chain-of-Thought(思维链),拆解其工作机制,探讨涌现现象背后的规律,并给出实用的Prompt工程指南。
枫子有风3 天前
面试·职场和发展·llm·agent
LLM-Agent智能体(大厂面试常问)今年26年,如果想找开发类的工作,基本了解agent已经成为标配了。**Function Call 到底怎么实现的?MCP 解决什么问题?A2A 和 MCP 什么关系?**这些搞不清楚,面试官一深挖就原形毕露。
昵称好难啊3 天前
人工智能·llm·agent
7.OpenClaw源码解析——可靠消息投递上节课我们主要学习了 OpenClaw 的 heartbeat 和 cron 两种异步任务机制,有如下特点:
董厂长3 天前
大数据·人工智能·驱动开发·llm
Loop Engineering:停止手动提示,开始设计自动提示的系统Boris Cherny 说:“我不再手动提示 Claude 了。我有循环在运行,它们提示 Claude 并自己弄清楚该做什么。我的工作是编写循环。”
把你拉进白名单3 天前
人工智能·llm·agent
7.OpenClaw源码解析——可靠消息投递上节课我们主要学习了 OpenClaw 的 heartbeat 和 cron 两种异步任务机制,有如下特点:
武子康3 天前
人工智能·opencv·计算机视觉·chatgpt·llm·向量化
调查研究-180 roboflow/supervision:计算机视觉工程里的“胶水层“,为什么值得关注?摘要:roboflow/supervision 不是一个训练框架,也不是新的视觉模型,而是一个面向计算机视觉应用开发的 Python 工程库。它的核心价值,是把 YOLO、SAM、Transformers、Roboflow Inference、Detectron2、MMDetection、VLM 等不同来源的模型输出,统一成 sv.Detections,再围绕这个统一对象做可视化、过滤、跟踪、区域计数、视频处理、数据集转换和指标评估。对于正在做视觉 demo、视频分析、机器人视觉、工业质检、交通统计、安防
Liigo3 天前
ai·llm·deepseek·liigo·faking
【AI对话实录】大模型自行删减原文并编造虚假URL链接翻译此文并支持中英文对照。 https://kerkour.com/async-rust-cooperative-scheduling-tokio