llm

Lei活在当下10 小时前
人工智能·llm·openai
【AI手记系列-2026/6/18】iSparto & Harness,Caveman 以及AI时代的生存指南原文链接:mp.weixin.qq.com/s/YhsmIXdIv…这篇文章是一名独立开发者的 Harness Engineering 实践记录。作者使用 Claude Code,设计出一套不同角色的 Agent Team,并通过这套 Team 真正完成了 iOS App "勇芽" 的开发与上线。我认为,文中最值得借鉴的是一种组织设计思路:围绕最终目标,为不同任务设置独立角色,再把这些角色组装成一个多职能团队。
冬奇Lab12 小时前
数据库·人工智能·llm
每日一个开源项目(第134篇):Zvec - 阿里开源的嵌入式向量数据库,向量搜索界的 SQLite"向量数据库的 SQLite——嵌进应用里跑,不需要外部服务器。"这是"每日一个开源项目"系列的第134篇文章。今天的主角是 Zvec——阿里巴巴通义实验室开源的进程内向量数据库。
得物技术1 天前
大数据·llm·ai编程
从埋点需求到规则资产:Hermes Agent 重构得物数仓工作流在埋点和指标需求里,最消耗数据承接方的往往是 把分散的信息重新拼起来:需求文档里的动作到底要不要采集,历史上有没有类似点位,指标口径有没有被下游使用,新增字段要改哪几层表,发布前又该由谁确认。 我们选择Hermes Agent而不是OpenClaw是因为它具备持续在线、持久记忆和技能沉淀能力。对数据团队来说,下面几个原生能力正好对准了这类流程痛点:
AINative软件工程1 天前
llm
AI Agent 的 Tool Schema 设计工程实践:函数签名写差了,调用成功率能差 30%Mastra 团队在 2025 年测试了 12 个主流模型(涵盖多家国内外大模型厂商)对 30 种 JSON Schema 约束的支持情况,最终把 tool calling 错误率从 15% 压到 3%。核心结论只有一个:Schema 写法不一样,同一个工具在不同模型上的成功率可以相差 5 倍。
柒和远方1 天前
langchain·llm·agent
LangGraph 深度解析:从增强型 LLM 到生产级 Agent你用过 withStructuredOutput,也写过 bindTools,但一旦业务变复杂——多轮工具调用、条件分支、并行请求、人在回路——光靠链式调用就开始力不从心。LangGraph 就是为这个而生的。
冬奇Lab2 天前
人工智能·llm·agent
Agent 系列(21):Harness 测试工程——45 个测试怎么设计,以及它发现了什么 bug普通业务逻辑测试覆盖"应该发生什么",Harness 测试还要覆盖"不应该发生什么":这类负向测试用业务逻辑测试框架很难自然写出来;专门的 Harness 测试套件才是第一公民。
harykali2 天前
人工智能·llm
Hello-ROCm:Gemma4微调 #Datawhale #AMDev这一篇文章是Datawhale Hello-ROCm的课程笔记,主要记录了了Gemma4微调的过程简单来说,我们这次的目标是微调把Gemma4从一个通用模型调整(Fine-Turning)为一个可以准确识别情绪的崔志领域模型,或者更加概括的来说也可以说是通过微调让Gemma4猜得更加准确一些,具体的实现形式上我们会输入一个句子,然后预测这个句子中所包含的情绪
DigitalOcean2 天前
llm·aigc·agent
砍掉 60% AI 推理成本:深度解构 DigitalOcean 推理路由器的 MoE 门控与智能分流机制这是刚打到你们生产 API 的一个请求:一个语法检查。答案是:没有,没问题。任何 $0.10/百万 token 档次的模型都能在一秒内正确回答。
羞儿2 天前
llm·调试·显存·构建
llm-algo-1涵盖了 Attention 机制原理、PyTorch Profiling 性能分析、显存优化 以及 数值调试技巧。这四个模块并非孤立存在,它们共同构成了 “LLM 底层系统工程” 的基石。要从“学会知识点”进阶到“构建体系化能力”,需要将这四块内容重组为一条 “正确性 → 可观测性 → 效率上限” 的工程闭环。以下是循序渐进认知与实践框架:
AndrewHZ2 天前
人工智能·语言模型·大模型·llm·cot·思维链·icl
【LLM技术全景】大模型能力探秘:In-Context Learning与思维链(CoT)摘要:本文是《LLM技术全景:从Token到部署》系列第七篇。为什么大模型"看几个例子就能举一反三",而无需任何参数更新?为什么只是加上"Let’s think step by step",数学推理准确率就能翻倍?本文深度解析两大神秘能力——In-Context Learning(上下文学习)与Chain-of-Thought(思维链),拆解其工作机制,探讨涌现现象背后的规律,并给出实用的Prompt工程指南。
枫子有风2 天前
面试·职场和发展·llm·agent
LLM-Agent智能体(大厂面试常问)今年26年,如果想找开发类的工作,基本了解agent已经成为标配了。**Function Call 到底怎么实现的?MCP 解决什么问题?A2A 和 MCP 什么关系?**这些搞不清楚,面试官一深挖就原形毕露。
昵称好难啊2 天前
人工智能·llm·agent
7.OpenClaw源码解析——可靠消息投递上节课我们主要学习了 OpenClaw 的 heartbeat 和 cron 两种异步任务机制,有如下特点:
董厂长2 天前
大数据·人工智能·驱动开发·llm
Loop Engineering:停止手动提示,开始设计自动提示的系统Boris Cherny 说:“我不再手动提示 Claude 了。我有循环在运行,它们提示 Claude 并自己弄清楚该做什么。我的工作是编写循环。”
把你拉进白名单2 天前
人工智能·llm·agent
7.OpenClaw源码解析——可靠消息投递上节课我们主要学习了 OpenClaw 的 heartbeat 和 cron 两种异步任务机制,有如下特点:
武子康2 天前
人工智能·opencv·计算机视觉·chatgpt·llm·向量化
调查研究-180 roboflow/supervision:计算机视觉工程里的“胶水层“,为什么值得关注?摘要:roboflow/supervision 不是一个训练框架,也不是新的视觉模型,而是一个面向计算机视觉应用开发的 Python 工程库。它的核心价值,是把 YOLO、SAM、Transformers、Roboflow Inference、Detectron2、MMDetection、VLM 等不同来源的模型输出,统一成 sv.Detections,再围绕这个统一对象做可视化、过滤、跟踪、区域计数、视频处理、数据集转换和指标评估。对于正在做视觉 demo、视频分析、机器人视觉、工业质检、交通统计、安防
Liigo2 天前
ai·llm·deepseek·liigo·faking
【AI对话实录】大模型自行删减原文并编造虚假URL链接翻译此文并支持中英文对照。 https://kerkour.com/async-rust-cooperative-scheduling-tokio
chenjim3 天前
llm·agent
你的 Agent 是个黑箱:eBPF 如何看见它真正在做什么沙箱防逃逸,审批防越权,但 Agent 拿到合法权限后的行为——没人看得见。 本文首发地址 h89.cn/archives/62…
Lkstar3 天前
数据库·人工智能·llm
万字长文Query改写与多路召回实战|从HyDE到RRF融合,召回率提升22%的完整方案Query 改写的本质,是在用户意图和检索系统之间搭一座桥。用户的原始 query 往往是口语化、不完整的,而检索系统需要的是结构化、语义明确的"搜索语言"。
AI语宙漫游指南3 天前
深度学习·llm
从 CV 扩散到 NLP:详解 Google DiffusionGemma 架构、推理机制与优劣最近发现个好玩的大模型 DiffusionGemma-26B-A4B-it,这个模型有什么特别的呢?可以先看下下面这张图。
程序员cxuan3 天前
ai·llm·agi
瑞幸出 CLI 了,这会是迈向 AGI 的第一步吗?昨天晚上刷到一个东西,瑞幸开放了 CLI,我第一反应是:这年头点杯咖啡也要进终端了?瑞幸出了 AI 开放平台,里面有 MCP、CLI、Skill。