llm

Hyyy1 小时前
llm·agent·ai编程
如何设计Agent的Harness在讲解具体设计前,先明确两个底层认知,建立清晰的概念边界:三层标准架构:Agent Harness 是管理智能体完整执行生命周期的运行时控制框架。它通过标准化的执行循环串联模型推理、工具调用、结果反馈、状态流转,将大模型的开放式语义决策能力,转化为可预测、可控制、可落地的真实操作。
董厂长2 小时前
人工智能·llm
从 Claude Code 放弃 RAG 说起:实际项目中如何合理创建知识库阅读路线图:📖 事实对齐🔍 原因剖析⚖️ 场景分界💡 理念转变🛠️ 落地实操🏛️ 架构哲学✅ 行动建议
武子康3 小时前
人工智能·llm·agent
调查研究-211 AgentBound 深度解析:AI Agent 不只要“有权限”,还要有可验证的行为治理关键词:AgentBound、行为治理、canonical action、governance receipt、standing delegation、AgentBound-Bench、AI Agent 安全、OWASP ASI 2026、可审计授权、review 状态、保守合成、运行时宪法、站点动作契约、可验证执行凭证、企业级 Agent 架构、policy as code、eBay Agent 安全、2026 AI Agent 治理、constitutional AI 运行时化、Zanzibar、Ce
JouYY6 小时前
架构·llm·agent
聊一下知识答疑Agent的“层次聚类”流程最近,我们需要开发一个面向B端的Agent答疑系统,在做用户问题识别的时候,我们面临这样一个问题:用户每次提问的表述千差万别,但他们想解决的问题往往可以归纳为有限的几类。
熊猫钓鱼>_>10 小时前
大数据·人工智能·重构·架构·llm·agent·ai-native
智能革命的巨浪——AI时代的社会重构与生存之道生成式人工智能并非一次普通的技术迭代,而是自工业革命以来最深刻的社会生产关系变革。与蒸汽机、电力和信息技术不同,AI直接侵蚀的是人类最后引以为傲的认知领域——推理、创造与决策。当机器不仅能替代肌肉,还能替代大脑时,"劳动创造价值"这一现代资本主义社会的基石正在被动摇。
qcx2310 小时前
人工智能·机器学习·ai·llm·脑信号
Agentic RAG不止能回答问题,已经能自动修复真实CVE漏洞了来源:arXiv 2606.22647 · 2026-06 · 杜伊斯堡-埃森大学 论文:RAVEN(Agentic RAG for Automated Vulnerability Repair) 核心标签:Agentic RAG、自动化漏洞修复、CVE、受控迭代修复
掉鱼的猫10 小时前
java·llm
用 ChatModel 构建 LLM 驱动的 Java 应用如果你尝试过在 Java 应用中集成大语言模型(LLM),大概率写过不少样板代码:HTTP 客户端、JSON 解析、流式处理、会话管理……Solon AI 4.0 的 ChatModel 用一套简洁的 Builder API 把这些都封装好了。
武子康11 小时前
大数据·人工智能·深度学习·llm·claude·glm·智谱
调查研究-212 智谱 ZCode Harness for GLM-5.2:国产 Coding Agent 从“模型能力“走向“工程执行环境“关键词:ZCode Harness、GLM-5.2、智谱、Agentic Development Environment、Coding Agent、长程任务、1M token context、IndexShare、MTP、MoE 744B-A40B、Goal Mode、Subagents、MCP Servers、Remote Development、Claude Code、Codex CLI、Agentic Engineering、国产 AI 编程、Z.ai、Harness 设计、桌面 ADE、Codin
SkySeraph11 小时前
llm
开源大模型本地部署硬件选型深度指南作者:SkySeraph 原始链接:llm_locally 日期:2026-05-17 数据截至 2026-05-17 本文基于截至 2026 年 5 月的公开资料与业内已验证的实测数据整理,价格/供货信息请以官网当日为准。
带刺的坐椅13 小时前
java·ai·llm·solon·rag·chatmodel
用 ChatModel 构建 LLM 驱动的 Java 应用如果你尝试过在 Java 应用中集成大语言模型(LLM),大概率写过不少样板代码:HTTP 客户端、JSON 解析、流式处理、会话管理……Solon 4.0 的 ChatModel 用一套简洁的 Builder API 把这些都封装好了。
浮生望14 小时前
llm
上下文工程:为什么现在写 Prompt 不用那么费劲了2023 年,你得像写论文一样精雕细琢每一句 Prompt。2026 年,随便说一句话 AI 就能懂。不是魔法,是范式变了。
不好听61314 小时前
javascript·面试·llm
从零搭建一个 RAG 语义搜索系统 —— DEMO的初始阶段一个前端开发者视角的 RAG 入门实战:从"只会写 CRUD"到"能解释清楚向量检索是怎么工作的"。2024 年以来,RAG(Retrieval-Augmented Generation,检索增强生成)几乎出现在每一个 AI 产品的技术栈里。不管是智能客服、企业知识库问答、还是 AI 搜索,核心套路都是同一套:
贵慜_Derek14 小时前
人工智能·算法·llm
MAI-04|干净数据在工程上意味着什么:MAI 预训练数据治理上一篇(MAI-03)讲了 Scaling Ladder 和 EG:架构或数据改动划不划算,要在多个模型尺寸上对照 loss 和算力成本。本篇只回答:30T 语料从哪来、怎么处理、和「干净数据」在工程上指什么。
AlfredZhao1 天前
llm·embedding·model·curl
一篇搞定:用 curl 测试私有部署模型联通性在私有部署模型环境里,最常见的排查动作就是先看服务是否存活,再分别验证对话模型和向量模型是否能正常收发请求。下面这组命令可以直接作为联通性测试模板使用。
Darling噜啦啦1 天前
llm·aigc
拆解 LLM 的内部黑盒:从 Token 到 Self-Attention 的逐层解码之旅每次你对 ChatGPT 说一句话,它内部到底发生了什么?从一段自然语言到一个 Token ID,从一串数字到高维语义向量,从"苹果"到"手机"的距离计算,再到 Self-Attention 让模型"理解"上下文——本文带你一步步走进 Transformer 的内部,看透 LLM 预测下一个词的完整链路。
武子康2 天前
人工智能·google·llm
调查研究-209 Apptronik Robot Park 深度解析:人形机器人竞争,开始拼“真实世界数据工厂“过去几年,人形机器人行业最常见的传播方式是视频。搬箱子、分拣、开门、叠衣服、走路、跳舞、和人对话。这些 Demo 有价值,因为它们证明了硬件、控制和感知系统已经能完成一些基本动作。
DigitalOcean2 天前
llm·agent
DigitalOcean 推出大模型自动化评估功能,上线前精准避坑在选择投入生产的模型或推理路由器时,光看性能榜单(Leaderboard)远远不够。真正稳妥的做法是:在上线之前,用自己的数据、自己的提示词、自己的评估标准,在同一平台内同时对比质量、延迟和成本,验证任何模型或路由配置是否达标。
ch_09182 天前
typescript·llm·agent
从0构建SDK第3节:实现 ReActAgent 的推理与行动循环上一节我们实现了 SimpleAgent。它已经能做三件重要的事:这一节继续往前走,实现一个更经典的 Agent 范式:ReActAgent。
得物技术3 天前
llm·aigc·测试
AI UITester:AI Native 的 UI 自动化测试新范式|得物技术痛点一:用例迁移成本高昂测试用例平台积累了大量描述性用例,但不可直接执行。QA 需要逐条手动翻译:理解业务逻辑、编写元素定位、调试执行路径。一个中等规模的模块,转化成本可能需要数人天。
不好听6133 天前
llm·agent
Harness Engineering:给千里马套上缰绳Prompt Engineering 教你怎么跟模型说话。Context Engineering 教你怎么给模型喂资料。而 Harness Engineering 回答的是一个更根本的问题:怎么管住一个比你聪明、但完全不靠谱的模型,让它稳定地干活?