openai

悟空码字14 小时前
aigc·openai·ai编程
【高德开放平台skill】从拍脑袋到看数据,我是如何把一个“选址直觉“做成 AI Skill 的创业圈里有句话:"选址定生死"。有个做线下连锁品牌的朋友常说,选到一个好铺位,生意就成了一半;选错了,再努力也是给房东打工。但每次听他们聊选址,聊到最后往往都是玄学——"这条街风水好""那边人流旺""感觉那个位置行"。
武子康18 小时前
人工智能·openai·claude
调查研究-185 CodeGraph 调研:给 AI 编程 Agent 一张代码库地图,少一点反复 grep(2026)摘要:AI 编程 Agent 已经能很快写代码,但它们在真实仓库里经常卡在"重新认识项目"这件事上:反复 grep、反复读文件、反复猜调用链。CodeGraph 的价值不是替代模型写代码,而是把代码库提前解析成本地知识图谱,让 Agent 可以通过 MCP 查询符号、调用关系、文件结构、影响面和受影响测试。本文从工程使用视角拆解 CodeGraph 的定位、架构、MCP 工具、与 RAG/LSP/静态分析的区别,以及它适合什么项目、不适合什么项目。
AINative软件工程20 小时前
llm·openai·agent
LLM 应用的 Bad Case 反馈闭环工程:别再把用户差评丢进客服表了如果你做过线上 LLM 应用,大概率遇到过这种场景:用户点了一个 👎,备注里写着“答非所问”。客服系统里多了一条工单,产品同学截图发到群里,研发看了一眼 trace,发现 prompt、检索、工具调用、模型返回都“看起来没报错”。最后大家讨论半小时,结论是:这个问题不好复现,先观察。
葫芦和十三3 天前
openai·agent·ai编程
多模态融合|是数据形态工程,不是 Prompt 工程大家好,我是十三!欢迎来到十三Tech。《Agent 设计模式之美》感知模块最后一讲。前三讲(分诊、压缩、发现)都默认一个前提——进入 Agent 的信息已经是某种 token。这一讲处理的是更前面的一步:数据在进入 Agent 之前,应该先变成什么形态。
Lei活在当下3 天前
人工智能·llm·openai
【AI手记系列-2026/6/18】iSparto & Harness,Caveman 以及AI时代的生存指南原文链接:mp.weixin.qq.com/s/YhsmIXdIv…这篇文章是一名独立开发者的 Harness Engineering 实践记录。作者使用 Claude Code,设计出一套不同角色的 Agent Team,并通过这套 Team 真正完成了 iOS App "勇芽" 的开发与上线。我认为,文中最值得借鉴的是一种组织设计思路:围绕最终目标,为不同任务设置独立角色,再把这些角色组装成一个多职能团队。
BingoGo3 天前
openai
Openai Codex 重大更新 已支持接入任意开源大模型如果你还认为 Codex(OpenAI 推出的 AI 编程助手)只能搭配 GPT 系列模型使用,那你可能错过了近期最重要的一次更新。
JaguarJack4 天前
ai·openai·codex
Openai Codex 重大更新 已支持接入任意开源大模型如果你还认为 Codex(OpenAI 推出的 AI 编程助手)只能搭配 GPT 系列模型使用,那你可能错过了近期最重要的一次更新。
Windeal5 天前
后端·openai
Agent ToolCall 循环怎么定制?PI Extension 与 DeepAgents Middleware 两条岔路深度对比当你想给 Agent 的 tool_call 循环挂自定义逻辑——拦截、改写、重试、注入工具——会发现两个明星框架选了两条互不重合的范式:PI 用"事件订阅",DeepAgents 用"中间件洋葱"。这篇把它们放在一起对比,告诉你根因在哪、各自的天花板在哪、你的项目该选哪种。
holly就是我5 天前
openai
我让 Claude 写了一个贪吃蛇游戏,然后用 ccglass 看清它发给模型的真实请求AI 编程 Agent 越来越强。现在我们已经不只是让模型补全一段代码,而是直接让 Claude Code、Codex、OpenCode 这类工具读项目、写文件、调用命令、修改代码、完成一整个开发任务。
ZzT5 天前
openai·ai编程·claude
谈谈 AI-Ready 和 AI-SDLC最近见到不少团队,一头扎进「多 Agent 协作平台」里:搭编排框架、设计角色分工、调工作流引擎,恨不得让一群 Agent 自动把需求从头跑到上线。可真用起来,AI 在他们的代码库里还是老样子,该犯的错照犯,该漏的步照漏。
面向Google编程5 天前
openai
我用 Codex 做周报自动化,第一件事是防止它胡写我每周最烦的时间点,基本就是写周报。前阵子我粗略算了一下,过去 3 个月我光是手写 prompt、翻记录、拼周报,差不多花了 12 个小时。平均下来,每周 50 分钟左右。这里面写字的时间其实不多,大头都花在找材料上:翻 GitHub,看这周提交了什么;翻 Jira,看哪些 ticket 还在自己手里;最后再把这些碎片凑成一段还算体面的文字。
武子康5 天前
人工智能·openai
调查研究-178 Google 官方 Agent Skills 仓库解读:AI Agent 时代,知识正在从「提示词」变成「可安装能力包」摘要:Google 开源的 google/skills 不是 SDK、不是 MCP Server,也不是普通 prompt 仓库,而是一组面向 Google Cloud、Gemini API、BigQuery、Cloud Run、GKE、认证、网络可观测性和 Well-Architected Framework 的 Agent Skills。它的核心意义是:把工程知识沉淀为 Agent 可以发现、按需加载、版本化管理的能力包。对开发者来说,这个仓库不只适合使用 Google 技术栈时减少 AI 幻觉,也提
葫芦和十三5 天前
openai·agent·ai编程
Agent 感知|语意压缩大家好,我是十三!欢迎来到十三Tech。上一讲聊了上下文分诊——信息进 Context 之前先排优先级。这一讲接住它的下一阶段:信息进来之后,Agent 只要跑得足够久,上下文一定会膨胀。
武子康6 天前
人工智能·openai·claude
调查研究-176 taste-skill:AI 编程时代,前端开发最缺的不是代码,而是品味AI 编程工具正在把"能不能做出来"这个问题快速推向廉价化。以前做一个落地页,需要设计稿、切图、组件拆分、响应式适配、动画实现和样式调试。现在只要给 Codex、Claude Code、Cursor、v0 或 Lovable 一段需求,它们很快就能生成一个页面。按钮有了,卡片有了,图标有了,响应式也大概有了。
机器之心7 天前
人工智能·openai
Claude Fable 5四日惊魂从万众期待的「AI 封神时刻」,到美国政府一纸禁令强制下线 —— 这个名字中有 5 的模型,没活过 5 天。
机器之心7 天前
人工智能·openai
打破SWE-bench唯分数论,首个独立测量harness的基准开源了编程 Agent 的评测,一直是本糊涂账。SWE-bench 如今已成事实标准,几乎每家发布新模型或新 Agent 框架,都会拿出一个 SWE-bench 分数来证明自己有多强。
ZzT7 天前
openai·ai编程·claude
费时费力做的 Spec 和知识库,Agent 真的受到约束了么?你给项目写了 CLAUDE.md,拆了几条 rule,做了几个 skill,又接了两个 MCP。然后 agent 该犯的错照犯,定下的规矩当没看见。