openai

Lei活在当下1 小时前
人工智能·llm·openai
【AI手记系列-2026/6/18】iSparto & Harness,Caveman 以及AI时代的生存指南原文链接:mp.weixin.qq.com/s/YhsmIXdIv…这篇文章是一名独立开发者的 Harness Engineering 实践记录。作者使用 Claude Code,设计出一套不同角色的 Agent Team,并通过这套 Team 真正完成了 iOS App "勇芽" 的开发与上线。我认为,文中最值得借鉴的是一种组织设计思路:围绕最终目标,为不同任务设置独立角色,再把这些角色组装成一个多职能团队。
BingoGo6 小时前
openai
Openai Codex 重大更新 已支持接入任意开源大模型如果你还认为 Codex(OpenAI 推出的 AI 编程助手)只能搭配 GPT 系列模型使用,那你可能错过了近期最重要的一次更新。
JaguarJack7 小时前
ai·openai·codex
Openai Codex 重大更新 已支持接入任意开源大模型如果你还认为 Codex(OpenAI 推出的 AI 编程助手)只能搭配 GPT 系列模型使用,那你可能错过了近期最重要的一次更新。
Windeal1 天前
后端·openai
Agent ToolCall 循环怎么定制?PI Extension 与 DeepAgents Middleware 两条岔路深度对比当你想给 Agent 的 tool_call 循环挂自定义逻辑——拦截、改写、重试、注入工具——会发现两个明星框架选了两条互不重合的范式:PI 用"事件订阅",DeepAgents 用"中间件洋葱"。这篇把它们放在一起对比,告诉你根因在哪、各自的天花板在哪、你的项目该选哪种。
holly就是我1 天前
openai
我让 Claude 写了一个贪吃蛇游戏,然后用 ccglass 看清它发给模型的真实请求AI 编程 Agent 越来越强。现在我们已经不只是让模型补全一段代码,而是直接让 Claude Code、Codex、OpenCode 这类工具读项目、写文件、调用命令、修改代码、完成一整个开发任务。
ZzT1 天前
openai·ai编程·claude
谈谈 AI-Ready 和 AI-SDLC最近见到不少团队,一头扎进「多 Agent 协作平台」里:搭编排框架、设计角色分工、调工作流引擎,恨不得让一群 Agent 自动把需求从头跑到上线。可真用起来,AI 在他们的代码库里还是老样子,该犯的错照犯,该漏的步照漏。
面向Google编程1 天前
openai
我用 Codex 做周报自动化,第一件事是防止它胡写我每周最烦的时间点,基本就是写周报。前阵子我粗略算了一下,过去 3 个月我光是手写 prompt、翻记录、拼周报,差不多花了 12 个小时。平均下来,每周 50 分钟左右。这里面写字的时间其实不多,大头都花在找材料上:翻 GitHub,看这周提交了什么;翻 Jira,看哪些 ticket 还在自己手里;最后再把这些碎片凑成一段还算体面的文字。
武子康2 天前
人工智能·openai
调查研究-178 Google 官方 Agent Skills 仓库解读:AI Agent 时代,知识正在从「提示词」变成「可安装能力包」摘要:Google 开源的 google/skills 不是 SDK、不是 MCP Server,也不是普通 prompt 仓库,而是一组面向 Google Cloud、Gemini API、BigQuery、Cloud Run、GKE、认证、网络可观测性和 Well-Architected Framework 的 Agent Skills。它的核心意义是:把工程知识沉淀为 Agent 可以发现、按需加载、版本化管理的能力包。对开发者来说,这个仓库不只适合使用 Google 技术栈时减少 AI 幻觉,也提
葫芦和十三2 天前
openai·agent·ai编程
Agent 感知|语意压缩大家好,我是十三!欢迎来到十三Tech。上一讲聊了上下文分诊——信息进 Context 之前先排优先级。这一讲接住它的下一阶段:信息进来之后,Agent 只要跑得足够久,上下文一定会膨胀。
武子康2 天前
人工智能·openai·claude
调查研究-176 taste-skill:AI 编程时代,前端开发最缺的不是代码,而是品味AI 编程工具正在把"能不能做出来"这个问题快速推向廉价化。以前做一个落地页,需要设计稿、切图、组件拆分、响应式适配、动画实现和样式调试。现在只要给 Codex、Claude Code、Cursor、v0 或 Lovable 一段需求,它们很快就能生成一个页面。按钮有了,卡片有了,图标有了,响应式也大概有了。
机器之心3 天前
人工智能·openai
Claude Fable 5四日惊魂从万众期待的「AI 封神时刻」,到美国政府一纸禁令强制下线 —— 这个名字中有 5 的模型,没活过 5 天。
机器之心3 天前
人工智能·openai
打破SWE-bench唯分数论,首个独立测量harness的基准开源了编程 Agent 的评测,一直是本糊涂账。SWE-bench 如今已成事实标准,几乎每家发布新模型或新 Agent 框架,都会拿出一个 SWE-bench 分数来证明自己有多强。
ZzT3 天前
openai·ai编程·claude
费时费力做的 Spec 和知识库,Agent 真的受到约束了么?你给项目写了 CLAUDE.md,拆了几条 rule,做了几个 skill,又接了两个 MCP。然后 agent 该犯的错照犯,定下的规矩当没看见。
武子康3 天前
人工智能·openai
调查研究-175 Supermemory:AI 时代的 Memory API,不只是另一个向量数据库过去几年,AI 应用的主线一直围绕模型能力展开:更大的模型、更长的上下文窗口、更强的推理能力、更低的推理成本。很多开发者会默认认为,只要模型足够强、上下文足够长,AI 应用就会自然变聪明。
小七-七牛开发者3 天前
ai·chatgpt·openai·agent·工作流·codex·skill·ai coding
Codex 实践系列 Vol.02:让 Codex 读懂开源项目 Typer在 Codex 系列第一篇(上篇),我们用一个很小的本地脚本,跑通了 Codex CLI 的基本流程:进入项目目录,启动 Codex,然后让它读文件、写代码、跑命令。
AINative软件工程4 天前
openai
LLM 流式响应的中断恢复工程:客户端断线、上游 502、运维下毒,三类场景下如何续传不重复扣 token上周我们一个客户的 AI 写作产品出了次成本异常。日均大模型 API 账单从 580 元跳到 1670 元,QPS 没涨,模型也没换。
AINative软件工程4 天前
openai
AI Coding 上线后,我们团队失效了的 6 条研发管理规则Q3 sprint planning 那天,PO 发了一条信息:"上个季度 AI 工具提效明显,这个季度我们把需求量加 30%,应该问题不大吧?"
AINative软件工程5 天前
openai
LLM 应用的 Canary 发布工程实践:模型升级不停服的灰度切流、回滚与流量染色你换了一个更强的模型,上线两小时后,客服工单量翻了三倍。不是模型出 bug,是它的输出风格稍微变了——日期格式不一样了,拒答的边界场景变多了,回复长度缩了 20%。你回滚,两天工作白费。