openai

武子康8 小时前
人工智能·openai·agent
调查研究-192 AI Agent 之间也需要“信任“:把多 Agent 信任变成可测指标AI Agent 之间也需要"信任":把多 Agent 信任变成可测指标(arXiv 2026 论文解读)
武子康9 小时前
人工智能·深度学习·openai
调查研究-191 SenseVoice 不只是 ASR:把语音从“转文字“升级成“理解状态“做 AI 语音对话系统时,很多人会先把语音识别理解成一件事:这个理解没有错。ASR 的核心任务确实是把音频转换为 transcript。问题是,真实的人机语音交互里,系统真正需要的并不只有"用户说了什么"。
crazyzzzzz12 小时前
openai
Codex Windows 自动更新后沙箱报错:一次 WindowsApps 受保护文件问题排查本文记录一次 Codex Windows 桌面端自动更新后的 sandbox 报错排查过程。结论先说:这不像普通项目目录权限问题,也不像单纯的 node_modules 路径过深问题;更可疑的是自动更新后 WindowsApps 应用包中的 app\resources 可执行文件处于 Encrypted / Application Protected 状态,导致沙箱上下文无法正常执行或加载。
怕浪猫14 小时前
openai·agent·ai编程
第4章 规划与推理:赋予Agent思考的能力在前几章我们完成了LLM底座、Prompt工程、记忆系统的搭建,Agent已经具备上下文记忆、长期语义回忆、结构化输出能力。但此时的Agent仍停留在「被动应答」阶段:面对复杂多步骤任务,只会简单线性执行,不会拆解、不会择优、不会纠错、不会复盘。
阿祖zu1 天前
程序员·openai·agent
优雅写作:开源两个我的文章写作 SkillLLM 带来了巨大的生产力提升。我目前主要用 Codex 辅助日常任务,写作也不例外。LLM 本来就是通用自然语言模型,最擅长处理语言文字,但带来便利的同时,也产生了新的问题。在我自己的观察和写作过程中,我遇到两个明确且突出的问题:
AI模型调用笔记2 天前
openai·ai编程
5 行代码同时调用 GPT + Claude + Gemini,附 Python 完整示例做 AI 相关开发的朋友都经历过这个阶段:项目里要用到多个模型,于是你接了 OpenAI SDK、Anthropic SDK、Google AI SDK……三个 SDK 三种调用方式,参数名都不一样,维护起来头疼得要命。
武子康2 天前
人工智能·深度学习·openai
调查研究-189 Kronos 调研:金融 K 线基础模型,是真突破,还是量化圈的新玩具?说明:本文只做技术研究和工程拆解,不构成任何投资建议,也不讨论任何具体标的的买卖决策。最近 GitHub 上一个叫 shiyu-coder/Kronos 的项目热度很高。它的完整标题是 Kronos: A Foundation Model for the Language of Financial Markets,直译过来就是"金融市场语言的基础模型"。
怕浪猫2 天前
aigc·openai·ai编程
第3章 记忆系统:构建Agent的长期与短期记忆前面章节我们掌握了 LLM 底层原理、Prompt 工程、结构化输出能力。但目前的 Agent 仍然存在一个致命问题:无记忆能力。
程序员辉哥2 天前
openai·ai编程·claude
Skill精通系列之GStack-最会做决策的虚拟团队嗨,我是辉哥,一个致力于使用 AI 技术搞副业的超级个体GStack用42个纯Markdown定义的Skill,搭起了一个完整的虚拟工程团队。每个Skill对应一个专业角色,有自己的思维方式、工作流程和评价标准。
武子康3 天前
人工智能·openai·claude
调查研究-187 Claude Fable 5 / Mythos 5 事件:前沿模型开始进入“能力分层”时代摘要:Claude Fable 5 / Mythos 5 这轮风波,不只是"Anthropic 又发布了一个更强模型"。更值得关注的是:前沿模型正在从单一聊天产品,变成按能力、访问身份、安全边界、数据治理和任务风险分层交付的基础设施。Fable 5 被报道为更广泛开放、带安全护栏的 Mythos-class 模型;Mythos 5 则更偏受控访问。随后,关于安全护栏、fallback、不可见限制、出口管制和全球禁用的报道,又把一个问题推到台前:当模型能力强到接近真实任务执行者时,开发者和企业不能只问"模型
怕浪猫3 天前
openai·agent·ai编程
第2章 核心技术栈:大语言模型与Prompt工程在上一章中,我们搭建好了 AI Agent 的开发环境、理清了智能体的架构与框架选型。从本章开始,我们正式进入AI Agent 底层核心技术栈实战学习。
悟空码字3 天前
aigc·openai·ai编程
【高德开放平台skill】从拍脑袋到看数据,我是如何把一个“选址直觉“做成 AI Skill 的创业圈里有句话:"选址定生死"。有个做线下连锁品牌的朋友常说,选到一个好铺位,生意就成了一半;选错了,再努力也是给房东打工。但每次听他们聊选址,聊到最后往往都是玄学——"这条街风水好""那边人流旺""感觉那个位置行"。
武子康3 天前
人工智能·openai·claude
调查研究-185 CodeGraph 调研:给 AI 编程 Agent 一张代码库地图,少一点反复 grep(2026)摘要:AI 编程 Agent 已经能很快写代码,但它们在真实仓库里经常卡在"重新认识项目"这件事上:反复 grep、反复读文件、反复猜调用链。CodeGraph 的价值不是替代模型写代码,而是把代码库提前解析成本地知识图谱,让 Agent 可以通过 MCP 查询符号、调用关系、文件结构、影响面和受影响测试。本文从工程使用视角拆解 CodeGraph 的定位、架构、MCP 工具、与 RAG/LSP/静态分析的区别,以及它适合什么项目、不适合什么项目。
AINative软件工程4 天前
llm·openai·agent
LLM 应用的 Bad Case 反馈闭环工程:别再把用户差评丢进客服表了如果你做过线上 LLM 应用,大概率遇到过这种场景:用户点了一个 👎,备注里写着“答非所问”。客服系统里多了一条工单,产品同学截图发到群里,研发看了一眼 trace,发现 prompt、检索、工具调用、模型返回都“看起来没报错”。最后大家讨论半小时,结论是:这个问题不好复现,先观察。
葫芦和十三5 天前
openai·agent·ai编程
多模态融合|是数据形态工程,不是 Prompt 工程大家好,我是十三!欢迎来到十三Tech。《Agent 设计模式之美》感知模块最后一讲。前三讲(分诊、压缩、发现)都默认一个前提——进入 Agent 的信息已经是某种 token。这一讲处理的是更前面的一步:数据在进入 Agent 之前,应该先变成什么形态。
Lei活在当下6 天前
人工智能·llm·openai
【AI手记系列-2026/6/18】iSparto & Harness,Caveman 以及AI时代的生存指南原文链接:mp.weixin.qq.com/s/YhsmIXdIv…这篇文章是一名独立开发者的 Harness Engineering 实践记录。作者使用 Claude Code,设计出一套不同角色的 Agent Team,并通过这套 Team 真正完成了 iOS App "勇芽" 的开发与上线。我认为,文中最值得借鉴的是一种组织设计思路:围绕最终目标,为不同任务设置独立角色,再把这些角色组装成一个多职能团队。
BingoGo6 天前
openai
Openai Codex 重大更新 已支持接入任意开源大模型如果你还认为 Codex(OpenAI 推出的 AI 编程助手)只能搭配 GPT 系列模型使用,那你可能错过了近期最重要的一次更新。
JaguarJack6 天前
ai·openai·codex
Openai Codex 重大更新 已支持接入任意开源大模型如果你还认为 Codex(OpenAI 推出的 AI 编程助手)只能搭配 GPT 系列模型使用,那你可能错过了近期最重要的一次更新。