openai

机器之心4 小时前
人工智能·openai
刚刚,DeepSeek-R1论文登上Nature封面,通讯作者梁文锋太令人意外!却又实至名归!最新一期的 Nature 封面,竟然是 DeepSeek-R1 的研究。也就是今年 1 月份 DeepSeek 在 arxiv 公布的论文《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》。这篇Nature论文通讯作者正是梁文锋。
安思派Anspire5 小时前
aigc·openai·agent
创建完整的评估生命周期以构建高(三)我们的V1代理在最具挑战性的测试用例中表现完美。然而,真正的生产就绪需要的不仅仅是修复已知的漏洞。我们需要确保我们新的、更复杂的系统不仅准确,而且高效,并且其准确性在不同类型的数据中都能保持。
机器之心21 小时前
人工智能·openai
LLM开源2.0大洗牌:60个出局,39个上桌,AI Coding疯魔,TensorFlow已死卷王指南又更新了,这次还有番外篇。开源 2.0 :变脸堪比整容等了一百多天,悬念终于揭晓。9 月 13 日上午,蚂蚁集团开源团队(「开源技术增长」)携《 2025 大模型开源开发生态全景图 》2.0 版,亮相上海外滩大会。
安思派Anspire1 天前
aigc·openai·agent
创建完整的评估生命周期以构建高(二)在明确了问题并准备好数据之后,是时候构建我们的第一个系统了。在评估驱动开发中,初始版本,即 V0,遵循一个核心原则:
机器之心1 天前
人工智能·openai
高阶程序,让AI从技术可行到商业可信的最后一公里很多人相信,我们已经进入了所谓的「AI 下半场」,一个模型能力足够强大、应用理应爆发的时代。然而,对于这个时代真正缺少的东西,不同的人有不同的侧重,比如(前)OpenAI 研究者姚顺雨强调了评估的重要性,著名数学家陶哲轩则指出必须降低成本才能实现规模化应用。
机器之心1 天前
人工智能·openai
刚刚,李飞飞空间智能新成果震撼问世!3D世界生成进入「无限探索」时代就在今天,斯坦福大学教授李飞飞的创业公司 World Labs 发布了新成果 —— 限量开放的测试预览版空间智能模型 Marble。
MrSYJ1 天前
llm·openai·ai编程
Chat Memory你知道怎么用吗我们借用官方文档的描述:Large language models (LLMs) are stateless, meaning they do not retain information about previous interactions. This can be a limitation when you want to maintain context or state across multiple interactions. To address this, Spring AI provid
机器之心2 天前
人工智能·openai
谁说Scaling Law到头了?新研究:每一步的微小提升会带来指数级增长很多人认为,Scaling Law 正在面临收益递减,因此继续扩大计算规模训练模型的做法正在被质疑。最近的观察给出了不一样的结论。研究发现,哪怕模型在「单步任务」上的准确率提升越来越慢,这些小小的进步叠加起来,也能让模型完成的任务长度实现「指数级增长」,而这一点可能在现实中更有经济价值。
coder_pig2 天前
chatgpt·openai·claude
🤔 试试 OpenAI 的最强编程模型 "GPT-5-Codex"?🐶 Cursor 近半年 "作妖不断" (各种变相涨价),20🔪的 Pro 越来越 "不耐用" 前阵子 "白嫖" 的三个月Pro,在我很 "节俭" 非重度使用的情况下 (尽量用临时免费的 grok-fast ,解决不了再Claude 4,还不行才 Claude 4🧠),结果两星期不到就蹬完了🤡,一个月两个 Pro 都不够用啊🤦‍♂️,还是得找下平替。
新智元2 天前
人工智能·openai
收手吧 GPT-5-Codex,外面全是 AI 编程智能体!一图看透全球大模型!新智元十周年钜献,2025 ASI 前沿趋势报告 37 页首发刚刚,GPT-5「船新」版本上线!
安思派Anspire2 天前
aigc·openai·agent
创建完整的评估生命周期以构建高(一)在传统机器学习中,准确率、精确率和F1分数等指标是基石。它们在有有限正确答案的任务中表现出色。然而,对于生成式AI和智能体系统而言,输出空间极为广阔,简单地将输出与单一**“正确”**答案进行字符串匹配已不再足够。
机器之心2 天前
人工智能·openai
刚刚,OpenAI发布GPT-5-Codex:可独立工作超7小时,还能审查、重构大型项目凌晨 1 点,OpenAI 发布了 GPT-5-Codex。从名字也能看出来,这是针对智能体编程任务进行了专门优化的 GPT-5。OpenAI 博客介绍说,GPT-5-Codex 的训练重点放在真实的软件工程任务上。它既能在短时间的交互式会话中快速响应,也能独立完成冗长复杂的任务。它的代码审查(code review)能力可以在代码上线前发现关键漏洞。
新智元3 天前
人工智能·openai
起猛了!这个国家任命 AI 为「部长」:全球首个,手握实权,招标 100% 透明一图看透全球大模型!新智元十周年钜献,2025 ASI 前沿趋势报告 37 页首发起猛了,AI 成功当上了一个国家的「部长」!
新智元3 天前
人工智能·openai
马斯克深夜挥刀,Grok 幕后员工 1/3 失业!谷歌 AI 靠人肉堆起,血汗工厂曝光一图看透全球大模型!新智元十周年钜献,2025 ASI 前沿趋势报告 37 页首发昨天,马斯克 xAI 内部曝出最大规模裁员。
机器之心3 天前
人工智能·openai
用光学生成图像,几乎0耗电,浙大校友一作研究登Nature见过省电的模型,但这么省电的,还是第一次见。在 《自然》 杂志发表的一篇论文中,加州大学洛杉矶分校 Shiqi Chen 等人描述了一种几乎不消耗电量的 AI 图像生成器的开发。
Code_流苏3 天前
人工智能·gpt·ai·openai·claude·qwen3-next·架构创新
AI热点周报(9.7~9.13):阿里Qwen3-Next震撼发布、Claude 增强记忆与服务抖动、OpenAI 聚焦模型规范化...名人说:博观而约取,厚积而薄发。——苏轼《稼说送张琥》 创作者:Code_流苏(CSDN)(一个喜欢古诗词和编程的Coder😊)
安思派Anspire3 天前
aigc·openai·agent
从 ETL 到 ELT 再到 EAI:AI 如何重塑数据处理(ChatGPT 生成图片)六个月前,在一次项目回顾会上,我目睹了一个数据团队的理念发生了转变。为了给 AI 聊天机器人清理客户支持数据,他们花了数周时间构建 ETL 管道——其中包含复杂的转换逻辑、固定的模式以及无数的边缘情况。随后,团队的机器学习工程师提出了一个问题:“如果我们直接将原始数据输入 LLM,让它自己判断哪些信息重要,会怎么样?”
乐予吕6 天前
aigc·openai·seo
GEO 入门:从 SEO 到 GEO 的转变随着 ChatGPT、Bard、Claude 等生成式 AI 工具的普及,我们正步入生成式引擎优化(GEO)的新时代。在这个 AI 主导的信息检索时代,用户习惯于直接向 AI 提问而非搜索引擎获取答案。这意味着内容创作者和营销人员必须重新思考如何让自己的内容被看见、被引用、被推荐。GEO 并非传统 SEO 的简单延伸,而是一种全新的内容优化思维:要求我们以更自然、权威且结构清晰的方式创作内容,以确保在 AI 模型训练和回答生成过程中脱颖而出。
sorryhc6 天前
前端·前端框架·openai
0~1构建一个mini blot.new(无AI版本)最近AI在线生成前端代码特别火,很多公司的PD都学会使用这类平台开始生成原型图了。例如blot.new、1D等一系列P2C、D2C的场景。
量子位6 天前
openai·ai编程
姚顺雨离职OpenAI,开启下半场为大模型开启 “下半场” 的姚顺雨,也开启了个人 AI 的下半场。就在最近,这位明星 OpenAI 华人研究员的动态,开始被火热关注。