零一万物完成数亿美元融资;OpenAI 引入 API 结构化输出功能

🦉 AI新闻

🚀 OpenAI 引入 API 结构化输出功能

摘要:8 月 6 日,OpenAI 发布新闻稿,宣布在 API 中引入结构化输出功能。这一功能确保模型响应符合用户提供的 JSON 模式,提升响应可靠性和一致性。新模型 gpt-4o-2024-08-06 在复杂 JSON 模式评估中实现了 100% 满分,大幅超过 gpt-4-0613 的成绩。

🚀 零一万物完成数亿美元融资

摘要:由李开复创办的 AI 大模型公司零一万物已完成数亿美元融资,投资方包括国际战投和东南亚财团。该公司成立于2023年5月,核心团队来自谷歌、微软等知名企业。零一万物推出了生产力工具"万知"和 AI 办公工具 PopAi,后者在9个月内获得接近1的投资产出比和近千万用户。李开复表示技术最为重要,不会参与国内依靠赔钱竞争的市场。

🚀 高德地图夜间红绿灯倒计时功能重新上线

摘要:高德地图夜间红绿灯倒计时功能重新上线,优化了夜间红绿灯倒计时的发布质量,使用户在夜间等待红灯时可看到倒计时信息。该功能通过大模型端到端预测能力,实现无需人工干预的倒计时显示。研发团队通过不断训练和优化增强对夜间交通模式的识别和预测能力。

🚀 受伤程序员利用AI高效编程

摘要:Claude工程师Erik Schluntz因骑车摔断右手,不得已开始与Claude AI结对编程,通过语音转文字及AI代码生成,在两个月内写出大量代码。他发现AI可以高效完成编写任务,让他体验到未来人类或无需手写代码的可能性。他还探索了AI调教技巧,以提高代码生成的质量与效率。

🚀 GPT-4o推新版本,性能提升价格下降

摘要:OpenAI 推出了新版 GPT-4o,较之前的版本性能全面提升,ZeroEval 测试跃居首位。新版本 GPT-4o-2024-08-06 支持结构化输出和 JSON 模式,输入输出价格分别降低 50% 和 33%。此外,token 输出扩展至 16k,尤其在图像输入方面性价比高。新版还增强了代码编辑功能和安全性更新,支持 Python 和 Node SDK。

🚀 谷歌Pixel 9 Pro引入Gemini AI和Add Me功能

摘要:MysteryLupin今天在X平台发布推文,分享了谷歌Pixel 9 Pro手机的宣传视频,重点介绍Gemini AI和Add Me功能。视频中展示了Gemini AI通过解析冰箱食材提供烹饪建议,以及Add Me功能可以将拍摄对象叠加到另一张图片上,使拍集体照变得更便捷。

🚀 MiniCPM-V 2.6 模型开源,端侧多模态超越 GPT-4V

摘要:面壁智能发布了开源的 MiniCPM-V 2.6 模型,拥有 8B 参数,超过20B以下的单图、多图、视频理解能力,达成3项SOTA成绩。其特点包括"三合一最强"端侧多模态,支持实时视频理解、多图联合理解等,高像素密度及端侧友好,推理速度提升33%,并支持多种语言统一。MiniCPM-V 2.6 通过GitHub和HuggingFace平台开源。

相关推荐
To_OC9 小时前
搞懂 Token 和 Embedding 后,我终于明白大模型是怎么 "读" 文字的
人工智能·llm·agent
冬奇Lab11 小时前
每日一个开源项目(第139篇):Voicebox - 本地运行的开源 ElevenLabs 替代品
人工智能·开源·资讯
冬奇Lab12 小时前
Skill 系列(03):Skill 设计范式——5 个模式让输出从混沌到可预测
人工智能·开源·agent
IT_陈寒14 小时前
Python搞不定字符串编码?这破玩意坑我两小时!
前端·人工智能·后端
大模型真好玩15 小时前
什么是Loop Engineering?最通俗易懂的Loop Engineering核心概念
人工智能·agent·deepseek
叁两15 小时前
前端转型AI Agent该如何学习?(前置篇)
前端·人工智能·node.js
LaiYoung_16 小时前
🎁 送你一套超好用超实用的 FE AI-Coding Skills
前端·人工智能·开源
ZzT18 小时前
怎么做才不会被 AI 替代?
人工智能·程序员
道友可好18 小时前
从今天开始:你的第一个 Harness Engineering 实践
前端·人工智能·后端