零一万物完成数亿美元融资;OpenAI 引入 API 结构化输出功能

🦉 AI新闻

🚀 OpenAI 引入 API 结构化输出功能

摘要:8 月 6 日,OpenAI 发布新闻稿,宣布在 API 中引入结构化输出功能。这一功能确保模型响应符合用户提供的 JSON 模式,提升响应可靠性和一致性。新模型 gpt-4o-2024-08-06 在复杂 JSON 模式评估中实现了 100% 满分,大幅超过 gpt-4-0613 的成绩。

🚀 零一万物完成数亿美元融资

摘要:由李开复创办的 AI 大模型公司零一万物已完成数亿美元融资,投资方包括国际战投和东南亚财团。该公司成立于2023年5月,核心团队来自谷歌、微软等知名企业。零一万物推出了生产力工具"万知"和 AI 办公工具 PopAi,后者在9个月内获得接近1的投资产出比和近千万用户。李开复表示技术最为重要,不会参与国内依靠赔钱竞争的市场。

🚀 高德地图夜间红绿灯倒计时功能重新上线

摘要:高德地图夜间红绿灯倒计时功能重新上线,优化了夜间红绿灯倒计时的发布质量,使用户在夜间等待红灯时可看到倒计时信息。该功能通过大模型端到端预测能力,实现无需人工干预的倒计时显示。研发团队通过不断训练和优化增强对夜间交通模式的识别和预测能力。

🚀 受伤程序员利用AI高效编程

摘要:Claude工程师Erik Schluntz因骑车摔断右手,不得已开始与Claude AI结对编程,通过语音转文字及AI代码生成,在两个月内写出大量代码。他发现AI可以高效完成编写任务,让他体验到未来人类或无需手写代码的可能性。他还探索了AI调教技巧,以提高代码生成的质量与效率。

🚀 GPT-4o推新版本,性能提升价格下降

摘要:OpenAI 推出了新版 GPT-4o,较之前的版本性能全面提升,ZeroEval 测试跃居首位。新版本 GPT-4o-2024-08-06 支持结构化输出和 JSON 模式,输入输出价格分别降低 50% 和 33%。此外,token 输出扩展至 16k,尤其在图像输入方面性价比高。新版还增强了代码编辑功能和安全性更新,支持 Python 和 Node SDK。

🚀 谷歌Pixel 9 Pro引入Gemini AI和Add Me功能

摘要:MysteryLupin今天在X平台发布推文,分享了谷歌Pixel 9 Pro手机的宣传视频,重点介绍Gemini AI和Add Me功能。视频中展示了Gemini AI通过解析冰箱食材提供烹饪建议,以及Add Me功能可以将拍摄对象叠加到另一张图片上,使拍集体照变得更便捷。

🚀 MiniCPM-V 2.6 模型开源,端侧多模态超越 GPT-4V

摘要:面壁智能发布了开源的 MiniCPM-V 2.6 模型,拥有 8B 参数,超过20B以下的单图、多图、视频理解能力,达成3项SOTA成绩。其特点包括"三合一最强"端侧多模态,支持实时视频理解、多图联合理解等,高像素密度及端侧友好,推理速度提升33%,并支持多种语言统一。MiniCPM-V 2.6 通过GitHub和HuggingFace平台开源。

相关推荐
野蛮的大西瓜6 分钟前
开源呼叫中心中,如何将ASR与IVR菜单结合,实现动态的IVR交互
人工智能·机器人·自动化·音视频·信息与通信
CountingStars61931 分钟前
目标检测常用评估指标(metrics)
人工智能·目标检测·目标跟踪
tangjunjun-owen39 分钟前
第四节:GLM-4v-9b模型的tokenizer源码解读
人工智能·glm-4v-9b·多模态大模型教程
冰蓝蓝44 分钟前
深度学习中的注意力机制:解锁智能模型的新视角
人工智能·深度学习
橙子小哥的代码世界1 小时前
【计算机视觉基础CV-图像分类】01- 从历史源头到深度时代:一文读懂计算机视觉的进化脉络、核心任务与产业蓝图
人工智能·计算机视觉
新加坡内哥谈技术1 小时前
苏黎世联邦理工学院与加州大学伯克利分校推出MaxInfoRL:平衡内在与外在探索的全新强化学习框架
大数据·人工智能·语言模型
fanstuck2 小时前
Prompt提示工程上手指南(七)Prompt编写实战-基于智能客服问答系统下的Prompt编写
人工智能·数据挖掘·openai
lovelin+v175030409662 小时前
安全性升级:API接口在零信任架构下的安全防护策略
大数据·数据库·人工智能·爬虫·数据分析
唐小旭2 小时前
python3.6搭建pytorch环境
人工智能·pytorch·python
洛阳泰山3 小时前
MaxKB基于大语言模型和 RAG的开源知识库问答系统的快速部署教程
人工智能·语言模型·开源·rag·maxkb