AI Weekly『12月16-22日』:OpenAI公布o3,谷歌发布首个推理模型,GitHub Copilot免费版上线!

大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的"外挂 ",专注于分享AI全维度知识,包括但不限于AI科普AI工具测评AI效率提升AI行业洞察。关注我,AI之路不迷路,2024我们一起变强。

关于AI Weekly

马化腾谈及AI时说:"我们最开始以为这是互联网十年不遇的机会,但是越想越觉得这是几百年不遇的、类似发明电的工业革命一样的机遇,所以我们觉得非常重要。"

AI Weekly回来了!

"AI Weekly"是AI领域的前沿资讯周报,每周与你相约,精心筛选并总结过去一周内AI领域最重要、最具影响力的事件。这个专栏致力于打破信息壁垒,帮助你高效掌握最新动态,增强对AI技术及应用趋势的洞察力。

省流版摘要

  1. OpenAI直播活动结束,公布新推理模型o3 :12天连续直播活动结束,OpenAI正式公布o3模型,超越人类智商,目前处于安全测试阶段,预计明年1月底发布mini版本。ChatGPT Search开放至免费用户,Work with Apps功能上线,支持从第三方应用获取上下文。

  2. 谷歌发布Gemini 2.0 Flash Thinking模型:谷歌推出首个通用推理模型,主打"清晰展现思考过程",在Chatbot Arena排行榜中排名第一,较前代模型在"硬提示"和"视觉"任务上分别提升14分和16分。

  3. Perplexity完成5亿美元融资,估值飙升至90亿美元:AI搜索引擎初创公司Perplexity完成新一轮融资,估值从今年4月的10亿美元跃升至90亿美元,计划开发搜索广告系统和吸引AI领域顶尖人才。

  4. GitHub Copilot免费版上线:GitHub推出Copilot Free订阅服务,每月免费提供2000次代码补全和50次聊天交互,进一步降低AI工具使用门槛,赋能1.5亿开发者。

  5. 快手发布可灵1.6模型:新模型在文本响应度、画面美感及运动合理性上显著提升,高品质模式效果较1.5模型提升195%,广泛适用于短视频内容创作。

  6. 字节即梦AI图片模型2.1上线:全新模型支持"一句话生成海报",通过简单指令控制文字和画面元素,为广告设计等场景提供高效解决方案。

  7. 智谱AI完成30亿元融资:智谱AI完成新一轮融资,用于提升基座大模型能力,支持复杂、多模态任务。2024年以来,其商业化收入实现同比翻倍增长。

1. OpenAI连续12天直播活动结束,公布新推理模型o3

OpenAI自12月5日起连续12天的直播活动已于12月20日结束。

本周的发布内容对于大多数人来说可能不是特别有吸引力,要么是不实用,要么是还没正式发布。最重磅的发布肯定要属o1的后继模型:o3的正式亮相 。超越人类智商的o3目前还处于安全测试阶段,预计明年1月底发布mini版本。

ChatGPT Search全面开放至免费用户,OpenAI兑现了几个月前的承诺。这符合OpenAI一贯的调性,新功能都是付费用户先体验一段时间,最终会向免费用户开放。

Work with Apps,很实用的功能,目前能做到直接从集成的第三方应用里获取上下文,未来可能能实现更深度的功能。

接下来是两个普通用户很可能用不到的功能:o1 API版本 正式发布,不过目前仅限Usage Tier 5的用户可用。电话直拨ChatGPT,目前支持美国和加拿大的用户。

完整的12天发布内容详情看这里。

日期 发布关键词 详细解读文章
🌟 Day 1 满血版 o1 · ChatGPT Pro 新套餐
✨ Day 2 强化学习微调 (RFT)
🎥 Day 3 文生视频模型 Sora
🖌️ Day 4 ChatGPT Canvas
🍎 Day 5 Apple Intelligence
🎄 Day 6 视频聊天 · 屏幕共享 · 圣诞模式
🚀 Day 7 ChatGPT Projects
🔍 Day 8 ChatGPT Search
💡 Day 9 o1 API · Realtime API · 偏好微调
📞 Day 10 电话直拨ChatGPT · WhatsApp支持
💻 Day 11 Work with Apps
🆕 Day 12 o3

2. 谷歌发布Gemini 2.0 Flash Thinking模型

2024年12月19日,谷歌在AI Studio平台发布实验性模型Gemini 2.0 Flash Thinking,这是其首个通用推理模型,主打"清晰展现思考过程"。该模型能够解答复杂问题,模仿人类逐步推理,展示其"思考"步骤,与OpenAI的o1推理模型形成竞争。

Gemini 2.0 Flash Thinking基于Gemini 2.0 Flash的速度和性能构建,在Chatbot Arena LLM排行榜中表现优异,在所有类别中均排名第一。尤其在"硬提示"和"视觉"任务中,较前代模型分别提升了14分和16分。

3. Perplexity完成5亿美元融资,估值飙升至90亿美元

2024年12月19日,AI搜索引擎初创公司Perplexity AI Inc.完成了5亿美元的融资,使公司估值从今年4月的10亿美元跃升至90亿美元。

Perplexity成立于2022年,致力于开发与谷歌竞争的搜索产品。其搜索引擎利用生成式AI技术,提供实时信息,与OpenAI的ChatGPT等产品形成差异化竞争。此次融资由Institutional Venture Partners领投,英伟达、新企业协会(NEA)、B Capital和T Rowe Price等参与。公司计划利用这笔资金吸引顶尖AI人才,并开发其搜索广告系统。

4. GitHub Copilot免费版上线

2024年12月19日,微软旗下GitHub宣布推出GitHub Copilot Free订阅服务,开发者可在GitHub Copilot官网页面以及Visual Studio Code中免费使用这一AI编程助手。免费版每月提供2000次代码补全机会,同时支持50次AI聊天交互。用户可选择Anthropic的Claude 3.5 Sonnet或OpenAI的GPT-4o模型作为支持。

此次免费开放使全球1.5亿GitHub开发者能够体验AI辅助编程的功能。GitHub表示,此举旨在降低AI工具的使用门槛,为更多开发者提供智能化编程支持,加速开发效率和创新能力的提升。

5. 快手发布可灵1.6模型

2024年12月19日,快手正式发布视频生成模型可灵1.6,对文本响应度、画面美感及运动合理性进行了显著优化。该模型生成的画面更加稳定、生动,支持标准和高品质模式。官方宣称,在内部评测中,高品质模式的整体效果较1.5模型提升了195%。

可灵1.6还针对图生视频的处理能力进行了加强,不仅在画面质量上实现突破,还优化了运动逻辑,使视频过渡更自然。

6. 字节即梦AI图片模型2.1上线,支持"一句话生成海报"

2024年12月20日,字节跳动旗下即梦AI推出全新图片生成模型2.1。该模型号称"一句话生成海报",通过简单指令即可实现图片生成,用户可控制文字的颜色、位置和大小等元素,快速制作中英文图像海报。

即梦AI还提供了常用提示词模板,包括艺术风格、画面主体描述和文字排版描述。例如,用户可以指定画面基调(如写实风、插画风或中国水墨风)、画面内容(人物或物品的具体状态),并通过指令精准设置文字的排版样式。这一升级大幅提升了创作效率,为广告设计、品牌宣传等场景提供了更便捷的解决方案。

7. 智谱AI完成30亿元融资

2024年12月17日,AI独角兽智谱AI宣布完成新一轮30亿元融资,新投资方包括多家战略投资者及国资,老股东君联资本等继续跟投。据悉,此轮融资将用于智谱AI基座大模型的进一步研发,从传统问答能力升级到解决复杂、多模态任务,帮助企业在AI生态系统中实现更深层次的应用场景落地。

2024年以来,智谱AI的商业化收入同比增长超过100%。智谱COO张帆指出,与传统企业需要近10年时间才能实现几亿元的年度经常性收入(ARR)相比,智谱仅用数月便完成了这一目标。


精选推荐


都读到这里了,点个赞鼓励一下吧,小手一赞,年薪百万!😊👍👍👍。关注我,AI之路不迷路,原创技术文章第一时间推送🤖。

相关推荐
古希腊掌管学习的神41 分钟前
[机器学习]XGBoost(3)——确定树的结构
人工智能·机器学习
ZHOU_WUYI1 小时前
4.metagpt中的软件公司智能体 (ProjectManager 角色)
人工智能·metagpt
haibo21441 小时前
GPT-Omni 与 Mini-Omni2:创新与性能的结合
gpt
靴子学长2 小时前
基于字节大模型的论文翻译(含免费源码)
人工智能·深度学习·nlp
AI_NEW_COME3 小时前
知识库管理系统可扩展性深度测评
人工智能
油泼辣子多加3 小时前
2024年12月18日Github流行趋势
github
海棠AI实验室3 小时前
AI的进阶之路:从机器学习到深度学习的演变(一)
人工智能·深度学习·机器学习
IT古董4 小时前
【机器学习】机器学习的基本分类-强化学习-策略梯度(Policy Gradient,PG)
人工智能·机器学习·分类
centurysee4 小时前
【最佳实践】Anthropic:Agentic系统实践案例
人工智能