AI Weekly『12月2-8日』：OpenAI发布发布满血版o1，Meta发布Llama 3.3模型！

大家好，我是木易，一个持续关注AI领域的互联网技术产品经理，国内Top2本科，美国Top10 CS研究生，MBA。我坚信AI是普通人变强的"外挂 "，专注于分享AI全维度知识，包括但不限于AI科普 ，AI工具测评 ，AI效率提升 ，AI行业洞察。关注我，AI之路不迷路，2024我们一起变强。

关于AI Weekly

马化腾谈及AI时说："我们最开始以为这是互联网十年不遇的机会，但是越想越觉得这是几百年不遇的、类似发明电的工业革命一样的机遇，所以我们觉得非常重要。"

AI Weekly回来了！

"AI Weekly"是AI领域的前沿资讯周报，每周与你相约，精心筛选并总结过去一周内AI领域最重要、最具影响力的事件。这个专栏致力于打破信息壁垒，帮助你高效掌握最新动态，增强对AI技术及应用趋势的洞察力。

省流版摘要

OpenAI宣布12天12场直播 ：首日推出完整版o1推理模型，支持图片输入；同时上线每月200美元的ChatGPT Pro订阅服务。第二日展示"强化微调"技术，提升AI模型领域表现。
Meta发布Llama 3.3模型：拥有700亿参数，但性能媲美4050亿参数模型，支持128K上下文长度，多语言优化，成本效益极高。
马斯克X平台Grok向免费用户开放：Grok聊天机器人每两小时可供免费用户发送10条消息。xAI计划于12月推出Grok独立应用。
腾讯开源HunYuan-Video视频生成模型：支持中英双语输入，130亿参数，提升视频生成质量，用户可在"腾讯元宝"中申请试用。
字节跳动AI助手豆包上线图片理解功能：用户上传图片即可识别和解读内容，并支持查询景点位置和角色出处等功能。
"AI教父"辛顿预测超人类智慧AI：辛顿表示，超越人类智慧的AI可能在未来20年内出现，最快5年内问世，需关注潜在威胁。
OpenAI探索在AI产品中引入广告：OpenAI正讨论为ChatGPT等产品引入广告，寻求新收入来源，但目前暂无具体实施计划。

1. OpenAI宣布12天12场直播，首日推出完整版o1模型和ChatGPT Pro订阅

OpenAI开启"12天发布季"，这无疑是本周最重磅和炸裂的新闻。

2024年12月4日，OpenAI首席执行官山姆·阿尔特曼宣布，公司将连续12个工作日每天进行一次直播，发布或演示新产品和功能。

在首日活动中，OpenAI正式发布了满血版的o1推理模型 ，此前的预览版本o1-preview彻底退出历史舞台。满血版o1响应速度更快，推理能力更强，尤其是代码、数学和写作任务，并且最新版的o1模型已支持图片输入。同时，OpenAI推出了每月200美元的ChatGPT Pro 订阅服务，面向工程和研究领域用户。该订阅包括无限制使用GPT-4o和o1模型，以及高级语音模式等功能。（备注：据开通了ChatGPT Pro的小伙伴表示，ChatGPT Pro并不能真正无限制使用o1，使用次数大约100条/天 。作为对比，每月20美元的ChatGPT Plus会员的o1使用次数限制为50条/周。）

在第二日的直播中，OpenAI介绍了"强化微调"技术，旨在通过领域专家的反馈，提升AI模型在特定领域的表现。阿尔特曼将其称为今年最大的惊喜，强调该技术有望显著提高模型的专业性和准确性。

关于OpenAI本次连续12天的直播发布活动，我会在公众号进行第一时间的同步解读，为小伙伴们带来第一手的更新解读，敬请关注。

2. Meta发布Llama 3.3模型：700亿参数，性能媲美4050亿参数模型

2024年12月6日，Meta推出了最新的开源AI模型Llama 3.3 。该模型拥有700亿（70B）参数，但在性能上可与此前4050亿参数（405B）的Llama 3.1相媲美。

Llama 3.3专为高效推理而设计，支持最长128K个标记的上下文长度，能够在一次处理过程中高效处理大型数据集或长文档。此外，该模型在多语言支持方面进行了优化，涵盖英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语等八种语言。

在MMLU基准测试中，Llama 3.3取得了86.0的高分，显示出其卓越的性能。同时，该模型在成本效益方面表现出色，每百万标记的生成成本低至0.01美元，为开发者提供了高性能且经济实惠的AI解决方案。

3. 马斯克X平台Grok AI聊天机器人向免费用户开放

2024年12月6日，马斯克旗下的AI聊天机器人Grok开始向X平台的免费用户开放。此前，Grok仅限于付费用户使用。根据最新政策，免费用户每两小时可向Grok发送最多10条消息。

Grok由马斯克的xAI公司开发，最初作为"幽默AI助手"于2024年8月推出，并仅面向X平台的付费用户。此次向免费用户开放，旨在扩大用户基础，与OpenAI的ChatGPT、谷歌的Gemini等免费聊天机器人竞争。

值得注意的是，Grok近期增加了图像生成和理解功能，提升了其多模态交互能力。此外，xAI正在探索为Grok推出独立应用程序，计划于12月上线，以进一步增强其市场竞争力。

4. 腾讯混元大模型上线并开源文生视频功能：支持中英双语，参数量达130亿

2024年12月3日，腾讯正式发布并开源其混元视频生成大模型（HunYuan-Video），该模型参数量高达130亿，支持中英文双语输入。用户只需输入一段描述，即可生成高质量视频，画面稳定且不易变形。目前，该模型已上线腾讯元宝，用户可在AI应用中的"AI视频"板块申请试用。

HunYuan-Video采用DiT架构，并适配新一代文本编码器，提升了语义理解能力，能够更好地处理多个主体的描绘，实现更细致的指令和画面呈现。在与国内外多个顶尖模型的评测对比中，HunYuan-Video以41.3%的总体评分排名第一，在文本视频一致性、运动质量和画面质量等多个维度表现领先，特别是在人物和人造场所等场景下表现尤为出色。

5. 字节跳动AI助手豆包上线图片理解功能

2024年12月3日，字节跳动旗下AI助手豆包推出了图片理解功能。用户在豆包App或PC端上传图片后，系统可识别并解读图片内容，包括识别图片中的元素和基本特征。此外，用户还可通过该功能询问某景点的位置或某角色出自哪部影视作品。

此前，豆包已在11月内测视频生成功能，支持图片文字一键生成视频、动态运镜和多镜头一致性等。根据市场调研机构IDC 9月发布的报告，豆包在市场影响力、用户活跃度和用户粘性方面表现出色。

6. "AI教父"杰弗里·辛顿：超越人类智慧的AI最快可能5年内问世

2024年12月4日，人工智能领域的开创者之一、加拿大多伦多大学名誉教授杰弗里·辛顿在接受日本《读卖新闻》采访时表示，超越人类智慧的AI可能在未来20年内出现，最快甚至在5年内。

辛顿指出，近年来AI的发展速度远超预期，过去认为具备超人能力的AI至少需要50至100年才能实现，但现在这一时间表已大幅提前。他表示，随着AI技术的迅猛发展，社会需要认真思考并应对其可能带来的潜在威胁和挑战。

7. OpenAI探索在AI产品中引入广告，寻求新收入来源

OpenAI首席财务官Sarah Friar近日表示，公司正在讨论在其AI产品（即ChatGPT）中引入广告，以开辟新的收入来源。她表示，虽然目前尚未有具体实施方案，但公司将谨慎评估广告模式的适用性。

据悉，OpenAI已从Meta和谷歌等科技巨头招聘广告人才，包括前谷歌搜索广告负责人Shivakumar Venkataraman。尽管广告模式在科技行业中被广泛采用，OpenAI管理层对此仍持谨慎态度，认为广告业务易受经济波动影响，且可能导致公司过度迎合广告商而非用户需求。

目前，OpenAI的主要收入来源是向企业和开发者提供API服务，以及销售ChatGPT的个人和企业版订阅服务。然而，开发先进AI模型的高昂成本使公司面临巨大的资金压力，预计年度亏损将超过50亿美元。

精选推荐

都读到这里了，点个赞鼓励一下吧，小手一赞，年薪百万！😊👍👍👍。关注我，AI之路不迷路，原创技术文章第一时间推送🤖。