大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的"外挂 ",专注于分享AI全维度知识,包括但不限于AI科普 ,AI工具测评 ,AI效率提升 ,AI行业洞察。关注我,AI之路不迷路,2024我们一起变强。
关于AI Weekly
马化腾谈及AI时说:"我们最开始以为这是互联网十年不遇的机会,但是越想越觉得这是几百年不遇的、类似发明电的工业革命一样的机遇,所以我们觉得非常重要。"
AI Weekly回来了!
"AI Weekly"是AI领域的前沿资讯周报,每周与你相约,精心筛选并总结过去一周内AI领域最重要、最具影响力的事件。这个专栏致力于打破信息壁垒,帮助你高效掌握最新动态,增强对AI技术及应用趋势的洞察力。
省流版摘要
-
OpenAI宣布12天12场直播 :首日推出完整版
o1
推理模型,支持图片输入;同时上线每月200美元的ChatGPT Pro订阅服务。第二日展示"强化微调"技术,提升AI模型领域表现。 -
Meta发布
Llama 3.3
模型:拥有700亿参数,但性能媲美4050亿参数模型,支持128K上下文长度,多语言优化,成本效益极高。 -
马斯克X平台Grok向免费用户开放:Grok聊天机器人每两小时可供免费用户发送10条消息。xAI计划于12月推出Grok独立应用。
-
腾讯开源
HunYuan-Video
视频生成模型:支持中英双语输入,130亿参数,提升视频生成质量,用户可在"腾讯元宝"中申请试用。 -
字节跳动AI助手豆包上线图片理解功能:用户上传图片即可识别和解读内容,并支持查询景点位置和角色出处等功能。
-
"AI教父"辛顿预测超人类智慧AI:辛顿表示,超越人类智慧的AI可能在未来20年内出现,最快5年内问世,需关注潜在威胁。
-
OpenAI探索在AI产品中引入广告:OpenAI正讨论为ChatGPT等产品引入广告,寻求新收入来源,但目前暂无具体实施计划。
1. OpenAI宣布12天12场直播,首日推出完整版o1模型和ChatGPT Pro订阅
OpenAI开启"12天发布季",这无疑是本周最重磅和炸裂的新闻。
2024年12月4日,OpenAI首席执行官山姆·阿尔特曼宣布,公司将连续12个工作日每天进行一次直播,发布或演示新产品和功能。
在首日活动中,OpenAI正式发布了满血版的o1
推理模型 ,此前的预览版本o1-preview
彻底退出历史舞台。满血版o1
响应速度更快,推理能力更强,尤其是代码、数学和写作任务,并且最新版的o1
模型已支持图片输入。同时,OpenAI推出了每月200美元的ChatGPT Pro 订阅服务,面向工程和研究领域用户。该订阅包括无限制使用GPT-4o
和o1
模型,以及高级语音模式等功能。(备注:据开通了ChatGPT Pro的小伙伴表示,ChatGPT Pro并不能真正无限制使用o1
,使用次数大约100条/天 。作为对比,每月20美元的ChatGPT Plus会员的o1
使用次数限制为50条/周。)
在第二日的直播中,OpenAI介绍了"强化微调"技术,旨在通过领域专家的反馈,提升AI模型在特定领域的表现。阿尔特曼将其称为今年最大的惊喜,强调该技术有望显著提高模型的专业性和准确性。
关于OpenAI本次连续12天的直播发布活动,我会在公众号进行第一时间的同步解读,为小伙伴们带来第一手的更新解读,敬请关注。
2. Meta发布Llama 3.3模型:700亿参数,性能媲美4050亿参数模型
2024年12月6日,Meta推出了最新的开源AI模型Llama 3.3 。该模型拥有700亿(70B)参数,但在性能上可与此前4050亿参数(405B)的Llama 3.1相媲美。
Llama 3.3专为高效推理而设计,支持最长128K个标记的上下文长度,能够在一次处理过程中高效处理大型数据集或长文档。 此外,该模型在多语言支持方面进行了优化,涵盖英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语等八种语言。
在MMLU基准测试中,Llama 3.3取得了86.0的高分,显示出其卓越的性能。 同时,该模型在成本效益方面表现出色,每百万标记的生成成本低至0.01美元,为开发者提供了高性能且经济实惠的AI解决方案。
3. 马斯克X平台Grok AI聊天机器人向免费用户开放
2024年12月6日,马斯克旗下的AI聊天机器人Grok开始向X平台的免费用户开放。此前,Grok仅限于付费用户使用。根据最新政策,免费用户每两小时可向Grok发送最多10条消息。
Grok由马斯克的xAI公司开发,最初作为"幽默AI助手"于2024年8月推出,并仅面向X平台的付费用户。此次向免费用户开放,旨在扩大用户基础,与OpenAI的ChatGPT、谷歌的Gemini等免费聊天机器人竞争。
值得注意的是,Grok近期增加了图像生成和理解功能,提升了其多模态交互能力。此外,xAI正在探索为Grok推出独立应用程序,计划于12月上线,以进一步增强其市场竞争力。
4. 腾讯混元大模型上线并开源文生视频功能:支持中英双语,参数量达130亿
2024年12月3日,腾讯正式发布并开源其混元视频生成大模型(HunYuan-Video
),该模型参数量高达130亿,支持中英文双语输入。用户只需输入一段描述,即可生成高质量视频,画面稳定且不易变形。目前,该模型已上线腾讯元宝,用户可在AI应用中的"AI视频"板块申请试用。
HunYuan-Video
采用DiT架构,并适配新一代文本编码器,提升了语义理解能力,能够更好地处理多个主体的描绘,实现更细致的指令和画面呈现。在与国内外多个顶尖模型的评测对比中,HunYuan-Video
以41.3%的总体评分排名第一,在文本视频一致性、运动质量和画面质量等多个维度表现领先,特别是在人物和人造场所等场景下表现尤为出色。
5. 字节跳动AI助手豆包上线图片理解功能
2024年12月3日,字节跳动旗下AI助手豆包 推出了图片理解功能。用户在豆包App或PC端上传图片后,系统可识别并解读图片内容,包括识别图片中的元素和基本特征。此外,用户还可通过该功能询问某景点的位置或某角色出自哪部影视作品。
此前,豆包已在11月内测视频生成功能,支持图片文字一键生成视频、动态运镜和多镜头一致性等。根据市场调研机构IDC 9月发布的报告,豆包在市场影响力、用户活跃度和用户粘性方面表现出色。
6. "AI教父"杰弗里·辛顿:超越人类智慧的AI最快可能5年内问世
2024年12月4日,人工智能领域的开创者之一、加拿大多伦多大学名誉教授杰弗里·辛顿在接受日本《读卖新闻》采访时表示,超越人类智慧的AI可能在未来20年内出现,最快甚至在5年内。
辛顿指出,近年来AI的发展速度远超预期,过去认为具备超人能力的AI至少需要50至100年才能实现,但现在这一时间表已大幅提前。他表示,随着AI技术的迅猛发展,社会需要认真思考并应对其可能带来的潜在威胁和挑战。
7. OpenAI探索在AI产品中引入广告,寻求新收入来源
OpenAI首席财务官Sarah Friar近日表示,公司正在讨论在其AI产品(即ChatGPT)中引入广告,以开辟新的收入来源。她表示,虽然目前尚未有具体实施方案,但公司将谨慎评估广告模式的适用性。
据悉,OpenAI已从Meta和谷歌等科技巨头招聘广告人才,包括前谷歌搜索广告负责人Shivakumar Venkataraman。尽管广告模式在科技行业中被广泛采用,OpenAI管理层对此仍持谨慎态度,认为广告业务易受经济波动影响,且可能导致公司过度迎合广告商而非用户需求。
目前,OpenAI的主要收入来源是向企业和开发者提供API服务,以及销售ChatGPT的个人和企业版订阅服务。然而,开发先进AI模型的高昂成本使公司面临巨大的资金压力,预计年度亏损将超过50亿美元。
精选推荐
都读到这里了,点个赞鼓励一下吧,小手一赞,年薪百万!😊👍👍👍。关注我,AI之路不迷路,原创技术文章第一时间推送🤖。