由 Air Street Capital 创始人 Nathan Benaich 等人制作的「人工智能全景报告」出炉,像素级回顾了过去这一年 AI 行业不能错过的突破性技术和行业新发展!
一年一度的「人工智能全景报告」(State of AI Report)又出炉了!
报告链接:www.stateof.ai/
这份 160 多页的报告涵盖了 AI 研究、行业、安全等领域的内容,非常的全面,是每一个对 AI 感兴趣的人都不能错过的优质(而且免费)内容。
这份报告要是放在别的咨询公司手里,不花个 1999 你最多只能看前边 5 页!
技术层面,在过去一年生成式 AI 寒武纪大爆发的背景下,报告不但全面展示了生成式 AI 这一年的发展历程,将闭源模型和开源模型的你追我赶,不断突破模型能力边界的过程展现得淋漓尽致。
并且,还对 AI 安全技术,数据资源枯竭,模型能力基准测试,大模型技术与机器人,自动驾驶,智能体应用的突破等最前沿的技术领域做了深刻地总结和展望。
人类数据将在 2025 年耗尽?
作者花了大量的精力收集提炼了一年当中最有突破性和应用前景的 AI 技术,简明扼要地呈现出来,让读者不错过任何有价值有潜力的技术突破。
产业层面,作者从硬件基础设施(英伟达赢麻了),行业投融资风向,明星独角兽等方面,给读者呈现了技术走出实验室落地的成果。
算力成为海湾国家的新石油?
很多意料之外的生成式 AI 应用也吸引到了众多用户
AI 安全性,今年成为了公众和政策制定者对于 AI 讨论最为火热的话题。不论是大佬们对于「开源闭源」的激烈讨论,还是「通向 AGI 的道路选择」,背后的核心议题都绕不开 AI 安全性方面的考量。
除此之外,报告对于很多单个亮点事件的捕捉,也是读者理解过去一年 AI 行业变化不能错过的内容。
闭源大模型:GPT-4 遥遥领先
2023 年当然是 LLM 之年,OpenAI 的 GPT-4 震惊了世界,它成功击败了所有其他 LLM------无论是在经典的 AI 基准测试上,还是在为人类设计的考试上。
甚至在很多为人类设计的考试上,它也超过大部分的人类。
由于安全和竞争方面的担忧,闭源模型的开放性有所减弱。
OpenAI 公布了 GPT-4 非常有限的技术报告,Google 在 PaLM 2 的发布会上几乎没有发布什么有价值的信息,Anthropic 根本没有公开 Claude 和 Claude 2 的技术细节。
开源模型紧追不舍,随时准备夺取王位
然而,作为开源 AI 的旗帜,Meta AI 和其他公司通过训练和发布能够匹配 GPT-3.5 的许多功能的有竞争力的开放式 LLM 点燃了开源的火种。
从 Hugging Face 的排行榜来看,开源比以往任何时候都更加活跃,下载量和模型提交量飙升至历史新高。
值得注意的是,在过去 30 天里,LLaMa 系列模型在 Hugging Face 上的下载量已超过 3200 万次。
如何全面而公平地评估模型的性能,不论从学术研究的角度还是应用层面都是非常的挑战,同时也是非常有前景的应用。
Hugging Face 的排行榜和斯坦福 HAI 研究中心的 HELM 作为其中的佼佼者,代表了评估体系的最流行和最全面的标准。
除了 LLM,包括微软在内的研究人员一直在探索小规模语言模型的可能性,发现使用高度专业化的数据集训练的模型可以与 50 倍大的竞争对手相媲美。
如果 Epoch AI 的团队的研究预测,我们将面临在未来「两年」内耗尽高质量语言数据库存的风险,这促使科研人员必须探索出一条新的训练数据的替代来源。
虽然 AI 科研的新常态是美国的领先优势在不断缩小,但绝大多数高被引论文仍然来自少数几家美国机构。
谷歌 + DeepMind 遥遥领先,各大高校和大厂紧随其后。
中国对于 AI 学术的贡献不仅在于直接产生的论文,还培养大量的华裔 AI 科学家。
英伟达赢麻了
生成式 AI 的迅猛发展意味着现在是进入 AI 硬件赛道的好时机。
英伟达是目前可以说唯一赚钱也是赚钱最多的 AI 公司, GPU 需求使他跻身「一万亿市值」俱乐部。
并且,他们的芯片在 AI 研究中的使用量是「所有替代方案总和」的 19 倍!
虽然英伟达会继续推出新的芯片,但他们的旧 GPU 却展现出了非凡的生命周期价值。
2017 年发布的 V100 是 2022 年 AI 研究论文中最受欢迎的 GPU。
而刚刚推出的 H100 的大规模的应用,也许将出现在多年之后。
对于 H100 高速增长的需求,各大公司和实验室急于构建大型集群。
然而,限制组建这种大规模算力集群的挑战,往往还体现在算力核心连接的工程难度之上。
生成式 AI 革命性进展
也许是有史以来最不令人惊讶的消息------Chat-GPT 是有史以来增长最快的互联网产品之一。
它在开发人员中特别受欢迎,取代了 Stack Overflow 成为了开发人员寻找编码问题解决方案的首选资源。
但根据红杉资本的数据,目前有理由怀疑生成式 AI 产品的持久力------从图像生成到 AI 助手,几乎所有 AI 产品的用户留存率都不稳定。
而除了消费领域,各种迹象表明生成式 AI 可以加速整体 AI 行业的进步。
Wayve GAIA-1 显示了令人印象深刻的通用性,可以作为训练和验证自动驾驶模型的强大工具。
除了生成式 AI 之外,之前一直在努力寻找和 AI 技术结合的各个行业都出现了大手笔的交易。
许多传统制药公司已 All In 人工智能,与 Exscientia 和 InstaDeep 等公司达成了价值数十亿美元的交易。
与此同时,风险投资行业的重担也落在了生成式 AI 的肩上,它撑起了 Atlas 等科技私募市场的天空。
如果没有生成式 AI 的繁荣,人工智能投资将比去年下降 40%。
除了 OpenAI 与微软的 100 亿美元交易之外,「Transformer 八子」已累计融资了至少 8.7 亿美元!
百度硅谷 AI 实验室的 DeepSpeech 2 团队情况也差不多。
他们在语音识别深度学习方面的工作向人们展示了现在支撑大规模人工智能应用的规模效应。该团队的大部分成员后来成为领先的机器学习公司的创始人或者高管。
然而,许多最引人注目的重磅融资根本不是由传统风险投资公司牵头的。
2023 年是企业风险投资年,大型科技公司有效利用了其资金。
英伟达又又又赢麻了!
AI 安全问题迫在眉睫
帮助 ChatGPT 成功破圈的 RLHF,同样面临了非常多的挑战,也许新的替代技术已经在出现的路上了。
作者之前的 AI 行业报告曾经警告过,大型实验室和公司忽视了 AI 的安全性。
2023 年就演变为了 AI 风险争论的一年,研究人员之间的「公开与封闭」争论愈演愈烈,「AI 灭绝人类风险」屡次成为头条新闻。
参考资料: