来源:MediaTek&Counterpoint&阿里
2022年11月30日,ChatGPT上线,并迅速获得追捧。这场最初由ChatGPT引发的生成式AI浪潮,让全球消费者惊讶于大语言模型(LLM)所带来的全新人机交互体验的同时,也让产业界充分认识到生成式AI技术在消费者(C端)市场的巨大应用潜力。而智能手机,作为当下最重要的个人智能终端,在全球范围内拥有超过40亿用户规模,无疑是生成式AI技术在C端应用成功与否的重中之重。
另一方面,智能手机产业在进入5G时代后,也需要一场真正意义上的颠覆性革新,为消费者带来更加智能、个性化,同时也更加安全的使用体验,将手机打造成全天候的私人智慧助手和移动生产力工具,从而为智能手机下个十年的发展打下坚实的基础。生成式AI技术与智能手机的融合刚好契合这一需求,它将全方位赋能智能手机产业,革新包括硬件、软件,以及相关的移动互联网内容生态的方方面面。
生成式AI与智能手机的融合既是产业各方的需要,也是AI普惠的必由之路,以智能手机为媒介,全球手机用户能够更便捷、更高效地享受生成式AI技术发展所带来的福祉。
本白皮书提出了生成式AI手机的概念,讨论了生成式AI手机生态中各个玩家,包括芯片厂商、手机厂商、大模型厂商、开发者的相关AI战略,以及围绕生成式AI手机的软硬件科技全景,最后是Counterpoint对生成式AI手机发展的预测。
第一章:智能手机开启生成式AI手机时代
从2023年底至2024年一季度,新一代旗舰智能手机陆续发布,越来越多的基于生成式AI能力的功能开始出现在这些产品中。无论是手机厂商还是其生态伙伴,在主动拥抱生成式AI趋势的同时,也在积极探索各种可能性,着力打造对用户有价值的高频使用场景,而这一探索将贯穿整个2024年。Counterpoint认为2024年会是生成式AI手机的元年。
手机的智能化演进
大约在二十多年前,以诺基亚塞班为代表的操作系统,第一次允许用户自行下载APP,并将其作为入口,访问服务和数字内容,这种模式一直持续到今天。也正是这种变化,使得全球的开发者可以加入到智能手机产业中来,为手机用户提供丰富多样的应用选择,促成了之后移动互联网生态的蓬勃发展,手机也逐渐发展为人们休闲娱乐、通信社交、健康和出行服务、消费购物,以及移动办公的重要载体,早已不可或缺。
2007年,iPhone的问世颠覆了传统的手机设计理念,物理键盘逐渐被淘汰,触控屏幕成为人机交互的核心。然而随着时间的推移,在一些场景下,触控输入的方式变得越来越低效,常常需要多次的用户干预,才能到达最终的服务界面。在此背景下,出现了包括智能语音助手,手势、眼球追踪在内的新的交互方式,致力于打造更流畅、高效,更加用户友好的交互体验。
通过AI技术赋能智能手机的尝试最早可以追溯至2017年,彼时苹果刚刚发布了首款后置双摄手机iPhone 7 Plus,而安卓阵营也开始在其SoC平台中加入独立的AI计算单元,用于运行和影像增强相关的深度学习模型。在这之后,AI技术逐渐被手机厂商用于更多方面,如强化安全、优化续航、提升网络性能等,但计算摄影一直是其最主要的应用领域,直到LLM被装进智能手机,手机AI应用从中小模型时代跨越至大模型时代。
得益于AI大模型的赋能,智能手机将迎来新一轮的革新。首先在人机交互层面,有了LLM的加持,新的多模态交互将取代传统的、单一的触控屏交互,逐渐实现从图形用户界面GUI到语音用户界面VUI的跨越式转变,用户可以以更直观、更自然的方式与手机沟通。其次,多模态输入和输出能力相结合,可以极大强化智能手机的生产力工具属性:既可以基于多种形式的输入信息,生成用户需要的图表、文本、音乐、图片甚至是视频,也可以对输入的图片、视频进行编辑。
最后,随着融合的深入,生成式AI技术将在智能手机上孕育出一个甚至多个智能生命体(AI Agent)。智能生命体以用户为中心,不断学习用户的行为习惯,能够智能识别用户意图,适时向用户推荐个性化的内容和服务。Counterpoint认为智能体将会成为专属于每个用户的应用入口,但预计在很长一段时间里,智能体仍将会和APP共存。
近期历史回顾: