AI手机大考,“荣耀们”的突破与局限

@科技新知 原创作者丨林书 编辑丨蕨影

回望2024年,一众手机厂商诸如苹果、荣耀等,都试图在AI手机赛道闯出一条路来。然而,时至今日,又有多少厂商交出了令人满意的答卷呢?

就在上周,华为发布了最新Mate70系列,不仅搭载了全新麒麟芯片,还支持纯血鸿蒙HarmonyOS Next,特别在AI影像、隐私保护和智能交互上进行了重大升级。尤其是在AI方面,华为通过推出AI动态照片、隔空传送、智能降噪等九大功能,试图展示其在智能技术领域的持续投入。

然而,仔细审视这些创新,不难发现,它们本质上仍然是现有技术框架下的渐进式改良,而非真正意义上的颠覆性突破。例如最被其称道的AI隔空传送功能,本质上不过是对已有手势识别技术的重新包装。

从技术上来说,它所依赖的不过是手机前置摄像头的感知能力,配合基础的计算机视觉算法,实现简单的手势追踪和识别。这种技术在三星、小米等品牌早已有过尝试,只不过都因为交互体验不够自然而逐渐被市场遗忘。

至于备受关注的"仅你可见"功能,其核心技术不过是基于面部识别的视线追踪算法。这项技术在PC领域早已存在多年,如今不过是被移植到了手机端。况且,其实际使用中的局限性显而易见:它要求用户必须保持特定的观看角度和距离,稍有偏离就会影响识别效果。

除此之外,此次发布会上Mate70展示的其他AI功能,例如AI通话总结、AI修改照片等,更是一些已经司空见惯的"标配技术",总体上看并无太多新意可言。

这些所谓的AI创新,更像是华为在缺乏实质性AI突破的情况下,不得不推出的一些表面功夫。在真正的AI革命面前,这些功能不过是浮于表面的点缀。

不过,实事求是地说,这样的"创新疲态",并不仅仅发生在华为一家大厂身上。

AI手机的尴尬现实

事实上,这一年的AI手机赛道,更像是一场平平无奇的技术秀。

苹果的iOS 18虽然大肆宣传"Apple Intelligence",但除了少部分跨应用级的AI调用功能外,其他大部分能力,不过是将ChatGPT等现成技术稍作包装,缺乏根本性的技术突破。

而荣耀在2024年MWC(世界移动通信大会)上,也重点展示了AI领域的新技术突破,特别是在Agent等方面的技术进展。

从总体上看,其Agent技术展现出的自动化能力,确实带给了人们一种"手机即将迈入自动驾驶"时代的想象。

但平心而论,这样的想象背后,却藏着两点难以忽视的隐忧。

例如,在一键点咖啡的场景中,当用户浏览相关信息或下达语音指令时,手机Agent就会直接识别意图,联动相关的外部应用(如支付、地图、订餐等),快速完成订单生成和支付流程。

同样地,面对"关闭APP自动续费功能"这样的请求,荣耀的AI Agent也能自动操作,找到所有开通APP自动续费服务的项目,并询问用户是否要取消。

但站在用户的角度来看,这样的"便捷"是否真的是一种直戳痛点的改进?

在手机这块方寸之间的屏幕上,各类APP的操作,实际上已经简化到了一个接近阈值的状态,对普通消费者来说,点咖啡这些任务,本身并不耗费太多精力,现有的手动操作方式已经足够便捷。在此基础上加入自动化功能,边际效益不但不高,甚至有可能适得其反。

因为自动化功能的加入,虽然看似高效,却可能让一些用户感到学习和适应成本过高。

举例来说,目前荣耀AI Agent 的启动方式,主要是依赖语音交互,但站在用户体验的角度看,**这仍是一种被动的,需要有意识地使用的功能。**以点咖啡这个场景为例,每当用户想下单时,都需要被动地用语音告诉手机:"我想点XX味的咖啡,要XX杯。"

既然都是被动,这和用户自己用手指多花几十秒操作,又有多大区别?况且,一个很影响体验地方是:在公共场合,或其他不便于语音交互的嘈杂场景,这样的互动方式,多少会让人觉得不自在。

此外,虽然Agent系统的主动操作功能,强调安全性和隐私保护,但手机 Agent在任务自动化过程中,总是需要访问用户的个人数据,包括联系人、位置信息,甚至是各类APP的登录密码等。

要避免这样的隐私问题,Agent 系统只能在执行任务时,一次次地请求用户"授权""确认"(例如其关闭自动扣款的功能),如此一来,便会不可避免地造成体验割裂的现象。

既然对用户的"扰动"如此频繁,那所谓自动化的意义究竟何在?

对于这点,前苹果设计主管 Jony Ive 认为,AI Agent最大的价值不是取代用户操作,而是创造更自然、更符合人类直觉的交互方式。言外之意**,**真正的创新在于让技术变得"无形"。

昂贵的AI军备竞赛

Jony Ive 最近与 OpenAI 合作开发新一代AI设备时提出:"我们需要重新思考人机交互的本质。AI不应该是一个需要学习使用的工具,而应该像空气一样自然存在。"

对此,Jony Ive提出了关于"无形"设计理念的三个核心观点:

一是自然交互, 当技术真正成功时,它应该消失在背景中。就像我们不会意识到空气的存在一样,最好的AI交互应该是无需思考的;二是情境感知, AI Agent不是简单的命令执行器,而是要理解用户的情境和意图。它应该在适当的时候提供帮助,而不是打扰用户的思维流;**三是人性化设计,**技术应该适应人类,而不是要求人类适应技术。

简而言之,Jony Ive认为,AI应该更多地充当一个"预判者"的角色,在用户产生需求之前就完成准备,而不是被动地等待用户的指令。

举个例子,想象你正在开车,手机通过多维度数据分析(GPS定位、日历安排、实时路况)发现你可能要去参加下午2点的一个重要会议。

这时,AI系统会主动检测到当前路段正在施工,预计会造成15分钟延误。于是便自动计算出你需要提前10分钟出发,在你还没有主动查询的情况下,就把最优绕行路线推送到你的车载系统。

这样的交互方式,充分利用了手机作为随身设备的特性,将各种零散的数据点(位置、时间、生理数据、日程表等)有机整合,主动为用户创造价值,而不是被动等待指令。

这才是真正符合移动场景的AI应用方式,而不是简单地把电脑上的Copilot或ChatGPT搬到手机上。

如果用这样的标准来看,很显然,无论是华为、荣耀还是苹果,都未能达到这样的"理想境界"。其所谓的"自动化",仅仅是用语音交互+Agent,将原本并没多复杂的步骤再精简了些许。

这就引出了另一个重要问题:对用户来说,他们是否真的愿意为目前这些华而不实,锦上添花的"AI功能"支付高昂的溢价?

对此,华尔街著名的科技分析师、被誉为"科技股教父"之一的Dan Ives评论道:手机厂商在AI领域的投入将在2024年达到历史新高,但这种投入与实际收益之间存在巨大鸿沟。我们看到的是一场昂贵的"AI军备竞赛",最终受害的是消费者的钱包。

前期优势正被稀释?

面对手机换机周期不断延长,以及零部件成本持续攀升的双重挑战,对于荣耀来说,在过去的一年多里,其在AI方面的投入,不可谓不激进,2023年,荣耀整体研发投入占到总营收的11.5%,其中AI研发费用累计已达100亿。

尽管自2024年初以来,手机市场已有明显的复苏迹象;但如此"豪赌"AI的背后,其目前呈现的锦上添花式的AI功能,究竟能否在将来真正带动消费者的购机热,这恐怕要打一个大大的问号。

在独立的三年多时间里,荣耀已经发布了Magic系列、数字系列、V系列与X系列四大产品体系,布局了超过30款手机,覆盖2000---10000元价位段。

但问题是,为了在连续下行的全球手机市场中站稳脚跟甚至冲击前五,荣耀不可能仅靠资本们很喜欢的高毛利高端产品来支撑销量,还是需要大量的走量机型。

这就和AI手机高昂的投入,形成了一个尖锐的结构性矛盾。

更讽刺的是,在专业化的大模型企业的攻势下,荣耀等手机厂商重金投入所铸就的AI优势,实际上正一点点被稀释。

今年10月,有着国内"AI六小虎"之称的智谱AI,发布了自身基于Agent技术的手机智能体AutoGLM,直接通过模拟人类操作行为,来实现手机上的各种功能。

智谱AI的定位,实际上是通过AutoGLM这样的技术,创造了一个全新的价值层:它既不是传统意义上的应用层,也不是系统层,而是一个"元操作层"。

大模型企业的入局,可能暗示了手机AI将来一个更大的变化:AI能力正在成为一种"基础设施",就像当年的互联网一样。对大模型企业来说,他们不需要完整的系统权限,因为未来的应用可能更多是基于API调用的"组合式服务",而不是传统的独立应用。

如此一来,各大手机厂商推出的独立AI系统,必定会受到更多挑战。但平心而论,即使是这种"实用性存疑"的状态,对很多手机厂商来说,也已经成为了一个难以触及的门槛。

根据益普索发布的《AI Phone白皮书》中的衡量标准,目前业内的手机AI,正处在跨越AI Phone的L2级别,向L3迈进。

L3级别要求手机"能够识别人类情感。实现任务级自主拆解闭环,人与AI协作并监督"。

这就是目前荣耀、苹果的Agent技术所达到的状态。

然而,这样一个并不太高的标准,vivo、OPPO这样的大厂,也不尽然能完全做到。

以vivo为例,其今年展示的AI系统,更多地将焦点放在了"一按一复制,或一按一拖拽"的这种更偏向传统的AI交互形式。虽然其OriginOS 5号称搭载了vivo自研的手机智能体「PhoneGPT」,能实现自动订座这样的功能,但截至目前,其并未展现出公开的演示。

同样地,号称自研了手机大模型的OPPO,在目前的公开展示中,也只是将重点放在了AI识图、AI一键问屏,或是AI修图等传统的功能上,总体上给人感觉仍停留在不痛不痒,可有可无的AI Phone的L1级别。

从目前来看,总体功能聊胜于无,交互方式不够人性、自然,以及专业化大模型企业的竞争等因素,共同构成了目前手机AI所面临的种种挑战。

而对于上述的难题,即使是身为行业巨头的苹果,目前也未能拿出令人满意的答案。

例如在自动化操作方面,Apple Intelligence展示的所谓"智能代理"功能,实际上是对iOS快捷指令的升级版本。虽然系统能够理解"帮我订一张去纽约的机票"这样的指令,但其执行过程仍然需要预先配置的应用程序支持。

这样的情形,似乎让手机AI陷入了一个尴尬的境地:既不够革命性来满足市场期待,又不够完善来证明其存在的价值。

但如果回望过去,我们就会发现:这某种程度上,是因为手机厂商们正在重复PC时代的老路------ 过度强调功能堆砌,而忽视了用户体验的本质。

相关推荐
Donvink22 分钟前
Transformers在计算机视觉领域中的应用【第3篇:Swin Transformer——多层次的Vision Transformer】
人工智能·深度学习·目标检测·计算机视觉·transformer
龙的爹233328 分钟前
2024论文翻译 | Multi-Review Fusion-in-Context
人工智能·深度学习·自然语言处理·prompt
梁小憨憨41 分钟前
变分推断(Variational Inference)
人工智能·算法·机器学习
资讯分享周1 小时前
思特奇亮相2024数字科技生态大会,以“智”谋新共赢AI新时代
人工智能·科技
HuggingAI1 小时前
Stable Diffusion Controlnet常用控制类型解析与实战课程 2
人工智能·ai·stable diffusion·ai绘画
一尘之中2 小时前
基于Transformer的编码器-解码器图像描述模型在AMD GPU上的应用
人工智能·深度学习·transformer
IT古董2 小时前
【机器学习】机器学习的基本分类-监督学习-决策树-C4.5 算法
人工智能·学习·算法·决策树·机器学习·分类
电子工程师UP学堂2 小时前
电子应用设计方案-37:智能鼠标系统方案设计
人工智能·单片机·嵌入式硬件·计算机外设
后端研发Marion2 小时前
【AI工具】强大的AI编辑器Cursor详细使用教程
人工智能·编辑器·cusor
pzx_0012 小时前
【时间序列预测】基于Pytorch实现CNN_LSTM算法
人工智能·pytorch·python·算法·cnn·lstm