超声波俱乐部分享:万物智能——AI重新定义交互体验

6月25日,第十八期超声波俱乐部内部分享会在杭州圆满落幕,本期的主题是:万物智能------AI重新定义交互体验。

到场的嘉宾有:超声波创始人杨子超,超声波联合创始人、和牛商业创始人刘思雨,上海非著名资深程序员兼AI爱好者靠谱的老马(马劲柏),杭州电子科技大学副教授沈运红,浙江天合航天发展基金会理事长李丽苮,优普兄弟AI创始人Alex(项先经),保观科技COO吕子睿,淘天集团前端技术专家李冬杰,技术美术工程师王智文等。

01

今年9月份AI将迎来2C应用创业潮

杨子超从近期iPhone计算器应用的交互体验更新开始,分享了他认为AI创业的几个大方向:

  1. 所有有行业和场景数据的企业都会+AI。

当下大部分企业还没有完全感知到AI的能力,所以目前只是"企业+AI "的开始,随后的两到三年,越来越多的企业会意识到+AI的重要性,2B的业务会有长足的发展。

  1. 手机和PC有内容和数据的应用也都会重做一遍。

各种各样的端侧"小"模型会进入手机和PC,所有的手机和PC的应用都会迎来AI的赋能提升,某种意义上也会出现所有应用重做一遍的大机会。

  1. AI将成为云服务的标配,所有IoT智能硬件都将成为智能体。

未来所有的云服务都将提供AI服务,所有的IoT智能硬件也都有AI的赋能,并具备云边端的AI服务,更多围绕数据服务的创新硬件智能体将会诞生。

  1. 端侧小模型将大有可为,服务于各种垂直场景。

端侧小模型最近会成为大家讨论的话题,一个是"小"模型是一个趋势,另一个是苹果也给了一个很好的示范作用,各种垂直场景会有不同的小模型作为场景方案适配,没有最好的小模型,只有最好的场景适配的小模型。

  1. 多模态识别和语音交互的交互体验重新定义App的交互设计。

杨子超认为这一条很重要,可以理解为之前App的交互体验是人的单项表达,现在是人和AI的共同表达。

本质上是把AI拆成三个角色:一个私人助手、一个分析师和一个分享者。私人助手帮你分解任务,分析师帮你分析和回答你的任务,分享者帮你展现和表达你的最终任务结论。

在杨子超看来,这是用户交互体验的AI化进化,这种进化可以和智能手机当年的"随时随地"功能相抗衡,是颠覆式的变革进化,任何一个AI创始人都需要认真体会这种进化。

所有的App有了重做的理由,这是一个以AI为代表的新App时代的到来,相信在今年的9月份将迎来一波2C的应用创业潮,就如同2012年的移动互联网井喷一样,这是一个我们谁都不敢错过的时间节点。

  1. 新能源自动驾驶与车载智能系统。

现在这个赛道已经很热了,相信大家都很认可。

  1. 家用机器人会在五年后成为大众商品进入家庭。

这个赛道要比大家想象的进化速度还要快,但比起AI的大部分赛道要慢一点。整体来看,家用机器人市场在这三年内都是默默耕耘期,需要创业者们耐得住寂寞,广积粮,抗持久战。这个赛道五年后一旦起来,将会带来AI真正的原生应用场景。

杨子超总结了目前AI创业的几个特点,首先一定不要做大模型的事,要做上来就能盈利的事。

2B围绕大老板的需求,2C围绕新奇展开。"新奇"大概率不是你设定好一个产品目标,就能完成的东西。而是你本身知道自己擅长什么,就朝着那个方向走,走着走着,可能就脱颖而出了。

马劲柏补充,其中2P(professional,专业人士)的市场机会也很大。比如律师、医生、高级工程师等,这些专业人士的时间非常宝贵,如果能帮助他们提升效率,也是非常有价值的。

杨子超发现AI创业团队中,1-3人的特种部队很多。习惯了特种部队的人,很难再去接纳更多的乌合之众。因为从思维到认知都无法沟通和理解,更无法一起并肩作战,因为特种部队的作战是一种赏心悦目的配合,而乌合之众的作战则是一种大锅饭式的冲锋。

另外,出海机会多多。目前海外还有一些流量红利,用户的付费意愿可能比国内更强。

更重要的是创业者一定要知道AI的能力边界在哪里,要善用AI能做到的能力。

杨子超还分享了自己最近的一些创业感悟:

1.创业不要预设目标,但要找到自己擅长的能力,持续把这个能力发挥到极致就能赚钱。

2.世界变化太快,新概念新技术发展太快,不要盲目跟进,但要持续学习。

3.放下个人的成见和ego,不断结交有才华的朋友,欣赏他们的才华。

4.远离负能量的人,远离认知低的人,不浪费大把时间和他们纠缠。

5.我们改变不了任何人,我们能掌控的只有我们自己,所以珍惜自己的时间。

6.不要着急,不要焦虑,不要崩溃。多运动,多和朋友聚会,多看书,多冥想。

7.人生就像大模型炼丹,经历几次失败很正常,但只要成功一次,就可以一鸣惊人。

02

"小"模型有大用处

马劲柏分享了他对小参数模型的观点。

什么是"小"模型?设备端部署场景下,GPU参数量<=7B,CPU参数量<=2B。目前市面上有多种小模型可以选择,表现也不错。

服务器端部署场景下,显存占用<=24GB,参数量<=33B(4bit量化后,33B模型显存占用大约为17GB)。

从设备端来看,有些实际使用场景不一定非要依赖云端大模型。云端的好处很明显,但也有不足,比如流量成本高、速度比较慢、可靠性也差一些,因为移动设备上的网络连接可能没那么好。

小模型不限于我们平常说的那些简单的语音语言交互功能,它不仅包含了大语言模型,还包括了传统的一些机器学习的模型,比如图像识别、语音识别(ASR)及生成(TTS)、面部识别、手势识别等。所以设备端小模型的使用场景还是比较广泛的。

比如健康监测市场在未来将会有非常大的发展前景。现在的智能手表有很多功能,最简单的就是测心率,还有血糖血氧分析等。现阶段比较常见的血糖分析手段,使用的是非侵入式的技术,准确率还不是很高,但后面一定会变得精准。随着技术的发展,一些实时追踪、血糖突然升高了会有一些警告或者介入治疗之类的功能,将在设备里变得普及。

设备端侧小模型的能力还体现在数据预处理方面。在传统的移动设备上去做数据处理,我们只能做很简单的东西。但通过小模型的能力,在端侧就可以从一些非结构化的数据中提取出来结构化的信息。

数据对企业来说是最宝贵的财产,尤其那些注重数据隐私和安全的企业,对私有化部署的需求比较多。

小模型也可以帮助企业解决一些私有化部署问题。马劲柏会遇到一些企业相关负责人的疑问:"调用GPT-4o或者Claude这种大参数模型的API,还经常满足不了我应用的需求。你弄一个7B甚至6B的小模型,它能满足我的需求吗?"

答案是分数据、分场景,在内容生成和数据分析的需求场景下,小模型有着非常不错的表现。内容生成方面,比如RAG(面向企业内部的信息查询系统),原来需要人手动去查很多资料才能找到的东西,现在通过小模型可以快速找到,并能生成符合要求的文档,能够节约很多时间。

企业技术产品支持里,传统的售前流程是,先接到客户的需求,然后整理客户企业的资料,再花几天时间苦思冥想写一个方案。现在可以根据客户自己的产品资料或者私有文档,可能有几百份、几千份文档,再结合客户的应用场景,直接为对方定制化方案。这也是一个所谓的2P场景,给高价值用户提供服务。

客服系统已经烂大街了,很多智能机器人乱打电话,大部分成了对客户的骚扰。但里面有很多细节问题可以挖掘和改进,比如做 24 小时的产品咨询、问题反馈等等功能。不只是文字方面,智能交互现在也可以做得很好了。

此外在企业内部自然语言查询、会议摘要自动生成方面,小模型都可以满足大部分需求。

在数据分析方面,小模型也可以很方便地把非结构数据结构化,做数据挖掘,数据提取。还有数据分类,就是打标签。传统的打标签可能需要人工标注,现在机器通过分析就可以自动打标签了,甚至还可以打多个标签。

不能说哪个模型是最好的,只能根据数据和场景,去找不同的模型、不同的提示词去试,才能找到最适合自己的模型。

比较复杂的问题,可以拆解成多个简单问题。小模型的能力虽然没有大模型那么强,但给它足够简单的问题,它一样也可以做得很好。

幻觉问题,对很多企业来说是很致命的。但有很多方法可以解决,比如通过拆分工作流和RAG,更好把控结果,基本不会出什么问题。

马劲柏总结:"现在很多人讲AI就立马套到大语言模型,实际上机器学习的这块东西已经非常多了,不光是大语言模型。"他举了一个制造业的例子,某工厂用来做高精密加工的数控机床有非常多的传感器,可以记录电压、电流、压力、温度、震动情况、转速等数据。

小模型可以通过分析这些数据,并结合历史样例,预测损耗件的使用寿命,让工厂可以精准地预防性更换损耗件和进行未来季度的备货,极大节约成本。在传统的机器学习方面,小模型也很好用。

03

万物智能AI for everything

吕子睿分享了两个正在使用AI降本增效的行业。

一个是影视制作行业,比如下周我们要拍10个景,传统的流程是先写剧本,剧本出来后是分镜头。画师先把图画出来,画完了以后导演才知道这个景搭建得对不对,往往等到画师费半天劲画完后,导演一看,还得改。

现在通过AI绘图,几秒钟就完事了。如果导演说这里不对,那里要再加点什么东西,那就再画一张。AI的加入,极大减少了前期的成本投入。

还有一个是首饰设计行业,传统的流程是先找设计师,然后设计师花很长时间把首饰图画出来。画完后交给师傅加工,结果师傅可能说做不出来,这种材质没有办法做到这个弧度。

现在就方便很多,前期通过简单的描述,让机器出几十张图。或者拍一张手头上的钻石给机器,看它基于这颗石头能设计出多少个耳坠或者戒指。我们再挑选出几张满意的给师傅看,师傅再告诉我们哪个能做哪个不能做,分别需要多长时间。最后再交给设计师细化。

虽然很多公司头疼大模型的幻觉问题,但在艺术领域,幻觉就是创造力。以往的流程是ABCD,现在可能变成了BAD。AI赋能下,传统的流程重塑。无论是文案,还是设计,很多岗位都在发生变化。

杨子超补充,目前大部分拥抱AI的企业家对AI的认知还是仅仅停留在降本增效层面,对AI重塑生产流程方面其实考虑得很少,更多的传统企业家还在观望和学习阶段。

李丽苮分享了AI是如何赋能航空航天产业的:"我们有一方面的应用是用AI做数据预测。结合以往三十年在太空中积累的数据,来预测一些科学实验的结果,比如特殊新材料的应用、太空育种等。如果AI能够跑出来特别重要的结论,再拿去太空环境下做验证。"

参会嘉宾们都贡献出了精彩观点,但由于是超声波俱乐部内部的分享会,所以很多精彩的内容不便对外公开,欢迎更多优秀的朋友们加入超声波俱乐部。

超声波俱乐部目前拥有超过200位AI领域的顶级创业者,连接超过1000位AI领域的创始人、CTO、产品经理、风险投资人。

超声波俱乐部定期组织成员开展内部分享会,也会举办不定期的开放交流活动,分享内容涵盖AI行业趋势、技术创新、产品及商业等方向。

相关推荐
Hunter_pcx14 分钟前
[C++技能提升]类注册
c++·人工智能
东临碣石8238 分钟前
【重磅AI论文】DeepSeek-R1:通过强化学习激励大语言模型(LLMs)的推理能力
人工智能·深度学习·语言模型
涛涛讲AI2 小时前
扣子平台音频功能:让声音也能“智能”起来
人工智能·音视频·工作流·智能体·ai智能体·ai应用
霍格沃兹测试开发学社测试人社区2 小时前
人工智能在音频、视觉、多模态领域的应用
软件测试·人工智能·测试开发·自动化·音视频
herosunly2 小时前
2024:人工智能大模型的璀璨年代
人工智能·大模型·年度总结·博客之星
PaLu-LI2 小时前
ORB-SLAM2源码学习:Initializer.cc(13): Initializer::ReconstructF用F矩阵恢复R,t及三维点
c++·人工智能·学习·线性代数·ubuntu·计算机视觉·矩阵
呆呆珝2 小时前
RKNN_C++版本-YOLOV5
c++·人工智能·嵌入式硬件·yolo
笔触狂放2 小时前
第一章 语音识别概述
人工智能·python·机器学习·语音识别
ZzYH222 小时前
文献阅读 250125-Accurate predictions on small data with a tabular foundation model
人工智能·笔记·深度学习·机器学习
格林威3 小时前
BroadCom-RDMA博通网卡如何进行驱动安装和设置使得对应网口具有RDMA功能以适配RDMA相机
人工智能·数码相机·opencv·计算机视觉·c#