2023云栖大会:写诗、作画、谱曲

说在前面

赶在10月的尾巴,在那么一个秋高气爽的时节,在那么一个四季分明的城市,阿里2023云栖大会在杭州盛大开幕。「计算,为了无法计算的价值」,这一届的云栖大会的主题沿用了2015年云栖大会,那一年,阿里云蓬勃发展,奠定了未来在云计算领域的引领地位,而如今再一次沿用这个主题,阿里云将开启AI时代的新篇章。

PS:写的是不是有点软文的感觉,嘻嘻~

首先感谢稀土掘金技术社区的支持,有幸成为媒体一员前往现场参加2023云栖大会。在落地杭州的那一刻,我是如此地激动,毕竟有专车司机来负责接送至酒店,而且,还是喜来登酒店。这一次大会的规格有些出乎我的意料,后来发现是我浅薄了,司机和我说:每年都是这样。

2022年,我还在向阿里的运营童鞋咨询云栖大会票务相关的事宜,那时对于云栖大会的期待无比热烈,且延续至今。许是有缘,在一年后,竟有机会亲身来到了现场,并且能和众多前沿的年轻开发者一起见证这一盛大的活动。

好了,前言说的有点多了,下面我想分享下这一次2023云栖大会的所见所想。

但本文并不是一次全面的"体验之旅",而是分享本次在2023云栖大会上见到的一些有趣的AI项目,希望能给未能前往现场的朋友带来一些不一样的体验。

本文共计3010字,预计阅读需要6分钟。

AI写诗:创建属于每个人的幻想世界

模型的泛化能力和智慧涌现,在最早被人们所知晓,是去年ChatGPT的全球的"肆虐",GPT几乎是在这个时代没有准备好的情况下,带来一连串的近乎是"外星科技"的降维打击。

在本次云栖大会(A展区主会场)上,除了阿里云分享的云和分布式计算对于大模型所需的算力的复用的理念、百川CEO王小川分享大模型时代的场景实践外(非常推荐看重播),作为一名产品经理和独立开发者,我特别关注到了「童语故事」这一商业化的产品,通过依托大模型的能力,来帮助孩子们构建自己的童话故事。

童语故事

孩子只需要上传照片,就可以生成专属于自己的童话故事,体验身临其境的童话之旅。这不由得让我想到之前在某管上看到的,通过GPT仿写儿童故事,使用Mid生成插图和Lei生成动图,最后结合视频编辑软件进行整合的项目案例。

写脚本、生成画面、动画配音.......将一系列的工作流中所需的环节都用AI替代,「童语故事」可以说是将上述需要多个大模型协同的工作进行了整合,最终形成了可规模化的产品能力。恕我孤陋寡闻,这是见过的国内第一个除了「妙鸭相机」外的C端商业化项目。

但在和其他媒体朋友交流过程中,也有AI领域的媒体朋友表示出了自己的担忧,一方面对于大模型生成内容在国内合法性还存在不小的争议。另一方面,对于父母而言,会更愿意花时间和孩子亲自将故事,多陪伴孩子,也希望孩子不要那么早接触这个虚拟的世界。

彩云小梦

在主论坛参加完开幕式后,在C展区算力馆-分论坛的创作者OpenTalk中,我见到了一款熟悉的产品--- ---彩云小梦。这是一款使用AI续写小说的工具,在几年前,我便尝试过用来创作小说(很可惜,没有坚持下去)。而今又见到了,便是一种和小说般的相遇。

让人眼前一亮的是,彩云小梦已经不仅仅只是帮助创作者进行小说创作,在最新的能力的演示中,彩云小梦CEO在现场展示了如何与虚拟的角色进行对话、并推出了新的创作者平台以构建更多的虚拟世界角色。

其中让我印象最深的,还是小梦CEO说的一句话:在未来当AI超出了人类的分辨能力时,你又怎么知道这个世界不是虚拟的呢?

AI作画:那一刻,我"看见"了未来

AI绘画,可能是目前最为热门的领域。无论是文生图还是图生图方向,图片都以文字所无法传达的感官体验刺激着每一个人。在B展区人工智能+馆中,除了阿里通义家族的「通义万象」展示的惊艳能力外,一些开源的大模型能力和一些有趣的应用场景吸引了不少年轻人排队参与体验。

FaceChain

最初接触文生图方向时,可能了解最多的是SD模型+LoRA微调的解决方案。在一个被女孩子包围的展位中,我注意到了一个开源的图生图大模型--- ---FaceChain。只需要输入3~4张照片就可以生成专属的证件照和形象照,而生成过程只需要短短10分钟。

可能对于其技能能力有所质疑,在逛了2圈后才忍不住好奇心进行了尝试。难以置信的是,现场工作人员使用电脑前置摄像头只是简单地拍了1张照片,在等到10分钟后回来,得到了这么张照片。

没错,我不管,这就是我!七分形似,三分神似,FaceChain的图片生成能力着实惊叹!

数字门

在大模型和硬件相结合的场景中,我被一个"打卡机"所吸引。在按耐着本能地厌恶人脸打卡的情绪,体验下「数字门」产品之后,对于上班打卡这件事,我有了重新的认识,还能这么玩?

员工打卡成功后,通过大模型图片转绘的能力,生成卡通形象。这让打卡这件枯燥的事情变得有趣,这才是科技所带来的魅力。

AI谱曲:此曲非彼曲

除了文生文、文生图(含图生图),你还可以想到哪些大模型方向?

在前两年,元宇宙、数字孪生和虚拟现实的概念热火朝天,其中最大的全球事件是为迎合未来在AI领域的发展,Facebook宣布改名为Meta。而如今随着大模型的兴起,我们看到了与AR不一样的"现实宇宙"的发展方向。

其中,语音合成技术为虚拟世界和现实世界打通了沟通的桥梁,让我们真正能和虚拟世界的人物进行对话。

数字智人

在路过展台(D展区产品创新馆)时着实被吓了一跳,一个等身的虚拟"大姐姐"就这么站在了我面前。

精致的脸庞,略显高冷的表情,完美的身材曲线....无一不体现出"优雅"二字。结合大模型相链接的能力,"大姐姐"可以直接进行语音对话,并配合语音对话的内容呈现个性化的表情和动作,营造接近真实对话的效果。

高维写实、实时渲染,数字人正一步步地进入到人们的生活。随着应用场景的增多和模型能力的不断演化,在未来,可能离拥有二次元老婆,真的不远了。

当然,对于科技感十足的"大姐姐",本人更偏爱于汉服"小姐姐"。

具身智能

虽然本次2023云栖大会上并没有看到具身智能机器人的身影,但出现了一个"科幻电影"中的熟悉身影--- ---机械外骨骼。结合人体力学、人体工程学原理,机械外骨骼可以让穿戴者更加容易完成一些日常生活中较难的事情。

在实地体验机械外骨骼(便携版)时,可以轻松举起15KG的沙袋(图中红色那个),这相当于我家2只布偶猫的重量合计。体验过程中,能够明显感受到腿部、腰部、背部有力反馈支撑。特别是在进行蹲下跳起时,反馈特别明显。PS:差点飞出去。

其他结合机器人+AI的项目也同样亮点,还偶遇了一只摔倒的机器狗,我就不说是谁了,哈哈哈~

不得不感叹,未来世界离我们真的不远。

AI之外,享受音乐,享受生活

要说2023云栖大会最让人印象深刻的事情(当然除了看到了蔡主席和王坚博士外,王坚博士YYDS),莫过于开幕式当天傍晚的「飞天音乐节」。

「飞天音乐节」是阿里云每年面向内部的音乐节活动,本次云栖大会除了内部员工的节目外,还特别邀请了「杭州亚运会开幕式主题曲领唱团」、「房东的猫」......

是的,「房东的猫」!演唱会都没有离得那么近!

Last But Not Least

晚上回到酒店,在与掘金的童鞋一起聊起今天的所见所闻的时候,有一个疑问一直环绕着我的心头。在本次云栖大会上,阿里云发布了通义千问2.0,不仅如此,通义大家族一口气发布了"全家桶"AI模型应用,包含:

通义灵码-智能编码助手 、通义智文-AI阅读助手 、通义听悟-工作学习AI助手 、通义星尘-个性化角色创作平台 、通义点金-智能投研助手 、通义晓蜜-智能客服 、通义仁心-个人专属健康助手 、通义法睿-AI法律顾问。

那么疑问点来了,当前大模型技术日益成熟叠加AI浪潮情况下,现象级的产品却显得格外的稀少,各类大厂都在推出自家的大模型,但在产业领域落地相关的项目也是不多。

是当前大模型技术能力还不够成熟,还是人们对于AI本身的顾虑延缓了AI应用的大爆发?

可能是我接触的信息太少了,正在阅读这篇文章的你有什么看法,欢迎在评论区留下你宝贵的思考~

相关推荐
Jamence2 分钟前
多模态大语言模型arxiv论文略读(八十九)
论文阅读·人工智能·语言模型·自然语言处理·论文笔记
AI technophile34 分钟前
OpenCV计算机视觉实战(7)——色彩空间详解
人工智能·opencv·计算机视觉
绝顶大聪明36 分钟前
[欠拟合过拟合]机器学习-part10
人工智能·机器学习
芷栀夏41 分钟前
Dify大语言模型应用开发环境搭建:打造个性化本地LLM应用开发工作台
人工智能·语言模型·自然语言处理
星辰生活说1 小时前
零碳办会新范式!第十届国际贸易发展论坛——生物能源和可持续发展专场,在京举办
大数据·人工智能·能源
寰宇视讯1 小时前
第 25 届中国全电展即将启幕,构建闭环能源生态系统推动全球能源转型
大数据·人工智能·能源
Icoolkj1 小时前
谷歌 AI Ultra:开启人工智能新时代
人工智能
白熊1881 小时前
【机器学习基础】机器学习入门核心算法:线性回归(Linear Regression)
人工智能·算法·机器学习·回归·线性回归
熊猫在哪1 小时前
野火鲁班猫(arrch64架构debian)从零实现用MobileFaceNet算法进行实时人脸识别(四)安装RKNN Toolkit2
人工智能·python·嵌入式硬件·深度学习·神经网络·目标检测·机器学习
大师兄带你刨AI1 小时前
「极简」扣子(coze)教程 | 小程序UI设计进阶!控件可见性设置
大数据·人工智能