坐井观天包,睁眼看世界——云栖大会见闻

整体观感

计算,为了无法计算的价值------振聋发聩,这是我到达现场第一时刻切实的感受。

在别处看到这句话,或许只会当作一句有哲理的名言,当来到云栖小镇,抬头望去,远方的标志彷佛就是在大声告诉我,睁大眼,好好看,你好像落伍了。

是的,我好像真是那个坐井观天的娃,本以为看到了整个世界,殊不知只看到了我想看到的。

感谢掘金社区能邀请我参加本次云栖峰会,也非常感谢阿里云和参会各大产品给我带来如此多的震撼和醒悟。

本文分享了我在云栖大会的一些真实体验和见闻,从感受的角度触发,希望能给大家带来现场版的体验。当然,时间简短,这是一次不完全、不全面的体验,如果想了解更详细的大会详情,请关注阿里云官网。

线下体验

机械外骨骼

在去云栖大会的途中,闭目养神,脑海中就开始幻想可能出现的设备,机器人、机械臂等不会少,区别就在于智慧程度,但这些让我兴趣寥寥,感觉只有机甲这种能让我大开眼界。

机甲还有点为时过早,但出现了另一个科幻常客------机械外骨骼,能先初步体验一下超人的感觉好像也不错。

机械外骨骼体验的时间倒是不长,给我留下的感受却是非常深的。首先,外骨骼没有想象中那么重,非常轻便,穿戴在身上也不是特别紧,穿戴过程也比较简单,整体设计是特别合理的。另外,机械外骨骼提供的力量是非常足的,穿戴着走动体验还不是特别明显,当我尝试起跳时,有一种被推动起飞的感觉,力道来得非常快、非常足,如果不控制好自己,很可能会趴地上,别问我为啥知道,差点趴了。

辅助举起重物的效果最为明显,体验现场有一个 30kg 的沙袋,单纯的提起还是需要一定的力量消耗,借助外骨骼辅助的话,这个过程就轻松了太多,感觉大力士附体,直接可以反复放提,有种我是健身猛男的幻觉,带着外骨骼健身,哎哟不错哦。

整体体验下来,动作和外骨骼力的同步性还略显不足,好多时候,人身的动作已经完成,力才延迟传来,这会导致有些急促,显得我有点呆。

现场我也咨询了官方的技术人员,为了体验感更好,灵敏挡位调至了最高,但这点还是保持质疑,不质疑,怎么才能进步。

总而言之,毕竟是体验产品,估计并非最新的成果,那这样估计得说,如果是最新产品,对于一些老人和需要辅助的人士,还是有一定的使用价值,整体穿戴不复杂,也比较轻便,看好它的未来。唯一就是担心它的成本,希望能惠民一些,帮助到更多需要它的人。

都聊到机器人了,都来看看这只可恶的机器狗,吓到了专心看展览的我,讲实话,它还真有点灵活的。

钉钉魔点数字门迎

本次大会中最喜欢的几项体验之一了,以前论坛很火的时候,每天登陆都会让我们选择一下当日状态,写一句感想或者展望,当时感觉挺有意思的,但现在网络发达了,这种行为就不够形象了,有些乏味。冰冷的文字体现不出对我内心的伤害ヾ(≧▽≦*)o。如果能有一个东西形象化我的一天,那好像是不错的体验。

数字门迎正是填补了心中的这点小情怀,虽然现在它的定位是每天早上的上班打卡。打卡大多只是一个简单的人脸识别,冰冷的照片开启残酷的一天,打工人苦啊。人脸打卡枯燥、冰冷、无聊、乏味、冷血,诸如此类的词我能像一堆,反正就是我不想上班,有点过分好像,好吧,我不想人脸识别打卡,数字门迎把这个痛苦的过程娱乐化了,给你卡通化一下,早上看到卡通、酷酷的自己,虽然不能改变工作依旧苦的本质,但生活总是添加了几份快乐。生活嘛,总是得在咸里想办法加点糖。

当然数字门迎不止如此简单的功能,还支持很多扩展功能,这里可以去查看公众号,扫卡通的我右下角二维码就行,但还是卡通化最吸引我。在现场得以体验了一下,效果还不错,但就是得注意拍照角度,要不有点呆狗啊,看看图一的我吧,没想到我还会翻白眼。

AR 眼镜

AR 眼镜有些大番出乎我的意料了,在我坐井观天的认知中,AR 眼镜或许还只停留在研发阶段,没想到好像已经即将迈入现实了。

在现场体验了两款 AR 眼镜,戴上 AR 眼镜后,可以实现在线浏览功能,也可以查百度,地图啥的都是可以的,我记得还看到了音乐软件,就是不知道怎么听音乐。最让我惊喜的是,可以实现虚拟的手势操控,看似我在空气中乱晃,其实我已经开始操控了,这点科技感爆棚,邪恶的小包已经在...。

但问题也挺明显的,首先 AR 眼镜目前还需要一个类似主机的东西,不算特别轻便;其次,操控起来灵敏度较差,这个不知道是不熟练还是本来就存在这种现象,确认按键虚空捏了半天才成功;还有这个眼镜非常的厚,像是个大墨镜,特别是我本身就戴眼镜,再戴一个眼镜,多少怪怪的,体验感就很差。

虽然还存在一些不足,我还是很看好这款炫酷的 AR 眼镜,如果功能更完善,附带更智能的标注,不敢想哦。

数字孪生

体验完外骨骼后,转身就遇到了这样漂亮的一个虚拟小姐姐,这精细程度、面部表情、身材曲线,无不显示虚拟人物正在逐步迈入我们的生活,开始不由得回忆起 qq 宠物的日子,假设有一天,我是说假设,手机中、电脑上、包括手表等各类智能设备都配置一个这么完美的虚拟人物或者一些卡通动物形象,不敢想哦。

在现场初步的体验了一下,小姐姐的对话功能已经算是很完善了,回答还会配合一些表情和动作,也可以实现简单的换装/发型等,可以说已经开始朝智人演变 ing。就是目前应用场景还有些狭窄,主要应用于博物馆等其他负责讲解的一些角色,但我相信在不远的未来,随着大模型的不段进步,它会走入我们的生活,有点期待哦。

AI 写真------FaceChain

AI 写真,大家应该都有所听闻了,妙鸭相机今年出圈了好几次,赞誉参半,这里不予置评。现场也看到了妙鸭相机的展位,围得可以说是真是人山人海,这让我最切实的体验到了 AI 大模型带来的新机会,或许我们已经迎来了一个新的时代。

FaceChain 是另一个 AI 写真的展位,现场提供了通义万相(具体见后文)和 FaceChain 两种体验,FaceChain 是阿里云达摩院魔塔社区推出的一款开源图生图大模型,只需 2-10 张图片,10 分钟左右,就可以训练出 Lora 模型,后续还提供了近 30 种风格任你转换,不论你懂不懂大模型,跟着它的步骤走,很快就可以拥有一组属于自己的写真;如果懂得多一点,还可以进一步进行微调,写真效果也会更好。

可以看一下生成的一些效果图(原图就不让大家看了),还是特别神似的,算是完美优化版吧。唯一体验的感悟就是传入训练的图像质量一定要高,越高效果越好,有点怕模糊,模糊图片训练出的五官容易怪。

FaceChain 真的效果很好,使用也比较简单,有兴趣推荐去尝试一下。但是我唯一担心的问题就是隐私性,虽说签订了隐私保护协议,但总是还有几分担忧。这应该也是当前很多人对 AIGC 保持观望的原因之一吧,安全隐私性到底该如何保证。

云端之旅

云端之旅应该算是 5D 体验,以前都没舍得体验过,这次很有幸在即将离开云栖前排队成功。

模拟飞行体验,跟着座舱一起游览了杭州的各大地标,有两个瞬间记忆犹新,一个是俯冲黄龙体育中心,那种瞬间的节奏变化和加速,座舱开始前后、左右、垂直多方向摆动,俯冲迅速着陆,慢慢滑翔经过过球场,路过拼搏的足球运动员,加速,跃向天空,最有飞行感的一瞬间,刺激。另外一个瞬间是到了尾声阶段,阅尽杭州美色,节奏开始减缓,一只仙鹤出现在镜头中心,飞机越过仙鹤,仙鹤不甘示弱,从侧面滑翔而来,雪白挥舞,扬长而去,那一瞬间意境很神圣,很美。

跟着云端之旅一起游览了杭州一遍,也算弥补了西湖都没转完的遗憾。

通义系列

通义系列是本次云栖大会的重磅发布之一,不得不赞叹,阿里很多产品名称起的是真有感觉,通义,字面意思就是普通适用的道理和准则,换个简单的理解,那就是,道这个字对国人来说,意义深远,可谓文化精髓之一。不知道设计之初是否有道的韵味,但小包从阿里的通义系列切实的体验到了阿里试图创立人工智能的新道路的决心。

通义系列并非单独的几个产品,孤岛般,而是沿袭全面发展、多方位开花的战略,目前为止,在官网上已有十大通义:例如通义千问、通义万相、通义灵码等等。

有些有幸在现场得以体验,有些没来得及,回到学校迫不及待地去体验了一番。

通义千问

在云栖大会当天,通义千问宣布 2.0 版本正式问世,而且十多个权威测评标识,千问 2.0 性能已经超越了 GPT3.5,正在加速追赶 GPT4.0。最重要的是通义千问 APP 已经上架各大手机应用市场,想体验的话就快行动起来吧。

作为新时代的青年,谨记邓爷爷教诲,实践才是检验整理的唯一标准,咱不能光听官方吹啊,测评也没有切实体会来的深,小包回来就迫不及待地尝试了一番。

首先网站页面设计风格我就特别喜欢,很简洁,紫色、灰色、白色的淡配色,整体非常舒服。

而且除了正常的问答窗口,官方事先提供好了多组文案,就类似于大模型中 prompt,一进来就是小包每次最愁的标题,你还会读心来着?

试着问了些问题,就以刚才的标题为例

让我看看怎么个事,好像真有点东西,单纯的问答也体现不出什么强大之处。

恰逢最近在面试,被算法痛苦的折磨中,要不来折磨折磨千问试试。

就先拿力扣经典的不能再经典的两数之和来 try try!

这个题目主要太熟悉了,看到双指针那一瞬间,就猜到它已经理解错题意了,可恶还是不行吗?

接下来我它提供了力扣的案例,它还是没有改变双指针的方案,有点失望。

于是我改变了点策略,给了一句提示,没想到仅一句提示,就 AC 了。有点东西呦。

加大难度,选了 medium 难度 盛最多水的容器题目,一次就 AC 了,有点夸张。

加大难度,在本窗口的基础上,选一个类似的 hard 难度题目,接雨水

接雨水这个描述非常简单,只有一句话,而且非常类似于上一道题,尝试之前我就可能怀疑会受到上一题的影响。经过我多次尝试提示,都没有能够成功做出这个题目。

盛最多水的容器影响可能还是太大了,因此单独又开启了一个会话。

如果大家有做过接雨水题目,可能依稀会记住,它有三种解决方案:动态规划、单调栈和双指针。

首先千问给出的解答是动态规划,有一点细节处理不对,但我并没有明确告诉它哪里错了,我只是告诉它动态轨迹有些问题。

然后千问便立刻切换了栈的思路,还是有些小问题,我接着为千问提供了一组测试样例。

然后没想到它直接切换为了双指针方法,成功 AC。

讲实话,真不错,对于 hard 难度的题目,解答起来还是比较轻松的。而且最良心的是,代码后还附带详细解读。

算法题如果都能做的不错,在别的问答方面应该更是问题不大的,那么现在就剩下一个关注点,回答信息实时性方面。

GPT3.5 知识是截止 2022 年的,很多情形下是足够的,但有时候需要查询一些最新趋势,最新动态,数据库就稍显不足。官方并没有给出千问的数据时间,但我 NBA 最新的篮球新闻测试了一下,近几日的消息都可以得到,很可能是截止最新的,这有点吸引人。

图片理解也测试了一番,传入图像解释是挺 ok 的,但是如果把图像任务复杂化,例如尝试传入两张类似照片找不同,效果就挺差的。

综合来说,通义千问的使用体验还是特别好的,最起码不用像 GPT 一样跨越高山,用下来问答也很顺畅,推荐大家尝试体验一下,战场小包已经认可它了。

通义万相

通义万相是另一款我非常推荐体验的产品,在云栖大会现场体验了证件照版本,效果你别说,理想中的样子,做梦都没敢朝这方面想。

回来我又体验了几组,人物整体训练的效果是特别好的,操作过程非常简单,仅需要 2-10 张照片,然后训练一段时间(两张照片大约在 10 分钟左右),然后选择想要的风格出图即可,官方一共提供了 10 种风格,可恶的是,男生的风格较少,只有证件照和职场男装。最重要的是,现在是免费的,每天有 50 灵感值,足够体验几次的。

如果想体验更多风格,生成效果更好,可以看上面 FaceChain 部分的分享,FaceChain 部分可以自己进行参数调整,自由度更高,上手难度也相对高一些。

通义智文

通义智文已经被我单方面委派为战场小包的学术伙伴了。

平常阅读英文论文都用知网云翻译,翻译功能是够用了,但是有两个地方内心我已经吐槽很久了。

一个是,你能不能帮我看啊,我还是得挨着看,挨着看倒是还能忍受,总结一篇文献有时很容易抓不住重点,后来又重返工阅读,时间消耗的成本是有点大的;另外,记笔记真的很麻烦,用知网云翻译的话,只能记在 pdf 上,要不就需要另外开一个窗口,用第二显示屏记录。GPT 虽然能简化一些步骤,但是体验感一般。

下面看看智文,智文的功能就比较适合学术一些,传入 pdf 文档后,它能有条理的、系统的提炼论文中的核心,此外还会进行一些简单的分析,扩展一下文献中的某些内容。如果对文献有什么疑问,还可以交互式的沟通,阅读文章的效率可以显著提升,已经爱不释手了。

除了论文阅读的功能,智文还提供了网页阅读、图书阅读等,目前还没有对应的需求,就没有做深一步体验。

其他通义系列

通义灵码也进行了部分体验,VSCode 中直接安装 TONGYI Lingma 插件就行,使用起来是非常简单的。

关于通义灵码,当前最看中的是代码解释功能,刚需,最近恰好在阅读 @babel 系列工具包的源码,不知道能提供到何种层面的帮助,这个部分还在进行中,还是不敢为灵码下断言,目前用下来还是比较舒适的。就有一个缺点,代码解释只能解释函数声明,函数表达式还不能解释。更多详细的体验,大家可以自己去尝试一下。

通义星尘也是我比较感兴趣,可以创建你想要对话的任何角色,兵圣孙武就挺好的的,对话起来,感觉都玩的有点入戏了,一时没能设计出自己想要的角色,准备去阅读阅读资料,设计一个泼猴角色,看我小包如何擒拿它。

聊聊云栖

这次云栖大会的体验我可以用两个字来形容,那就是震撼;如果换成四个字,那就是不虚此行。算例、人工智能、产业创新加技术论坛,多翼齐飞,给我全身心带来了透彻的体验。

或许已经开始进入下一个时代,而我们正是新时代的主角,不论位于何种行业,AIGC 都将成为我们必须了解的知识之一,避免成为坐井蛙,而要成为翱翔鹤。

最后再次感谢云栖大会和掘金社区的邀请,一次永生难忘的体验,下次再会。

你又是怎么看待这波新浪潮的吗?保持观望或者迎难而上?

朋友们,如果您有更好的想法,欢迎在评论区留下你宝贵的思考,一起交流,一起进步。

相关推荐
风清扬雨几秒前
【计算机视觉】超简单!傅里叶变换的经典案例
人工智能·计算机视觉
HuggingFace9 分钟前
自动评估基准 | 设计你的自动评估任务
人工智能·自动评估
小白学前端66618 分钟前
React Router 深入指南:从入门到进阶
前端·react.js·react
GISer_Jing23 分钟前
神经网络初学总结(一)
人工智能·深度学习·神经网络
szxinmai主板定制专家31 分钟前
【国产NI替代】基于A7 FPGA+AI的16振动(16bits)终端PCIE数据采集板卡
人工智能·fpga开发
web1309332039839 分钟前
前端下载后端文件流,文件可以下载,但是打不开,显示“文件已损坏”的问题分析与解决方案
前端
outstanding木槿1 小时前
react+antd的Table组件编辑单元格
前端·javascript·react.js·前端框架
数据分析能量站1 小时前
神经网络-AlexNet
人工智能·深度学习·神经网络
Ven%1 小时前
如何修改pip全局缓存位置和全局安装包存放路径
人工智能·python·深度学习·缓存·自然语言处理·pip
szxinmai主板定制专家1 小时前
【NI国产替代】基于国产FPGA+全志T3的全国产16振动+2转速(24bits)高精度终端采集板卡
人工智能·fpga开发