对话火山引擎侯爽:字节原生的边缘云

编者按:相对于集中式的数据中心,建设边缘节点要面临的基础设施更加多样复杂,而边缘云承载的业务需求也更加离散,找到一条健康可持续的边缘云业务发展路径将会是个巨大挑战。作为火山引擎边缘云负责人,侯爽详细分享了如何利用字节跳动的业务优势,数据驱动,联合众多的合作伙伴实现这个高难度的任务。 策划 / LiveVideoStack

对于字节跳动,似乎任何问题都可以用数据驱动来解决。和侯爽交流后,再次深刻地感受到这一点。数据驱动不仅可以让好作品直达目标受众,还能让广告主获得更高的ROI。让好作品直达目标受众,对于火山引擎的边缘云业务也非常关键。"我们有一套非常强的数据模型去驱动基础设施建设。比如,站在抖音业务看,我们知道全网分布,知道哪个地方体验比较差,哪个地方体验比较好。我们知道从何入手去提升用户体验,同时兼顾成本",火山引擎边缘云负责人侯爽告诉LiveVideoStack。正是有了强大的数据模型,边缘云业务可以稳健、高效地发展,避免盲目投入。在字节跳动以视频业务为主线带动下,边缘云业务有了较多经验积累。

但这并不意味着一帆风顺。

1.积累与创新

火山引擎边缘云的优势可以总结为几个关键词:规模弹性、边缘云原生、技术创新、内外统一。"火山引擎是从字节跳动生长出来的,很大的一个特点就是可以内外复用,基础技术有很长时间的规模化磨炼,在边缘云侧也是如此",侯爽表示,字节跳动海量的业务需求,让火山引擎一开始就拥有了很高的起步规模。同时,火山引擎在边缘侧采用云原生的技术方案,开源的云原生生态比较完善,可以解决可观测、可运维、多云融合等问题,这些本来就是构建边缘基础设施的痛点。就这样,字节原生的边缘云基础设施,经过春晚、"618"、"双 11"这样大规模流量洪峰场景的海量验证,这些经验将为火山引擎对外服务客户,提供更好的技术架构与实践案例。

火山引擎边缘云的快速发展得益于字节跳动集中而海量的业务需求,但在新场景、新行业仍需突破。例如边缘云正在向汽车、金融、工业、能源等更多行业渗透,相对于泛互联网业务而言,既"小"又复杂。

"在泛互联网行业,音视频就是刚需,对基础设施降本和应用体验优化的需求都会带来大量的边缘应用。但在其他新兴行业尚处在早期,虽然我们在辅助驾驶、工业互联网领域有了一些落地场景,但还需要慢慢摸索。"侯爽表示。

对于火山引擎边缘云,他有着清醒的认识,侯爽坦言,如何渗透到更多新的行业,除了 know-how,对新场景、新业务的理解和突破也是接下来火山引擎要去努力的方向。

2.短期与长期

当被问及今年的目标时,侯爽表示,今年的核心是要全面夯实火山引擎边缘云产品与服务体系,做到从1到100的蜕变,真正让客户感受到火山引擎边缘云的核心价值,以及帮助客户解决问题,加速企业的发展与创新。当然,侯爽和他的团队要做得不仅如此。"海外的潜在市场空间很大,边缘云基础设施和安全产品深度结合,和音视频产品的协同解决方案,帮助更多客户"走出去",是下阶段关注的重点。"

而谈到长期趋势,侯爽认为边缘云的未来可以概括为两个核心:更深融合、更广连接。更深融合,是从纵向的维度看云边端融合,既包括云边端调度的一体化,也包含云边缘的数据一体化,还有云边端的运维一体化,云边端的安全一体化。"通过更深层次的融合,应用才能更加充分发挥边缘云的能力"。更广连接则是从横向维度来看边缘云的发展,"边缘云的一大特性是广域覆盖,这就意味着,在全世界范围内,边缘云都需要建立更广泛的连接",真正做到让"连接与计算无处不在"。

在技术规划上,侯爽则谈到需要构建小型化、轻量化、集成化的技术架构体系,在有限的资源上,以更加灵活的产品解决方案满足各类业务的需求。同时要软硬一体优化,"也许这是一个较长期的方向",侯爽表示。

侯爽反复强调火山引擎是个后来者,有一定优势,但更多的应该向行业伙伴去学习,"在产品技术层面与行业伙伴有非常多互通、借鉴和交流。面向未来,大家一同构建有长期竞争力的差异化的解决方案。"

以下为对话侯爽实录:

LiveVideoStack:侯爽您好,这应该是 LiveVideoStack 第一次和您进行深入交流,先和读者介绍一下自己和团队吧。

侯爽:我是 2015 年加入字节跳动,先后负责字节跳动视频中台架构、应用流量架构等业务和团队,现主要负责火山引擎边缘云产品与研发相关工作。 我们团队主要有两个核心职责:首先是服务好内部业务,保障业务体验和服务效率。比如抖音要举行大型线上活动的时候,我们是不是能够提供稳定可靠的基础设施服务去承载海量洪峰业务,同时保证最低的成本和最高的效率。我们的基础设施服务包括终端网络库、融合传输链路、海量边缘节点和数据中心服务。 其次,我们通过火山引擎输出边缘云系列产品与解决方案,To B对于火山引擎来说也还处于早期阶段。第一,解决产品从无到有的问题,夯实标准化的产品与技术。目前,火山引擎边缘云已初步构建了"All IN ONE 边缘云原生计算平台、全球一体化的内容分发网络、基于边缘网络原生的全域联网加速解决方案、可信的数字资产管理与智能解析调度体系"为主的四大产品矩阵;第二,构建融合的基础设施解决方案,提升基础设施的规模弹性,包括推进业务内外统一,加大资源并池规模,以及与伙伴供应商一起构建多云融合服务的模式,提升资源供给效率和弹性;第三,既要看现在,也要看看远期的未来,要关注产品技术的变更、客户需求的演进、行业的快速发展。目前,边缘云业务正在从泛互联网行业向工业、能源、金融、汽车等多行业去渗透,那里既有很强的数字化转型的需求,也有全新的技术调整,构建场景化的解决方案也是我们非常重要的探索方向。

LiveVideoStack:在字节跳动这样的巨量业务和基础设施条件下,开展边缘云业务有哪些优势?要面对哪些挑战?

侯爽:火山引擎是从字节跳动生长出来的,很大的一个特点就是可以内外复用,基础技术有很长时间的规模化磨炼,在边缘云侧也是如此。 首先,火山引擎边缘云的第一个核心优势是规模弹性,借助字节跳动海量的业务需求,让我们在基础设施层面有很高的起步规模,包括全网超过百Tbps带宽、百万异构算力的超大规模弹性资源池以及超低延时1-40ms的业务场景与基础网络全覆盖; 第二,边缘云原生。作为后来者,我们在边缘侧采用云原生的技术方案,独创小型化、轻量化、集成化的边缘云原生操作系统,构建云网协同、云边协同、边边协同、多云协同能力; 第三,面向未来发展的技术创新,比如 CPU/GPU/ARM All in One 的全新边缘异构计算实例以及融合链路加速、全域组网、边缘安全的全球边缘一体化网络; 第四,内外统一,字节原生。边缘云基础设施产品经过了春晚、"618"、"双 11"这样大规模流量洪峰场景的海量验证,这些经验也帮助我们的客户,提供最佳技术架构与实践案例。 再说说挑战。首先,我们要解决脱胎于字节业务的边缘云技术体系向行业标准化产品技术方案演进;第二,面对市场众多客户的复杂场景需求,如何构建具备更强开放性和兼容性的产品技术生态,是我们另一个思考的问题;第三,如何渗透到更多新的行业,除了 know-how,对新场景、新业务的理解和突破也是接下来我们要去努力的方向。

LiveVideoStack:如何定义边缘云以及它的核心价值?

侯爽:边缘云计算这个概念早期起源于"把基础设施部署在边缘",有了接近二十多年的发展历史,而就行业应用而言, 大家对边缘云的解读各不相同,主要原因是行业仍然在快速发展,缺少标准化的定义。回到我们自身,边缘云是云计算的一种形态,云边端的协同会是长期的演进趋势。2022 年火山引擎发布了边缘云系列产品,我们定义的边缘云是以云原生技术为基础底座,融合了异构算力和边缘网络,构建在大规模边缘基础设施之上的云计算服务,形成了以边缘位置的计算、网络、存储、安全、智能为核心能力的新一代的分布式云解决方案;边缘云作为基础设施服务一个核心价值就是广域覆盖的接入与传输网络。无论是早期音视频服务,还是云游戏云渲染、自动驾驶等,网络是必需的能力。伴随网络的基础需求,会衍生出更多本地化数据计算、存储的需求,还需要配套的安全能力;从长期的趋势看, AI 能力在边缘侧的下沉,也是我们的重点关注方向。"连接与计算无处不在"是火山引擎边缘云的Slogan,也是我们的核心价值主张。 当然,作为后来者,我们需要更多向行业伙伴学习,在产品技术层面与行业伙伴有非常多互通、借鉴和交流。面向未来,大家一同构建有长期竞争力的差异化的解决方案。"

LiveVideoStack:边缘云给C端用户带来的体验提升或者最直接的感受是什么?

侯爽:字节跳动过去在音视频领域的积累比较多,我们的音视频产品及解决方案是构建在边缘云基础设施之上,包括基础CDN、点播、直播、RTC等服务,我们在早期的工作重点之一就是服务于音视频体验的优化。关于体验的核心包括几部分:第一,超低延时访问。以抖音为例,用户可以在直播间与主播进行实时直播互动,这两年大火的直播健身、电商平台好物秒杀抢购、春晚、世界杯等大型节日活动互动等等,用户基本感受不到什么时延了;第二,沉浸式体验交互。过去参加明星演唱需要亲临现场前排观看才能获得较好的体验,现在躺在家里的沙发上戴着头显就能沉浸式观看,体验"私人"演唱会;第三,降低使用成本。通过融合架构、自研传输协议、编解码等算法的优化,帮助用户降低产品使用成本,提升访问体验,同时能够减少基础设施的资源成本消耗。

LiveVideoStack:今年的目标是什么?

侯爽:今年的核心是要全面夯实火山引擎边缘云产品与服务体系,做到从1到100的蜕变,全面推向市场,在 ToB 市场形成完整的边缘云产品和解决方案认知,真正让客户感受到火山引擎边缘云的核心价值,以及帮助我们客户解决问题,加速企业的发展与创新。同时我们希望能够和行业伙伴做更多的深度共创和协同,携手把边缘云这个赛道的产品解决方案做得更好,赋能于行业,服务好客户。

LiveVideoStack:能够支撑边缘云商业模式的关键业务场景有哪些?未来看好哪些行业或场景?

侯爽:从商业视角看,业务肯定符合二八法则。当前大部分需求来自音视频大赛道,包括点播、直播、RTC,以及像云游戏等新兴业务,这里既有网络需求,也有算力的需求。长期看还有很多不确定性,这是由边缘云发展的特性决定的,边缘侧的需求比较分散,分布在不同行业,有各自不同的诉求。比如在泛互联网行业,音视频就是刚需,对基础设施降本和应用体验优化的需求都会带来大量的边缘应用。但在其他新兴行业都处在早期。比如自动驾驶赛道才刚刚开始,虽然有一些应用,但还需要较长的周期才能走向成熟。传统工业行业数字化转型,肯定不会那么快,客户线下的数据怎么样和线上的服务去做结合?是不是能够上云?怎样解决数据隔离安全性?推进的周期会非常长,产品解决方案很难实现快速复制,需要慢慢摸索渗透。 更长期来看,除了存量的泛互联网赛道,在汽车、金融、工业、能源等怎么找到更大的突破口,这个问题可能也会伴随着我们未来几年发展。

LiveVideoStack:包括突破海外市场?

侯爽:从边缘云的角度看,海外是刚刚开始,需要找到一些确定性的驱动因素来帮助我们完成从 0 到 1 的构建,这些因素包括集团自身的需求、ToB 客户的出海衍生需求。海外的潜在市场空间很大,边缘云基础设施和安全产品深度结合,和音视频解决方案的协同解决方案,可能是下阶段关注的重点。当然,海外市场的竞争也会更加激励,怎样结合业务需求和自身核心优势,找到海外业务发展切实可行的实施路径,这会是在海外探索的关键点。

LiveVideoStack:海外会选择哪些地区突破?

侯爽:短期聚焦在音视频领域,东南亚可以作为一个切入点,人口、产业发展阶段在一定程度上可以发挥我们的优势。比如,我们在音视频能力上的积累,能够帮助客户在东南亚提升商业化的效率,提升用户的体验。

LiveVideoStack:您觉得在边缘云业务上,有没有一些技术可以让成本大幅降低,或者算力爆发,或者在某一方面给用户的体验带来质的变化?如果有的话,这些单点技术是什么?

侯爽:从技术的驱动力的角度可能分层看。底层基础设施,云原生技术能够帮助我们快速构建基础设施产品和解决方案。相对于传统技术体系,我们作为后来者可以采用最新的技术栈,免去了各种技术债的烦恼。云原生的开源生态比较完善,可以有效地解决基础设施的可运维、可观测、多云协同等各类问题,这些本来就是构建边缘基础设施的痛点。另外,边缘云产品面临的核心痛点之一就是资源异构,通用化的产品屏蔽底层的异构,肯定是业务的首选;第二,边缘节点的规模小且分散,在单个节点可能只有几台机器,需要同时解决计算、存储、网络的需求,和集中式的数据中心方案就会有很大的不同,在边缘节点侧,我们需要构建小型化、轻量化、集成化的架构体系,在有限的资源上,以更加灵活的技术体系满足各类业务的需求;第三,软硬一体协同优化,从边缘云原生的技术体系到边缘节点的定制服务器的协同优化,也许这是一个较长期的方向。

LiveVideoStack:如何预测异构算力未来在边缘侧的变化?包括 ARM、x86、ASIC 以及越来越多的 GPU?

侯爽:这个问题的核心是要想清楚,选择某个硬件和软件的生态所服务的业务场景是什么。其实,是规模。如果没有规模化的需求,很难谈收益。从集中式的数据中心来看,软硬一体的深度优化已经非常成熟,包括自研研芯片与服务器、DPU等。在边缘侧,目前业务需求分散,行业也比较分散,很难通过某单一场景驱动硬件规模化的发展。过去,云游戏对 ARM 板卡有需求,但规模还没有那么大。即便是同样的云游戏的客户,不同的厂商对硬件选择也不一样,有些用传统的计算实例,有些用高通的板卡,有些会使用 ARM 服务器实例,但规模都都会有一定的限制。火山引擎会考虑资源的长期使用率,在硬件选择上会谨慎一些。

LiveVideoStack:尽管单个边缘节点的投入不大,但需要建设的数量要远远大于数据中心的数量,怎样更科学的评估和建设边缘节点?

侯爽:基础设施的建设需要科学严谨的ROI评估体系,关键要有数据支撑,这就与整个业务是息息相关。数据中心承载的是算力存储密集型的业务,可以规模化的集中建设。而边缘侧有两个不同:首先,是业务应用特点的需求。以音视频分发为例,如果所有用户都连到数据中心,物理传输链路就非常长,无论传输算法优化、智能调度优化都不可能突破物理链路的极限。所以,我们就需要建设更广覆盖和更广分布的边缘节点;接下来,怎么样去建设?这会涉及到业务需求、资源规划、物理选点、商务合作等方方面面。我们有一套非常强的数据模型去驱动基础设施建设。以抖音业务为例,我们知道在兼顾成本的大背景下,如何去优化提升用户体验。通过全网分布和用户体验反馈,知道哪个地方体验好,哪个地方体验待提升。比如,要在提升某个地区体验,也许我们就需要有目标的加大本地服务节点的覆盖;第三,面向长期的前置投资。比如数据安全、算力下沉等需求。需要我们做好调研分析和预判,做到有节奏的战略投入。

LiveVideoStack:在您的观察中,未来几年边缘云会有怎样的发展?

侯爽:边缘云的未来可以概括为两个核心:更深融合、更广连接,这分别是从两个维度对边缘云发展的思考。更深融合,是从纵向的维度,看边缘云的云边端融合,边缘云势必要在云边端的联动上更加紧密。这包括,云边端调度的一体化,对云上资源、边上资源、端上资源的整体调度,包含云边缘的数据一体化,数据在端的采集,边和云的处理,提供一体化方案。还有云边端的运维一体化,云边端的安全一体化。通过这些更深层次的融合,应用才能更加充分发挥边缘云的能力;第二个发展趋势呢,是从横向维度来看边缘云的发展,边缘云的一大特性是广域覆盖,这就意味着,在全世界范围内,边缘云都需要建立更广泛的连接,从而助力企业的全球数字化转型。未来,火山引擎边缘云将通过领先、可信赖的云和智能技术,帮助全球企业降本增效、加速创新。

关于火山引擎边缘云: 火山引擎边缘云,以云原生技术为基础底座,融合异构算力和边缘网络,构建在大规模边缘基础设施之上的云计算服务,形成以边缘位置的计算、网络、存储、安全、智能为核心能力的新一代分布式云计算解决方案。

相关推荐
.生产的驴7 分钟前
SpringCloud OpenFeign用户转发在请求头中添加用户信息 微服务内部调用
spring boot·后端·spring·spring cloud·微服务·架构
肥猪猪爸24 分钟前
使用卡尔曼滤波器估计pybullet中的机器人位置
数据结构·人工智能·python·算法·机器人·卡尔曼滤波·pybullet
丁总学Java34 分钟前
ARM 架构(Advanced RISC Machine)精简指令集计算机(Reduced Instruction Set Computer)
arm开发·架构
readmancynn36 分钟前
二分基本实现
数据结构·算法
萝卜兽编程39 分钟前
优先级队列
c++·算法
盼海1 小时前
排序算法(四)--快速排序
数据结构·算法·排序算法
一直学习永不止步1 小时前
LeetCode题练习与总结:最长回文串--409
java·数据结构·算法·leetcode·字符串·贪心·哈希表
Rstln2 小时前
【DP】个人练习-Leetcode-2019. The Score of Students Solving Math Expression
算法·leetcode·职场和发展
芜湖_2 小时前
【山大909算法题】2014-T1
算法·c·单链表