对话咔嚓剪辑金邦飞 | 如果把我的人生类比成播放器去开发与设计...

策划、编辑 | Aris Wang受访对象 | 咔嚓剪辑出品人:金邦飞

七月底的上海,潮湿又燥热,笔者在一家远离市中心的星巴克见到金邦飞,但店里实在吵闹,金老师只好带我换到隔壁汉堡王餐厅进行当天的采访对话。他穿着一身黑色简洁的休闲服装,看上去质朴、憨厚,和他做的咔嚓剪辑具备类似的气质。金邦飞是浙江人,今年50岁,在上海读完大学后便一直留在这里。算下来,这是他投身多媒体音视频工作的第24年

金邦飞是多媒体领域的一位技术老兵,2000年便加入敏递软件负责DVD的研发,后来跳到视龙担任CTO,参与了一系列播放器的规划、研发与测试,并也是他职业生涯首次担任管理岗位。

在访谈时,他回忆说:"当时正处在WinMobile时期,实际做多媒体的人也不多,像HTC、LG、摩托罗拉、诺基亚是主要客户。到了2008年,进入安卓时期,不过当时安卓里面的引擎播放器内核非常弱,文件类型不能很好支持,性能也差,我们当时就赶上这个时期,帮助他们完善多媒体功能。"由此,命运的齿轮开始转动,自研框架,开发播放器引擎贯穿了金邦飞的整个职业生涯。

至今,多媒体的发展史大约有40年的时间,这40年里, 一代代技术人不断投身于多媒体事业的汪洋。其中,包括LiveVideoStack此次采访的金邦飞、此前采访过的张贤国、陆其明、赵军等深耕该领域的技术老兵。我们以此持续关注多媒体技术标杆的时代故事。

透过这些人物群体,每个人都有其个性下的共性,也保留着时代的痕迹------并非每个带着光环登场的技术老兵都最终成功,甚至其中遗憾更多,但他们的成长轨迹才是属于多媒体圈子故事中最迷人的部分

以下是金邦飞的讲述:

A. 做事情做到极致
如果把自己的人生当作一款产品去开发和设计

回忆我的职业生涯,其实一直专注在多媒体领域。

我最初其实做过一段时间的管理,此前做CTO的时候带过一百来号人,但后来发现,还是单纯做技术更开心

说起我的读书经历,我大学学的并不是计算机,是机械设计,但是大部分时间放在了自学计算机上。大概1998年左右的时候,我正式进入到计算机行业。我是从2000年开始进入多媒体领域,当时去了敏递软件,负责DVD/VCD工具开发,也是在这里认识的陆其明。

图为金邦飞和陆其明出品的《Direct show》

随后2005年,我又跳到了视龙担任CTO,负责公司研发部门,在当时的WinMobile时期,HTC是公司的最大客户。到了2008年,随着安卓自身的播放器越来越完善,公司的业务转向和内容提供商合作,期间用过DirectShow,基于OMX开放播放器,后来自研框架,开发播放器引擎。

2016年,我跳到了七牛云担任技术专家,本职工作依然是开发视频播放器SDK,印象深刻,DAU最高的时候有2亿。2019年,我又来到了B站,也是负责开发视频播放器SDK,在后来开始负责开发视频编辑器引擎,底层的数据结构、素材管理、解码、渲染等都需要非常熟悉FFmpeg、以及各个显卡的硬件解码、编码、渲染。后来,产品必剪PC端已经上线,性能和功能十分接近剪映,但又保有B站的特色。

因为合同到期,今年四月,我选择了离开B站。但总结过去这些年的工作经历,我始终秉承"把产品做到极致"的信念带入到每一份工作当中。

出于一直以来对写技术代码的兴趣爱好,我开始自己写了一套视频编辑软件的demo,也就是现在的咔嚓剪辑。当然,也是认为视频编辑器工具有很好的发展前景。

我对于做技术的价值观念是,如果在当下竞争这么激烈的市场,产品做不到NO.1,那其实就会思考是否真的有意义。我对于技术的高要求态度一直如此,对于咔嚓剪辑也是如此。

如果把我的人生当作一款产品设计和研发的话,我其实认为自我设计和人生设计大同小异,产品的生命周期如同个人的成长发展周期一样,不同阶段需要不同的设计和调整。

自己还是小白的时候,疯狂汲取营养是第一要务;长身体的时候,抓住一切机会让自己学习和成长;羽翼渐丰之时,适当对外联系可以扩展自己的社交圈与资源层;功名成就之际,是否有第二增长点吸引着你继续前进。

像打磨产品一样打磨自己,不断优化和迭代,让自己的人生从1.0升级到2.0。

在我看来,人生做的最成功和最有意义的事情两者并不能画上等号,成功与职业、物质财富会挂钩,能对自己的生活质量有所改善,但是意义层面,更多的是精神上面的满足和慰藉。

做咔嚓剪辑是我认为最有意义的事情,这款产品能帮助一些群体解决某类问题,这让我从心里上获得成就感。

当然,做咔嚓剪辑之前的二十几年公司打工经历,确实让自己先有了生活保障,才能去做自己想做的事情。

B. 一款不卷商业不卷投资的产品
没有很渴望成功

我从来没有将自己定义为一个创业者。

正是出于个人兴趣爱好来做咔嚓剪辑,索性我也没有成立公司,从设计到研发亲力亲为,一个人搞定了。很坦白的说,我现在没有收入来源,毕竟咔嚓剪辑这款产品还处于打磨阶段,还在继续完善。不过基于过去工作经验积攒下来的收入,我还不用有太多物质层面的担心。

不卷商业,不卷投资,也没有办公室,我从来没有将自己定义为一个创业者,我只是基于自己的爱好驱动,在做自己感兴趣的技术。从内心出发,我做咔嚓剪辑的确不是抱着功利的心态去做的,也没有说很渴望成功。

50多岁,能All in做自己想做的东西,已经知足。

所以过去几个月,我的确没有思考过该如何运营推广咔嚓剪辑这款产品,这也是目前遇到的最大困难。至于是否扩充人手从工作室开始做起,我想未来会有所计划,到时,我来主要负责技术,搭建起市场、产品等部门,大家一起来把这款产品做好,我想也不错。

如果说研发咔嚓剪辑的灵感源动力,那可能是和很多朋友吃饭聊出来的,也有很多次,早上五点钟醒来,脑子突然闪过特别好的一个产品功能,立马就用代码把它实现了。可能是突然想到一个可以极大提升咔嚓性能的方法,也有可能是突然想到一个新的产品模块功能。

在回答你这个问题之前,我对于人生目标和产品目标感觉没有太大野心。年轻的时候钱是第一位,在后来,自己心态也发生改变,到了这个年龄,我的人生目标就是身体健康,生活开心。产品目标了话,则希望咔嚓剪辑能被越来越多人看见,被使用。

目前咔嚓剪辑是免费提供给C端用户的,未来我希望能够根据用户的不断反馈,进而开发出更多新的功能和迭代升级。能够吸引到更多B端企业的眼光,给这类群体提供SDK开发能力,来完善他们的产业链,再从B端客户得以实现产品的盈利。

目前B端企业已经包含国内耳熟能详的TMT巨头、初创的直播、AIGC公司,他们底层也是需要一个视频编辑的引擎在里面,他们来产生草稿,我可以帮他修改草稿

把底层的技术服务于这些企业,确实是接下来可以实现商业化的手段。

的确,目前企业自己做SDK的难度还是比较大的,这背后牵扯到物力、人力的投入,如果说某家互联网公司去开发SDK。鉴于我过去的实践案例。没有几千万、半年至一年的实践,实际很难做出一个视频编辑引擎。

但换成我自己去做,可能只需要花费几十万、一个月的时间就可以做出一套SDK,并且对于一些初创公司来说,也不太可能花如此高昂的成本去自己开发。

C. 有剪映在了,为什么还要做咔嚓?
不和剪映直接抗衡

我被大家问过最多的一个问题:国内已经有剪映视频剪辑软件的存在了,你为什么还要做咔嚓?

我的回答很统一,到现在还没变:咔嚓剪辑不跟剪映直接抗衡,和剪映只是一个补充。剪映没有开发出来的,咔嚓剪辑就去要开发它。

当然,剪映毕竟是上千人的团队共同开发而成,这点我确实无法直面竞争。但其他差异化方面,咔嚓剪辑可以在十几年前的老电脑上面跑起来,产品运行速度对电脑性能依赖度很低;另外,咔嚓剪辑的流畅度方面,我也觉得不输剪映,这是用户的真实反馈。

在产品模块的实际使用中,用户做视频剪辑的时候会翻来覆去移动自己想要的那一振,咔嚓剪辑可以做到一秒钟拉动十几来帧的画面,这点我觉得是要比剪映做的好的地方。

不可否认,个人和企业不同场景之下做出的产品天差地别,企业里面几百个人共同推动产品的落地,但只要涉及一个内容上的修改,流程则会受到很大影响,变慢或者停滞不前;但如果是个人开发者,就像我,当一个idea突然灵光乍现,那就直接改完事了,所以我的有些优化就可以做的更好。

我前几天刚提到的,因为产品的UI框架是我自己写的,完美结合底层引擎,所以关键帧之间的白线会紧紧跟随鼠标移动而移动。但据我所知,剪映的关键帧已经向左或者向右拉出去好多,那根白线才会慢慢跟过来,可能会对用户体验打些折扣。

不过实现这个目标也挺难,前提是必须自研一套UI框架,但如果是使用市面上开源的播放器框架,是很难做得到的,这是做编辑器一大技术难点。

如果让我再重新设计开发咔嚓剪辑,或者任意一种产品的话,我会认为重新评估用户需求是整个流程中最重要的阶段。

因为在前期开发时,我踩过"自嗨"的坑,闭门造车开发出了一些交互功能,但实际上用户并不需要,反而觉得繁琐。即便我自己认为这款产品很酷炫,但背离了用户的真实需求。所以假设重做,第一步肯定会是了解目前用户最想要的需求有哪些,然后开发时来反推这些需求,重新设计这个架构。

让我想想我走偏路的实际例子。之前我写了一个视频轨道变速功能的代码,觉得很酷,可以直接拉出来非常直观,甚至我还吐槽其他剪辑产品在这方面没有我做的好。但后来发现,基本没有用户在视频轨道上去用这个变速功能,一是这功能在模块里藏的比较深,需要开关打开才可以,二是用户不习惯,还是认为像剪映那样的习惯。

的确,曲线变速的精确到每一帧有多长时间,对于用户来说没有什么必要,用户只是希望简单易用的效果,所以,我最后还是加了类似剪映这样的交互模式,把这个变速功能就隐藏起来了。

毕竟,咔嚓剪辑存在的意义是要解决用户的痛点,这是我做产品的核心理念。

D. 谈谈愿景与未来
浏览器直接当作视频编辑器 多媒体的前世、今生、未来

针对目前客户端播放数据量越来越大,我写了一个浏览器版本的视频编辑器,意思是浏览器可以直接被当作视频编辑器,免去用户安装,打开浏览器就可以直接进行视频编辑。而且,现在电脑上安装的软件越来越少了,好像只剩下了浏览器。因为浏览器能够完成的事情越来越多,有它就够了。 另外现在网上下载的软件不安全,可能会中毒。视频编辑器作为一个重度使用工具,用户对性能,流畅度要求很高,目前很少有纯前端的网页版视频编辑器。所有的云剪辑都是先上传视频文件,后端转码后(分辨率变小)再编辑。上传耗时,担心隐私,视频模糊等,用户体验很差。咔嚓的界面和内核都是跨平台的,网页版本只是重新编译而已。所以和本地安装软件差不多。**不需要上传视频,功能和本地的一模一样。**这样用户只要打开网页就可以和本地软件一样的使用体验。

视频编辑器新的玩法我认为还有很多,基于现在火热的AIGC、元宇宙里的触感,可以作为特效功能,加到视频编辑器里。这样,内容创作者在创造视频的时候,就会生成有触感的视频,未来玩法还有很多,比如视频素材支持嗅觉、触觉,都有可能,不仅是眼睛,涉及到人的鼻子、嘴巴、皮肤等感官的功能体验都有可能。

虽然咔嚓剪辑现在还很小,但我对做剪辑产品的愿景还是很宏大的,你看,这么多年过来了。所谓的AI、3D还远未到我们认为成熟的水平,3D可能到了全息才真正成为3D。不管怎样,人对于体验的追求是无穷无尽的追求,大有可为。

人接收信息主要来自于眼睛,耳朵,也就是视频,音频。可以说有人就有多媒体了。很长很长一段时间,多媒体来自于现实空间(比如戏剧表演)。随着技术的发展,后来有了广播,电视。后来就是音视频文件,再后来就是流媒体。以后可能全息投影,再现现实场景。多媒体不管怎么发展,目的一直没有变,让人的接收信息更清晰,更舒服,更真实。

聊到最后,一个惊喜的得知是------金邦飞在年轻时,有一段"不为人知"的"创业"经历。

"2000年的时候,还没有智能机,只有彩信,不过得要两毛钱,我当时开发了一个软件------疯狂短信,只需要一毛钱就可以把歌曲、图片发送出去。不过,可惜还是失败了。当时我就是个纯粹的技术男,脑子里思考的是要发送的图片、铃声哪里来,索性我就提供一个绘图工具软件,甚至我还研究过五线谱。但我当时忘了一件重要的事,有多少用户真的懂五线谱、还会用工具画出图片来。虽然这个想法很好,一毛钱就实现了,但缺陷在于没有了解用户。我当时还开发过一个背单词软件,确实做了很多东西,到最后都失败了,那个时候我28岁。"

"疯狂短信本来有机会做出来的,技术都搞清楚了,可是不懂推广,错过了一次机会,后来心有不甘,当然过去很多年,现在肯定释怀了。"金邦飞笑了笑说。

过往不恋,纵情向前。

Hi,LVS最近重新对公号原创内容栏目做了思考,未来我们希望通过此栏目发现多媒体生态当下的新变化,痛点以及如何推动行业持续繁荣发展,将会产出更多原创深度报道文章。

如果你对多媒体圈子好奇,或战斗在行业发展前线,愿意分享自己的洞察和思考,尤其是有选题线索来爆料、寻求报道,欢迎联络笔者。WeChat:XinWell0709 Email:aris.wang@livevideostack.com

▲点击"阅读原文"▲

跳转LiveVideoStackCon 2023 深圳站 官网,了解更多信息

相关推荐
uzong15 小时前
软件架构指南 Software Architecture Guide
后端
又是忙碌的一天15 小时前
SpringBoot 创建及登录、拦截器
java·spring boot·后端
勇哥java实战分享16 小时前
短信平台 Pro 版本 ,比开源版本更强大
后端
学历真的很重要16 小时前
LangChain V1.0 Context Engineering(上下文工程)详细指南
人工智能·后端·学习·语言模型·面试·职场和发展·langchain
计算机毕设VX:Fegn089516 小时前
计算机毕业设计|基于springboot + vue二手家电管理系统(源码+数据库+文档)
vue.js·spring boot·后端·课程设计
上进小菜猪16 小时前
基于 YOLOv8 的智能杂草检测识别实战 [目标检测完整源码]
后端
韩师傅17 小时前
前端开发消亡史:AI也无法掩盖没有设计创造力的真相
前端·人工智能·后端
栈与堆18 小时前
LeetCode-1-两数之和
java·数据结构·后端·python·算法·leetcode·rust
superman超哥18 小时前
双端迭代器(DoubleEndedIterator):Rust双向遍历的优雅实现
开发语言·后端·rust·双端迭代器·rust双向遍历
1二山似18 小时前
crmeb多商户启动swoole时报‘加密文件丢失’
后端·swoole