>> 大家好,我是在问平台的技术负责人。在问是一个模型聚合平台,主要是帮助国内用户体验和使用全世界最先进的大模型技术的公益性质项目。由清华大学许展玮博士发起。
缘起在问AI
作为一个大模型平台产品的技术负责人,使用AI编程有得天独厚的优势,基于在问平台内部团队使用各种大模型免费,同时紧跟业界最前沿的技术动态,所以在绝大多数AI相关技术的接触和使用上都是领先的。
早在copilot出现的时候,我们内部就开始各种尝试。但是那个时候,Ai编程其实并不是很优秀,只能起到一个代码补全的作用和CURD这种大量模版代码的开发场景。很快Claude Code,XCode,Cursor等等优秀海外大模型出现,Ai编程的能力得到了快速的提升。可以开发更多有趣的功能。
当然我们国内的大模型也并不示弱,Qwen3-code,Glm-code都是非常优秀的编程模型,与海外大模型差距也并不是特别明显。
AI编程的本质
Ai编程,也就是Vide Coding。其实本质就是结对编程,一个人负责思考,一个人负责写,而现在编程大模型的出现,Ai代替了写的那个角色。
这里需要注意一下,Ai只是帮你写代码,并不是帮你思考如何写代码。因此这里在Ai编程上会有两个极端人群出现
- 极度信任Ai编程的人,认为Ai可以写出绝大多数代码,满足自己的业务需要。
- 只是拿Ai当作助手,认为Ai目前还无法满足自己的日常工作需要,Ai给出的代码需要自己反复修改才能满足日常开发需要。
为什么会出现这种情况?其实理由很简单,Ai的能力是由两个因素决定的"知识"和"思考"。"知识"就是用于训练大模型的底层数据,底层数据直接决定大模型能处理什么样的问题。"思考"就是算法,算法决定大模型输出的内容质量如何。但是"思考"被局限于"知识"。Ai没办法基于没有的知识去"思考"。因此我们需要使用上下文,Rag,微调来解决这类问题。但是最终其实效果有限。
因此对于绝大多数简单的编程场景,大模型优势明显,比如CURD这种大量模版代码的场景。尤其是对于后端开发效率提升明显。
但是对于计算密集型,流量密集型,技术垂直专精深度要求高的场景就显得力不从心。为什么?因为这些模型训练厂商很难获取到对应的数据用于训练。其次,这种技术方案往往都是各家的核心技术,基本上不会轻易对外曝光技术细节,其次不同的业务场景具体的技术实施细节也差距很大,哪怕同样是OTA或者外卖业务,整体技术架构方向是相近的,但是具体落地细节则完全不同。所以,基于"知识"和"思考"的大模型在没有"知识"储备的情况下就很难满足这类场景,因为大模型无法"做决策"这是Ai非常致命的缺陷。
AI编程很强大,但是需要理性
Ai编程,可以提供绝大多数功能的代码方案,基本上可以涵盖业界90%左右的代码开发工作。那么在Ai加持下,对于一个善于使用Ai编程的程序员来说,可以借助Ai从一个P4工程师快速完成到P7工程师的蜕变。这对于小微企业来说无疑是一个非常好的事情。但是这并不等于你可以使用更少的人来开发更多的功能。
做过技术团队管理的人,尤其是从底层写代码十几年并做过成本核算的人,应该很清楚,在软件开发过程中,最大的成本是人,但是并不是写代码。一个程序员大量的时间其实是消耗在沟通和理解需求上。正在写代码的成本只占总工作量的1/3 ~ 1/4.而Ai目前在很多团队解决的仅仅是这写代码的问题。所以,如果当你听到下属说使用Ai编程,开发效率提升了2,3倍的时候,需要理性看待。这并不意味着你可以把原来12个人的团队缩减到4~6个人。他只是帮你把一群P4,P5编码水平的人提升到P6,P7编码能力的水平。并不意味着你可以用更少的人做更多的事儿,反而,Ai使用水平不同的人,能做的事儿也完全不一样。所以目前阶段Ai完全还只是一个编程辅助工具。并不是能替代开发人员编程的"研发人员"。
因此,目前市面上不少小微公司看见业界对于AI编程的强大而开始对于自己团队内部的研发模式进行改革,大力推广AI编程,甚至在市场上开始寻找那些所谓有优秀使用Ai编程经验的人来帮助自己团队提升。但是正所谓"风浪越大,鱼越贵"。对于企业高管需要时刻搽亮眼睛。国内互联网每一次技术革命浪潮来临的时候,往往伴随着一大批浑水摸鱼的人。而很多公司,尤其创业起步阶段的公司,往往死于这种"折腾"的技术浪潮之下。而我自己就亲身经历了几次。所以,在自己没有搞清楚现象的本质之前,不要盲目的瞎折腾,适可而止,及时止损,找到适合自己团队的运作模式才是更重要的。
风险与收益并存
Ai很强大,他可以以极低的成本快速将技术团队的研发能力提高一个档次。但是同时,也面临很大的风险"安全"。
Ai编程的本质就是要不断的吸收新的编程场景和代码,不断迭代,不断训练推出更强大的版本,实现更强大的编程能力。
那么这些代码从何而来?Copilot可以通过github的内容来学习,Google可以通过内部允许的数据,部分搜索引擎的数据和外部的数据来训练。
那么就仅限于此么?答案显然不是的。当在问的创始人把他导师用一句话就实现的一个Vr的Demo给我看的时候,我陷入了沉思。
首先,这种算法即使对外公开,也是一些早被曲解的面目全非的论文,经过特殊处理的文献。而通过Ai完全生成是很难的。至少要经过几次调整和人工介入。
其次,短短20几个字就实现可以直接执行演示的代码。毫无疑问是有类似的技术方案被模型供应商拿到了。
那么这就引申出来一个问题:"风险"。
如果你的业务是一个机密性很高的方向,比如政府,国防,科研那么久不适合使用外部的编程模型。甚至一些需要建立自己的技术研发壁垒的技术驱动型产品,也需要在这里时刻注意。
当然你可以说我小题大做。但是,这是现实。
在问与Ai的实践
在问,作为一个一直与Ai息息相关的产品,无时无刻都在关注着Ai领域的最新动态,Ai编程也是一直在探索的事情,但是,由于我们资金有限,设施有限,作为一个公益型产品,所以我们只能在极其少的投入下解决问题,那么也就需要在技术的探索上寻找一个适合在问发展的新方向。
因此在Ai编程上我们的探索并不是那么特别美好,很多时候Ai带来的bug更多,带来很多不确定性,但是正如我前面说的,在CURD场景,Ai的表现非常好,尤其是一些低技术含量的外包项目,大量模版代码的场景,Ai是一个非常不错的选择,其次,技术边界,在一些验收标准不太高的场景:管理后台,我们完全使用Ai辅助编程,由一个人来完成整个管理后台的研发工作。甚至只会写Py和算法的工程师也可以接手很多前端开发工作。
所以Ai编程目前阶段,在一些低技术含量的编程场景,和验收标准比较低的场景,是非常好的手段。
而核心产品,对客端产品,因为质量,标准都非常高,并且需要具备一定的技术前瞻性,需要"向前思考"。提前预判业务发展。所以这些地方完全由Ai开发是不太行的通的。需要人去指挥Ai如何写代码。那么这个指挥,有的时候就不如自己亲手写了。但是更多时候,Ai确实是一个非常不错的帮手,但是对于效率提升方面,就不如前一个场景那么明显。
因此。Ai编程,更多是以辅助为主。但是从24年3月份开始。我们做了一个大胆的尝试,省略了产品经理,由AI担任。当Gemini出现以后,我们发现Gemini在产品思维方面往往比我们的产品经理更出色。因此在24年年初。我们就开始使用AI来代替产品经理,不光能快速形成产品方案,还可以快速生成产品原型。帮助我们快速完成产品定义。甚至,某些时候,产品原型经过一些改动可以直接上线功能。比如"在问足球社"就是一个完全由AI设计的产品,90%的功能由AI开发的产品,当然另外10%是我来告诉AI如何写还有运维部书的活。
本身在问是一个完全由爱驱动的产品,绝大多数团队成员是没有工资收入的,所以很难持久和占有大量时间在在问的工作上。但是在Ai的加持下,尤其是Gemini3-Pro的出现,让我们可以更加从容的面对一切。节约下大量的时间来陪伴家人。