关注公众号回复1
获取一线、总监、高管《管理秘籍》
这两天有老板陆续在咨询:到底应该如何基于DeepSeek开展AI项目?
抛开一些偏细节、偏敏感的付费内容,其实有一套方法论倒是可以分享。
第一,也是最重要一点:目标是什么?
AI产品的目标是什么?
据群里的粉丝反馈,开工第一天几乎所有的老板都在讨论AI、讨论DeepSeek。
并有多个CEO表示:后续业务开展,全面拥抱AI,并期待实现行业应用的领先!
说实话,这个味道很熟悉,基本又回到了两年前ChatGPT刚诞生的情况,很多公司出于焦虑 或者想要抢占行业注意力 ,都做好了准备 All In AI,但这里我要泼一点冷水 :你的急迫可能导致巨大损失!
一、DeepSeek并没有领先于GPT
首先,所有人必须认识到的一个事实是:虽然DeepSeek非常优秀,但他并没有领先于GPT!
换句话说,之前各位可以根据GPT的API调用完成的功能,如果基座模型换成DeepSeek后,他的表现可能还会差点。
DeepSeek真正的价值在于两点:
第一、合规性,他是国内的开源模型,并且能力优秀,这可以为医疗、金融等相对敏感的行业松绑,他们有更优的基座模型选择了。
而由于基座模型的进化可能带来的价值是:实现路径的大幅成本降低!这可以节约不少钱。
第二、可以私有化部署,并且训练的成本极低!
常规的AI产品基础技术架构事实上只有两条:API、API+知识图谱。
之前多数人认为预训练+微调是错误的技术选择,其核心是高昂的成本。
现在基于DeepSeek的微调貌似成本也不高,这会导致新的技术路径产生,而API、API+知识图谱、基于微调的AI产品三者之间差异是什么,到底如何选择,很多人是模糊的。
二、可以兴奋但别焦虑
老板们逐渐相信AI会重塑所有,于是他们会想用AI的方式将公司产品重塑一次。
这会引发第一轮的焦虑,因为没有可以抄的对象,多数人是不知道怎么做的!所以多公司现在是既迷茫又兴奋:
- 兴奋的点在于,行业洗牌的机会来了,抓住了就是下一个头部;
- 迷茫的点在于,那是真的不知道该怎么做;
首先是AI对于自己的产品意义是什么,比如是产品用上AI的能力,还是用AI能力去重塑产品,不清楚;
其次是AI能力的边界在哪里,比如数据对于大模型幻觉的意义是什么,是否要投入大量资源去整理数据,不敢赌;
然后是具体的技术路径是什么,比如是API还是微调,不明白;
其实这里有个判断依据:**在DeepSeek出现前,GPT的表现已经足够优秀,**如果你们公司在之前没出太多创新,今年也很难马上做出什么。
这里的原因是AI产品的非对称性。
三、非对称性
无论是GPT还是DeepSeek,他们都太强大了,基于他们做出来的AI产品容易让我们产生一个幻觉:我们公司的AI太强大了!
醒醒吧,这是幻觉!AI很容易产出一个demo,但很难得到一个应用!
大白话是:业务判断AI产品能不能用的标志是能不能完全接管业务,如果不能就是玩具!
对于AI应用,你可以用一周时间完成一个demo;但半年后,实现的产品效果依旧不能超越这个demo!
这里非对称性也就出来了,花费10%的资源可以得到一个70分的demo;想要将70分推到90分,可能你需要1000%的资源!
**入门简单,精通难!**大模型是很容易造成老板/产品/技术错误判断的存在,如果轻易承诺,肯定会坑了自己。
所以,想要AI在应用上表现出现,必须要有耐性!
四、耐心很重要
做AI项目,耐心是很很重要的,简单来说:你认为Prompt提示词困难吗?
Prompt不是有手就行嘛,谁会中文还不会写点提示词,但Prompt其实很难:
- 首先,写出稳定输出的Prompt很难;
- 其次,在不同场景中Prompt要稳定输出更难;
- 最后,要与优质数据配合并且要稳定输出的Prompt很难;
这对我们的启示是什么呢?这对我们的要求是有耐心、有定力,不要因为今天产品表现得好而过分开心,也不要因为明天产品表现的弱智而过分焦虑。
保持平常心,去面对,去调整,因为提示词调优只是AI产品过程中最简单的部分,寻找正确的路径,试验正确的路径,才是其中的难点...
对于一般公司,**AI项目的成败取决于技术团队工程能力的强弱,**以及对相关领域的认知!
所以好的程序员跨界去深入学习某行业知识,再转做产品经理会变得十分吃香。
其次,在基座模型能力上来后,大家都是在70分水准的基线上竞争,如何通过自身的优势快速达到90分会成为占领高地的关键。
不急不躁
有了以上认知后,我们会达成一个共识:我们离成熟的AI应用诞生还有一段时间(1-2年),而就算已经有爆款产品出现,也不要慌张,产品层面的进步是最容易赶上的。他不会比DeepSeek比肩GPT更难!
所以,我们最应该想清楚两个问题:
- 目标是什么;
- 目标对AI能力的要求是什么;
如果GPT的能力值是100分(大学生水平),也许你的产品其实只需要70分(初中生水平)就够了呢?
在目标清晰后,就应该坚定的执行在这个窗口期(1-2年)将配套设施打磨好 ,而不是急于推出产品去吸引注意力。
在这个基础上,我们再来探讨如何做技术选型。
技术选型
出于敏感性考虑,这块我会去除大量细节,请各位海涵
基础技术选型
最基础的技术选择无非三块,提示词、RAG 和微调,其优劣如表格所述:
对比维度 | 提示词 | RAG | 微调 |
---|---|---|---|
定义 | 通过优化输入文本,引导现有模型生成预期结果 | 将外部检索系统与模型结合,增强生成内容的准确性 | 使用特定领域数据对模型进行二次训练,提高定制化能力 |
开发成本 | 极低,无需模型修改 | 中等,需要搭建检索和存储系统 | 高,需要大量优质数据和计算资源 |
技术复杂度 | 低 | 中等,需整合检索系统和模型 | 高,涉及数据清洗、标注和训练流程 |
适用场景 | 灵活、轻量级需求,如客服对话、创意文案 | 需要实时更新或动态领域知识,如医疗、法律咨询 | 高精度、高专业性需求,如金融分析、企业知识问答 |
优点 | 快速、无成本、简单易用 | 知识扩展能力强,适合知识动态变化的场景 | 效果精确,满足专业化和领域化需求 |
局限性 | 受限于基础模型能力,难以满足高专业性或精度需求 | 对检索系统和知识库质量依赖较大 | 开发周期长,成本高,不适合快速变化的需求 |
响应速度 | 快 | 较快,但受检索系统效率影响 | 较慢,需事先完成模型训练 |
扩展性 | 高,直接基于现有模型 | 中等,依赖知识库更新与维护 | 低,需重新训练模型 |
典型应用 | 客服自动回复、生成文案、创意触发 | 医疗问答、法律建议、实时行业动态 | 行业专用AI工具、精准预测分析 |
产品实现路径
PS,这里涉及敏感信息,我做简要说明即可
其实,基础技术选型问题不值一提,他们既可以混用又可以不停转换,我们实际做开发过程中大概率三条路径都会用,所以这里的重点不是基础技术的选择 而是产品实现路径的思考。
这里的核心为:模型只是一个API调用工具,工程实现是核心。
实际实现时候需要考虑几个点:
- 单纯基于大模型当前AI产品能达到的极限是什么,问题是什么;
- 基于AI产品的行业KnowHow是什么;
- 要打破AI产品的极限,需要的优质数据(数据+工程规则)是什么;
- 如何用工程的能力组织这套AI架构,实现数据、工程自迭代,最终形成飞轮系统;
具体来说:大模型的工作模式是输入输出:输入 -> Prompt -> 输出。
所有的工程能力全部会体现在这个Prompt ,所谓Prompt就是我们对规则理解的文字化。
比如要做的是AI律师,这里的Prompt就是某著名律师这10多年的经验。
这个经验是理解用户问什么,然后给予他正确的法律反馈 ,如何给予用户正确的反馈,这就是该合伙人需要给技术工程的优质数据,也就是AI律师需要的输入输出规则。
而这里的**"优质数据又是如何形成的呢?"** 答案是基于10几年律师问答的总结整理,他需要深刻理解关于 输入输出五个部分:
- 大量输入(输入材料的相关性);
- 输入正确(输入材料的正确性)
- 输入可理解(输入材料的多样性,泛化相关思考)
- 输出假设和及时反馈(强化学习的关键)
- 检索强化(如果有知识图谱,可能会用到的)
但大模型是一个新生事物,他所需要的优质数据/规则数据 在以往时代大概率没有系统性的、完整性的存在。
因此,很多AI产品的推出都会有一个优质数据准备的阶段,在这个时间窗口下,对所有人都是一个机会,所以各位老板真的不用急。
只要将**"优质数据"(数据+规则)**是什么搞清楚,产品的实现路径自然而然就出来了。
而后的问题就是工程侧如何将这一切循环优化起来,形成一套飞轮系统,一旦飞轮系统形成,跟其他公司的差距就拉开了。
飞轮系统
就个人认知,想要延伸基座模型的能力只有两个做法:
第一是构建一套自己的行业知识库(知识图谱)。每次输入前将相关信息带上,如图所示:
![](https://files.mdnice.com/user/25507/fb646169-972c-4bab-be14-66b5fc40f73d.png)
第二是基于"行业知识库"形成多套微调数据,去训练模型。每次输入输出会变成这样:
![](https://files.mdnice.com/user/25507/9b55eaf4-e0b8-480d-afb3-659db08810d6.png)
第一套架构复杂起来会形成一个庞大的知识图谱、第二套其实就是MoE架构的雏形。
两套系统看似不同,其核心其实类似,都包括两点:
- 路由规则的优化;
- 专家模型如何优化;
所以在基础架构搭建完成后,真正困难的是工程控制:如何用海量优质增量数据去优化模型本身,这就是所谓飞轮系统。
其实这里的核心是:优质数据哪里来?,他包括:
- 初期数据哪里来?
- 中期哪里来?
- 后期哪里来?
初中期的数据与规则
首先,第一批少量 优质数据的整理多半需要跨领域融合,比如律师+技术。
只不过,如果以律师+程序员的方式要产出数据成本是很高的,因为好的律师会很高傲;他很难配合程序员的工作,而程序员要达到律师行业的KnowHow是需要大量的时间的。
所以,程序员或者产品必须主动上前,软磨硬泡把核心规则与样例数据搞到手,而后必须有其他手段去处理这种矛盾,这里的核心有二:
- 程序员群体必须有基本KnowHow;
- 对行业专家(律师、医生)的使用方式要变;
KnowHow在这个合作模式喜爱要分为三个部分:
- 第一是知道怎么做------程序员必须会;
- 第二是知道找谁做------遇到规则问题程序员需求助领域专家;
- 第三是知道好不好,这里的核心是评价------让领域专家对应用打分;
经过一轮磨合,这对于程序员是比较轻松的,最终形成的合作模式是:AI产出数据,行业专家评价效果,根据效果优化数据,最终形成数据集+规则。
数据反馈回路
AI应用的优化依赖于数据反馈回路,即通过建立一个自我增强的飞轮系统,实现持续的自我优化。
以DeepSeek R1为例,初期通过少量专家标注数据启动,但关键在于后续的数据再生和强化学习。
机器通过自我探索和反复调整,逐步减少偏差,提升准确性,形成一个有效的反馈回路。
这种方式与传统监督学习不同,后者依赖人工标注数据的直接关系,而强化学习通过自主学习和数据再生,不断调整策略。
成功的飞轮系统不仅依赖专家数据,还需大量高质量数据的自动生成和修正。
技术与行业专家的合作,是推动飞轮系统有效运转的关键。然而,数据偏差和结果偏离可能是挑战,需要依赖飞轮系统的自我校正来精准化数据和反馈。
AI应用的飞轮系统需要耐心,因为优化过程是渐进的。关键在于建立持续的反馈机制和自我修正能力,推动数据的有效利用,进而提升系统的长期表现。
结语
今天,我们对如何开展AI项目的思路有做了一些简单探讨。
从明确目标出发,选择适合的技术路径,到构建AI产品的飞轮系统,每个环节都需要不停试错。
AI的应用和技术实现往往伴随挑战,尤其是在数据准备和工程实现方面。
构建飞轮系统、优化数据反馈回路,以及与行业专家的深度合作,这些都不是短期内能够轻松解决的问题。
虽然初期可能会面临一定的技术复杂性和高昂的成本,但这些投入和耐心,最终将为企业带来可持续的竞争优势。
文章中提到的技术选型和路径选择,可能给一些读者带来些许迷惑。
我们在此强调,AI项目并不是一蹴而就的,选择合适的技术和实现路径,取决于具体的业务需求和行业特点。
对于没有经验的企业来说,首先要清晰定义目标,再根据目标选择合适的技术,而不是一味追求"最先进"的解决方案。对技术路径的选择应当具备灵活性,随着项目进展及时调整。
总之,AI技术的应用和开发不仅需要深厚的技术储备,更需要扎实的行业知识和耐心。企业应理性看待AI应用,避免过度焦虑,逐步推动项目实施,才能确保在未来的竞争中占据有利位置。
PS:这是本周最后一篇AI相关文章,要开始发管理课程了,不然有点太不务正业了...
![](https://files.mdnice.com/user/25507/dfbdbae0-7236-421c-bbb0-badae3db3d76.png)