DeepSeek太火,但老板们别慌,这里有份AI项目开展手册

关注公众号回复1

获取一线、总监、高管《管理秘籍》

这两天有老板陆续在咨询:到底应该如何基于DeepSeek开展AI项目?

抛开一些偏细节、偏敏感的付费内容,其实有一套方法论倒是可以分享。

第一,也是最重要一点:目标是什么?

AI产品的目标是什么?

据群里的粉丝反馈,开工第一天几乎所有的老板都在讨论AI、讨论DeepSeek

并有多个CEO表示:后续业务开展,全面拥抱AI,并期待实现行业应用的领先!

说实话,这个味道很熟悉,基本又回到了两年前ChatGPT刚诞生的情况,很多公司出于焦虑 或者想要抢占行业注意力 ,都做好了准备 All In AI,但这里我要泼一点冷水你的急迫可能导致巨大损失!

一、DeepSeek并没有领先于GPT

首先,所有人必须认识到的一个事实是:虽然DeepSeek非常优秀,但他并没有领先于GPT!

换句话说,之前各位可以根据GPT的API调用完成的功能,如果基座模型换成DeepSeek后,他的表现可能还会差点

DeepSeek真正的价值在于两点:

第一、合规性,他是国内的开源模型,并且能力优秀,这可以为医疗、金融等相对敏感的行业松绑,他们有更优的基座模型选择了。

而由于基座模型的进化可能带来的价值是:实现路径的大幅成本降低!这可以节约不少钱。

第二、可以私有化部署,并且训练的成本极低!

常规的AI产品基础技术架构事实上只有两条:API、API+知识图谱

之前多数人认为预训练+微调是错误的技术选择,其核心是高昂的成本

现在基于DeepSeek的微调貌似成本也不高,这会导致新的技术路径产生,而API、API+知识图谱、基于微调的AI产品三者之间差异是什么,到底如何选择,很多人是模糊的。

二、可以兴奋但别焦虑

老板们逐渐相信AI会重塑所有,于是他们会想用AI的方式将公司产品重塑一次。

这会引发第一轮的焦虑,因为没有可以抄的对象,多数人是不知道怎么做的!所以多公司现在是既迷茫又兴奋:

  1. 兴奋的点在于,行业洗牌的机会来了,抓住了就是下一个头部;
  2. 迷茫的点在于,那是真的不知道该怎么做;

首先是AI对于自己的产品意义是什么,比如是产品用上AI的能力,还是用AI能力去重塑产品,不清楚;

其次是AI能力的边界在哪里,比如数据对于大模型幻觉的意义是什么,是否要投入大量资源去整理数据,不敢赌;

然后是具体的技术路径是什么,比如是API还是微调,不明白;

其实这里有个判断依据:**在DeepSeek出现前,GPT的表现已经足够优秀,**如果你们公司在之前没出太多创新,今年也很难马上做出什么。

这里的原因是AI产品的非对称性。

三、非对称性

无论是GPT还是DeepSeek,他们都太强大了,基于他们做出来的AI产品容易让我们产生一个幻觉:我们公司的AI太强大了!

醒醒吧,这是幻觉!AI很容易产出一个demo,但很难得到一个应用!

大白话是:业务判断AI产品能不能用的标志是能不能完全接管业务,如果不能就是玩具!

对于AI应用,你可以用一周时间完成一个demo;但半年后,实现的产品效果依旧不能超越这个demo!

这里非对称性也就出来了,花费10%的资源可以得到一个70分的demo;想要将70分推到90分,可能你需要1000%的资源!

**入门简单,精通难!**大模型是很容易造成老板/产品/技术错误判断的存在,如果轻易承诺,肯定会坑了自己。

所以,想要AI在应用上表现出现,必须要有耐性!

四、耐心很重要

做AI项目,耐心是很很重要的,简单来说:你认为Prompt提示词困难吗?

Prompt不是有手就行嘛,谁会中文还不会写点提示词,但Prompt其实很难:

  1. 首先,写出稳定输出的Prompt很难;
  2. 其次,在不同场景中Prompt要稳定输出更难;
  3. 最后,要与优质数据配合并且要稳定输出的Prompt很难;

这对我们的启示是什么呢?这对我们的要求是有耐心、有定力,不要因为今天产品表现得好而过分开心,也不要因为明天产品表现的弱智而过分焦虑。

保持平常心,去面对,去调整,因为提示词调优只是AI产品过程中最简单的部分,寻找正确的路径,试验正确的路径,才是其中的难点...

对于一般公司,**AI项目的成败取决于技术团队工程能力的强弱,**以及对相关领域的认知!

所以好的程序员跨界去深入学习某行业知识,再转做产品经理会变得十分吃香。

其次,在基座模型能力上来后,大家都是在70分水准的基线上竞争,如何通过自身的优势快速达到90分会成为占领高地的关键。

不急不躁

有了以上认知后,我们会达成一个共识:我们离成熟的AI应用诞生还有一段时间(1-2年),而就算已经有爆款产品出现,也不要慌张,产品层面的进步是最容易赶上的。他不会比DeepSeek比肩GPT更难!

所以,我们最应该想清楚两个问题:

  1. 目标是什么
  2. 目标对AI能力的要求是什么

如果GPT的能力值是100分(大学生水平),也许你的产品其实只需要70分(初中生水平)就够了呢?

在目标清晰后,就应该坚定的执行在这个窗口期(1-2年)将配套设施打磨好 ,而不是急于推出产品去吸引注意力

在这个基础上,我们再来探讨如何做技术选型。

技术选型

出于敏感性考虑,这块我会去除大量细节,请各位海涵

基础技术选型

最基础的技术选择无非三块,提示词、RAG 和微调,其优劣如表格所述:

对比维度 提示词 RAG 微调
定义 通过优化输入文本,引导现有模型生成预期结果 将外部检索系统与模型结合,增强生成内容的准确性 使用特定领域数据对模型进行二次训练,提高定制化能力
开发成本 极低,无需模型修改 中等,需要搭建检索和存储系统 高,需要大量优质数据和计算资源
技术复杂度 中等,需整合检索系统和模型 高,涉及数据清洗、标注和训练流程
适用场景 灵活、轻量级需求,如客服对话、创意文案 需要实时更新或动态领域知识,如医疗、法律咨询 高精度、高专业性需求,如金融分析、企业知识问答
优点 快速、无成本、简单易用 知识扩展能力强,适合知识动态变化的场景 效果精确,满足专业化和领域化需求
局限性 受限于基础模型能力,难以满足高专业性或精度需求 对检索系统和知识库质量依赖较大 开发周期长,成本高,不适合快速变化的需求
响应速度 较快,但受检索系统效率影响 较慢,需事先完成模型训练
扩展性 高,直接基于现有模型 中等,依赖知识库更新与维护 低,需重新训练模型
典型应用 客服自动回复、生成文案、创意触发 医疗问答、法律建议、实时行业动态 行业专用AI工具、精准预测分析

产品实现路径

PS,这里涉及敏感信息,我做简要说明即可

其实,基础技术选型问题不值一提,他们既可以混用又可以不停转换,我们实际做开发过程中大概率三条路径都会用,所以这里的重点不是基础技术的选择 而是产品实现路径的思考

这里的核心为:模型只是一个API调用工具,工程实现是核心

实际实现时候需要考虑几个点:

  1. 单纯基于大模型当前AI产品能达到的极限是什么,问题是什么;
  2. 基于AI产品的行业KnowHow是什么;
  3. 要打破AI产品的极限,需要的优质数据(数据+工程规则)是什么;
  4. 如何用工程的能力组织这套AI架构,实现数据、工程自迭代,最终形成飞轮系统;

具体来说:大模型的工作模式是输入输出:输入 -> Prompt -> 输出

所有的工程能力全部会体现在这个Prompt ,所谓Prompt就是我们对规则理解的文字化

比如要做的是AI律师,这里的Prompt就是某著名律师这10多年的经验。

这个经验是理解用户问什么,然后给予他正确的法律反馈 ,如何给予用户正确的反馈,这就是该合伙人需要给技术工程的优质数据,也就是AI律师需要的输入输出规则

而这里的**"优质数据又是如何形成的呢?"** 答案是基于10几年律师问答的总结整理,他需要深刻理解关于 输入输出五个部分

  1. 大量输入(输入材料的相关性);
  2. 输入正确(输入材料的正确性)
  3. 输入可理解(输入材料的多样性,泛化相关思考)
  4. 输出假设和及时反馈(强化学习的关键)
  5. 检索强化(如果有知识图谱,可能会用到的)

但大模型是一个新生事物,他所需要的优质数据/规则数据 在以往时代大概率没有系统性的、完整性的存在

因此,很多AI产品的推出都会有一个优质数据准备的阶段,在这个时间窗口下,对所有人都是一个机会,所以各位老板真的不用急。

只要将**"优质数据"(数据+规则)**是什么搞清楚,产品的实现路径自然而然就出来了。

而后的问题就是工程侧如何将这一切循环优化起来,形成一套飞轮系统,一旦飞轮系统形成,跟其他公司的差距就拉开了。

飞轮系统

就个人认知,想要延伸基座模型的能力只有两个做法:

第一是构建一套自己的行业知识库(知识图谱)。每次输入前将相关信息带上,如图所示:

第二是基于"行业知识库"形成多套微调数据,去训练模型。每次输入输出会变成这样:

第一套架构复杂起来会形成一个庞大的知识图谱、第二套其实就是MoE架构的雏形。

两套系统看似不同,其核心其实类似,都包括两点:

  1. 路由规则的优化
  2. 专家模型如何优化

所以在基础架构搭建完成后,真正困难的是工程控制:如何用海量优质增量数据去优化模型本身,这就是所谓飞轮系统

其实这里的核心是:优质数据哪里来?,他包括:

  1. 初期数据哪里来?
  2. 中期哪里来?
  3. 后期哪里来?

初中期的数据与规则

首先,第一批少量 优质数据的整理多半需要跨领域融合,比如律师+技术。

只不过,如果以律师+程序员的方式要产出数据成本是很高的,因为好的律师会很高傲;他很难配合程序员的工作,而程序员要达到律师行业的KnowHow是需要大量的时间的。

所以,程序员或者产品必须主动上前,软磨硬泡把核心规则与样例数据搞到手,而后必须有其他手段去处理这种矛盾,这里的核心有二:

  1. 程序员群体必须有基本KnowHow;
  2. 对行业专家(律师、医生)的使用方式要变;

KnowHow在这个合作模式喜爱要分为三个部分:

  1. 第一是知道怎么做------程序员必须会;
  2. 第二是知道找谁做------遇到规则问题程序员需求助领域专家;
  3. 第三是知道好不好,这里的核心是评价------让领域专家对应用打分;

经过一轮磨合,这对于程序员是比较轻松的,最终形成的合作模式是:AI产出数据,行业专家评价效果,根据效果优化数据,最终形成数据集+规则

数据反馈回路

AI应用的优化依赖于数据反馈回路,即通过建立一个自我增强的飞轮系统,实现持续的自我优化。

以DeepSeek R1为例,初期通过少量专家标注数据启动,但关键在于后续的数据再生和强化学习。

机器通过自我探索和反复调整,逐步减少偏差,提升准确性,形成一个有效的反馈回路。

这种方式与传统监督学习不同,后者依赖人工标注数据的直接关系,而强化学习通过自主学习和数据再生,不断调整策略。

成功的飞轮系统不仅依赖专家数据,还需大量高质量数据的自动生成和修正。

技术与行业专家的合作,是推动飞轮系统有效运转的关键。然而,数据偏差和结果偏离可能是挑战,需要依赖飞轮系统的自我校正来精准化数据和反馈。

AI应用的飞轮系统需要耐心,因为优化过程是渐进的。关键在于建立持续的反馈机制和自我修正能力,推动数据的有效利用,进而提升系统的长期表现。

结语

今天,我们对如何开展AI项目的思路有做了一些简单探讨。

从明确目标出发,选择适合的技术路径,到构建AI产品的飞轮系统,每个环节都需要不停试错。

AI的应用和技术实现往往伴随挑战,尤其是在数据准备和工程实现方面。

构建飞轮系统、优化数据反馈回路,以及与行业专家的深度合作,这些都不是短期内能够轻松解决的问题。

虽然初期可能会面临一定的技术复杂性和高昂的成本,但这些投入和耐心,最终将为企业带来可持续的竞争优势。

文章中提到的技术选型和路径选择,可能给一些读者带来些许迷惑。

我们在此强调,AI项目并不是一蹴而就的,选择合适的技术和实现路径,取决于具体的业务需求和行业特点。

对于没有经验的企业来说,首先要清晰定义目标,再根据目标选择合适的技术,而不是一味追求"最先进"的解决方案。对技术路径的选择应当具备灵活性,随着项目进展及时调整。

总之,AI技术的应用和开发不仅需要深厚的技术储备,更需要扎实的行业知识和耐心。企业应理性看待AI应用,避免过度焦虑,逐步推动项目实施,才能确保在未来的竞争中占据有利位置。

PS:这是本周最后一篇AI相关文章,要开始发管理课程了,不然有点太不务正业了...