两年前,ChatGPT火的时候,我写过一篇文章,名字叫《我可能要给鼓吹AI的那些人,浇盆凉水了》。这篇文章受到不少人的关注,很快阅读过万,评论过千,基本上看过的人都想留下几句话。
文章中我表达了这样一个观点:不否定AI的作用以及未来。包括我自己也用它辅助工作。但是提醒大家量力而为。国内的中小企业在实际应用的落地上,依然会面临一些关于算力和数据上的窘境。现在依然是处于弱人工智能时代,并且还会长期处于这个阶段。不是说AI不行,而是没有宣传的那样行。
当然,此言论一出,大家众说纷纭。
有调侃的:
也有认可的:
有说等两年再看的:
现在差不多是2年之后了,恰巧赶上了DeepSeek火了,我又冒出来谈谈我的看法。
这次,我先限定一个范围,科研、战略、经济我不懂,我只谈AI在中小企业当中的应用。我的观点,AI是很热门,但是你瞅瞅身边的公司,除了培训卖课的,哪个公司依托AI产生了质变,退一步讲,就算产生量变也行啊。
我从2018年开始学习并输出AI教程,到现在8年了。
并且我也从很早开始就关注AI和各个行业的结合。
因此,我只谈从我经历中总结出的认识。因受困于环境,难免片面。
话说,最近我们公司挺乱的。就是因为这个DeepSeek闹的。我们公司处于一个大型传统行业,信息化一直落后很多。即便如此,信息部门也有几十号人,架不住业务多啊。技术水平呢,也就比各个县区的官网强一些。
去年新来一个IT高管,不是我们行业的,来半年多了,没有干出什么业绩。看到新闻后,突然盯上了DeepSeek。因为都在宣传各大厂商纷纷接入DeepSeek。
因此,他想用DeepSeek搭建一整套的工作流程,要用AI实现内容的生产、加工、流转、发布、销售。因为我们公司的业务属于产销一体,线上结合线下。一款产品基本上先是出创意,再是制作线下实体内容,然后设计互联网产品,再新媒体宣传,最后卖到用户手里,然后提供服务。
他就开始操作了。
出创意,可以让DeepSeek出。一问:小D小D,请帮我出一个创意。DeepSeek经过几十秒的深度思考,输出了一个创意。哎,这样的话,创意部就可以裁掉了。
出完创意后面是研发内容,可以让DeepSeek出。一问:小D小D,请帮我生成一本书,生成一首诗,生成一套题,一张配图。哎,有问必答。这样的话,内容制作部就可以裁掉了。
下面是开发互联网产品。小D小D,请帮我写产品方案,制作UI设计图,写代码模块,测试方案,部署方案。哎,都行哎,哈哈,产品开发部也可以裁掉了。
再后面是新媒体宣传。小D小D,帮我生成宣传文案,拿着文案再对接短视频生成平台。哎,这也可以。哈哈,新媒体部可以裁掉了。
小D小D......客服部可以裁掉了。小D小D,法务、财务都可以裁掉了。
旁观者一看,完喽,人工智能给我们带来了灭顶之灾。你看,我们能做的它都能做。它还不用交社保,也不说累。
老板也很开心,演示的很好,整个环节都是通的,这不实现了降本增效嘛!可不能让员工知道了,先试行一下吧。行的话,就改为机器。
结果一试,出问题了,发现谁也替代不了。当我们不深入每个行业去了解,就会感觉能出结果就是替代。但是,出得结果就一定可用吗?具体问题得具体分析吧。
输出一个观点:不加干预的通用模型,解决不了具体的场景问题。
我是搞OCR识别的,也就是用户拍一张做题的照片,我通过几十项复杂的技术操作,识别出上面写了什么内容。再具体一些,你在纸上根据汉语写下英语,我通过图像识别技术,先将你写的字识别出来,然后判断对不对。
我把类似的图发给了DeepSeek大模型,让它识别一下告诉我结果,并且我还提了一个过分的要求,要以结构化的形式返回给我。也就是输出{"num":55, "english":"inform"}的格式,因为这种格式程序可以直接使用。结果,它真的输出结果了。
看似大模型胜利了。或者外行人感觉,哎呀,你个写AI的程序员都被AI给替代了。那我们写稿子的更完犊子了。
别着急,我不慌不忙。业内人看得不是有没有,而是行不行。
它是出结果了,形式上很像。但是它的题号是错的,9个51题,6个81题。这样的话,实际上没法用。
好的,我知道DeepSeek的特长是推理,而非图像处理。我们换ChatGPT。
我找了一张拍摄很标准的从第51到第100题的默写表格发给GPT,看看我们的对话。
我:没有了吗?我这是50道题,应该还有吧?
AI:抱歉刚才没有完全列出所有内容。补充完整的识别结果如下。
我:图上59题的汉语是取胜。你识别乱了。
AI:感谢你的提醒!我已经根据你的反馈调整了顺序和汉字内容。以下是正确的输出
我:62的英语图上写的是imply。
我:你重新再自检一遍,63不是display,图上是implication,另外,哪有101题啊?
我:和图上还是不对应,而且题目变成99了。
我:越来越乱了,100个题目,你不但搞成93个,而且题号和汉字、英文对应也越来 越混乱了,请仔细查看,重新识别一遍!!!
......
ChatGPT失控了,完败。换Kimi。
我:没有的数据不要杜撰,人家没写你别自己给补全,这是考试,没有的就为空。
我:你看59没有手写的英文,你还是给出数据来了。
我:我说59你就只改59啊,没填的都空着,题号和汉语、英语,要真实,如实反馈
我:怎么没有的数据你还显示啊?!
......
Kimi也不行。
最好的大模型基本也就这个水平了。在我的具体OCR场景下,感觉它不聪明,你指导它,它也听不明白,可能听明白了也做不到。这是为什么?
因为没有训练过咱家的场景啊。没训练过就不会。你光说没用,说你要这样,要那样,这仅仅是浅层次的提示语,想要好使得投喂数据进行训练。
我一开始为什么不慌不忙,不担惊受怕。因为从底层看,它想要精确地识别出手写的每一个字,必须需要一个OCR识别引擎。不管是Tesseract、Paddle,还是阿里的、腾讯的,都得有个引擎。我之前干得工作,就是优化一个定制的引擎。通俗一点,我可能就是那个引擎单元。大模型再好,最终还是要调用我这样的单元。那我担忧个锤子!
那位说了,你程序员高科技,我这个小编辑,我不高科技,是不是容易被替代。
咱们一样啊。原理一样,理念一样:通用模型解决不了具体的场景问题。
拿我熟悉的教育领域来说,假如你是个小学数学的学科编辑。那么你应该知道,在编题的时候,2+3=?和3+2=?,对于小学生来说,是完全不一样的。可能一个会,一个不会。尽管我们成年人理解不了。而5-3=?又是另一番天地。至于2+x=5嘛,那得是难于上青天了。几岁该出现什么题,他们出现的先后顺序怎样,这都有讲究。更别说在你们的课程体系和目录下又有新的规则了。这些通用大模型不知道。这类都叫具体场景。
为什么我的效果好,因为我训练过啊。你的模型,听过你的很多故事,因此了解你。
那怎么训练啊。不好意思,要技术人员,要设备,要数据。哈哈,百万起步。
那么,为啥大家都接入了DeepSeek?我从各个平台搜索"接入",后边就会跟着"DeepSeek"。
接入DeepSeek的有三类组织。第一类,有研发和资金实力的企业,比如学而思、腾讯、阿里。第二类,使用它通用能力的企业,比如政务单位、客服中心。第三类,没有实力想解决具体场景的企业。
第一类,叫改用。DeepSeek是个好模型。好在中文表现好,推理能力强,而且训练成本比GPT低很多,关键它还开源哦。因此,有实力的企业拿来在此基础上融合自己的AI,很快融合到业务之中。
第二类,叫使用。DeepSeek有很多通用能力。就比如理解文档的能力。你把你们公司的制度发给它,你问它关于制度的问题,它能回答得很好。你把一本小说发给它,你问它里面的情节,它也能回答得很好。因此,很多地方将政策法规发给它,它基本上回答得也合理合法。但是,这不叫训练,也不叫你自己的大模型,它还是那个通用能力,就是理解文档。
所以很多地方耗费上百万搭建671B的最大参数的顶配模型,也就是作为一个文档搜索工具而已。基本上应用都是知识库、智能客服。这类应用,花得多,起效快。原来需要人员从里面巴拉,然后统计分析,现在机器帮人做了。
他们有数据啊,不管是政务还是客服,少不了手里有日常的积累,尤其和大数据局合作。也有钱啊,买服务器。至于技术,搭建就行,仅仅是使用。
那么问题来了,你有什么?
第三类,叫乱用,我打了好几次字,它都蹦出来卵用。没钱,不舍得花百十来万买设备,搞个三五万的机器。手里也没有数据,有数据也是没有清洗过的素材。至于技术人员嘛,搭环境都费劲,更别谈训练。就这样还成天嚷嚷着训练自己的专属模型。
这都不重要。重要的是,你的模型训练起来了,能给你的业务带来什么改变吗?你相信真人直播都卖不出去货,改成数字人直播就可以逆势大卖吗?加一个专属客服,能提高卖地瓜的销量吗?可能会,也可能不会,但绝非一定会。
两年过去了。我还是不改初心。AI是趋势,就像婴儿是未来。富二代可以现在就考虑未来,我们普通百姓先专注当下的生计就行。
面对DeepSeek,有实力的大企业可能大有发展。普通小企业,顶多节省一些人工,可能还会赔本。通用能力能解决你的问题除外,买课做培训的除外。