AI应用进化论(上):Fabarta个人专属智能体如何找准场景与功能

作者:谭宇

枫清科技(Fabarta)技术合伙人

AI 领域每天都在发生剧烈的变化。可能每三个月或每一个月就能走完一遍技术循环曲线。 以轰动全球的通用智能体Manus为例,首先是期待值拉满,高呼人类要被取代,然后逐步回归现实,总共用时不到三个月的时间。这大大超出了之前大数据、云计算等各类技术的演进速度。

从ChatGPT发布到现在,特别是2025年初DeepSeek V3/R1发布之后, AI 应用是否可以为我们的工作带来提升、逐步融入业务已经没有争议。

于是AI领域的趋势可以说从"模型大战"进入了"模型与应用共舞"的时代,而这个应用基本上又可以使用"Agent" 或 智能体来概括。

这个在市场上也可以看出明显趋势:

虽然模型的能力还在逐日增强,不断刷新着榜单,但中国乃至全球的基础模型训练玩家已经收敛。

在AI应用方面,也有着从通用逐步走向垂类的趋势,真正实现应用层面的百花齐放。 最初,大模型刚刚发布时,全球的开发者就像一个摄影爱好者刚刚拿到一台相机一样,总想着拍大场景大画面,想给观众以无与伦比的视觉冲击力,但事与愿违,观众并不对这种大而全、毫无特色的内容买单,于是大家慢慢学会了聚焦,在小场景、小画面上进行挖掘。

总体上来说,我们目前还处于一个智能化的初级阶段。

第一个表现就是基础模型的能力还是飞速发展,各个玩家还在卖力的打榜。

**第二个表现则是只要你愿意,你完全可以把你的手机/电脑装上各类智能APP,可以比之前"百团大战"要装的APP还要多。**全网还充斥着《2025年不可错过的40/50/100个AI工具》这样的内容。 但是我们可以问问,我真的需要那么多工具吗,有多少人下载了APP后就再也没有打开过? 这说明绝大部分APP对于用户来说是没有价值的。 绝大部分企业也用不了超过50个工具。

第三个表现则是AI应用、除了编程方面以外,还未看到杀手级的应用。

在这个阶段,如果说想要在AI应用方面有所建树,那就需要特别谨慎的选择与思考。 一方面要关注进入的赛道在AI时代是否值得投入、是否会有剧烈变化;另一方面你做的东西可能随时被基础模型的进化而抹平,比如很多针对RAG的优化,可能在基础模型发展后变得不那么必要,让投入变得无价值; 最后还要关注当下与未来的平衡,这主要包括在快速变化的情况下的技术栈选择以及公司对技术发展的坚持, 这虽然是普遍问题,但在当下AI应用领域尤其重要。

01 Fabarta的思考与选择

Fabarta从2022年成立以来,一直都在数据和AI领域耕耘,结合我们过去在数据领域积累的企业级数据与知识的处理能力,构建了"以数据为中心"的知识引擎和智能体构建与应用平台, 在金融、制造、能源等多个行业,服务了包括中化信息、龙盈智达、华润医药等头部企业,积累了丰富的AI应用落地经验。

在这个过程中,我们的客户给了非常多的反馈,让我们能够接触到很多用户的实际问题,这也促使我们不断的思考AI应用到底要怎么建设与发展。

现有AI应用的痛点

我们知道现有以大语言模型为基础的AI应用其实是偏科的,现阶段一切AI应用的能力都要受限于此。

这跟之前的"数字化"浪潮的技术相比有明显的不同,在数字化时代,企业会有一个很明确的目标或指标,那就是要"以客户为中心,建设直接面向用户(DTC,Direct To Customer)的系统"。这个过程中会涉及到大量的数据收集、业务流程重构,所以海量算力与存储、微服务等云算生技术被催生。基础设施与应用相互促进,两个方面都在为企业数字化的最终目标演进。它是一个渐进式、可预期的过程。

但这不适用于现在的AI应用建设,现在的情况是我们首先要专注弥补大模型能力的不足(如RAG),其次才是在大语言模型擅长的领域去寻找机会,可以说有点拿着锤子找钉子的意思。即在现在所谓的"智能化时代",没有像数字化一样有一个很明确的业务指标,甚至连目标也没有,是为了节省成本还是更智能化的业务? 所以在找不到合适的业务场景的时候,大家只能是看别人做什么我也做什么,Fabarta也经历过这个阶段,现在也还有很多企业处于这个阶段,我们主要通过陪伴客户、共同寻找机会的方式来打破僵局。

认识到了上述差异,就能够透彻的理解当今AI应用的痛点。

对于用户来说,**第一个痛点就跟上面提到的差异有关,即当前主流的AI应用并非以"用户"为中心,而是以"模型"为中心,在用户体验上有明显的痛点。**比如用户只能主动上传受限制的文档,AI应用再基于这些文档产出一些中间产物,用户再将这些中间产物融入到自己最终产出物上。整个流程在灵活度、效率上都不是最优。对于各大模型厂商来说,这个自然不是问题,本身提供的这些应用有相当大的成份也是为了展现自家模型的能力。但正因为业务目标不明确,所以AI应用厂商在建设AI应用的时候,默认也使用了大模型厂商的方法,这就导致相关痛点都被延续了下来。

**第二个痛点则是当前主流AI应用似乎是AI将人引入到了它的工作流中,而并非是让AI进入到人的工作流里。**比如当今绝大部分AI应用都没有做到贴近用户,形成用户真正的"个人助手",可能也会给你一些地方将文章或内容保存下来,但并不会越用越懂你。这个过程中只有人的主动沉淀,并没有AI的被动沉淀与对你的理解,所以从这个角度来看,并非是AI成为了你的助手,反而是人成为了AI中的一环。

**第三个痛点则是在个人数据、企业数据乃至公域数据之间的交互困难。**在实践过程中,个人数据与企业数据之间的交互特别重要。各大模型厂商的AI应用基本都提供了联网搜索能力,虽然仍然有很多交互上的问题,比如要达到好的效果,基本上需要用户自己控制联网搜索的开启时机,不过也算是基本解决了公域数据使用的问题。但企业数据和个人数据并没有很好的连通手段, 我们完成工作的方式基本上可以归结为结合个人积累的素材、企业数据、公域数据来产出。但是目前主流的AI应用没有办法将三者很好的结合起来。

除了上述由理念层面引起的痛点外,在实际产品层面当然也有很多痛点:

  • 大多数AI应用的功能都属于多而不精,就是似乎什么都可以做,但基本上每个功能都做不到及格。
  • 还有很多AI应用为了在实现层面简单,需要用户做大量的配置工作,无法开箱即用。比如很多AI应用支持用户自带大模型的访问密钥,这对于技术人员群体,自然是没有太大的问题,但对普通用户来说申请一个大模型的密钥已经超出了适度配置的范围。
  • 少部分专注于垂直类的AI应用也没有办法端到端的完成功能。 以写作为例,有大量的垂直类的需求,比如标书(又可以细分为招标书、应答标书等)、制式(企业内部相应格式的文档,如测试文档、审计文档、合同)等,有的应用的确号称能满足这些垂类需求,但在当下大模型能力水平下,并不能一次就生成完全符合用户需求的文档,这个时候就需要二次交互或用户自行微调,但绝大部分AI应用只做到了前半段生成,后续部分仍然需要用户自行到Word或其他编辑器中完成,不符合端到端解决问题的原则。
  • 交互上千篇一律或者缺乏思考,要么都是问答框,没有寻求更符合场景的交互方式。要么就是回退到更为传统的方式上,需要用户填写大量的信息。
  • 宣传大于实际,比如浏览器应用,宣传效果看起来很好,但实际上需要在非常特定的场景下才能使用,或者是速度慢到无法使用。
  • 本质上是个技术类产品,比如很多产品做了非常多的模型接入,看起来用户有模型选择的自由,但实际上用户对此并不感兴趣。

当然用户愿意列出这些痛点恰恰说明AI应用已经逐步进入到一个新的阶段,那就是AI应用的确能为用户带来实际业务价值,否则用户早就不会使用而不是提出改进意见。 这对我们到底应该怎么构建AI应用也是一个很有价值的输入。

客户需要什么样的AI应用

如上所述,在当下智能化并没有一个很明确的指标或目标,所以对于一个AI服务提供商来说,是机遇也是挑战,机遇是客户愿意投入,而挑战则是怎么跟客户讲清楚价值,这本身跟任何新技术的普及逻辑是一致的,这里除了陪伴客户成长以及企业自身对技术洞察力的把握以外并没有其它办法,不过一般说来客户要的价值一般分为两个方向,一是赚取更多的利润,二是提升效率降低成本,不管是员工的效率还是生产效率。能够一步走到赚取更多的利润固然好,但这并不是新技术的常见途径,结合今天AI应用的特点,从提升效率然后逐步渗透到核心业务环节才是正常演进路径。所以我们这里讲的客户更多的是在提升效率场景下的终端用户,至于其他更复杂的场景则需要对业务和市场环境有更深入的理解,不在此讨论。

对于终端用户来说,一个好用的AI应用至少要做到几点:

  • 开箱即用。对于大部份用户来说,不希望做过多的设置,从之前提到的大模型密钥到模型的选择,甚至是文档的解析方式、分块大小等,这不应该是普通用户所要关注的。
  • 专注实用、精品的能力。用户希望AI应用能理解他原来的业务流程并进行增强,而不是去学习更多的新功能,比如文生图有它的价值,但它的价值应该是存在于一个更大的流程中,比如写作等场景。以ChatGPT为例,它可以生成吉卜力风格的图片,但用户想要的终端场景应该是发朋友圈或小红书。
  • 端到端流程。跟上一条类似,用户真正在工作的时候,不希望在多个工具之间来回切换,比如将大模型回答的段落再粘贴回Word 中进行文字或格式上的调整,用户希望AI应用能帮他产出最终产物。
  • 被动沉淀。虽然现在有很多AI应用提供主动沉淀机制,比如用户在和大模型的交互过程中可以将有价值的中间结果保存下来,可以将相关的文档放入到个人的知识库,但主动沉淀的效率其实并不高,用户想要的其实是在使用的过程中AI应用可以将有价值的东西被动沉淀下来。
  • 不断进化的个人助理。这实际上是一个在智能化之前就存在的问题,不管是搜索的个性化还是当今短视频、文章的推流机制,主打的就是越来越懂用户,但实际上在今天的AI应用上还没有做到,这里当然有数据隐私等因素存在,但另一方面也存在缺乏思考和技术限制的原因,不过目前业界在此也开始有所尝试,比如出现了开始专注在Agent Memory管理的解决方案。
  • 个人数据与企业数据或公域数据无缝结合。这个在上一节已经有所阐述,绝大部分用户都不会有一个完美的知识管理系统,所以期望能在这些数据之间快速选择与使用。

很明显在客户的需求与现有AI应用的能力上还有一些差距,这些差距也迫使我们思考为什么这样,是技术上的问题还是商业上的问题,抑或是兼而有之?在技术上当然存在挑战,但是随着各个模型在上下文长度、指令遵循、function call等各方面的进步,专用或通用Agent都已在快速发展,可以说技术上是可以克服的。 商业上的挑战最终则需要产品力来支撑。单纯思考并不能很确定的回答这些问题,于是我们做了 "Fabarta个人专属智能体" 这个产品来表达我们对AI应用产品的一些想法。

02 Fabarta个人专属智能体

根据上述分析与Fabarta过去两年服务行业头部企业的经验,我们很快做出了一些选择:

  • 垂直类AI应用。我们选取了办公场景开始切入,因为这是目前AI应用相对来说主要的领域,当然办公场景仍然是一个非常大的场景,我们还需要在其中进行更精细的划分和取舍。
  • 应用的主要形态为桌面程序。这里的桌面程序主要是指运行在用户本地的程序,这更加有利于将用户本地的数据与企业数据结合起来,和将网页程序直接转换为桌面APP有本质的不同。同时也可以在个人助理方面进行一些尝试,因为数据存储在用户本地,在数据安全与隐私方面能给用户相当的保证。
  • 在开箱即用的同时兼顾企业内部算力与云上算力。不管是个人用户还是企业内部用户,都无需额外的设置即可开箱即用。对于企业客户,企业IT部门可以通过快速定制的方式使用企业内部算力,还能够将企业内部已经建设的AI能力下推到桌面程序,赋予这些AI能力访问本地知识的能力,形成"云端 ------ 边端(企业内部)------ 终端(桌面)"相结合的能力,这也是过去几年Fabarta的主要积累。
  • 要尽可能的解决上面提到的痛点
  1. 以用户为中心,将AI融入到用户的工作流中,即建立在理解用户的工作流基础之上。
  2. 被动沉淀,越用能够越懂用户。
  3. 符合AI时代的交互方式等等。

产品功能上的选择

在做出了产品形态以及领域方面的选择后,就要决定做哪些功能,虽然我们一开始就强调要专注且实用,但还是难免规划出一些需要长期投入的功能,比如最开始选了智能问答、写作、数据分析、翻译、文生图、语音等功能,且所有的这些功能都要基于本地知识库,在实现的过程中,还是觉得太多,最终我们将主要功能减少到三个:

  • 本地知识库

用户可以将本地的数据快速转变为知识,而且文件就存储在本地,无需用户上传也不用担心数据泄漏。这是目前Fabarta个人专属智能体最主要的基础功能,也是和其他AI应用最主要的区别,其他所有功能都基于本地知识库来构建。

  • 基于本地知识库的智能问答

这个功能实际上我们比较犹豫,毕竟国内大厂的智能问答应用都不收费,而我们调用大模型API则要收费,看起来不是一个合适选择,但最终决定还是加上这个能力,一方面是基于本地知识库,这是其他智能问答不具备的。另一方面是检索/RAG是基础能力,在后续的写作或其他功能都要用到,这里的效果直接决定了其他功能的水平。 最后是如果企业用户选择将企业知识库接入,那在这里可以实现更多更丰富的功能。

  • 写作

主要包括DeepResearch长文写作以及模板写作。选择这个功能的原因比较明确,一方面是需求多,另一方面也是未来其他能力的基础,比如就算要做PPT,也只有有了深刻的认知及研究后才能做出。

在后续文章中,我们将讨论确立产品功能后,如何以可行的技术路径去实现需求。

相关推荐
GoGeekBaird2 小时前
想在AI 时代做点东西,GoHumanLoop阶段性总结
github·agent·ai编程
waterHBO3 小时前
使用 gemini 来分析 github 项目
github·agent·gemini
前网易架构师-高司机4 小时前
Coze Studio开源版:AI Agent开发平台的深度技术解析- 入门篇
agent·工作流·字节·eino·coze studio
阿里云云原生7 小时前
AI Agent 发展趋势与架构演进
agent
AI大模型9 小时前
技术实践 | 几乎零代码!像搭乐高一样做AI应用,LazyLLM确实有点东西!
程序员·llm·agent
聚客AI11 小时前
❗️智能体工作流(Agentic Workflow):AI应用开发的全面解析
人工智能·llm·agent
dylan55_you13 小时前
理解AI 智能体:多智能体架构
人工智能·ai·架构·agent·多agent
安思派Anspire16 小时前
我测试了所有AI Code Generator——这是最终赢家(二)
aigc·openai·agent
威化饼的一隅18 小时前
【大模型LLM学习】Research Agent学习笔记
大模型·agent·deep research·search-o1·research agent