目录
一、项目背景与痛点分析
企业在日常经营分析中面临诸多挑战,主要包括:
- 数据提取与整理耗时:由于SQL技能一般和数据库复杂,数据提取成为一项耗时的工作。同时,数据分析师的需求响应时间较长,进一步加剧了时间成本。
- 分析结果的不确定性:数据提取到本地后,分析过程同样耗时,且结果可能并不具备实际价值,导致原委挖掘到最后可能并不存在真实问题。
- 分析角度的构思压力:需要不断突破现有的分析思路,为老板提供增量价值,以满足绩效要求。
二、产品调研与"坑"总结
在调研AI数据分析项目时,发现了一些开源项目,如DB-GPT、Supersonic和SQLcoder,但在实际应用中均存在一些问题:
-
DB-GPT:
优势:底层调用大模型,将自然语言转为SQL,对数据进行调用,并提供分析思路。
不足:返回的结果不深入,数据维度无法自行调整,且不一定返回有效信息。
图片展示:

总结:目前阶段难以争取到资源推动项目落地。
-
Supersonic:
优势:表之间通过外键连接,避免了大模型的幻觉问题,提高稳定性。可以提前设置指标,对话时如果命中指标,有成功返回的概率,且可以手动调整时间范围。
不足:只能处理简单问题,展示效果有限,且会给出多个意图解析,需要用户自行判断。
图片展示:




总结:可视化效果不错,但重度依赖大模型的能力以控制稳定输出,仍有提升空间。
-
SQLcoder:
优势:专门用来辅助生成SQL代码的开源项目,效果稳定,语序通顺时基本不会出错。
不足:对于某些特定词汇(如"同比")可能不了解,需要增加提示词或微调来提升能力。
图片展示:

结合Superset:通过结合Superset这个数据可视化的BI工具,可以实现用自然语言建立图表和仪表盘,操作更加稳定,即使报错也可以修改。

三、落地思路与策略
基于以上调研和分析,提出以下落地思路与策略:
-
短期目标:
选择SQLcoder作为取数工具:由于其效果稳定,且能够辅助生成SQL代码,适合作为短期内的生产力工具。
结合Superset实现可视化:通过Superset将SQLcoder生成的SQL代码转化为图表和仪表盘,提高分析效率和直观性。
培养数据分析师的使用习惯:从数据分析师入手,培养他们使用SQLcoder和Superset的习惯,逐步替代传统的手动取数和整理过程。
-
中期目标:
优化模型能力:随着模型能力的提升和企业的自行微调,逐步优化SQLcoder和Supersonic等工具的性能,提高自动化程度。
拓展应用范围:将AI数据分析的应用范围从取数和可视化拓展到数据整理和分析等环节,进一步提高分析效率和准确性。
-
长期目标:
构建智能Agent:随着更多语料的积累和结构化、非结构化数据的沉淀,构建更大、更智能的Agent,实现更多分析建议的自动生成和推荐。
实现全面自动化:最终实现从数据提取、整理、分析到汇报的全面自动化,为企业提供更高效、更智能的数据分析服务。
四、注意事项
- 人员监督与修正:由于目前阶段大模型还不完善,所以在落地企业级项目时,需要增加人员的监督和修正,确保分析结果的准确性和可靠性。
- 权责机制:本着"谁使用谁负责"的权责机制,明确数据分析师的责任和权限,确保他们在使用AI数据分析工具时能够遵守相关规定和流程。
- 持续迭代与优化:随着模型能力的提升和企业的实际需求变化,需要持续迭代和优化AI数据分析工具的功能和性能,以满足企业的长期发展需求。
综上所述,企业在落地AI数据分析项目时,需要充分考虑自身的痛点和需求,选择合适的工具和策略,并注重人员的培训和监督,以确保项目的顺利实施和长期效益。