AIGC与数据分析融合,引领商业智能新变革(TOP企业实践)

AIGC与数据分析融合,引领商业智能新变革(TOP企业实践)

前言

在当今数字化时代,数据已成为企业发展的核心资产,而如何从海量数据中挖掘出有价值的信息,成为了企业面临的重要挑战。随着人工智能技术的飞速发展,AIGC(人工智能生成内容)与数据分析的融合为企业提供了新的解决方案。

阿里巴巴作为全球领先的科技公司,一直致力于探索和应用前沿技术,以提升企业的数据分析能力和决策效率。在这个背景下,阿里巴巴的 Quick BI 产品在自然语言问数、辅助搭建和洞察等领域进行了深入的研究和实践,并且自研了 BI 领域的大模型。

通过将 AIGC 技术与数据分析相结合,Quick BI 能够帮助用户更轻松地理解和处理数据,以自然语言的方式进行交互,快速获取所需的信息。这不仅大大降低了数据分析的门槛,还提高了数据分析的效率和准确性。

此外,Quick BI 还具备强大的可视化功能,能够将复杂的数据以直观、易懂的方式呈现给用户,帮助用户更好地发现数据中的规律和趋势。同时,Quick BI 的安全体系也非常完善,通过了 ISO 的安全和隐私体系认证,确保用户数据的安全和隐私。

AIGC 技术与数据分析的融合实践,为企业提供了一种全新的数据分析方式,帮助企业更好地应对数字化时代的挑战,实现数据驱动的决策和发展。接下来,我们将深入探讨 Quick BI 在大模型与数据分析融合方面的具体内容和实践成果。

AIGC与数据分析融合

在当今数字化时代,数据分析和商业智能(BI)工具已成为企业洞察数据、优化决策的关键。随着生成式AI的发展,阿里巴巴旗下的Quick BI积极探索大模型与数据分析的融合,为企业提供更智能、高效的数据分析解决方案,引领商业智能的新变革。

Quick BI是一款连续五年入选Gartner ABI魔力象限的产品,今年继续巩固了在魔力象限中的挑战者地位,并稳步提升。Gartner发布的2024年数据分析和商业智能魔力象限市场分析报告显示,Quick BI在多设备的可视化交互功能、与企业业务系统的集成以及符合中国市场的标准报告制作上具有优势,尤其适合分析开发人员和业务分析师的使用场景。

近年来,BI分析市场呈现出三大特征。首先,数据科学和机器学习技术的普及使得BI行业逐渐向这些领域靠拢,国际市场上的BI竞品更加注重数据科学家的角色,以实现一站式的算法验证和数据分析,而国内市场在这方面的涉猎相对较少。其次,大模型的应用带来了生成式分析体验,增强了BI端到端和增强分析的能力,如智能助理等新功能使消费者能够更轻松地通过自然语言对话进行数据分析。最后,大模型在自然语言理解和归纳能力方面的突破,使整个BI行业的分析能力得到了质的飞跃,能够更好地理解和处理自然语言数据,为用户提供更准确、高效的数据分析服务。

BI的技术演进经历了从传统BI到敏捷BI,再到智能BI和AI时代的对话式分析的过程。传统BI依赖于预先定义的数据模型和语义层,用户需要通过复杂的查询和报表工具访问数据,对技术背景和数据库结构有一定要求,数据分析相对固定和有限。敏捷BI则通过更直观的操作方式,如点击按钮、拖拽元素等,降低了技术门槛,使非技术背景的用户也能进行数据分析,提高了分析的灵活性和自主性。智能BI阶段通过大模型提供了更加智能化的数据分析方式,用户只需以自然语言描述分析需求,智能助理便能根据上下文自动理解意图,拆解并执行任务,进一步简化了数据分析过程。AI时代的对话式分析,尤其是在AIGC的加持下,用户可以通过自然的对话与数据交互,提供了全新的端到端交互体验。Gartner认为,到2025年,增强的消费者体验将推动市场对ABI能力的采用率首次超过50%,进而影响更多的业务流程和决策。

Quick BI连续五年入选Gartner报告,具备三大竞争力。首先是灵活,阿里云拥有广泛的销售渠道和灵活的定价方式,Quick BI可以在多个平台上售卖,并提供可定制的功能包和定价模型,适应不同企业的需求,定价模式具有竞争力。其次是可集成,Quick BI与阿里云整个产品系统可组合分析,既可以作为独立工具提供,也是瓴羊大产品组合的一部分。最后是客户成功,阿里云瓴羊通过系统的培训提升用户技能,并颁发证书,推动客户成功。回到产品本身,Quick BI提供分析协同消费的数据可视化分析整体解决方案,具有智能、安全、快速、开放四大特色优势。智能方面,Quick BI的自然语言对话式操作让智能分析的门槛触手可及,其自研的BI领域大模型保障问数准确率在业界领先。安全方面,Quick BI安全体系通过ISO的安全和隐私体系认证,包括权限、水印等六大安全管控能力业界领先。快速方面,自研可控的多模式加速引擎能让10亿条数据查询秒级获取,同时支撑云上百万并发稳定服务,可用性达99.9999%。开放方面,Quick BI提供登录、嵌入、自定义、扩展等多种开放集成能力,可按需接入各类复杂系统。

在大模型与数据分析的融合探索方面,Quick BI针对企业数智化升级过程中业务团队和数据团队难以融合贯通的痛点,进行了产品形态的探索。智能搭建功能通过一键生成报表、对话式图表创建以及智能美化等功能,提升了报表搭建效率。智能问数功能使用户可以通过与智能助手对话,以自然语言获取数据并展示,实现数据集问题的即时回答。智能洞察能力帮助用户快速生成报表摘要,自动检测异常并进行归因诊断,快速发现数据问题和原因。在实现层面,Quick BI基于成熟大模型的基座,结合对BI业务的独特理解,训练出针对BI领域的大模型,并与产品的功能底座相结合,探索出BI和AI结合的最佳实践路径。

在智能小Q路线选择上,Quick BI最初面临两条道路。第一条道路是基于已有能力进行问述,先有BI,再融合迭代大模型的能力;第二条道路类似于早期开源DEMO项目,先简单对接通用大模型,如调用GPT生成特定SQL,再用开源图表组件展示数据。虽然第二条道路门槛较低,演示效果好,但难以商用,存在图表无交互能力、缺乏权限管控和数据源管理等企业级能力的弊端。因此,Quick BI选择了第一条道路,目前小Q使用了大量的BI能力,如可视化分析能力、成熟的图组件、高端计算能力、多端可消费能力等,还依赖了文件的四大内核引擎,包括建模分析引擎、加速引擎、渲染引擎等。智能小Q在产品上具有快速响应用户提问、直观表达数据、准确识别分析意图、简化高级知识分析等优势。

智能搭建实践中,智能搭建用自然语言辅助搭建报表,具有生成报表、调整数据、辅助分析和样式美化等功能。生成报表功能可根据选定数据一键生成报表,用户可在此基础上进行增补和调整。调整数据功能允许用户通过文字指令更改字段、名称和统计方式。辅助分析功能可简化多步骤高频操作,通过自然语言实现累计计算、添加条件格式辅助线等操作。样式美化功能可一键美化报表,提供惊艳效果,提升用户视觉和使用体验。

智能问数实践中,NL2SQL基于自然语言交互直接获取数据结果,具有结果可交互、易理解的AI处理过程、企业级功能和多场景支持等特色。结果可交互包括强大的可视化展示能力、结果分享或导出以及数据结果支持图表切换。易理解的AI处理过程使用户能看到AI处理数据的步骤,增加透明度和可信度。企业级功能包括权限分析、主题嵌入、自有系统多端等,满足企业用户需求。多场景支持能处理复杂查询语句,适用于多种使用场景。智能问数的关键处理步骤包括意图识别、数据实体提取和召回、模型改写以及BI系统处理及数据源精确转换。

在通用智能问数架构设计和实践方面,智能小Q的通用智能架构设计从上到下分为应用层、AI中间层、资源BI以及BI基座。领域模型与通用模型在行业数据和系统逻辑表达上进行了结耦,大模型工具链实现了自动化微调和高效稳定的推理服务。AI中间层位于上层应用和大模型之间,负责任务分发及协同工作,提供自定义的标准结构化语言DSL,完成AI和算子操作的对接,将BI领域大模型的应用编程变成确定性编程。BI基座引擎保证了数据分析的强复用性,承载了从数据连接建模到复杂高级计算和分析的能力。渲染引擎负责图表的可视化展示和交互式分析。

对于智能问数系统中NL2SQL流程的演进,最初系统定义了DSL,由大模型直接学习并生成,然后通过中间层将DSL在原始数据和知识库中实例化,转换成Quick BI能理解的实际查询参数,最后由引擎转化为物理SQL语句执行数据提取。随着系统支持更多样化的用户意图,为DSL语义准备样本的成本增加,且通用模型不包含DSL内容,团队在单表查询的标准SQL基础上进行扩展,增加抽象函数和高级计算,形成增强的SQL语言,并通过自研语法解析器将其转换成DSL映射,既利用了通用模型的能力,又降低了训练样本的准备成本。

在BI领域大模型实践中,NL2API负责将用户的自然语言转换为机器可读的API命令及其参数,通过AI技术识别用户意图并生成API指令,调用现有功能执行特定任务,这是一个不断进化的过程,要求扩展智能助理的功能范围并提升执行任务的质量。NL2SQL专注于处理和解释与数据库查询相关的自然语言,通过利用企业级知识库和实际问答数据,结合专门的工程技术,不断学习和优化查询解析能力,采用自定义的DSL涵盖复杂查询场景,引入反问、多轮对话和问题修正等机制,确保模型能精确处理用户查询,将其从理论演示转变为实际生产中的实用工具。

通过Quick BI在AIGC技术与数据分析的融合实践,为企业提供了更智能、高效的数据分析解决方案,推动了商业智能的发展和变革。在未来,随着技术的不断进步,相信这种融合将为企业带来更多的价值和机遇。

参考

https://mp.weixin.qq.com/s/TR1jUpwmq8QMCfIWirYZfQ

相关推荐
xuehaisj29 分钟前
论文内容分类与检测系统源码分享
人工智能·分类·数据挖掘
大耳朵爱学习1 小时前
大模型预训练的降本增效之路——从信息密度出发
人工智能·深度学习·机器学习·自然语言处理·大模型·llm·大语言模型
loongloongz2 小时前
联合条件概率 以及在语言模型中的应用
人工智能·语言模型·自然语言处理·概率论
lijfrank2 小时前
情感计算领域期刊与会议
人工智能·人机交互
sp_fyf_20242 小时前
计算机人工智能前沿进展-大语言模型方向-2024-09-18
人工智能·语言模型·自然语言处理
sp_fyf_20242 小时前
计算机人工智能前沿进展-大语言模型方向-2024-09-14
人工智能·语言模型·自然语言处理
ybdesire2 小时前
nanoGPT用红楼梦数据从头训练babyGPT-12.32M实现任意问答
人工智能·深度学习·语言模型
AI极客菌2 小时前
Stable Diffusion绘画 | 生成高清多细节图片的各个要素
人工智能·ai·ai作画·stable diffusion·aigc·midjourney·人工智能作画
FOUR_A2 小时前
【机器学习导引】ch2-模型评估与选择
人工智能·机器学习
lupai3 小时前
盘点实用的几款汽车类接口?
大数据·人工智能·汽车