基于多模态融合与图神经网络的用户精准感知系统研究

摘要

5G时代,通信运营商面临网络复杂化、业务差异化和用户需求多样化等挑战,引入人工智能技术,实现对用户的精准感知,并按需为用户提供个性化服务,已经成为运营商数字化转型的重点方向。研究了用户精准感知系统的构建方案,系统具备对运营商网络数据、业务数据以及声音、图像、文本数据进行多模态融合的能力,并能够通过图神经网络算法进行建模分析,实现对用户的精准感知与洞察。另外,介绍了基于用户精准感知系统进行高危流失用户挽留的应用场景,为人工智能技术在运营商数字化转型中的应用提供一种新的思路。

前言

近年来人工智能技术的发展影响到了企业与个人的方方面面,深度学习技术作为人工智能技术的一个分支发展尤为迅速,并且在文本、语音、图像等数据上已经取得了很大的成功。目前,将语音、图像、文本等多种类型的数据进行多模态融合,服务于具体的业务场景是人工智能的一个重要发展方向。

除了图像、文本、语音等数据外,许多行业领域还存在着图结构的数据,例如社会科学中的社交网络、电子商务领域中的商品与用户关系、通信网络的拓扑结构等,为了充分挖掘这些图结构数据的特征,图神经网络技术被提出,并在很多行业表现出巨大的发展潜力。

通信运营商具备海量的网络与业务数据,其中运营商的网络拓扑结构、人机物交互拓扑、用户社交关系等都是能够以图结构表示的数据,具有应用图神经网络技术的天然优势。另外,运营商在开展业务中存储了大量的语音、文本、图像等数据,具备进行多模态融合的基础。人工智能领域的图神经网络算法结合多模态数据(文本、语音、图像等)在复杂场景下表现出比传统机器学习更优的决策能力,将图神经网络、多模态融合等新技术应用于通信运营商业务场景已成为通信领域人工智能研究的新热点。

01 用户精准感知系统关键技术

1.1 多模态技术

不同的存在形式或信息来源均可以被称之为一种模态,由2种或2种以上模态组成的数据称之为多模态数据。多模态数据可用来表示不同形态的数据形式或者同种形态的不同格式,一般有文本、图片、音频、视频、混合数据等。

自然现象具有十分丰富的特征,单一模态很难提供某个现象的完整信息。多模态数据融合负责将多个模态的信息进行有效整合,汲取不同模态的优点,完成对信息的融合。对于同一个描述对象,多模态数据通过不同领域或视角获取到数据,通过多模态融合实现对数据每一个领域或视角的优点最大化,充分发挥各模态数据在应用场景中的价值。

1.2 图神经网络技术

图数据是除语音、文本、图像、视频、表格等数据外,另外一种数据的表现形式。图数据通过将现实场景中的实体转化为节点、将实体间的关系转化为边进行建模,图结构数据对现实场景具有很强的表达能力。

虽然深度学习技术在声图文数据中的应用取得了惊艳的效果,但是应用于图数据时存在诸多挑战。图数据具有不规则的结构,图的节点之间是无序的,图中每个节点与其他节点之间存在复杂的依赖关系。常见的卷积神经网络(Convolutional Neural Network,CNN)、循环神经网络(Recurrent Neural Network,RNN)提取图像、文本特征的能力,在图数据上无法适用。图神经网络算法的提出就是用于建模图节点之间的依赖关系,从而对图节点进行表示,充分提取图数据特征,应用于下游任务。

图神经网络的基本思想就是聚合邻居,为了更加全面地刻画每个节点,除了节点自身的属性信息,还需要更加全面的结构信息,所以要聚合邻居节点的信息。图神经网络模型最初由谱方法导出,将卷积核作用在谱空间的输入信号上,并利用卷积定理实现图卷积,以完成邻居节点的信息聚合。图卷积网络(Graph Convolutional Network,GCN)算法将图神经网络从谱域卷积的研究转向了空间域卷积的研究。

为了适应现实业务场景,研究人员设计了不同的聚合函数来聚合中心节点与邻居节点的信息,提出了GraphSAGE模型,并将注意力机制引入图算法,提出了图注意力网络(Graph Attention Network,GAT)模型。随着图神经网络技术的发展,越来越多的算法模型被提出,并且在很多领域的应用中得到了良好的效果。

02 用户精准感知系统功能

本文研究了基于多模态数据融合与图神经网络的用户精准感知系统。系统功能架构如图1所示,包含数据接入、数据库、算子库、图技术能力开放中心、知识中心等功能模块。基于上述功能模块,在数据层面,系统具备应用多模态数据融合技术进行多源数据整合、创建知识中心、构建用户关系画像等数据处理能力;在算法层面,系统具备应用机器学习、深度学习、图神经网络等人工智能算法进行建模分析,服务于具体应用场景的能力。

2.1 数据接入模块

原始数据从运营商业务领域来划分,可以分为B域数据、O域数据、M域数据等;从数据类型划分可以分为结构化数据、半结构化数据、非结构化数据、图数据等。原始数据经数据采集功能采集后放置到数据预处理层的数据总线,为保证数据处理的实时性,数据总线一般采用分布式消息平台 Kafka,根据数据的类型,使用分布式文件系统 HBASE 或者数据仓库Hive。系统数据接入模块主要包括以下3个功能。

a)运营商网络与业务数据接入。支持对接运营商已有的数据仓库,获取运营商网络数据与业务数据,获取方式采取与运营商现有数据仓库直接对接的方式,支持按小时、按天、按周、按月同步,同时支持自定义同步周期。

b)声图文数据接入。支持多模态数据(语音、图像、文本、网页等)接入,接入方式支持本地文件上传,同时支持FTP、SFTP等方式传输。

c)外部知识中心接入。支持对接已有的知识中心,具备同步其他业务知识中心数据的能力,能够对接使用neo4j、JanusGraph、HugeGraph等底层存储的图数据。

2.2 数据库模块

原始数据首先进行数据预处理,数据预处理完整步骤包括数据清理、数据集成、数据规约、数据变换、数据描述、特征选择、特征组合、特征抽取7步。根据不同的预处理目标,不同的数据经过以上步骤或者部分步骤后,进入数据库模块进行存储,数据库模块包括以下功能。

a)图数据存储。系统具备图数据存储的能力,适配 neo4j、JanusGraph、HugeGraph 等常见的图数据库,支持处理高度连接数据的查询与存储。

b)向量存储。系统支持对大规模深度学习向量进行高性能相似搜索的向量检索,可以应对海量向量数据的存储和检索。

c)对象存储。系统支持对海量照片、视频、音频、文档等格式的非结构化数据进行存储。

d)文本存储。系统支持常见的文本数据库,用于文本数据的存储。

e)分布式关系型数据库。系统具备对海量的关系型数据进行存储的能力,用于对接运营商数据仓库,存储运营商海量网络数据与用户业务数据。

2.3 算子库模块

系统具备一套面向多模态数据处理和图谱挖掘的通用算子库,为相关人员进行算法模型开发提供个性化开发工具,包括图表示学习、图神经网络、数据预处理、多模态信息融合、语音识别、语义理解、文本处理、机器学习、情感识别、文本生成、关系抽取、深度学习等。算子库模块包括以下6个功能。

a)数据预处理算法:支持去空、去重、空值填充等实际业务中需要的数据操作。

b)语音处理算法:语音识别、情感分析等算子工具。

c)文本处理算法:命名实体识别、情感识别、模板语言生成等算子工具。

d)传统机器学习算法:lightGBM、Xgboost、随机森林等常用算子工具。

e)深度学习算法支持的深度学习框架:Tensor⁃flow、Pytorch等。

f)图算法:图谱表示、链路预测和图挖掘、图嵌入、图计算等算子工具。

2.4 图技术能力开放中心模块

图技术能力开放中心模块面向业务化应用的多模态图谱挖掘场景,提供算力、数据和算子等资源接口,便于相关人员组建个性化的开发环境。

系统搭建开发图技术能力开放中心模块,通过API方式实现算力资源、数据资源、算子资源向上层应用的可控开放,提供相关方案确保能力开放的可管可控。

业务或算法人员可以在图技术能力开放中心模块上传数据或选择数据库数据,按比例划分出训练集、验证集和测试集,然后根据实际业务场景从算子库选择适合的算法或者自主编写代码程序进行算法模型训练。

模型在训练过程中,系统可图示误差曲线,便于研究人员调参、优化模型。模型结果及中间的特征数据都是作为产品化后台应用的重要依据,因此每个训练周期的特征数据和模型数据都会实时更新导入线上。特征、模型由平台产品化能力负责,不需要用户做额外的操作,模型相关数据在训练任务完成后会自动更新到产品化后台。

2.5 知识中心模块

系统知识中心模块具备用户画像、家庭画像、关系画像等功能,满足支持算法及上层应用的需求。

2.5.1 用户画像

用户画像提供运营商用户属性、标签、行为的分析洞察,具备以下功能。

a)多源数据实时采集。基于数据接入模型,实时接入不同来源和不同类型的多方客户数据,包括埋点数据、外部平台、内部业务系统等。对于埋点数据和外部平台,有 2 种获取方式:第 1 种是对方有接口规范,根据接口规范进行获取即可,支持消息、文本、数据库表等多种方式,基于Kafka进行数据接入。第2种是对方没有接口规范,可以使用爬虫进行数据获取,数据获取后经过预处理形成系统可以识别的格式导入系统。

b)客户标签灵活加工。提供简单易操作的标签加工和客户分群工具,通过可视化界面所见即所得实现多种自定义标签加工,快速响应个性化的需求。系统可以基于图数据库的社区搜索算法对客户进行社区化分群,也可以应用标签传播算法,基于已有的标签,通过用户之间的关系进行标签传播,实现未打标用户的标签打标。

c)精准圈取目标人群。针对运营商业务场景,通过用户属性、行为、标签等条件进行交、并、差集关系的组合圈人,实现对目标人群精准划分。

d)多维度洞察分析。需要基于多维度数据结合多种算法进行分析,包括机器学习算法、深度学习算法提供的用户性格分析、转化分析、行为分析、留存分析、RFM、生命周期分析等模型,从多个维度分析和了解客户。

2.5.2 家庭画像

基于家庭基础业务、家庭成员、语音特征、网络特征、产品特征、地理位置、消费价值、互联网行为等数据构建家庭画像,提供家庭级的特征分析,包含类别和人员构成等;提供家庭画像的点击接口,并可导入外部标签数据;提供低门槛操作的标签加工和客户分群工具,通过可视化界面所见即所得实现多种自定义标签加工,快速响应个性化业务需求。

2.5.3 关系画像

通过运营商固网业务、通话关系、地理位置、用户偏好等数据实现对用户关系的画像。以用户为节点,用户各种标签为节点属性,用户间各种关系为边,通过数据抽取和转换,将数据导入图数据模型构建用户关系画像。通过用户关系画像可以实现对用户间关系的查询和分析,实现秒级数据运算和数据可视化,并以图谱的形式进行可视化展示。系统支持基于已建好的用户关系画像进行用户间关系的查询、分析和探索。

03 基于用户精准感知系统的高危流失用户挽留

当前通信运营商竞争日趋激烈,业务发展也进入存量经营阶段。在通信市场存量用户十分有限的情况下,通信运营商业务面临着极大的市场竞争压力。运营商发展新用户越来越困难,维护高价值老客户比发展新用户更能有效节省企业成本开支。维系好现有的客户,提升用户满意度,为用户精准地匹配所需业务,已经成为通信运营商数字化转型的关键问题。

基于多模态数据融合与图神经网络技术的用户精准感知系统可以通过多模态数据融合充分挖掘用户特征与属性,结合通信行业的网络数据与人机物交互关系,利用图神经网络技术对用户进行精准感知与刻画,满足复杂业务场景下的协同精准运营闭环。

本章介绍了基于用户精准感知系统相关能力实现高危流失用户的预测及挽留,其流程如图 2所示。通过系统的数据接入能力实现数据的接入,通过算子能力实现数据处理与各种画像构建,进而生成用户感知图谱;通过图神经网络算法结合机器学习算法实现用户流失预测建模;通过系统算子库语音文本相关算法构建个性化挽留策略,并生成智能话术;实现高危流失用户的精准化感知、预测、挽留的业务闭环。

3.1 用户感知图谱构建

基于系统的数据接入能力接入运营商B域、O域数据,系统可以通过算子能力构建用户画像标签,包括产品、业务、财务、偏好、行为、性格等用户属性标签。通过图算法及机器学习算法挖掘用户关系,包括用户通话关系、家庭关系、社交关系、工作关系、偏好关系、产品关系等。

以用户画像与关系画像为基础构建图数据,其中用户画像中的相关属性作为用户节点特征,用户之间的关系画像作为图的边,实现用户感知图谱的构建。用户感知图谱除了具备原有用户属性外,还包含了用户之间的关系信息,以此为基础进行建模能够实现对用户更精准的感知与描述。

3.2 基于图神经网络算法的用户流失预测模型

当前高危流失用户预测建模主要是通过机器学习算法进行流失预测建模。本文基于上述用户感知图谱,通过图神经网络算法对用户流失问题进行建模,并与传统机器学习方法建模结果进行对比,过程如下。

a)流失标签定义。当前账期出账用户作为预测的基础用户,预测这些用户在未来3个月是否会流失,未流失用户标记为0,流失用户标记为1。

b)机器学习方法建模。以积分情况、语音、流量、短信使用情况、费用使用情况、欠缴费等用户属性信息作为特征,进行特征组合以及特征工程,训练逻辑回归、决策树、随机森林、lightGBM等机器学习模型,在测试集上对模型效果进行验证。

c)图算法建模。以用户感知图谱作为数据基础,通过图神经网络算法进行用户节点的嵌入表示(em⁃bedding),将机器学习方法使用特征结合图神经网络模型输出的用户节点 embedding作为 lightGBM 输入,训练 lightGBM 模型,在测试集上对模型结果进行验证。

机器学习算法与图算法建模在测试集上的对比结果如图3所示,相比传统机器学习方法,图算法建模结果在精确率(Precision)、召回率(Recall)、AUC值上均得到了提升,其中精确率提升 3% 左右,召回率和AUC获得了5%以上的提升。通过图算法结合用户感知图谱进行用户节点的embedding,可以挖掘一些潜在的特征,使模型效果获得一定程度的优化,为后续用户挽留打下良好的基础。

3.3 高危流失用户个性化挽留策略

基于上述用户流失预测模型输出高危流失用户名单,通过系统的模型结果下发功能可以将用户名单下发到一线业务人员。系统具备智能话术功能,可以支持一线业务人员对高危流失用户进行个性化挽留。

系统提供的高危流失用户个性化挽留功能如图4所示,主要包括以下步骤。

a)流失预测模型输出名单。基于上述高危流失用户预测模型,输出高危流失用户名单。

b)个性化挽留策略构建。基于系统知识中心构建的用户画像、家庭画像、关系画像、套餐画像,通过策略算法构建个性化用户挽留策略。

c)智能话术。通过系统声图文数据接入能力,接入客服语音数据,通过语音识别、情感分析等技术丰富用户性格标签;基于个性化挽留策略,通过自然语言生成算法生成用于挽留的智能话术,提高挽留的成功率。

通过上述用户感知图谱、用户流失模型、个性化挽留形成高危流失用户感知、预测、挽留的全业务流程,用户挽留过程中的语音记录及对话内容可以用来对流失模型以及个性化策略进行进一步的优化。

04 总 结

人工智能技术的应用为各行业的业务发展提供了新的思路,其中运营商存在海量各种模态的数据,为多模态融合技术的应用提供了土壤。此外,运营商的网络和用户关系等都是图数据,具备应用图神经网络技术的条件。

5G时代运营商业务发展面临极大压力,如何应用新技术提升用户满意度,同时实现运营商降本增效,推动运营商数字化转型是一个重要研究课题。本文通过对用户精准感知系统的核心技术、系统架构与功能、应用场景进行论述和研究,为运营商应用图神经网络与多模态融合等新技术满足业务需求提供了理论和技术支撑。

关于文章

来源于:[1]高伟,汪悦,宋春涛等.基于多模态融合与图神经网络的用户精准感知系统研究[J].邮电设计技术,2023,No.568(06):30-35.

相关推荐
从后端到QT2 分钟前
标量-向量-矩阵-基础知识
人工智能·机器学习·矩阵
新智元3 分钟前
65 岁图灵巨头离职创业!LeCun 愤然与小扎决裂,Meta 巨震
人工智能·openai
机器之心5 分钟前
全球第二、国内第一!钉钉发布DeepResearch多智能体框架,已在真实企业部署
人工智能·openai
新智元12 分钟前
翻译界的 ChatGPT 时刻!Meta 发布新模型,几段示例学会冷门新语言
人工智能·openai
沉默媛14 分钟前
什么是Hinge损失函数
人工智能·损失函数
北青网快讯26 分钟前
声网AI技术赋能,智能客服告别机械式应答
人工智能
机器之心39 分钟前
TypeScript超越Python成GitHub上使用最广语言,AI是主要驱动力
人工智能·openai
nju_spy42 分钟前
周志华《机器学习导论》第 15 章 规则学习(符号主义学习)
人工智能·机器学习·数理逻辑·序贯覆盖·规则学习·ripper·一阶规则学习
许泽宇的技术分享1 小时前
当 AI 工作流需要“人类智慧“:深度解析 Microsoft Agent Framework 的人工接入机制
人工智能·microsoft
ifeng09181 小时前
HarmonyOS资源加载进阶:惰性加载、预加载与缓存机制
深度学习·缓存·harmonyos