导读:
针对警务业务中多源异构数据难以快速理解、检索分析与直观呈现的问题,本文面向警务数据分析与教学科研场景,设计并实现了一套桌面端数据分析可视化处理平台。平台以Python为主要开发语言,采用PyQt5构建图形交互界面,并通过QtWebEngine将pyecharts生成的交互式HTML图表嵌入客户端,实现"数据处理--分析建模--交互可视化展示"的一体化流程。系统围绕三类典型任务构建模块:1) 网络舆情文本分析与多视图可视化,基于中文分词与停用词过滤完成词频统计,采用TF-IDF评估关键词重要性,生成词云、词频/权重表、评论长度分布图,并结合IP/地域信息进行二维地图展示;2) 警情文本信息检索与统计展示,对案件类别进行聚合统计并生成饼图/玫瑰图,支持按类别条件过滤与表格化结果回显;3) 基于机器学习的人脸识别流程,采用PCA进行特征降维并训练SVM分类器,通过准确率、F1值与混淆矩阵对模型性能进行评估,同时以可视化方式展示推理结果。实验结果表明,该平台具有较好的交互性、模块化与可扩展性,可为警务数据可视化处理系统原型构建及教学实训提供工程化参考。
作者信息:
侯学慧*, 冯玉花:新疆警察学院信息安全工程系,新疆 乌鲁木齐;肖淑蓉:新疆维吾尔自治区人民检察院喀什分院/第一检察部,新疆 喀什
论文详情
需求分析与总体设计
系统主要面向三类应用:网络舆情评论信息分析、警务文本信息搜索及可视化统计、基于机器学习的人脸识别。
平台运行于本地计算机CPU环境,开发工具为PyCharm,Python版本为3.8,依赖库包含Numpy、Sklearn、Pyecharts、PyQt5、Matplotlib、PIL、sqlite3等。
平台采用分层与模块化设计:1) 表示层:PyQt5主窗口与多视图控件,负责菜单切换、输入触发、结果呈现。代码中通过多个按钮连接槽函数实现模块切换与交互,例如网络舆情模块、检索模块、人脸识别模块。2) 业务层:封装文本分析、统计汇总、检索过滤与识别推理逻辑。3) 可视化渲染层:集中在charts逻辑中生成HTML图表文件,并由QtWebEngineView加载显示,形成图表生产与展示解耦。4) 采用SQLite3作为本地持久化存储与查询引擎。系统首次运行时将原始CSV数据集自动导入SQLite数据库并完成表结构初始化;后续文本分析与检索统计均通过SQL查询获取数据,结合对情感字段与类别字段的索引设计提升查询效率与响应速度。
警务数据可视化处理方法
1. 网络舆情文本处理与多视图展示
本文舆情实验所使用的weibo_sentiment_labeled_dataset数据集来源于公开微博评论数据。数据采集时间为2025年3月28日,覆盖57个社会话题,共采集文章1986篇,累计获得评论15,142条。
最终结果以多视图形式输出并可视化展示(关键词表格、词云、长度分布、地图),形成"数据库查询--统计计算--可视化渲染"的闭环流程。
2. 警情文本信息检索与统计可视化
文本信息检索实验数据采用自建的虚拟"警情文本(网络诈骗)"数据集,以结构化表格构建,包含内容"content"与类型"class"字段,用于实现"按类别聚合统计(饼图/玫瑰图)以及按类别过滤回显(表格)"的检索闭环。共1000条文本、9类;类别分布:信贷理财239、购物消费210、冒充类153、平台诈骗110、招聘兼职133、婚恋交友63、网络盗窃53、冒充公检法32、中奖诈骗7;描述案情文本内容长度均值约121个字符。
3. 基于PCA与SVM的人脸识别可视化推理
人脸图片来源于LFW (Labeled Faces in the Wild) people公开数据集,模型评估使用Accuracy、Macro-F1、Kappa、MCC、ROC-AUC等评估指标。
平台实现与界面集成
平台采用主窗口承载多页面控件,通过按钮触发隐藏与显示不同模块区域,实现模块切换。界面包括:舆情文本信息分析(如图1所示)、警情文本信息搜索及人脸识别系统页面,形成统一入口与一致交互。

实验与结果分析
平台在CPU环境下运行,典型任务响应时间为分钟级别,整体效果良好,主要耗时集中在文本预处理、TF-IDF计算、图表渲染及人脸识别训练及推理等步骤,采用离线渲染HTML并加载的方式降低了GUI绘图复杂度,提升了整体可维护性。
"见表1"所示的实验结果,各模型在人脸识别任务中的性能存在明显差异。

讨论与改进方向
数据接入方面:本文平台定位为面向教学实训与科研演示的桌面端原型系统,现阶段实验数据规模相对较小,主要用于验证"数据导入--清洗处理--建模分析--可视化展示"的端到端流程与功能闭环,而非面向真实业务环境的大规模在线处理。
算法能力方面:人脸识别模块目前基于传统机器学习流程,具备可解释与易部署优势,但在复杂光照、姿态变化条件下存在精度上限。可在保留PCA与SVM基线模型的基础上,引入深度学习特征提取网络并采用模型压缩与加速技术以适配边端部署。
可视化联动方面:当前采用多HTML视图并行展示,后续可进一步引入跨图联动选择、高亮与钻取分析机制,实现从词项到文档到地域的关联追踪,提升研判效率。
结论
本文设计并实现了一套面向警务业务需求的数据可视化建模处理平台。平台以PyQt5作为桌面端交互框架,以pyecharts作为交互式可视化引擎,通过QtWebEngine实现图表网页与GUI的融合展示,构建了网络舆情分析、警情文本检索与机器学习人脸识别三类模块,实现从数据预处理、建模分析到可视化呈现的完整流程。实验与应用分析表明,该平台具有良好可用性与扩展潜力,能够为警务数据可视化处理与相关教学科研提供工程化参考。后续将围绕实时数据接入、深度学习识别与可视化联动分析进一步完善。
基金项目:
新疆维吾尔自治区自然科学基金资助项目,项目编号:2025D01B94;2024年度自治区高校本科教育教学研究和改革项目普通教改项目,项目编号:XJGXJGPTB-2024077;2024年新疆警察学院校级科研创新团队项目(数据建模与智能计算),项目编号:XJKYKJTD202401。