测试OMS(订单管理系统)时,对Elasticsearch(ES)数据和算法数据进行测试(如何测试几百万条数据)

1. 测试目标

在测试OMS中的ES数据和算法数据时,主要目标包括:

  1. 数据完整性

数据完整性 :确保所有需要的数据都被正确采集、存储和索引。
数据准确性 :确保数据内容正确无误,符合业务逻辑
性能 :确保系统在处理大规模数据时的响应速度和稳定性
一致性 :确保不同模块之间的数据保持一致,尤其是在分布式系统中

在针对几百万条数据进行测试时,进行全面测试可能不太现实,如何对几百万条数据进行测试

2. 测试策略:

数据采样 :采用分层抽样或随机抽样 的方法,选取具有代表性的数据子集进行测试

数据生成工具 :使用**数据生成工具(如Mockaroo、generatedata.com)**生成测试数据,确保数据覆盖各种边界条件和异常情况。

数据备份与还原
数据备份与还原:在测试前备份原始数据,测试完成后还原数据,避免测试对生产环境造成影响。

3. 数据完整性测试
字段完整性 :检查ES索引中的每个字段是否都已正确填充,是否缺少字段
数据覆盖范围 :验证所有需要索引的数据是否都已成功写入ES,是否存在遗漏的数据
数据来源验证:检查数据是否来自正确的数据源,是否按照预定的逻辑进行采集和存储

4.数据准确性测试

根据业务逻辑,定义数据校验规则。例如,检查订单金额是否为正数、日期格式是否正确、字段值是否符合预期范围等。
数据校验规则 :根据业务逻辑,定义数据校验规则。例如,检查订单金额是否为正数、日期格式是否正确、字段值是否符合预期范围等。
数据一致性 :验证ES(Elasticsearch )数据生成工具 中的数据是否与数据库或其他数据源中的数据一致。可以通过编写SQL查询或使用数据比对工具(如WinMerge、Beyond Compare)进行比对
异常数据处理:测试系统是否能够正确处理异常数据,例如重复数据、脏数据等

相关推荐
洛森唛13 小时前
Elasticsearch DSL 查询语法大全:从入门到精通
后端·elasticsearch
字节跳动数据平台18 小时前
代码量减少 70%、GPU 利用率达 95%:火山引擎多模态数据湖如何释放模思智能的算法生产力
大数据
得物技术19 小时前
深入剖析Spark UI界面:参数与界面详解|得物技术
大数据·后端·spark
武子康21 小时前
大数据-238 离线数仓 - 广告业务 Hive分析实战:ADS 点击率、购买率与 Top100 排名避坑
大数据·后端·apache hive
武子康2 天前
大数据-237 离线数仓 - Hive 广告业务实战:ODS→DWD 事件解析、广告明细与转化分析落地
大数据·后端·apache hive
大大大大晴天2 天前
Flink生产问题排障-Kryo serializer scala extensions are not available
大数据·flink
Elasticsearch3 天前
如何使用 Agent Builder 排查 Kubernetes Pod 重启和 OOMKilled 事件
elasticsearch
Elasticsearch4 天前
通用表达式语言 ( CEL ): CEL 输入如何改进 Elastic Agent 集成中的数据收集
elasticsearch
武子康4 天前
大数据-236 离线数仓 - 会员指标验证、DataX 导出与广告业务 ODS/DWD/ADS 全流程
大数据·后端·apache hive
武子康5 天前
大数据-235 离线数仓 - 实战:Flume+HDFS+Hive 搭建 ODS/DWD/DWS/ADS 会员分析链路
大数据·后端·apache hive