- Data Masking的介绍
- Data Masking概览
- 什么是data masking?
Data masking is the process of replacing sensitive information with realistic data based on masking rules.
- 为什么使用data masking?
Use data masking so that data can be shared with nonproduction users such as testing companies.
- Data masking的特点?
- Centralized data masking formats
- Automatic referential integrity
- Shared data mask definition
- Application mask template
- Condition-based, compound and deterministic masking
- Support for heterogeneous database masking
- User-defined masks
- Data Masking工作流程

- Data Masking测试环境
本次测试使用EM12C完成Data masking测试,数据Masking直接在EM12C的资料库中完成
- 硬件环境
HP Proliant DL580 服务器
-
- 8颗双核CPU
- 8 G 内存
- 375 G 硬盘 raid-0
- 千兆网卡
-
软件环境
- OS:Oracle Enterprise Linux 5.7 X86_64
- EM :Enterprise Manager Cloud Control 12C
-
Reporsitory :Oracle Database 11gR2
-
测试需求
测试表: CREDIT.EMP_DM
PK字段: ID1 NUMBER(16)
需加密字段: OCCZIP CHAR(12)
INCOME NUMBER(10)
TIME DATE
表大小: 400 Mb
数据量: 951111

数据样本
-
Data Masking测试过程
-
TDM PACK的部署
EM12C Data Masking 的功能是属于Database Management里的Test Data Management Pack,需要部署在源库上
- 登陆EM12c页面,在任意用户登陆后的页面里,都可以通过点击 "Enterprise" → " Job" →"Activity" 进入配置页面

- 选择"Create Job"的下拉菜单, 选择"Deploy Test Data Management Packages", 点击 "Go"

- "General"页面中输入Job Name,选择要部署的数据库

- Parameters选择"Custom Application"

- Credentials选择"SYSDBA Database Credentials", 完成后"Submit' Job

- 部署成功

-
创建 Application Data Model
-
登陆EM12c页面,在任意用户登陆后的页面里,都可以通过点击 "Quality Management" → "Data Discovery and Modeling" 进入配置页面
-
点击"Create"创建ADM
-
输入ADM名称,选择源数据库,继续
-
选择SCHEMA,继续
-
创建成功后回到配置页面,点击"Edit"进行
-
选择"Sensitive Columns"页面点击"Add"添加敏感字段
-
选择SCHEMA下的表和相关敏感字段
-
添加完成EMP_DM表的3个敏感字段
-
创建 Data Masking Formats
-
登陆EM12c页面,在任意用户登陆后的页面里,都可以通过点击 "Quality Management" → "Data Masking Formats" 进入配置页面
-
点击"Create"创建新的Format

- 创建名为"TIME', RANDOM日期类型的FORMAT

- 输入FORMAT的起始范围


- 点击"OK'完成FORMAT的创建

- 重复以上步骤, 添加了自定义的三个FORMAT: MYZIP, SALARY, TIME

-
创建 Data Masking Definitions
-
登陆EM12c页面,在任意用户登陆后的页面里,都可以通过点击 "Quality Management" → "Data Masking Definitions" 进入配置页面

- 点击"Create"创建新的Masking定义

- 输入Masking定义名, 选择已创建的ADM, 点击添加字段

- 选择SCHEMA后点击"Search", 在ADM中已经定义的敏感字段会全部显示, 选择第一个字段, 点击"Define Format And Add"

- 点击"Import Format"

- 选择"UNDEFINED"类型的敏感字段, 点击"Search", 显示所有自定义的FORMAT, 选择"SALARY"的格式Import

- 可更改字段的起始值, 点"OK"完成字段的添加

- 完成三个字段的添加后点"OK"

- Data Masking Definitions创建完成

-
应用 Data Masking Definitions
-
选择已经创建的Data Masking Definitions, 点击"Generate Script"

- 完成脚本的产生

- 选择已经创建的Data Masking Definitions, 点击"Schedule Job"

- 选择库及操作系统和数据库信任, 点击"Submit"

- 完成后点击"View'查看Job的执行

- JOB执行完成, 耗时45秒

- 根据表的PK字段, 和备份表关联查看Masking结果, 三个字段Masking成功
字段的值按规则完美Masking