数据仓库,扫描量有五种通用技术用于限制数据的扫描量,正如图3 - 4所示。第一种技术是扫描那些被打上时戳的数据。当一个应用对记录的最近一次变化或更改打上时戳时,数据仓库扫描就能够很有效地进行,因为日期不相符的数据就接触不到了。然而,目前的数据被打上时戳的很少。 数据仓库抽取中限制数据扫描量的第二种技术是扫描增量文件。增量文件由应用程序生成,仅仅记录应用中所发生的改变。有了增量文件,扫描的过程就会变得高效,因为不在候选扫描集中的数据永远不会涉及到。但是,许多应用程序并没有创建增量文件。 第三种技术是扫描审计文件或日志文件。