技术栈

vectorized

Dreammmming Time
1 年前
spark·iceberg·vectorized·parquet
Iceberg: 列式读取Parquet数据BaseBatchReader支持以Batch + Vectorized的特性,读取底层的文件。通过VectorizedSparkParquetReaders::build Reader()静态方法创建的读取器,关键特性如下: