clickhouse - 重新建表覆盖旧表-解决分区时间错误问题-197001

Wonderful_一直有你2025-05-08 14:01

由于上传时间戳为毫秒级，建表sql的分区按照 PARTITION BY toYYYYMM(toDate(ts)) 秒级划分，导致所有的数据计算后超出范围全部标注在了 1970-01的分区上面。

尝试修改表的配置分区无效。
创建新表更新分区的配置 PARTITION BY toYYYYMM(toDate(ts/1000)) ，抽取数据到新表。再依次验证后还原表名字。

验证函数中的数据，toDate转换的情况

sql 复制代码

SELECT toYYYYMM(toDate(ts / 1000)) FROM ts_kv_cluster 

Query id: efa8f8b1-cb92-4344-b39e-bf18f3c00ff1

┌─toYYYYMM(toDate(divide(ts, 1000)))─┐
│                             202504 │
│                             202504 │
│                             202504 │
│                             202504 │




SELECT toYYYYMM(toDate(ts)) FROM ts_kv_cluster 

Query id: 92620905-0add-4c91-8b3a-2065fe67d7b3

┌─toYYYYMM(toDate(ts))─┐
│               197001 │
│               197001 │
│               197001 │

解决分区的时间错误

sql 复制代码

# 创建新表
 CREATE TABLE iot.ts_kv_cluster_new
(
    `entity_id` String,
    `key` Int32,
    `ts` Int64,
    `bool_v` Nullable(UInt8),
    `str_v` Nullable(String),
    `long_v` Nullable(Int64),
    `dbl_v` Nullable(Float64),
    `json_v` Nullable(String)
)
ENGINE = ReplicatedMergeTree('/clickhouse/table/{shard}/ts_kv_cluster_new', '{replica}')
PARTITION BY toYYYYMM(toDate(ts / 1000))
PRIMARY KEY (entity_id, key, ts)
ORDER BY (entity_id, key, ts)
SETTINGS index_granularity = 8192;



# 复制数据到新表中
INSERT INTO iot.ts_kv_cluster_new SELECT * FROM iot.ts_kv_cluster;

# 对比数量
SELECT COUNT(*) FROM iot.ts_kv_cluster;
SELECT COUNT(*) FROM iot.ts_kv_cluster_old;

# 重命名 原有的表名  到 旧表
RENAME TABLE iot.ts_kv_cluster TO iot.ts_kv_cluster_old;

# 重命名 新表 到原有的表名
RENAME TABLE iot.ts_kv_cluster_new TO iot.ts_kv_cluster;

# 查看分区的分布
SELECT partition, count() FROM system.parts WHERE table = 'ts_kv_cluster' GROUP BY partition;


# 删除 旧表
DROP TABLE iot.ts_kv_cluster_old;