利用短整数类型和部分字符串优化DuckDB利用数组求解数独SQL

与利用定长字符串版本相比,利用整数数组的速度略慢,这是因为数组是复杂数据结构,有开销,这个开销抵消了字符串转整数的开销。

因此,它还有几处细节可以优化。

1.存储二进制位状态的rows, cols, boxes数组都保存了大整数,而在每个递归步骤都要保存当前的状态,多用了几倍的空间,考虑每个二进制不超过512,可以用转成smallintl类型来优化。

实测计算只有17个已知数的最小数独,定长字符串版本用时3.048秒,大整数数组用时4.686 秒,短整数数组用时3.212秒。

2.每步用instr从字符串找最前.位置不必要,其实每步的.位置都是确定的, 可以在第一步计算完毕,供以后读取。

3.基于第二点,每步保存的字符串不必是完整字符串,只要保存当前状态部分就够了,然后在最后一步,将它与input再合并成完整字符串。使用了这个优化,短整数数组用时2.881秒,终于反超了定长字符串版本。

sql 复制代码
WITH RECURSIVE
  input(sud) AS (
 VALUES('9......4..5..2........1......69..1........5.24..7......1....3.....6...9....4.....')
--    VALUES('.....1..7....6..2.8..9..3...954....3..3...4..4......8......7..6.1..2....5..3..9..')
  ),
  a(ins) as(select list(i::tinyint order by i) from input, range(1, 82)t(i) where sud[i]='.'), 
  digits(z, lp, bit) AS (
    VALUES('1', 1, 1::smallint)
    UNION ALL SELECT 
    CAST(lp+1 AS TEXT), lp+1, bit * 2 FROM digits WHERE lp<9
  ),
  -- 初始化行列宫的二进制状态(基于已有数字)
  init_state AS (
    SELECT 
      sud,(select list(s::smallint order by rn) from(select sum(bit)s,rn from(select bit,i//9 rn from digits, range(0,81) t(i) where substr(sud,i+1,1)=z union all select 0,i from range(9)t(i)) group by rn)) as rows,

      -- 列的二进制状态数组
      (select list(s::smallint order by rn) from(select sum(bit)s,rn from(select bit,i%9 rn from digits, range(0,81) t(i) where substr(sud,i+1,1)=z union all select 0,i from range(9)t(i)) group by rn)) as cols,

      -- 宫的二进制状态数组
      (select list(s::smallint order by rn) from(select sum(bit)s,rn from(select bit,(i//27*3 + i%9//3) rn from digits, range(0,81) t(i) where substr(sud,i+1,1)=z union all select 0,i from range(9)t(i)) group by rn)) as boxes
    FROM input
  ),
  -- 递归求解
  x(lv, s, ind, rows, cols, boxes) AS (
    SELECT 1::tinyint, '', 
      --substr(replace(sud,'.',''),1,ins[1]-1) 
      ins[1], 
      --instr(sud, '.'),
      rows,
      cols,
      boxes
    FROM init_state, a
    UNION ALL
    SELECT lv+1, 
      s||z, 
      --substr(s, 1, ind-1) || z || substr(s, ind+1),
      ins[lv+1], 
      --instr( substr(s, 1, ind-1) || z || substr(s, ind+1), '.' ),
      -- 更新行的二进制状态
      list_transform(rows, (val, idx) -> 
        CASE WHEN idx = ((ind-1)//9) + 1 THEN val | z.bit ELSE val END),
      -- 更新列的二进制状态
      list_transform(cols, (val, idx) -> 
        CASE WHEN idx = ((ind-1)%9) + 1 THEN val | z.bit ELSE val END),
      -- 更新宫的二进制状态
      list_transform(boxes, (val, idx) -> 
        CASE WHEN idx = (((ind-1)//27)*3 + ((ind-1)%9)//3) + 1 THEN val | z.bit ELSE val END)
    FROM x, digits AS z, a
    WHERE ind>0
      -- AND z.lp BETWEEN 1 AND 9
      -- 使用位运算检查是否可以放置数字
      AND (rows[((ind-1)//9) + 1] & z.bit) = 0
      AND (cols[((ind-1)%9) + 1] & z.bit) = 0
      AND (boxes[(((ind-1)//27)*3 + ((ind-1)%9)//3) + 1] & z.bit) = 0
 )--select s from x,a where lv=len(ins)+1;
  , j as(select s from x,a where lv=len(ins)+1) --结果部分字符串
 , j2 as(select substr(s, i, 1) s, ins[i] idx from j, a , range(1, 82)t(i) where i <=len(ins)) --带位置的结果字符表
 , j3 as(select substr(sud, i, 1)s, i idx from input , range(1, 82)t(i) where substr(sud, i, 1)<>'.') --带位置的初始字符表
 select listagg(s, '' order by idx) from (from j2 union all from j3);
相关推荐
sunywz19 小时前
【JVM】(4)JVM对象创建与内存分配机制深度剖析
开发语言·jvm·python
亲爱的非洲野猪19 小时前
从ReentrantLock到AQS:深入解析Java并发锁的实现哲学
java·开发语言
星火开发设计19 小时前
C++ set 全面解析与实战指南
开发语言·c++·学习·青少年编程·编程·set·知识
cly119 小时前
Ansible自动化(十三):调试与优化
数据库·自动化·ansible
QQ_43766431419 小时前
redis相关命令讲解及原理
数据库·redis·缓存
沛沛老爹19 小时前
Web开发者进阶AI:Agent Skills-深度迭代处理架构——从递归函数到智能决策引擎
java·开发语言·人工智能·科技·架构·企业开发·发展趋势
Good_Starry20 小时前
Java——正则表达式
java·开发语言·正则表达式
萤丰信息20 小时前
开启园区“生命体”时代——智慧园区系统,定义未来的办公与生活
java·大数据·运维·数据库·人工智能·生活·智慧园区
二哈喇子!20 小时前
前端HTML、CSS、JS、VUE 汇总
开发语言·前端
欧洵.20 小时前
Java.基于UDP协议的核心内容
java·开发语言·udp