lancedb 表名 编解码 与 转译 python

在本地储存 lancedb 数据库,表名需要处理。

如果是有效表名,则直接使用,否则编码为base64字符串 (特化的base64字符串),特化的字符串以 b64u8 开头。

python 复制代码
from lancedb.util import validate_table_name

# ----------------------------------------------------------------------------------------------------------------

_enc_prefix = '_b64u8_'
_encode_translation = bytes.maketrans(b'+/=', b'-_.')
_decode_translation = bytes.maketrans(b'-_.', b'+/=')


# 转译 原始字符串 到 编码后字符串。如果 validate_table_name 失败则转译
def _encode_name(name: str):
    try:
        validate_table_name(name)
        return name
    except ValueError:
        pass
    name = _enc_prefix + base64.b64encode(name.encode('u8')).translate(_encode_translation).decode('u8')
    validate_table_name(name)
    return name

# 转译 编码后字符串 到 原始字符串。根据前缀,决定是否转译
def _decode_name(name: str):
    if name.startswith(_enc_prefix):
        name = name.removeprefix(_enc_prefix)
        name = base64.b64decode(name.encode('u8').translate(_decode_translation)).decode('u8')
    return name


def encode_names(names: str|list[str]):
    if isinstance(names, str):
        return _encode_name(names)
    else:
        assert isinstance(names, (tuple, list))
        return [_encode_name(n) for n in names]

def decode_names(names: str|list[str]):
    if isinstance(names, str):
        return _decode_name(names)
    else:
        assert isinstance(names, (tuple, list))
        return [_decode_name(n) for n in names]


def dt_to_lance_ts_str(t: dt.datetime):
    # 转换为lancedb可用的时间字符串
    t_str = t.strftime("%Y-%m-%d %H:%M:%S.%f")
    t_str2 = f"to_timestamp('{t_str}')"
    return t_str2

# ----------------------------------------------------------------------------------------------------------------
相关推荐
燐妤9 小时前
现代 Python Web 框架:FastAPI实战指南
python·fastapi
清风一徐9 小时前
Python函数基础
开发语言·python
代码地平线9 小时前
C++ 入门篇类和对象·上篇:从本质深剖类与对象与C++基本用法
c语言·开发语言·数据结构·c++·笔记·算法
花落yu9 小时前
【无标题】
pytorch·python·深度学习
云上码厂9 小时前
R 语言基于 lavaan 包实现结构方程模型 (SEM) 从环境配置到建模绘图全流程实战
开发语言·r语言
zhangfeng11339 小时前
htc 中minconda 明明安装了 Python 3.10显示 python 3.8 因为 `conda activate` 没有真正切换成功
开发语言·python·conda
十五年专注C++开发9 小时前
C++17之类模板实参自动推导CTAD
开发语言·c++·聚合初始化·catd
iCxhust9 小时前
C# 程序,实现二进制文件十六进制查看器,支持按行定位
开发语言·单片机·嵌入式硬件·c#·微机原理·8086最小系统·8088单板机
m沐沐9 小时前
【机器学习】NLP---用 Python+TF-IDF 给《红楼梦》自动提取关键词
人工智能·python·机器学习·自然语言处理·nlp·中文分词·tf-idf
Fleshy数模9 小时前
深度学习核心:神经网络
python