在DuckDB中使用http(s)代理

httpfs插件支持代理,文档 https://duckdb.org/docs/stable/core_extensions/httpfs/https 介绍了两种方法

方法1:

复制代码
CREATE SECRET http_proxy ( TYPE http, HTTP_PROXY 'http://proxy.com:8080');

方法2:

复制代码
set http_proxy='http://proxy.com:8080';

load httpfs;后,按照任意一种方法设置,原来无法访问的互联网地址就能访问了。

比如安装duckdb插件。

如果不设置

复制代码
D install tpch;
IO Error:
Failed to download extension "tpch" at URL "http://extensions.duckdb.org/v1.4.1/linux_arm64/tpch.duckdb_extension.gz"
Extension "tpch" is an existing extension.

如果设置

复制代码
CREATE SECRET http_proxy ( TYPE http, HTTP_PROXY 'http://proxy.com:8080');
┌─────────┐
│ Success │
│ boolean │
├─────────┤
│ true    │
└─────────┘

D install tpch;
100% ▕██████████████████████████████████████▏ (00:00:04.77 elapsed) 

也可以把网络文件保存到表中

复制代码
D create table t as from read_blob('https://www.miit.gov.cn/cms_files/filemanager/1226211233/attach/20259/795cf87158b0441ea697899f4cf626c4.xlsx');
D select count(*) from t;
┌──────────────┐
│ count_star() │
│    int64     │
├──────────────┤
│      1       │
└──────────────┘
D describe t;
┌───────────────┬──────────────────────────┬─────────┬─────────┬─────────┬─────────┐
│  column_name  │       column_type        │  null   │   key   │ default │  extra  │
│    varchar    │         varchar          │ varchar │ varchar │ varchar │ varchar │
├───────────────┼──────────────────────────┼─────────┼─────────┼─────────┼─────────┤
│ filename      │ VARCHAR                  │ YES     │ NULL    │ NULL    │ NULL    │
│ content       │ BLOB                     │ YES     │ NULL    │ NULL    │ NULL    │
│ size          │ BIGINT                   │ YES     │ NULL    │ NULL    │ NULL    │
│ last_modified │ TIMESTAMP WITH TIME ZONE │ YES     │ NULL    │ NULL    │ NULL    │
└───────────────┴──────────────────────────┴─────────┴─────────┴─────────┴─────────┘
D select filename,size from t;
┌─────────────────────────────────────────────────────────────────────────────────────────────────────────────┬───────┐
│                                                  filename                                                   │ size  │
│                                                   varchar                                                   │ int64 │
├─────────────────────────────────────────────────────────────────────────────────────────────────────────────┼───────┤
│ https://www.miit.gov.cn/cms_files/filemanager/1226211233/attach/20259/795cf87158b0441ea697899f4cf626c4.xlsx │ 92279 │
└─────────────────────────────────────────────────────────────────────────────────────────────────────────────┴───────┘
copy (select content from t) to 'car.blob';

注意,有的功能比如rusty_sheet需要持久的SECRET ,否则仍无法访问。

复制代码
-- 按照上述任意一种设置后:
from read_sheet('https://www.miit.gov.cn/cms_files/filemanager/1226211233/attach/20259/795cf87158b0441ea697899f4cf626c4.xlsx',range='2:');
Binder Error:
https://www.miit.gov.cn/cms_files/filemanager/1226211233/attach/20259/795cf87158b0441ea697899f4cf626c4.xlsx: IO Error: SSL connection failed error for HTTP HEAD to 'https://www.miit.gov.cn/cms_files/filemanager/1226211233/attach/20259/795cf87158b0441ea697899f4cf626c4.xlsx'

LINE 1: from read_sheet('https://www.miit.gov.cn/cms_files/filemanager...
             ^


CREATE persistent SECRET http_proxy( TYPE http, HTTP_PROXY 'http://proxy.com:8080');
┌─────────┐
│ Success │
│ boolean │
├─────────┤
│ true    │
└─────────┘

D from read_sheet('https://www.miit.gov.cn/cms_files/filemanager/1226211233/attach/20259/795cf87158b0441ea697899f4cf626c4.xlsx',range='2:');
┌─────────┬─────────┬──────────────────────┬───────────────────┬────────────────────┬───┬──────────────────────┬──────────────────────┬──────────────────────┬──────────────────────┐
│  地区   │  序号   │     车辆生产企业     │     车辆型号      │ 申报推广数\n(辆) │ ... │ 核定补助标准\n(万...  │ 应清算补助资金\n(...  │ 按整车企业取整后补...  │       核减原因       │
│ varchar │ varchar │       varchar        │      varchar      │       int64        │   │        double        │        double        │        int64         │       varchar        │
├─────────┼─────────┼──────────────────────┼───────────────────┼────────────────────┼───┼──────────────────────┼──────────────────────┼──────────────────────┼──────────────────────┤

设置了持久SECRET后,它就保存到本地,不用每次打开DuckDB重新设置,若要取消设置,用drop persistent secret http_proxy;

相关推荐
一只fish14 小时前
Oracle官方文档翻译《Database Concepts 26ai》第23章-数据库开发者概念
数据库·oracle
todoitbo14 小时前
从 MySQL 到 KingbaseES:Database、Schema、User 一次讲透
数据库·mysql·国产数据库·kingbasees
勇往直前plus15 小时前
Redis&Python 梳理
数据库·redis·python
千云15 小时前
100w大表0停机回滚:我们为什么放弃Undo Log,选择表名切换?
数据库·后端·mysql
SXJR15 小时前
使用docker 部署向量数据库Milvus
数据库·docker·容器·milvus·向量数据库
这个DBA有点耶15 小时前
时序数据库深度对比:2026 年主流 TSDB 架构演进与选型指南
数据库·sql·云原生·架构·运维开发·时序数据库
计算机安禾15 小时前
【数据库系统原理】第9篇:SQL的结构化思维:DDL、DML与DCL的职责分离
数据库·sql·oracle
计算机安禾15 小时前
【数据库系统原理】第12篇:视图机制:外模式在SQL层级的逻辑数据独立性实现
数据库·sql·oracle
前进的李工15 小时前
MySQL性能优化:索引与子查询实战技巧
数据库·sql·mysql·性能优化
疯狂成瘾者15 小时前
API Key 生成和鉴权机制:从随机凭证生成到请求拦截校验
数据库·oracle