在DuckDB中使用http(s)代理

httpfs插件支持代理,文档 https://duckdb.org/docs/stable/core_extensions/httpfs/https 介绍了两种方法

方法1:

复制代码
CREATE SECRET http_proxy ( TYPE http, HTTP_PROXY 'http://proxy.com:8080');

方法2:

复制代码
set http_proxy='http://proxy.com:8080';

load httpfs;后,按照任意一种方法设置,原来无法访问的互联网地址就能访问了。

比如安装duckdb插件。

如果不设置

复制代码
D install tpch;
IO Error:
Failed to download extension "tpch" at URL "http://extensions.duckdb.org/v1.4.1/linux_arm64/tpch.duckdb_extension.gz"
Extension "tpch" is an existing extension.

如果设置

复制代码
CREATE SECRET http_proxy ( TYPE http, HTTP_PROXY 'http://proxy.com:8080');
┌─────────┐
│ Success │
│ boolean │
├─────────┤
│ true    │
└─────────┘

D install tpch;
100% ▕██████████████████████████████████████▏ (00:00:04.77 elapsed) 

也可以把网络文件保存到表中

复制代码
D create table t as from read_blob('https://www.miit.gov.cn/cms_files/filemanager/1226211233/attach/20259/795cf87158b0441ea697899f4cf626c4.xlsx');
D select count(*) from t;
┌──────────────┐
│ count_star() │
│    int64     │
├──────────────┤
│      1       │
└──────────────┘
D describe t;
┌───────────────┬──────────────────────────┬─────────┬─────────┬─────────┬─────────┐
│  column_name  │       column_type        │  null   │   key   │ default │  extra  │
│    varchar    │         varchar          │ varchar │ varchar │ varchar │ varchar │
├───────────────┼──────────────────────────┼─────────┼─────────┼─────────┼─────────┤
│ filename      │ VARCHAR                  │ YES     │ NULL    │ NULL    │ NULL    │
│ content       │ BLOB                     │ YES     │ NULL    │ NULL    │ NULL    │
│ size          │ BIGINT                   │ YES     │ NULL    │ NULL    │ NULL    │
│ last_modified │ TIMESTAMP WITH TIME ZONE │ YES     │ NULL    │ NULL    │ NULL    │
└───────────────┴──────────────────────────┴─────────┴─────────┴─────────┴─────────┘
D select filename,size from t;
┌─────────────────────────────────────────────────────────────────────────────────────────────────────────────┬───────┐
│                                                  filename                                                   │ size  │
│                                                   varchar                                                   │ int64 │
├─────────────────────────────────────────────────────────────────────────────────────────────────────────────┼───────┤
│ https://www.miit.gov.cn/cms_files/filemanager/1226211233/attach/20259/795cf87158b0441ea697899f4cf626c4.xlsx │ 92279 │
└─────────────────────────────────────────────────────────────────────────────────────────────────────────────┴───────┘
copy (select content from t) to 'car.blob';

注意,有的功能比如rusty_sheet需要持久的SECRET ,否则仍无法访问。

复制代码
-- 按照上述任意一种设置后:
from read_sheet('https://www.miit.gov.cn/cms_files/filemanager/1226211233/attach/20259/795cf87158b0441ea697899f4cf626c4.xlsx',range='2:');
Binder Error:
https://www.miit.gov.cn/cms_files/filemanager/1226211233/attach/20259/795cf87158b0441ea697899f4cf626c4.xlsx: IO Error: SSL connection failed error for HTTP HEAD to 'https://www.miit.gov.cn/cms_files/filemanager/1226211233/attach/20259/795cf87158b0441ea697899f4cf626c4.xlsx'

LINE 1: from read_sheet('https://www.miit.gov.cn/cms_files/filemanager...
             ^


CREATE persistent SECRET http_proxy( TYPE http, HTTP_PROXY 'http://proxy.com:8080');
┌─────────┐
│ Success │
│ boolean │
├─────────┤
│ true    │
└─────────┘

D from read_sheet('https://www.miit.gov.cn/cms_files/filemanager/1226211233/attach/20259/795cf87158b0441ea697899f4cf626c4.xlsx',range='2:');
┌─────────┬─────────┬──────────────────────┬───────────────────┬────────────────────┬───┬──────────────────────┬──────────────────────┬──────────────────────┬──────────────────────┐
│  地区   │  序号   │     车辆生产企业     │     车辆型号      │ 申报推广数\n(辆) │ ... │ 核定补助标准\n(万...  │ 应清算补助资金\n(...  │ 按整车企业取整后补...  │       核减原因       │
│ varchar │ varchar │       varchar        │      varchar      │       int64        │   │        double        │        double        │        int64         │       varchar        │
├─────────┼─────────┼──────────────────────┼───────────────────┼────────────────────┼───┼──────────────────────┼──────────────────────┼──────────────────────┼──────────────────────┤

设置了持久SECRET后,它就保存到本地,不用每次打开DuckDB重新设置,若要取消设置,用drop persistent secret http_proxy;

相关推荐
我命由我123454 小时前
Java 开发 - 粘包处理器 - 基于消息头 + 消息体(魔数验证、长度验证)
java·网络·后端·网络协议·java-ee·intellij-idea·intellij idea
小糖学代码4 小时前
网络:5.应用层协议HTTP
网络·网络协议·http
JIngJaneIL6 小时前
就业|高校就业|基于ssm+vue的高校就业信息系统的设计与实现(源码+数据库+文档)
java·前端·数据库·vue.js·spring boot·毕设·高校就业
CXH7286 小时前
nginx-file-server
运维·数据库·nginx
一 乐6 小时前
社区互助|社区交易|基于springboot+vue的社区互助交易系统(源码+数据库+文档)
java·数据库·vue.js·spring boot·后端·小区互助系统
q***57746 小时前
Spring Boot 实战:轻松实现文件上传与下载功能
java·数据库·spring boot
失散136 小时前
分布式专题——57 如何保证MySQL数据库到ES的数据一致性
java·数据库·分布式·mysql·elasticsearch·架构
YJlio6 小时前
进程和诊断工具速查手册(8.13):VMMap / DebugView / LiveKd / Handle / ListDLLs 一页式现场排障清单
数据库·笔记·学习
whn19777 小时前
达梦的dbms_lock在DSC中能用吗
数据库
未来之窗软件服务7 小时前
自建开发工具IDE(五)数据库预览——东方仙盟炼气期
数据库·ide·仙盟创梦ide·东方仙盟