PostgreSQL 16 + pgvector 完整安装和内网访问指南(Ubuntu 20.04)

1. 更新系统并安装必要工具

bash 复制代码
sudo apt update
sudo apt install -y wget ca-certificates gnupg lsb-release

2. 导入 PostgreSQL archive 仓库 GPG 密钥

bash 复制代码
wget -qO- https://www.postgresql.org/media/keys/ACCC4CF8.asc | sudo gpg --dearmor -o /usr/share/keyrings/postgresql-archive.gpg

3. 添加 PostgreSQL 16 archive 仓库

bash 复制代码
echo "deb [signed-by=/usr/share/keyrings/postgresql-archive.gpg] https://apt-archive.postgresql.org/pub/repos/apt focal-pgdg-archive main" | sudo tee /etc/apt/sources.list.d/pgdg-archive.list

注意 :如果之前添加过 http://apt.postgresql.org/pub/repos/apt focal-pgdg 的仓库,需要删除:

bash 复制代码
sudo rm /etc/apt/sources.list.d/pgdg.list

4. 更新软件源索引

bash 复制代码
sudo apt update

此时应该看到 focal-pgdg-archive 成功更新。


5. 安装 PostgreSQL 16 与 pgvector

bash 复制代码
sudo apt install -y postgresql-16 postgresql-client-16 postgresql-contrib-16
sudo apt install -y postgresql-16-pgvector

6. 启动 PostgreSQL 并设置开机自启

bash 复制代码
sudo systemctl start postgresql
sudo systemctl enable postgresql

7. 切换到 PostgreSQL 系统用户并进入 psql

bash 复制代码
sudo -i -u postgres
psql

提示符应为:

复制代码
postgres=#

8. 设置超级用户密码

sql 复制代码
ALTER USER postgres PASSWORD 'root';
  • 密码 root 仅为示例,生产环境请使用安全密码

9. 配置允许内网访问

编辑 pg_hba.conf:

bash 复制代码
sudo vim /etc/postgresql/16/main/pg_hba.conf

在文件末尾追加(假设内网段是 10.0.0.0/8):

conf 复制代码
# Allow internal network access
host    all     all     10.0.0.0/8     scram-sha-256

如果只想允许单台机器,例如 10.0.4.10:

conf 复制代码
host    all     all     10.0.4.10/32  scram-sha-256

10. 修改监听地址

编辑 postgresql.conf:

bash 复制代码
sudo vi /etc/postgresql/16/main/postgresql.conf

找到:

conf 复制代码
#listen_addresses = 'localhost'

改为:

conf 复制代码
listen_addresses = '*'

或只监听内网 IP:

conf 复制代码
listen_addresses = '10.0.4.121'

11. 重启 PostgreSQL

bash 复制代码
sudo systemctl restart postgresql

12. 验证服务监听

bash 复制代码
ss -lntp | grep 5432

应看到:

复制代码
0.0.0.0:5432
[::]:5432

说明 PostgreSQL 已对内网开放。


13. 验证 pgvector 插件

sql 复制代码
CREATE EXTENSION IF NOT EXISTS vector;

SELECT extname, extversion FROM pg_extension WHERE extname='vector';

输出示例:

复制代码
 extname | extversion
---------+------------
 vector  | 0.8.0

14. 创建向量存储示例表

sql 复制代码
CREATE TABLE embedding_store (
    id bigserial PRIMARY KEY,
    biz_id varchar(64),
    content text NOT NULL,
    embedding vector(1536) NOT NULL,
    metadata jsonb,
    created_at timestamptz DEFAULT now()
);
  • 1536 是 OpenAI Embedding 默认维度,可按需修改

15. 插入测试数据

sql 复制代码
INSERT INTO embedding_store (biz_id, content, embedding, metadata)
VALUES (
    'test-1',
    'pgvector test record',
    array_fill(0.01, ARRAY[1536])::vector,
    '{"source": "manual_test"}'
);

16. 向量相似度查询示例

sql 复制代码
SELECT
    id,
    biz_id,
    content,
    embedding <=> array_fill(0.01, ARRAY[1536])::vector AS distance
FROM embedding_store
ORDER BY distance
LIMIT 3;

17. 创建向量索引(HNSW,提升大数据性能)

sql 复制代码
CREATE INDEX embedding_store_hnsw_idx
ON embedding_store
USING hnsw (embedding vector_l2_ops)
WITH (
    m = 16,
    ef_construction = 200
);

-- 查询前设置搜索参数
SET hnsw.ef_search = 40;

18. 内网访问测试

从内网其他机器执行:

bash 复制代码
psql -h 10.0.4.10 -U postgres -d postgres -W

输入密码 root,即可登录。


19. 生产环境安全建议

  1. 不要用 postgres 做业务操作
    • 创建专用业务用户:
sql 复制代码
CREATE USER myapp WITH PASSWORD 'MyAppPass123';
CREATE DATABASE myappdb OWNER myapp;
  1. 防火墙控制内网访问
bash 复制代码
sudo ufw allow from 10.0.0.0/8 to any port 5432
sudo ufw reload
  1. 不要直接暴露 0.0.0.0 到公网
    • 仅内网访问或 VPN

以上就是 Ubuntu 20.04 + PostgreSQL 16 + pgvector + 内网访问 + 密码设置 + 向量表 + HNSW 索引 的完整流程

相关推荐
霖霖总总1 天前
[小技巧56]深入理解 MySQL 聚簇索引与非聚簇索引:原理、差异与实践
数据库·mysql
Dreamboat-L1 天前
Redis及其两种持久化技术详解
数据库·redis·缓存
伐尘1 天前
【MySQL】间隙锁 与 排他锁 的区别
数据库·mysql
浒畔居1 天前
机器学习模型部署:将模型转化为Web API
jvm·数据库·python
一个响当当的名号1 天前
lectrue9 索引并发控制
java·开发语言·数据库
liu****1 天前
4.Qt窗口开发全解析:菜单栏、工具栏、状态栏及对话框实战
数据库·c++·qt·系统架构
bjxiaxueliang1 天前
一文解决蓝牙连接难题:Ubuntu命令行蓝牙强制配对
linux·ubuntu·蓝牙连接命令
三水不滴1 天前
Redis缓存更新策略
数据库·经验分享·redis·笔记·后端·缓存
Will_Ye1 天前
Ubuntu22.04 蓝牙设备快速自动连接
ubuntu·bluetoothctl
企鹅侠客1 天前
第35章—内核解析篇:Redis内存淘汰机制
数据库·redis