Doris Streamloader安装教程

官方连接:Doris Streamloader - Apache Doris

简单概述:Doris Streamloader 是一款用于++将数据导入 Doris 数据库++的专用客户端工具。

step1:安装go环境

复制代码
[root@localhost ~]# rpm --import https://mirror.go-repo.io/centos/RPM-GPG-KEY-GO-REPO
[root@localhost ~]# curl -s https://mirror.go-repo.io/centos/go-repo.repo | tee /etc/yum.repos.d/go-repo.repo
yum install go

step2:新建一个目录,用于存放Doris Streamloader工具

复制代码
mkdir /opt/DorisStreamloader
cd /opt/DorisStreamloader
git clone https://github.com/apache/doris-streamloader.git
cd doris-streamloader

step3:编译项目

复制代码
./build.sh

编译构建成功。

step4:加入到环境变量中

vim /etc/profile

source /etc/profile

step5:构建测试数据,试验工具是否安装成功

创建streamloader_example.csv文件

复制代码
1,Emily,25
2,Benjamin,35
3,Olivia,28
4,Alexander,60
5,Ava,17
6,William,69
7,Sophia,32
8,James,64
9,Emma,37
10,Liam,64

创建表:

复制代码
CREATE TABLE TEST.test_streamloader(
    user_id            BIGINT       NOT NULL COMMENT "用户 ID",
    name               VARCHAR(20)           COMMENT "用户姓名",
    age                INT                   COMMENT "用户年龄"
)
DUPLICATE KEY(user_id)
DISTRIBUTED BY HASH(user_id) BUCKETS 10
PROPERTIES(
"replication_num" = "2"
);

使用steamloader

复制代码
doris-streamloader --source_file="/root/streamloader_example.csv" --url="http://udh01:8030" --header="column_separator:," --db="TEST" --table="test_streamloader"

--source_file:为刚刚创建的CSV绝对路径

--url=:为FE_OR_BE_SERVER_URL:PORT,FE_OR_BE_SERVER_URL是FE或任意BE的IP,PORT是doris webUI访问的端口,我用的是8030

--db="TEST",代表需要导入到TEST库中

--table="test_streamloader",代表导入对应表是test_streamloader

执行以上命令返回如下图代表成功:

相关推荐
小悟空几秒前
[AI 生成] Flink 面试题
大数据·面试·flink
livemetee5 分钟前
Flink2.0学习笔记:Stream API 常用转换算子
大数据·学习·flink
AutoMQ2 小时前
技术干货|为什么越来越多企业放弃 Flink/Spark,用 AutoMQ 替代传统 ETL?
大数据
zxsz_com_cn3 小时前
智能化设备健康管理:中讯烛龙预测性维护系统引领行业变革
大数据·架构
Pigwantofly4 小时前
SpringAI入门及浅实践,实战 Spring‎ AI 调用大模型、提示词工程、对话记忆、Adv‎isor 的使用
java·大数据·人工智能·spring
拓端研究室4 小时前
专题:2025电商增长新势力洞察报告:区域裂变、平台垄断与银发平权|附260+报告PDF、原数据表汇总下载
大数据·人工智能
阿里云大数据AI技术5 小时前
[VLDB 2025]面向Flink集群巡检的交叉对比学习异常检测
大数据·人工智能·flink
青云交5 小时前
电科金仓 KingbaseES 深度解码:技术突破・行业实践・沙龙邀约 -- 融合数据库的变革之力
大数据·数据安全·数字化转型·kingbasees·企业级应用·融合数据库·多模存储
shinelord明6 小时前
【计算机网络架构】网状型架构简介
大数据·分布式·计算机网络·架构·计算机科学与技术
lucky_syq6 小时前
Flink窗口:解锁流计算的秘密武器
大数据·flink