Doris Streamloader安装教程

官方连接:Doris Streamloader - Apache Doris

简单概述:Doris Streamloader 是一款用于++将数据导入 Doris 数据库++的专用客户端工具。

step1:安装go环境

复制代码
[root@localhost ~]# rpm --import https://mirror.go-repo.io/centos/RPM-GPG-KEY-GO-REPO
[root@localhost ~]# curl -s https://mirror.go-repo.io/centos/go-repo.repo | tee /etc/yum.repos.d/go-repo.repo
yum install go

step2:新建一个目录,用于存放Doris Streamloader工具

复制代码
mkdir /opt/DorisStreamloader
cd /opt/DorisStreamloader
git clone https://github.com/apache/doris-streamloader.git
cd doris-streamloader

step3:编译项目

复制代码
./build.sh

编译构建成功。

step4:加入到环境变量中

vim /etc/profile

source /etc/profile

step5:构建测试数据,试验工具是否安装成功

创建streamloader_example.csv文件

复制代码
1,Emily,25
2,Benjamin,35
3,Olivia,28
4,Alexander,60
5,Ava,17
6,William,69
7,Sophia,32
8,James,64
9,Emma,37
10,Liam,64

创建表:

复制代码
CREATE TABLE TEST.test_streamloader(
    user_id            BIGINT       NOT NULL COMMENT "用户 ID",
    name               VARCHAR(20)           COMMENT "用户姓名",
    age                INT                   COMMENT "用户年龄"
)
DUPLICATE KEY(user_id)
DISTRIBUTED BY HASH(user_id) BUCKETS 10
PROPERTIES(
"replication_num" = "2"
);

使用steamloader

复制代码
doris-streamloader --source_file="/root/streamloader_example.csv" --url="http://udh01:8030" --header="column_separator:," --db="TEST" --table="test_streamloader"

--source_file:为刚刚创建的CSV绝对路径

--url=:为FE_OR_BE_SERVER_URL:PORT,FE_OR_BE_SERVER_URL是FE或任意BE的IP,PORT是doris webUI访问的端口,我用的是8030

--db="TEST",代表需要导入到TEST库中

--table="test_streamloader",代表导入对应表是test_streamloader

执行以上命令返回如下图代表成功:

相关推荐
字节跳动数据平台19 小时前
代码量减少 70%、GPU 利用率达 95%:火山引擎多模态数据湖如何释放模思智能的算法生产力
大数据
得物技术20 小时前
深入剖析Spark UI界面:参数与界面详解|得物技术
大数据·后端·spark
武子康1 天前
大数据-238 离线数仓 - 广告业务 Hive分析实战:ADS 点击率、购买率与 Top100 排名避坑
大数据·后端·apache hive
武子康2 天前
大数据-237 离线数仓 - Hive 广告业务实战:ODS→DWD 事件解析、广告明细与转化分析落地
大数据·后端·apache hive
大大大大晴天2 天前
Flink生产问题排障-Kryo serializer scala extensions are not available
大数据·flink
武子康4 天前
大数据-236 离线数仓 - 会员指标验证、DataX 导出与广告业务 ODS/DWD/ADS 全流程
大数据·后端·apache hive
武子康5 天前
大数据-235 离线数仓 - 实战:Flume+HDFS+Hive 搭建 ODS/DWD/DWS/ADS 会员分析链路
大数据·后端·apache hive
DianSan_ERP5 天前
电商API接口全链路监控:构建坚不可摧的线上运维防线
大数据·运维·网络·人工智能·git·servlet
够快云库6 天前
能源行业非结构化数据治理实战:从数据沼泽到智能资产
大数据·人工智能·机器学习·企业文件安全
AI周红伟6 天前
周红伟:智能体全栈构建实操:OpenClaw部署+Agent Skills+Seedance+RAG从入门到实战
大数据·人工智能·大模型·智能体