Doris Streamloader安装教程

官方连接:Doris Streamloader - Apache Doris

简单概述:Doris Streamloader 是一款用于++将数据导入 Doris 数据库++的专用客户端工具。

step1:安装go环境

复制代码
[root@localhost ~]# rpm --import https://mirror.go-repo.io/centos/RPM-GPG-KEY-GO-REPO
[root@localhost ~]# curl -s https://mirror.go-repo.io/centos/go-repo.repo | tee /etc/yum.repos.d/go-repo.repo
yum install go

step2:新建一个目录,用于存放Doris Streamloader工具

复制代码
mkdir /opt/DorisStreamloader
cd /opt/DorisStreamloader
git clone https://github.com/apache/doris-streamloader.git
cd doris-streamloader

step3:编译项目

复制代码
./build.sh

编译构建成功。

step4:加入到环境变量中

vim /etc/profile

source /etc/profile

step5:构建测试数据,试验工具是否安装成功

创建streamloader_example.csv文件

复制代码
1,Emily,25
2,Benjamin,35
3,Olivia,28
4,Alexander,60
5,Ava,17
6,William,69
7,Sophia,32
8,James,64
9,Emma,37
10,Liam,64

创建表:

复制代码
CREATE TABLE TEST.test_streamloader(
    user_id            BIGINT       NOT NULL COMMENT "用户 ID",
    name               VARCHAR(20)           COMMENT "用户姓名",
    age                INT                   COMMENT "用户年龄"
)
DUPLICATE KEY(user_id)
DISTRIBUTED BY HASH(user_id) BUCKETS 10
PROPERTIES(
"replication_num" = "2"
);

使用steamloader

复制代码
doris-streamloader --source_file="/root/streamloader_example.csv" --url="http://udh01:8030" --header="column_separator:," --db="TEST" --table="test_streamloader"

--source_file:为刚刚创建的CSV绝对路径

--url=:为FE_OR_BE_SERVER_URL:PORT,FE_OR_BE_SERVER_URL是FE或任意BE的IP,PORT是doris webUI访问的端口,我用的是8030

--db="TEST",代表需要导入到TEST库中

--table="test_streamloader",代表导入对应表是test_streamloader

执行以上命令返回如下图代表成功:

相关推荐
郑寿昌3 分钟前
2026脑机接口与大模型融合架构解析
大数据·人工智能·架构
涤生大数据7 分钟前
大数据面试高频题:row_number() 数据倾斜到底怎么解决?
java·大数据·面试
lizhihai_9912 分钟前
股市学习心得-技术指标学习(布林线+MACD)
大数据·人工智能·学习
胡耀超17 分钟前
《设计数据密集型应用》(DDIA, 2nd ed.) 心智模型导览——《Designing Data-Intensive Applications》书介绍导航
大数据·数据库·分布式·ai·架构·数据
一个数据大开发24 分钟前
数据中台架构中本体驱动的语义治理实践
大数据·架构
夏贰四25 分钟前
数据库管理有哪些核心要点?数据库管理该如何规范落地?
大数据·数据库·数据库管理·数据库管理员
石逸凡31 分钟前
论组织本源与钻形式招牌的空子
大数据·组合模式
千桐科技32 分钟前
qData 数据中台开源版v1.5.2 正式发布!重构建模流程,完善全域数据资产治理体系
大数据·开源·#开源项目·# 数据中台·#中小企业数字化·#数据治理·#数字化转型
Elastic 中国社区官方博客1 小时前
一个查询,无限 Elasticsearch Serverless 项目:跨项目搜索介绍
大数据·elasticsearch·搜索引擎·信息可视化·云原生·serverless·全文检索
samFuB2 小时前
【数据集】中国已签署双边投资协定(BIT)数据(2000-2025年)
大数据