Doris Streamloader安装教程

官方连接:Doris Streamloader - Apache Doris

简单概述:Doris Streamloader 是一款用于++将数据导入 Doris 数据库++的专用客户端工具。

step1:安装go环境

复制代码
[root@localhost ~]# rpm --import https://mirror.go-repo.io/centos/RPM-GPG-KEY-GO-REPO
[root@localhost ~]# curl -s https://mirror.go-repo.io/centos/go-repo.repo | tee /etc/yum.repos.d/go-repo.repo
yum install go

step2:新建一个目录,用于存放Doris Streamloader工具

复制代码
mkdir /opt/DorisStreamloader
cd /opt/DorisStreamloader
git clone https://github.com/apache/doris-streamloader.git
cd doris-streamloader

step3:编译项目

复制代码
./build.sh

编译构建成功。

step4:加入到环境变量中

vim /etc/profile

source /etc/profile

step5:构建测试数据,试验工具是否安装成功

创建streamloader_example.csv文件

复制代码
1,Emily,25
2,Benjamin,35
3,Olivia,28
4,Alexander,60
5,Ava,17
6,William,69
7,Sophia,32
8,James,64
9,Emma,37
10,Liam,64

创建表:

复制代码
CREATE TABLE TEST.test_streamloader(
    user_id            BIGINT       NOT NULL COMMENT "用户 ID",
    name               VARCHAR(20)           COMMENT "用户姓名",
    age                INT                   COMMENT "用户年龄"
)
DUPLICATE KEY(user_id)
DISTRIBUTED BY HASH(user_id) BUCKETS 10
PROPERTIES(
"replication_num" = "2"
);

使用steamloader

复制代码
doris-streamloader --source_file="/root/streamloader_example.csv" --url="http://udh01:8030" --header="column_separator:," --db="TEST" --table="test_streamloader"

--source_file:为刚刚创建的CSV绝对路径

--url=:为FE_OR_BE_SERVER_URL:PORT,FE_OR_BE_SERVER_URL是FE或任意BE的IP,PORT是doris webUI访问的端口,我用的是8030

--db="TEST",代表需要导入到TEST库中

--table="test_streamloader",代表导入对应表是test_streamloader

执行以上命令返回如下图代表成功:

相关推荐
Mikhail_G28 分钟前
Python初学者入门指南
大数据·运维·开发语言·python·数据分析
isNotNullX2 小时前
kettle好用吗?相较于国产ETL工具有哪些优劣之处?
大数据·数据库·数据仓库·信息可视化·etl
说私域2 小时前
开源AI大模型AI智能名片S2B2C商城小程序源码赋能下的“信息找人”:人工智能时代的精准零售场景
大数据·人工智能·小程序·开源·零售
G皮T3 小时前
【Elasticsearch】文档迁移(Reindex)
大数据·elasticsearch·搜索引擎·全文检索·文档·reindex·文档迁移
安大小万3 小时前
Git的命令大全
大数据·git·elasticsearch·团队开发·个人开发
璞华Purvar3 小时前
2025年全国技术贸易创新实践案例:AI编辑助手平台助力“一带一路”数字媒体产业高质量发展
大数据·人工智能·媒体
麓殇⊙4 小时前
操作系统期末复习--操作系统初识以及进程与线程
java·大数据·数据库
大师兄带你刨AI4 小时前
「AI大数据」| 《华为:面向智能制造的工业大模型标准化研究报告》
大数据·人工智能
Elastic 中国社区官方博客4 小时前
使用 Elasticsearch 提升 Copilot 能力
大数据·数据库·elasticsearch·搜索引擎·全文检索·copilot·mcp
F36_9_5 小时前
如何高效实现公司文件管理
大数据·数据库·人工智能