ClickHouse安装教程:开启你的列式数据库之旅

ClickHouse是一个高性能的列式数据库管理系统,适用于在线分析处理(OLAP)。以下是ClickHouse的一些基本使用步骤:

  1. 下载二进制文件:您可以通过运行以下curl命令在Linux、FreeBSD或macOS上本地下载ClickHouse:

    curl https://clickhouse.com/ | sh

此安装方式也是目前官方推荐的安装方式,执行完后,会下载二进制文件

  1. 安装应用:按照上一步输出的命令提示执行

    ./clickhouse install

中间会提示输入数据库密码,输入后回车

看到这个就是安装成功了

  1. 启动服务器:运行以下命令来启动ClickHouse服务器:

    clickhouse start

  1. 启动客户端 :使用clickhouse-client连接到您的ClickHouse服务。打开一个新的终端,切换到保存clickhouse二进制文件的目录,然后运行以下命令:

    clickhouse-client --password xxx

Warnings:

  • Delay accounting is not enabled, OSIOWaitMicroseconds will not be gathered. You can enable it using echo 1 > /proc/sys/kernel/task_delayacct or by using sysctl.
  • Maximum number of threads is lower than 30000. There could be problems with handling a lot of simultaneous queries.

一般不用管它,当然也可以调怎一下:

  • 延迟计算未启用:这意味着OSIOWaitMicroseconds(操作系统输入/输出等待时间的微秒数)将无法收集。要解决这个问题,您可以通过以下命令启用延迟计算:

    echo 1 > /proc/sys/kernel/task_delayacct

  • 线程数低于30000 :这个警告表明,当前设置的线程数可能不足以处理大量的同时查询。您可以通过修改ClickHouse的配置文件来增加线程数。在/etc/clickhouse-server/config.xml文件中找到max_threads设置,并根据您的服务器性能和负载情况进行调整。如:

    <yandex> ... <max_threads>30000</max_threads> ... </yandex>

调整后,重启ClickHouse服务

  1. 创建表 :使用CREATE TABLE定义一个新表。ClickHouse中的典型SQL DDL命令工作正常,但需要添加一个ENGINE子句。使用MergeTree可以利用ClickHouse的性能优势:

    CREATE TABLE my_table (
    user_id UInt32,
    message String,
    timestamp DateTime
    ) ENGINE = MergeTree PRIMARY KEY (user_id, timestamp)

  1. 插入数据 :您可以使用熟悉的INSERT INTO TABLE命令与ClickHouse一起使用,但重要的是要理解,每次插入到MergeTree表都会在存储中创建一个部分(文件夹)。为了最小化部分,一次性批量插入大量行(成千上万甚至数百万):

    INSERT INTO my_table (user_id, message, timestamp)
    VALUES
    (101, 'Hello, ClickHouse!', now()),
    (102, 'Insert a lot of rows per batch', yesterday()),
    (102, 'Sort your data based on your commonly-used queries', today()),
    (101, 'Granules are the smallest chunks of data read', now() + 5)

  1. 查询新表:您可以像使用任何SQL数据库一样编写SELECT查询:

    SELECT * FROM my_table ORDER BY timestamp

ClickHouse图形客户端

上面我们使用的是命令行客户端连接clickhouse,当然也是有图形客户端可以使用的,我们来看看DBeaver,基本上和MySQL一样。

相关推荐
学掌门12 分钟前
数据分析师职业规划——数据分析师的职业焦虑与未来发展
大数据·信息可视化
亚马逊云开发者13 分钟前
EMR Core 节点部署 Flink Client 实战:Bootstrap Action 一次打包多次复用,解决调度系统提交任务的痛点
大数据·flink·bootstrap
盘古信息IMS31 分钟前
九宸纳百川,数智启新程|盘古信息与合肥昊邦科技合资成立合肥九宸智能,共筑智造新生态
大数据·人工智能
Irene199140 分钟前
大数据开发语境下,SQL 模式名,映射关系 - - 概念理解
大数据·数据库·sql
顾随44 分钟前
(二)kettle--输入与输出
javascript·数据库·kettle
2401_833033621 小时前
如何修复固定定位头部容器中悬浮下拉菜单的错位问题
jvm·数据库·python
SelectDB1 小时前
Doris & SelectDB for AI 实战:从基础 RAG 到知识图谱增强的完整实现
数据库·人工智能·数据分析
小熊美家熊猫系统1 小时前
社区家政与平台家政:两种创业模式的深度对比分析
大数据·家政行业·社区家政·平台家政·家政管理软件
互联网志1 小时前
打通转化通道 赋能产业发展——高校科技成果转化的现状与破局
大数据·人工智能·物联网
绿虫光伏运维1 小时前
一文理清光伏运维的内容、常见问题与重要措施
大数据·运维·光伏业务