【Apache Doris】周FAQ集锦:第 9 期

【Apache Doris】周FAQ集锦:第 9 期

欢迎查阅本周的 Apache Doris 社区 FAQ 栏目!

在这个栏目中,每周将筛选社区反馈的热门问题和话题,重点回答并进行深入探讨。旨在为广大用户和开发者分享有关 Apache Doris 的常见问题。

通过这个每周 FAQ 栏目,希望帮助社区小伙伴更好地了解和应用 Apache Doris,促进经验交流和技术共享。

SQL问题

❓Q1 doris如何查看表的状态是否正常?

💡A1 如下:

ADMIN SHOW REPLICA STATUS FROM {表名} WHERE STATUS != "OK";

❓Q2 2.0.2版本查询时报:

detailMessage = (xx.xx.xx.xx)[INVALID_ARGUMENT]unknown filter

💡A2 2.0.9版本已经fix,可以考虑升级至最新的三位数版本,稳定性更佳。

2.0.9 release内容可以查阅:
https://doris.apache.org/zh-CN/docs/dev/releasenotes/release-2.0.9

数据操作问题

❓Q3 已建的表是否能修改或者新增Properties配置项?

💡A3 如下:

  1. 大部分可以直接alter table set propery
  2. 有些配置项需要重建表,比如 unique 模型开启mow 需要重新建表
    具体可以查阅ALTER-TABLE-PROPERTY:
    https://doris.apache.org/zh-CN/docs/dev/sql-manual/sql-statements/Data-Definition-Statements/Alter/ALTER-TABLE-PROPERTY

❓Q4 通过catalog的方式同步至doris,对上游系统的性能是否有影响?

💡A4 只有scan数据的负载,不过影响不大;如果是rds,一般都有主备模式,可以从备库读,最小化影响。

❓Q5 动态分区表的分区数超过500是否无法再创建了?

💡A5 如下:

  1. 动态分区start-end默认最大创建是500(可以设置max_dynamic_partition_num调大),建表时显示创建默认最大是4096
  2. 相关参数设置
    a. 批量创建:max_multi_partition_num
    b. 动态分区:max_dynamic_partition_num
    FE参数说明可以查阅FE配置项:
    https://doris.apache.org/zh-CN/docs/dev/admin-manual/config/fe-config

❓Q6 doris能连金仓吗?

💡A6 开源doris目前不支持直接连接金仓,但可以通过etl工具将金仓数据导入doris中进行分析查询。

❓Q7 doris中使用like模糊查询有什么优化建议?

💡A7 可以通过NGram BloomFilter 加速。

NGram BloomFilter 内容可以查阅:
https://doris.apache.org/zh-CN/docs/dev/table-design/index/ngram-bloomfilter-index

运维常见问题

❓Q8 doris的be宕机问题如何排查?

💡A8 目前一般遇到的有这么几种情况:

  1. BE 进程非正常退出
    a. 有 bug 导致BE进程Crash
    b. BE 进程OOM
  2. BE 进程正常退出
    主要看非正常退出这块。因为其实有部分情况是这样的,
    有些同学和运维同学内部没有对齐,可能服务器reboot了或者什么情况,
    所以一般出现问题后,可以先和相关的同学对齐下,看看是否有其他操作。
    具体可以查阅Doris论坛帖子:
    https://ask.selectdb.com/questions/D1GG/be-dang-ji-wen-ti-pai-cha-de-zui-jia-shi-jian

❓Q9 doris从2.0.4升级到2.1后,审计日志表不更新

💡A9 2.1后审计日志表为__internal_schema.audit_log,可以手动在__internal_schema里建audit_log表解决。

2.1 release内容可以查阅:
https://doris.apache.org/zh-CN/docs/dev/releasenotes/release-2.1.0/

其它问题

❓Q10 doris是否可以用于存日志/时序数据,进行大规模日志/时序数据处理和分析?

💡A10 doris在日志/时序场景持续深耕,推出了一系列核心能力,如高效的倒排索引、灵活的 Variant 数据类型等,为日志/时序数据的处理分析提供了更高效、灵活的解决方案。

具体可以查阅最新的一篇实践PR:
https://mp.weixin.qq.com/s/O3H80qL3Gqysn853n-bm5g


一臻数据

关于社区

Apache Doris 是一个基于 MPP 架构的高性能、实时的分析型数据库,以极速易用的特点被人们所熟知,仅需亚秒级响应时间即可返回海量数据下的查询结果,不仅可以支持高并发的点查询场景,也能支持高吞吐的复杂分析场景。

如果您对 Apache Doris 感兴趣,可以通过以下入口访问官方网站、社区论坛、GitHub和dev邮件组:

💡官方文档

💡社区论坛

💡GitHub

💡dev邮件组:dev@doris.apache.org

非常欢迎您在社区论坛中与其他用户分享您的使用经验和技巧,或者向dev邮件组提交反馈和意见。

相信,您的参与将帮助Apache Doris变得更加完善。

相关推荐
PersistJiao17 分钟前
在 Spark RDD 中,sortBy 和 top 算子的各自适用场景
大数据·spark·top·sortby
2301_8112743129 分钟前
大数据基于Spring Boot的化妆品推荐系统的设计与实现
大数据·spring boot·后端
Yz987636 分钟前
hive的存储格式
大数据·数据库·数据仓库·hive·hadoop·数据库开发
青云交37 分钟前
大数据新视界 -- 大数据大厂之 Hive 数据导入:多源数据集成的策略与实战(上)(3/ 30)
大数据·数据清洗·电商数据·数据整合·hive 数据导入·多源数据·影视娱乐数据
武子康40 分钟前
大数据-230 离线数仓 - ODS层的构建 Hive处理 UDF 与 SerDe 处理 与 当前总结
java·大数据·数据仓库·hive·hadoop·sql·hdfs
武子康42 分钟前
大数据-231 离线数仓 - DWS 层、ADS 层的创建 Hive 执行脚本
java·大数据·数据仓库·hive·hadoop·mysql
时差9531 小时前
Flink Standalone集群模式安装部署
大数据·分布式·flink·部署
锵锵锵锵~蒋1 小时前
实时数据开发 | 怎么通俗理解Flink容错机制,提到的checkpoint、barrier、Savepoint、sink都是什么
大数据·数据仓库·flink·实时数据开发
二进制_博客1 小时前
Flink学习连载文章4-flink中的各种转换操作
大数据·学习·flink
大数据编程之光1 小时前
Flink入门介绍
大数据·flink