【Apache Doris】周FAQ集锦:第 9 期

【Apache Doris】周FAQ集锦:第 9 期

欢迎查阅本周的 Apache Doris 社区 FAQ 栏目!

在这个栏目中,每周将筛选社区反馈的热门问题和话题,重点回答并进行深入探讨。旨在为广大用户和开发者分享有关 Apache Doris 的常见问题。

通过这个每周 FAQ 栏目,希望帮助社区小伙伴更好地了解和应用 Apache Doris,促进经验交流和技术共享。

SQL问题

❓Q1 doris如何查看表的状态是否正常?

💡A1 如下:

ADMIN SHOW REPLICA STATUS FROM {表名} WHERE STATUS != "OK";

❓Q2 2.0.2版本查询时报:

detailMessage = (xx.xx.xx.xx)[INVALID_ARGUMENT]unknown filter

💡A2 2.0.9版本已经fix,可以考虑升级至最新的三位数版本,稳定性更佳。

2.0.9 release内容可以查阅:
https://doris.apache.org/zh-CN/docs/dev/releasenotes/release-2.0.9

数据操作问题

❓Q3 已建的表是否能修改或者新增Properties配置项?

💡A3 如下:

  1. 大部分可以直接alter table set propery
  2. 有些配置项需要重建表,比如 unique 模型开启mow 需要重新建表
    具体可以查阅ALTER-TABLE-PROPERTY:
    https://doris.apache.org/zh-CN/docs/dev/sql-manual/sql-statements/Data-Definition-Statements/Alter/ALTER-TABLE-PROPERTY

❓Q4 通过catalog的方式同步至doris,对上游系统的性能是否有影响?

💡A4 只有scan数据的负载,不过影响不大;如果是rds,一般都有主备模式,可以从备库读,最小化影响。

❓Q5 动态分区表的分区数超过500是否无法再创建了?

💡A5 如下:

  1. 动态分区start-end默认最大创建是500(可以设置max_dynamic_partition_num调大),建表时显示创建默认最大是4096
  2. 相关参数设置
    a. 批量创建:max_multi_partition_num
    b. 动态分区:max_dynamic_partition_num
    FE参数说明可以查阅FE配置项:
    https://doris.apache.org/zh-CN/docs/dev/admin-manual/config/fe-config

❓Q6 doris能连金仓吗?

💡A6 开源doris目前不支持直接连接金仓,但可以通过etl工具将金仓数据导入doris中进行分析查询。

❓Q7 doris中使用like模糊查询有什么优化建议?

💡A7 可以通过NGram BloomFilter 加速。

NGram BloomFilter 内容可以查阅:
https://doris.apache.org/zh-CN/docs/dev/table-design/index/ngram-bloomfilter-index

运维常见问题

❓Q8 doris的be宕机问题如何排查?

💡A8 目前一般遇到的有这么几种情况:

  1. BE 进程非正常退出
    a. 有 bug 导致BE进程Crash
    b. BE 进程OOM
  2. BE 进程正常退出
    主要看非正常退出这块。因为其实有部分情况是这样的,
    有些同学和运维同学内部没有对齐,可能服务器reboot了或者什么情况,
    所以一般出现问题后,可以先和相关的同学对齐下,看看是否有其他操作。
    具体可以查阅Doris论坛帖子:
    https://ask.selectdb.com/questions/D1GG/be-dang-ji-wen-ti-pai-cha-de-zui-jia-shi-jian

❓Q9 doris从2.0.4升级到2.1后,审计日志表不更新

💡A9 2.1后审计日志表为__internal_schema.audit_log,可以手动在__internal_schema里建audit_log表解决。

2.1 release内容可以查阅:
https://doris.apache.org/zh-CN/docs/dev/releasenotes/release-2.1.0/

其它问题

❓Q10 doris是否可以用于存日志/时序数据,进行大规模日志/时序数据处理和分析?

💡A10 doris在日志/时序场景持续深耕,推出了一系列核心能力,如高效的倒排索引、灵活的 Variant 数据类型等,为日志/时序数据的处理分析提供了更高效、灵活的解决方案。

具体可以查阅最新的一篇实践PR:
https://mp.weixin.qq.com/s/O3H80qL3Gqysn853n-bm5g


一臻数据

关于社区

Apache Doris 是一个基于 MPP 架构的高性能、实时的分析型数据库,以极速易用的特点被人们所熟知,仅需亚秒级响应时间即可返回海量数据下的查询结果,不仅可以支持高并发的点查询场景,也能支持高吞吐的复杂分析场景。

如果您对 Apache Doris 感兴趣,可以通过以下入口访问官方网站、社区论坛、GitHub和dev邮件组:

💡官方文档

💡社区论坛

💡GitHub

💡dev邮件组:dev@doris.apache.org

非常欢迎您在社区论坛中与其他用户分享您的使用经验和技巧,或者向dev邮件组提交反馈和意见。

相信,您的参与将帮助Apache Doris变得更加完善。

相关推荐
Data跳动9 分钟前
Spark内存都消耗在哪里了?
大数据·分布式·spark
woshiabc1111 小时前
windows安装Elasticsearch及增删改查操作
大数据·elasticsearch·搜索引擎
lucky_syq2 小时前
Saprk和Flink的区别
大数据·flink
lucky_syq2 小时前
流式处理,为什么Flink比Spark Streaming好?
大数据·flink·spark
袋鼠云数栈2 小时前
深入浅出Flink CEP丨如何通过Flink SQL作业动态更新Flink CEP作业
大数据
小白学大数据3 小时前
如何使用Selenium处理JavaScript动态加载的内容?
大数据·javascript·爬虫·selenium·测试工具
15年网络推广青哥3 小时前
国际抖音TikTok矩阵运营的关键要素有哪些?
大数据·人工智能·矩阵
节点。csn4 小时前
Hadoop yarn安装
大数据·hadoop·分布式
arnold664 小时前
探索 ElasticSearch:性能优化之道
大数据·elasticsearch·性能优化
NiNg_1_2345 小时前
基于Hadoop的数据清洗
大数据·hadoop·分布式