【Apache Doris】周FAQ集锦:第 7 期

【Apache Doris】周FAQ集锦:第 7 期

欢迎查阅本周的 Apache Doris 社区 FAQ 栏目!

在这个栏目中,每周将筛选社区反馈的热门问题和话题,重点回答并进行深入探讨。旨在为广大用户和开发者分享有关 Apache Doris 的常见问题。

通过这个每周 FAQ 栏目,希望帮助社区小伙伴更好地了解和应用 Apache Doris,促进经验交流和技术共享。

SQL问题

❓Q1 2.1.0和2.1.1版本查询报错:[E-3113]string column length

💡A1 调大 parallel_pipeline_task_num 会话参数解决;例如:32c 256G的配置,set parallel_pipeline_task_num = 16 或设置为32可解决。

具体可以查阅Doris论坛帖子:

https://ask.selectdb.com/questions/D1wp/2-1-0-he-2-1-1-bao-e-3113-string-column-length

❓Q2 jdbc catalog查询报错:Can not connect to jdbc due to error: wait millis 5000, active 10, maxActive 10, creating 0, Catalog

💡A2 jdbc catalog 连接超限导致,默认是10,需要修改连接池的最大连接数或重建catalog加上这个参数:

alter catalog <catalog_name> set properties ('connection_pool_max_size' = '100') 

具体可以查阅Doris论坛帖子:

https://ask.selectdb.com/questions/D1Sg/doris-ban-ben-2-1-0-zai-jin-xing-shu-ju-dao-ru-de-shi-hou-be-bao-cuo-caused-by-getconnectiontimeoutexception-wait-millis-5000-active-10-maxactive-10-c

数据操作问题

❓Q3 字符类型定义为varchar还是string?

💡A3 如下:

1. key列没法用string,非key列如果65533长度能够满足,可以定义为varchar(65533),大于这个范围可以用string
2. varchar(65533)的65533只是定为字符长度上限,实际占用的以数据存储多少为主

❓Q4 2.1 版本的create job能否放多条sql语句?

💡A4 当前不能;但依赖关系后续大概率会做,即任务编排dag。

2.1 create job内容可以查阅:

https://doris.apache.org/zh-CN/docs/sql-manual/sql-reference/Data-Definition-Statements/Create/CREATE-JOB

❓Q5 2.1 版本的异步视图是否支持秒级更新?

💡A5 当前最细颗粒度是分钟级;后续会研究同步多表物化视图来解决实时性比较高的场景。

2.1异步物化视图内容可以查阅:

https://doris.apache.org/zh-CN/docs/query-acceleration/async-materialized-view/

❓Q6 2.1 版本的arrow flight端口和 fe对arrow flight端口是否需要一样?

💡A6 可用端口即可,可以不一样。

2.1 arrow flight sql protocol内容可以查阅:

https://github.com/apache/doris/issues/25514

❓Q7 1.2升级至2.0后,表结构里面无法区分是decimalv1还是v3了?

💡A7 新版本对于新创建的表没有v1和v3这一区分了,统一为decimal v3;对于存量的表,还是旧的decimal类型,如果修改,需要手动修改列类型。

运维常见问题

❓Q8 为什么information_schema的库表不能删改?

💡A8 information_schema的库表没有物理实体,都是虚拟表,所以无法进行删改。

❓Q9 服务器有主ip和vip(nginx+keepalived),vip做负载均衡:

可否将: priority_networks = 10.0.0.0/24
改成: priority_networks = 10.0.0.128/25 
并且vip设为10.0.0.10来确保keeplived和doris均正常启动? 
改完后10.10.0.127以下的访问doris集群是否会有异常?

💡A9 结合initAddrUseIp的逻辑分析:

fe 进行 initAddrUseIp 时会从符合该规则范围的 ip 地址中选择一个作为本地地址,如果没有任何 ip 地址符合规则,fe 进程将停止并报错退出;

所以,如果 vip 设为 10.0.0.10,并且新的 priority_networks 配置为 10.0.0.128/25,只要服务器的主 ip 或其它 ip 在 10.0.0.128/25 范围内,doris 和 keepalived 应该能够正常启动;

否则,将无法启动,并且需要重新调整 IP 地址配置。

其它问题

❓Q10 doris 默认为3副本, 如果有5个BE节点,那么设置副本数为5,对于查询性能是否能有显著的提升?

💡A10 副本数主要为了保证数据安全性,一般3副本就能满足单节点故障;5副本的集群,对于故障的容忍率也会更高些,读写可以容忍2副本故障,但是资源相对会占用更多些。副本数,主要是保障数据的可用性和可靠性,对于性能方面并不是副本越多,查询越快。

关于社区

Apache Doris 是一个基于 MPP 架构的高性能、实时的分析型数据库,以极速易用的特点被人们所熟知,仅需亚秒级响应时间即可返回海量数据下的查询结果,不仅可以支持高并发的点查询场景,也能支持高吞吐的复杂分析场景。

如果您对 Apache Doris 感兴趣,可以通过以下入口访问官方网站、社区论坛、GitHub和dev邮件组:

💡官方文档

💡社区论坛

💡GitHub

💡dev邮件组:dev@doris.apache.org

非常欢迎您在社区论坛中与其他用户分享您的使用经验和技巧,或者向dev邮件组提交反馈和意见。

相信,您的参与将帮助Apache Doris变得更加完善。

相关推荐
水蓝烟雨3 小时前
Elasticsearch基本操作
大数据·elasticsearch·搜索引擎
sl43796 小时前
Flink CDC3.X + Flink1.19环境搭建
大数据·flink
逆风就重开7 小时前
数据埋点从入门到了解
大数据·linux·前端·数据库·数据仓库
掘根7 小时前
【Linux】压缩命令——gzip,bzip2,xz
大数据·linux·运维
猴子微胖7 小时前
ElasticSearch常用操作
大数据·elasticsearch·jenkins
临水逸8 小时前
知名的以图叙事开源平台和工具
大数据
T06205148 小时前
最新整理的机器人相关数据合集(1993-2022年不等 具体看数据类型)
大数据
AI数据标注猿10 小时前
世界人工智能大会中“数据+标注”相关的关键词浅析
大数据·人工智能
夜夜流光相皎洁_小宁11 小时前
认识流式处理框架Apache Flink
大数据·flink·apache·实时处理·流式处理·flink发展史·flink使用场景
UI设计开发服务商11 小时前
HMI 的 UI 风格成就经典
大数据·人工智能·数据分析·云计算·区块链