【Apache Doris】周FAQ集锦:第 7 期

【Apache Doris】周FAQ集锦:第 7 期

欢迎查阅本周的 Apache Doris 社区 FAQ 栏目!

在这个栏目中,每周将筛选社区反馈的热门问题和话题,重点回答并进行深入探讨。旨在为广大用户和开发者分享有关 Apache Doris 的常见问题。

通过这个每周 FAQ 栏目,希望帮助社区小伙伴更好地了解和应用 Apache Doris,促进经验交流和技术共享。

SQL问题

❓Q1 2.1.0和2.1.1版本查询报错:[E-3113]string column length

💡A1 调大 parallel_pipeline_task_num 会话参数解决;例如:32c 256G的配置,set parallel_pipeline_task_num = 16 或设置为32可解决。

具体可以查阅Doris论坛帖子:

https://ask.selectdb.com/questions/D1wp/2-1-0-he-2-1-1-bao-e-3113-string-column-length

❓Q2 jdbc catalog查询报错:Can not connect to jdbc due to error: wait millis 5000, active 10, maxActive 10, creating 0, Catalog

💡A2 jdbc catalog 连接超限导致,默认是10,需要修改连接池的最大连接数或重建catalog加上这个参数:

复制代码
alter catalog <catalog_name> set properties ('connection_pool_max_size' = '100') 

具体可以查阅Doris论坛帖子:

https://ask.selectdb.com/questions/D1Sg/doris-ban-ben-2-1-0-zai-jin-xing-shu-ju-dao-ru-de-shi-hou-be-bao-cuo-caused-by-getconnectiontimeoutexception-wait-millis-5000-active-10-maxactive-10-c

数据操作问题

❓Q3 字符类型定义为varchar还是string?

💡A3 如下:

复制代码
1. key列没法用string,非key列如果65533长度能够满足,可以定义为varchar(65533),大于这个范围可以用string
2. varchar(65533)的65533只是定为字符长度上限,实际占用的以数据存储多少为主

❓Q4 2.1 版本的create job能否放多条sql语句?

💡A4 当前不能;但依赖关系后续大概率会做,即任务编排dag。

2.1 create job内容可以查阅:

https://doris.apache.org/zh-CN/docs/sql-manual/sql-reference/Data-Definition-Statements/Create/CREATE-JOB

❓Q5 2.1 版本的异步视图是否支持秒级更新?

💡A5 当前最细颗粒度是分钟级;后续会研究同步多表物化视图来解决实时性比较高的场景。

2.1异步物化视图内容可以查阅:

https://doris.apache.org/zh-CN/docs/query-acceleration/async-materialized-view/

❓Q6 2.1 版本的arrow flight端口和 fe对arrow flight端口是否需要一样?

💡A6 可用端口即可,可以不一样。

2.1 arrow flight sql protocol内容可以查阅:

https://github.com/apache/doris/issues/25514

❓Q7 1.2升级至2.0后,表结构里面无法区分是decimalv1还是v3了?

💡A7 新版本对于新创建的表没有v1和v3这一区分了,统一为decimal v3;对于存量的表,还是旧的decimal类型,如果修改,需要手动修改列类型。

运维常见问题

❓Q8 为什么information_schema的库表不能删改?

💡A8 information_schema的库表没有物理实体,都是虚拟表,所以无法进行删改。

❓Q9 服务器有主ip和vip(nginx+keepalived),vip做负载均衡:

复制代码
可否将: priority_networks = 10.0.0.0/24
改成: priority_networks = 10.0.0.128/25 
并且vip设为10.0.0.10来确保keeplived和doris均正常启动? 
改完后10.10.0.127以下的访问doris集群是否会有异常?

💡A9 结合initAddrUseIp的逻辑分析:

fe 进行 initAddrUseIp 时会从符合该规则范围的 ip 地址中选择一个作为本地地址,如果没有任何 ip 地址符合规则,fe 进程将停止并报错退出;

所以,如果 vip 设为 10.0.0.10,并且新的 priority_networks 配置为 10.0.0.128/25,只要服务器的主 ip 或其它 ip 在 10.0.0.128/25 范围内,doris 和 keepalived 应该能够正常启动;

否则,将无法启动,并且需要重新调整 IP 地址配置。

其它问题

❓Q10 doris 默认为3副本, 如果有5个BE节点,那么设置副本数为5,对于查询性能是否能有显著的提升?

💡A10 副本数主要为了保证数据安全性,一般3副本就能满足单节点故障;5副本的集群,对于故障的容忍率也会更高些,读写可以容忍2副本故障,但是资源相对会占用更多些。副本数,主要是保障数据的可用性和可靠性,对于性能方面并不是副本越多,查询越快。

关于社区

Apache Doris 是一个基于 MPP 架构的高性能、实时的分析型数据库,以极速易用的特点被人们所熟知,仅需亚秒级响应时间即可返回海量数据下的查询结果,不仅可以支持高并发的点查询场景,也能支持高吞吐的复杂分析场景。

如果您对 Apache Doris 感兴趣,可以通过以下入口访问官方网站、社区论坛、GitHub和dev邮件组:

💡官方文档

💡社区论坛

💡GitHub

💡dev邮件组:dev@doris.apache.org

非常欢迎您在社区论坛中与其他用户分享您的使用经验和技巧,或者向dev邮件组提交反馈和意见。

相信,您的参与将帮助Apache Doris变得更加完善。

相关推荐
luoganttcc19 分钟前
加快高水平科技自立自强,引领发展新质生产力 <十五五 规划节选>
大数据·人工智能·科技
TDengine (老段)39 分钟前
益和热力性能优化实践:从 SQL Server 到 TDengine 时序数据库,写入快 20 秒、查询提速 5 倍
大数据·数据库·物联网·性能优化·时序数据库·tdengine·1024程序员节
秋已杰爱1 小时前
技术准备十五:Elasticsearch
大数据·elasticsearch·搜索引擎
青云交2 小时前
Java 大视界 -- Java 大数据在智能家居能源消耗模式分析与节能策略制定中的应用
java·大数据·智能家居·数据采集·能源消耗模式分析·节能策略制定·节能效果评估
B站计算机毕业设计之家3 小时前
python图像识别系统 AI多功能图像识别检测系统(11种识别功能)银行卡、植物、动物、通用票据、营业执照、身份证、车牌号、驾驶证、行驶证、车型、Logo✅
大数据·开发语言·人工智能·python·图像识别·1024程序员节·识别
数字化脑洞实验室7 小时前
如何理解不同行业AI决策系统的功能差异?
大数据·人工智能·算法
starandsea11 小时前
gitlab解决传过大文件后删除导致pack过大问题
大数据·elasticsearch·gitlab
拉姆哥的小屋13 小时前
时间序列早期分类中的置信度累积问题:从ECE-C到时序依赖建模
大数据·人工智能
蚁巡信息巡查系统13 小时前
政府网站与政务新媒体监测服务主要是做什么的?
大数据·人工智能
饼干吖13 小时前
hadoop安装
大数据·hadoop·教程