【Apache Doris】周FAQ集锦:第 14 期

【Apache Doris】周FAQ集锦:第 14 期

欢迎查阅本周的 Apache Doris 社区 FAQ 栏目!

在这个栏目中,每周将筛选社区反馈的热门问题和话题,重点回答并进行深入探讨。旨在为广大用户和开发者分享有关 Apache Doris 的常见问题。

通过这个每周 FAQ 栏目,希望帮助社区小伙伴更好地了解和应用 Apache Doris,促进经验交流和技术共享。

SQL问题

❓Q1 doris怎么设置/声明变量?

💡A1 参考如下:

复制代码
set @doris_data='2024-06-22 00:00:00';
select @doris_data

❓Q2 doris中update能否跟 left join 结合起来使用?

💡A2 参考如下:

复制代码
UPDATE t1
SET t1.c1 = t2.c1, t1.c3 = t2.c3 * 100
FROM t2 LEFT JOIN t3 ON t2.id = t3.id
WHERE t1.id = t2.id;

❓Q3 doris如何关闭runtime filter?

💡A3 参考如下:

复制代码
-- 方式一:直接关闭
set runtime_mode=OFF;
-- 方式二:runtime filter类型设置为空
set runtime_filter_type = '';

数据操作问题

❓Q4 doris中导入label为什么不能重?

💡A4 Doris 的导入作业都可以设置一个 Label。这个 Label 通常是用户自定义的、具有一定业务逻辑属性的字符串。Label 的主要作用是唯一标识一个导入任务,并且能够保证相同的 Label 仅会被成功导入一次。Label 机制可以保证导入数据的不丢不重。如果上游数据源能够保证 At-Least-Once 语义,则配合 Doris 的 Label 机制,能够保证 Exactly-Once 语义。Label 在一个数据库下具有唯一性。Label 的保留期限默认是 3 天。即 3 天后,已完成的 Label 会被自动清理,之后 Label 可以被重复使用。

Lable机制内容可查阅:
https://doris.apache.org/zh-CN/docs/dev/data-operate/import/load-atomicity

❓Q5 workload group和resource group是否可以共用

💡A5 workload group和resource group逻辑相互独立,可以共用。

doris2.0 版本引入了 workload group,可以实现对 CPU 资源的软限制;doris2.0之前提供resource group多租户和资源隔离方案,主要目的是为了多用户在同一 Doris 集群内进行数据操作时,减少相互之间的干扰,能够将集群资源更合理的分配给各用户。

❓Q6 doris中执行delete删除后什么时候会释放磁盘空间?

💡A6 doris中执行delete删除只是标记删除,真正的删除动作是在做完compaction后,即在触发 compaction 动作时会将相应的磁盘空间释放。

❓Q7 doris能否支持通过 hive catalog 向 hive 表中回写数据?

💡A7 从 2.1.3 版本开始,Apache Doris 支持对 Hive 的 DDL 和 DML 操作。用户可以直接通过 Apache Doris 在 Hive 中创建库表,通过执行INSERT INTO语句来向 Hive 表中写入数据。通过该功能,用户可以通过 Apache Doris 对 Hive 进行完整的数据查询和写入操作,进一步帮助用户简化湖仓一体架构。

2.1.3 release内容可以查阅:
https://doris.apache.org/zh-CN/docs/dev/releasenotes/release-2.1.3

运维常见问题

❓Q8 doris目前兼容哪些版本的jdk?

💡A8 doris在2.1及之前版本中,主要支持的是jdk 8。新的jdk由于支撑模块化等一些新功能,在反射的api支持上做了一些和jdk 8不兼容的改动,所以,在使用doris 2.x的时候,请务必使用jdk 8。

预计在下一个大版本,会将jdk升级到jdk 17, 以便利用最新的jdk技术。同时,jdk 17也是oracle可以免费商用的一个LTS版本。

❓Q9 doris中be的doris_scanner_thread_pool_thread_num 这个参数值能否超过机器的核数?

💡A9 可以,但是超过了也没意义。

比如一个八核的机器可以起几百个线程,但是实际同时跑的还是只有八个,而且还得花费更多损耗去调度。

其它问题

❓Q10 doris是否适合日志存储分析?

💡A10 Doris/SelectDB不拘泥于传统数仓的限制,针对日志数据的特点引入了多项创新性技术,使用户可基于 Doris/SelectDB 构建开放、高性能、低成本、统一的日志存储分析平台,截至目前已在近百家行业内知名企业中落地。

《SelectDB 新一代日志存储分析平台解决方案》白皮书内容可查阅:《SelectDB 新一代日志存储分析平台解决方案》白皮书重磅发布|立即下载

在该白皮书中,从日志场景的存储成本、写入性能、查询性能、集群管理等多方面出发,详细对比 Elasticsearch、ClickHouse 与 Doris/SelectDB 应对日志数据存储分析的优势。


一臻数据

关于社区

Apache Doris 是一个基于 MPP 架构的高性能、实时的分析型数据库,以极速易用的特点被人们所熟知,仅需亚秒级响应时间即可返回海量数据下的查询结果,不仅可以支持高并发的点查询场景,也能支持高吞吐的复杂分析场景。

如果您对 Apache Doris 感兴趣,可以通过以下入口访问官方网站、社区论坛、GitHub和dev邮件组:

💡官方文档

💡社区论坛

💡GitHub

💡dev邮件组:dev@doris.apache.org

非常欢迎您在社区论坛中与其他用户分享您的使用经验和技巧,或者向dev邮件组提交反馈和意见。

相信,您的参与将帮助Apache Doris变得更加完善。

相关推荐
B站_计算机毕业设计之家24 分钟前
大数据YOLOv8无人机目标检测跟踪识别系统 深度学习 PySide界面设计 大数据 ✅
大数据·python·深度学习·信息可视化·数据挖掘·数据分析·flask
AORO20251 小时前
遨游科普:三防平板是指哪三防?有哪些应用场景?
大数据·网络·5g·智能手机·电脑·信息与通信
橙色云-智橙协同研发2 小时前
【PLM实施专家宝典】离散制造企业ECO管理优化方案:构建自动化、零错误的变更引擎
大数据·云原生·解决方案·数字化转型·plm·eco·云plm
星光一影2 小时前
基于SpringBoot智慧社区系统/乡村振兴系统/大数据与人工智能平台
大数据·spring boot·后端·mysql·elasticsearch·vue
e6zzseo5 小时前
独立站的优势和劣势和运营技巧
大数据·人工智能
wudl55669 小时前
flink 1.20 物化表(Materialized Tables)
大数据·flink·linq
InfiSight智睿视界10 小时前
AI 技术助力汽车美容行业实现精细化运营管理
大数据·人工智能
迦蓝叶11 小时前
Apache Jena SPARQL 查询完全指南:入门与实战案例
apache·知识图谱·图搜索算法·三元组·jena·sparql·图查询
8K超高清12 小时前
高校巡展:中国传媒大学+河北传媒学院
大数据·运维·网络·人工智能·传媒
amhjdx12 小时前
政策东风下:卓玛儿童级健康腻子引领行业升级
大数据