大数据_面试_ETL组件常见问题_spark&flink

|------------------------------|------------------------------------------------------------------------------------------------------------------------|
| 问题列表 | 回答 |
| spark与flink的主要区别 | |
| flink cdc如何确保幂等与一致性 | ++Flink SQL CDC 实践以及一致性分析-阿里云开发者社区++ |
| spark 3.0 AQE动态优化 | |
| hbase memorystore blockcache | |
| sparksql如何调优 | 通过webui定位那个表以及jobid,jobid找对应的执行计划 |
| hdfs的常见的压缩算法 | |
| hbase的数据倾斜 | |
| spark数据处理得数据倾斜与解决方案 aqe | |
| spark oom | |
| spark sql调优 | |

相关推荐
码喽哈哈哈16 分钟前
Kettle——CSV文件转换成excel文件输出
etl
GDDGHS_21 分钟前
大数据工具 flume 的安装配置与使用 (详细版)
大数据·flume
Acrelhuang2 小时前
安科瑞5G基站直流叠光监控系统-安科瑞黄安南
大数据·数据库·数据仓库·物联网
皓7412 小时前
服饰电商行业知识管理的创新实践与知识中台的重要性
大数据·人工智能·科技·数据分析·零售
Mephisto.java2 小时前
【大数据学习 | kafka高级部分】kafka的kraft集群
大数据·sql·oracle·kafka·json·hbase
Mephisto.java2 小时前
【大数据学习 | kafka高级部分】kafka的文件存储原理
大数据·sql·oracle·kafka·json
W Y2 小时前
【架构-37】Spark和Flink
架构·flink·spark
ycsdn102 小时前
Caused by: org.apache.flink.api.common.io.ParseException: Row too short:
大数据·flink
DolphinScheduler社区4 小时前
Apache DolphinScheduler + OceanBase,搭建分布式大数据调度平台的实践
大数据
时差9535 小时前
MapReduce 的 Shuffle 过程
大数据·mapreduce