某小型外包—ETL工程师面试

没有包装简历,面试感觉跟聊天一样,会就是会,不会就是不会。

1.datax和sqoop的对比,优点与缺点

1.1 datax的组件

2.sql的执行顺序。

select a.* ,b* from a left join b on a.id = b.id 先join 再 select。

3.数据采集到数仓中,做了那些清洗。

4.hive表有哪几种数据格式。

5.hive的sql有哪些优化方式

6.linux命令是否熟悉。

如何修改linux的文件的属性

7.有什么要问的

  1. java相关

8.1 java的数据结构有那些。

  1. 从kafka中消费数据的命令。 这个忘记了 ,赶紧项目跑起来。

  2. 如何进行数据建模,常见的模型。

最后,确认期望薪资在6k以上。 同时反问,用到的组件有dataworks, 可能用到python。

相关推荐
BD_Marathon5 小时前
【Hive】复杂数据类型
数据仓库·hive·hadoop
isNotNullX10 小时前
怎么用数据仓库来进行数据治理?
大数据·数据库·数据仓库·数据治理
谅望者13 小时前
数据分析笔记01:数据分析概述
大数据·数据库·数据仓库·数据分析
Hello.Reader2 天前
Flink CDC + StarRocks用 StarRocks Connector 打通实时明细与分析
数据仓库·adb·flink
piepis4 天前
Doris Docker 完整部署指南
数据仓库·docker·doris·容器部署
FeelTouch Labs5 天前
数据仓库和数据集市之ODS、CDM、ADS、DWD、DWS
数据仓库
TTBIGDATA6 天前
【Ambari开启Kerberos】Step1-KDC服务初始化安装-适合Ubuntu
运维·数据仓库·hadoop·ubuntu·ambari·hdp·bigtop
码·蚁7 天前
SpringMVC
数据仓库·hive·hadoop
2021_fc7 天前
StarRocks技术分享
数据仓库