某小型外包—ETL工程师面试

没有包装简历,面试感觉跟聊天一样,会就是会,不会就是不会。

1.datax和sqoop的对比,优点与缺点

1.1 datax的组件

2.sql的执行顺序。

select a.* ,b* from a left join b on a.id = b.id 先join 再 select。

3.数据采集到数仓中,做了那些清洗。

4.hive表有哪几种数据格式。

5.hive的sql有哪些优化方式

6.linux命令是否熟悉。

如何修改linux的文件的属性

7.有什么要问的

  1. java相关

8.1 java的数据结构有那些。

  1. 从kafka中消费数据的命令。 这个忘记了 ,赶紧项目跑起来。

  2. 如何进行数据建模,常见的模型。

最后,确认期望薪资在6k以上。 同时反问,用到的组件有dataworks, 可能用到python。

相关推荐
JZC_xiaozhong9 小时前
多系统并行的权限治理难题:如何消除“权限孤岛”与安全风险?
安全·数据安全·etl工程师·iam·数据集成与应用集成·多系统权限管理·统一数据集成
笨蛋少年派10 小时前
数据仓库系统建设:数据采集、预处理与集成
数据仓库
qq 87622396511 小时前
基于Matlab/simulink的双电机建模驱动控制仿真模型:探索纯电与混动汽车世界
数据仓库
番茄撒旦在上20 小时前
Hive数仓分层——国内大数据就业洞察
大数据·数据仓库·hive
沟通qq 87622396521 小时前
COMSOL与MATLAB联手:水力压裂岩石损伤耦合模拟
etl工程师
梦里不知身是客112 天前
hive中metastore 服务的意义
数据仓库·hive·hadoop
梦里不知身是客112 天前
hive让分区关联数据的三种方式
数据仓库·hive·hadoop
jumu2023 天前
三菱FX5U与3台三菱E700变频器通讯实战
数据仓库
写代码的【黑咖啡】3 天前
数据仓库中保障数据质量的关键环节:任务发布后数据校验
数据仓库
m0_740043733 天前
Spring_全面详解入门
数据仓库·hive·hadoop