某小型外包—ETL工程师面试

没有包装简历,面试感觉跟聊天一样,会就是会,不会就是不会。

1.datax和sqoop的对比,优点与缺点

1.1 datax的组件

2.sql的执行顺序。

select a.* ,b* from a left join b on a.id = b.id 先join 再 select。

3.数据采集到数仓中,做了那些清洗。

4.hive表有哪几种数据格式。

5.hive的sql有哪些优化方式

6.linux命令是否熟悉。

如何修改linux的文件的属性

7.有什么要问的

  1. java相关

8.1 java的数据结构有那些。

  1. 从kafka中消费数据的命令。 这个忘记了 ,赶紧项目跑起来。

  2. 如何进行数据建模,常见的模型。

最后,确认期望薪资在6k以上。 同时反问,用到的组件有dataworks, 可能用到python。

相关推荐
隔着天花板看星星2 小时前
Hive-存储-文件格式
数据仓库·hive·hadoop
isNotNullX2 小时前
6种ETL计算引擎介绍
数据仓库·etl
天才的白鸟5 小时前
电商数据仓库
数据仓库
大数据小朋友10 小时前
Pand函数详解进阶:案例解析(第26天)
大数据·开发语言·数据仓库·python·pandas
灰太狼!!14 小时前
hive面试题
数据仓库·hive·hadoop
sj天问20 小时前
Hive排序字段解析
数据仓库·hive
逆风就重开1 天前
万字长文MySQL Binlog 详细指南
大数据·数据库·数据仓库·mysql
SelectDB技术团队1 天前
网易游戏如何基于 Apache Doris 构建全新湖仓一体架构
大数据·数据仓库·数据湖·湖仓一体·网易游戏
逆风就重开1 天前
不止是只有维度建模,数据仓库还有Data Vault建模
大数据·数据库·数据仓库·数据分析
RestCloud1 天前
ETL数据集成丨使用ETLCloud实现MySQL与Greenplum数据同步
数据库·数据仓库·mysql·etl·数据集成·etlcloud