某小型外包—ETL工程师面试

没有包装简历,面试感觉跟聊天一样,会就是会,不会就是不会。

1.datax和sqoop的对比,优点与缺点

1.1 datax的组件

2.sql的执行顺序。

select a.* ,b* from a left join b on a.id = b.id 先join 再 select。

3.数据采集到数仓中,做了那些清洗。

4.hive表有哪几种数据格式。

5.hive的sql有哪些优化方式

6.linux命令是否熟悉。

如何修改linux的文件的属性

7.有什么要问的

  1. java相关

8.1 java的数据结构有那些。

  1. 从kafka中消费数据的命令。 这个忘记了 ,赶紧项目跑起来。

  2. 如何进行数据建模,常见的模型。

最后,确认期望薪资在6k以上。 同时反问,用到的组件有dataworks, 可能用到python。

相关推荐
想做富婆2 小时前
Hive:窗口函数[ntile, first_value,row_number() ,rank(),dens_rank()]和自定义函数
数据仓库·hive·hadoop
weixin_307779132 天前
设计转换Apache Hive的HQL语句为Snowflake SQL语句的Python程序方法
数据仓库·hive·python·sql
想做富婆2 天前
Hive:窗口函数(1)
数据仓库·hive·hadoop
weixin_307779132 天前
本地Apache Hive的Linux服务器集群复制数据到SQL Server数据库的分步流程
数据库·数据仓库·hive·sqlserver
weixin_307779133 天前
在AWS上使用KMS客户端密钥加密S3文件,同时支持PySpark读写和Snowflake导入
大数据·数据仓库·python·spark·云计算
想做富婆3 天前
Hive:复杂数据类型之Map函数
数据仓库·hive·hadoop
想做富婆4 天前
Hive:struct数据类型,内置函数(日期,字符串,类型转换,数学)
数据仓库·hive·hadoop
想做富婆4 天前
Hive:基本查询语法
数据仓库·hive·hadoop
STONE_KKK4 天前
Hive详细讲解-各类函数速通
数据仓库·hive·hadoop
STONE_KKK4 天前
Hive详细讲解-调优分区表速通
数据仓库·hive·hadoop