没有包装简历,面试感觉跟聊天一样,会就是会,不会就是不会。
1.datax和sqoop的对比,优点与缺点
1.1 datax的组件
2.sql的执行顺序。
select a.* ,b* from a left join b on a.id = b.id 先join 再 select。
3.数据采集到数仓中,做了那些清洗。
4.hive表有哪几种数据格式。
5.hive的sql有哪些优化方式
6.linux命令是否熟悉。
如何修改linux的文件的属性
7.有什么要问的
- java相关
8.1 java的数据结构有那些。
-
从kafka中消费数据的命令。 这个忘记了 ,赶紧项目跑起来。
-
如何进行数据建模,常见的模型。
最后,确认期望薪资在6k以上。 同时反问,用到的组件有dataworks, 可能用到python。