某小型外包—ETL工程师面试

没有包装简历,面试感觉跟聊天一样,会就是会,不会就是不会。

1.datax和sqoop的对比,优点与缺点

1.1 datax的组件

2.sql的执行顺序。

select a.* ,b* from a left join b on a.id = b.id 先join 再 select。

3.数据采集到数仓中,做了那些清洗。

4.hive表有哪几种数据格式。

5.hive的sql有哪些优化方式

6.linux命令是否熟悉。

如何修改linux的文件的属性

7.有什么要问的

  1. java相关

8.1 java的数据结构有那些。

  1. 从kafka中消费数据的命令。 这个忘记了 ,赶紧项目跑起来。

  2. 如何进行数据建模,常见的模型。

最后,确认期望薪资在6k以上。 同时反问,用到的组件有dataworks, 可能用到python。

相关推荐
冰^2 小时前
MySQL VS SQL Server:优缺点全解析
数据库·数据仓库·redis·sql·mysql·json·数据库开发
IT成长日记4 小时前
【Hive入门】Hive数据模型与存储格式深度解析:从理论到实践的最佳选择
数据仓库·hive·hadoop·数据模型·存储格式
RestCloud8 小时前
ETL 数据集成都包含哪些?
数据仓库·etl·数据集成·数据集成平台
IT成长日记9 小时前
【Hive入门】Hive分区与分桶深度解析:优化查询性能的关键技术
数据仓库·hive·hadoop·分区·分桶
Leo.yuan9 小时前
数据仓库是什么?数据仓库架构有哪些?
大数据·数据库·数据仓库·架构·数据分析
Faith_xzc9 小时前
Hive 数据同步到 Doris 最佳实践方案:从场景适配到性能调优全解析
大数据·数据仓库·hive·hadoop·doris
酷爱码9 小时前
hive默认的建表格式
数据仓库·hive·hadoop
Hadoop_Liang10 小时前
Hive 多表查询案例
数据仓库·hive·hadoop
RestCloud14 小时前
如何借助ETL数据集成工具实现数据一致性?
数据仓库·api·etl·数字化转型·数据转换·数据抽取·集成平台
随缘而动,随遇而安14 小时前
第五十二篇 浅谈ETL系统设计
大数据·数据仓库·数据分析·数据库开发·数据库架构