某小型外包—ETL工程师面试

没有包装简历,面试感觉跟聊天一样,会就是会,不会就是不会。

1.datax和sqoop的对比,优点与缺点

1.1 datax的组件

2.sql的执行顺序。

select a.* ,b* from a left join b on a.id = b.id 先join 再 select。

3.数据采集到数仓中,做了那些清洗。

4.hive表有哪几种数据格式。

5.hive的sql有哪些优化方式

6.linux命令是否熟悉。

如何修改linux的文件的属性

7.有什么要问的

  1. java相关

8.1 java的数据结构有那些。

  1. 从kafka中消费数据的命令。 这个忘记了 ,赶紧项目跑起来。

  2. 如何进行数据建模,常见的模型。

最后,确认期望薪资在6k以上。 同时反问,用到的组件有dataworks, 可能用到python。

相关推荐
zgl_200537793 小时前
ZGLanguage 解析SQL数据血缘 之 Python提取SQL表级血缘树信息
大数据·数据库·数据仓库·hive·hadoop·python·sql
Justice Young1 天前
Hive第四章:HIVE Operators and Functions
大数据·数据仓库·hive·hadoop
LF3_1 天前
hive,Relative path in absolute URI: ${system:user.name%7D 解决
数据仓库·hive·hadoop
Justice Young1 天前
Hive第六章:Hive Optimization and Miscellaneous
数据仓库·hive·hadoop
Justice Young1 天前
Hive第五章:Integeration with HBase
大数据·数据仓库·hive·hbase
Justice Young1 天前
Hive第三章:HQL的使用
大数据·数据仓库·hive·hadoop
zgl_200537792 天前
ZGLanguage 解析SQL数据血缘 之 标识提取SQL语句中的目标表
java·大数据·数据库·数据仓库·hadoop·sql·源代码管理
sq07232 天前
数据仓库工具箱:缓慢渐变维度(SCD)
数据仓库
Databend3 天前
Databend 2025:海量数据 × AI 一体化底座,v1.3 即将发布
大数据·数据仓库
心止水j3 天前
hive问题
数据仓库·hive·hadoop