某小型外包—ETL工程师面试

没有包装简历,面试感觉跟聊天一样,会就是会,不会就是不会。

1.datax和sqoop的对比,优点与缺点

1.1 datax的组件

2.sql的执行顺序。

select a.* ,b* from a left join b on a.id = b.id 先join 再 select。

3.数据采集到数仓中,做了那些清洗。

4.hive表有哪几种数据格式。

5.hive的sql有哪些优化方式

6.linux命令是否熟悉。

如何修改linux的文件的属性

7.有什么要问的

  1. java相关

8.1 java的数据结构有那些。

  1. 从kafka中消费数据的命令。 这个忘记了 ,赶紧项目跑起来。

  2. 如何进行数据建模,常见的模型。

最后,确认期望薪资在6k以上。 同时反问,用到的组件有dataworks, 可能用到python。

相关推荐
workflower25 分钟前
量子比特实现方式
数据仓库·服务发现·需求分析·量子计算·软件需求
青春之我_XP9 小时前
【基于阿里云搭建数据仓库(离线)】Data Studio创建资源与函数
大数据·数据仓库·sql·dataworks·maxcompute·data studio
Leo.yuan17 小时前
实时数据仓库是什么?数据仓库设计怎么做?
大数据·数据库·数据仓库·数据分析·spark
涤生大数据2 天前
Apache Doris 在数据仓库中的作用与应用实践
数据仓库·apache·doris
IT成长日记3 天前
【Doris基础】Apache Doris vs 传统数据仓库:架构与性能的全面对比
数据仓库·架构·doris·doris vs 传统数据仓库
xx155802862xx3 天前
hive聚合函数多行合并
数据仓库·hive·hadoop
安审若无3 天前
Hive的存储格式如何优化?
数据仓库·hive·hadoop
Leo.yuan3 天前
数据安全中心是什么?如何做好数据安全管理?
大数据·运维·网络·数据库·数据仓库
Leo.yuan3 天前
数据资产是什么?数据资产平台如何发挥作用?
大数据·运维·数据仓库·人工智能·信息可视化
Hadoop_Liang4 天前
Hive自定义函数案例(UDF、UDAF、UDTF)
数据仓库·hive·自定义函数·udf