某小型外包—ETL工程师面试

没有包装简历,面试感觉跟聊天一样,会就是会,不会就是不会。

1.datax和sqoop的对比,优点与缺点

1.1 datax的组件

2.sql的执行顺序。

select a.* ,b* from a left join b on a.id = b.id 先join 再 select。

3.数据采集到数仓中,做了那些清洗。

4.hive表有哪几种数据格式。

5.hive的sql有哪些优化方式

6.linux命令是否熟悉。

如何修改linux的文件的属性

7.有什么要问的

  1. java相关

8.1 java的数据结构有那些。

  1. 从kafka中消费数据的命令。 这个忘记了 ,赶紧项目跑起来。

  2. 如何进行数据建模,常见的模型。

最后,确认期望薪资在6k以上。 同时反问,用到的组件有dataworks, 可能用到python。

相关推荐
liliangcsdn17 小时前
mac测试ollama llamaindex
数据仓库·人工智能·prompt·llama
晴天彩虹雨1 天前
统一调度与编排:构建自动化数据驱动平台
大数据·运维·数据仓库·自动化·big data·etl
Sirius Wu2 天前
Hive的窗口函数
数据仓库·hive·hadoop
isNotNullX3 天前
数据集成难在哪?制造企业该怎么做?
大数据·数据库·数据仓库·人工智能·制造
Sirius Wu3 天前
一文说清楚Hive
数据仓库·hive·hadoop·后端
天翼云开发者社区4 天前
离线数仓优化简述
数据仓库
Leo.yuan4 天前
小白做投资测算,如何快速上手?
数据库·数据仓库·人工智能·算法·信息可视化
摘星编程4 天前
MCP与企业数据集成:ERP、CRM、数据仓库的统一接入
数据仓库·erp系统·mcp协议·crm集成·企业数据集成
sheep85214 天前
HIVE实战处理(二十四)留存用户数
数据仓库·hive·hadoop
AI扶我青云志7 天前
Hive数据仓库工具
数据仓库·hive·hadoop