ETL工程师-面试

1.自我介绍

2.数据流程

3.说下自己写过的脚本

4.关于hive提问

4.1 如何把服务器中的数据上传到hive表里面

4.2 hive中的一个表分区的数据怎么导入到另一个表中的分区中。

4.3 如果一个字段 不为空,取空值,如果字段为空,取默认值

4.4 udf, udtf使用场景

5.Flink的数据一致性

Flink中在kafka中数据重新再写回到kafka里面有什么好处。

6.项目中为什么使用orc和snappy? 对比其他的存储算法,有什么好处。

7.你们是自己做运维的吗,集群中出现一些问题,该如何解决。

总结----

面试过程中出现了一些卡顿,主要是场景题时。

相关推荐
hg01182 分钟前
津巴布韦政府宣布取消水泥进口限制
大数据
霍格沃兹测试开发学社-小明25 分钟前
测试开发技术路线全新升级:在云原生与AI时代构建核心竞争力
大数据·人工智能·云原生
说私域32 分钟前
基于链动2+1模式AI智能名片S2B2C商城小程序的微商运营内容研究
大数据·人工智能·小程序
雷工笔记1 小时前
MES学习笔记之MES系统的作用和定位及与SCADA的关系
大数据·笔记·学习
语落心生1 小时前
流式数据湖Paimon探秘之旅 (二十一) 企业级最佳实践和案例分析
大数据
语落心生1 小时前
流式数据湖Paimon探秘之旅 (二十) 性能测试与基准对标
大数据
爱写代码的liding1 小时前
git 常用命令
大数据·git·elasticsearch
yangmf20401 小时前
ES 服务编排利器--INFINI Cloud
大数据·elasticsearch·搜索引擎·全文检索
黄焖鸡能干四碗1 小时前
软件试运行方案试运行报告文档下载(WORD)
大数据·运维·数据库·安全
语落心生1 小时前
流式数据湖Paimon探秘之旅 (十九) REST Catalog自定义服务开发
大数据