数仓开发-面试二

1.finebi使用

2.数据抽取中间件 flink,kettle

flink和kettle区别

3.flink本身的优点和缺点

4.flink容错机制

5.DS

6.数据库

7.主要找orcle、clickhourse

8.mysql离线查作业执行计划,如,你写个sql500,这个时候你怎么定位问题,查看问题。怎么执行作业执行计划

9.比如sql执行需要1分钟,现在效率低,要你优化到500ms(这个时候500行sql,你咋定位问题呢?定位问题怎能定位?)

10.mysqkl调优怎么做?怎么查看作业执行计划?(本身sql语句没有问题,可能数据存在问题,要不是表结构,要不逻辑问题)

11.此岗位非偏hive(公司企业有20-30个系统)找ETL,需要适合多数据库,做报表开发

相关推荐
拓端研究室18 小时前
专题:2025AI产业全景洞察报告:企业应用、技术突破与市场机遇|附920+份报告PDF、数据、可视化模板汇总下载
大数据·人工智能·pdf
A尘埃19 小时前
Flink实时数据处理
大数据·flink·实时数据处理
金融小师妹21 小时前
基于NLP语义解析的联储政策信号:强化学习框架下的12月降息概率回升动态建模
大数据·人工智能·深度学习·1024程序员节
S***t71421 小时前
Vue面试经验
javascript·vue.js·面试
矶鹬笛手1 天前
(2.2) 新一代信息技术及应用
大数据·云计算·区块链·时序数据库
汤姆yu1 天前
基于python大数据的小说数据可视化及预测系统
大数据·python·信息可视化
立控信息LKONE1 天前
库室采购安全设施设备——自主研发、国产化监管一体机
大数据·安全
WYiQIU1 天前
面了一次字节前端岗,我才知道何为“造火箭”的极致!
前端·javascript·vue.js·react.js·面试
努力学算法的蒟蒻1 天前
day20(11.21)——leetcode面试经典150
面试
z***89711 天前
【分布式】Hadoop完全分布式的搭建(零基础)
大数据·hadoop·分布式