数仓开发-面试二

1.finebi使用

2.数据抽取中间件 flink,kettle

flink和kettle区别

3.flink本身的优点和缺点

4.flink容错机制

5.DS

6.数据库

7.主要找orcle、clickhourse

8.mysql离线查作业执行计划,如,你写个sql500,这个时候你怎么定位问题,查看问题。怎么执行作业执行计划

9.比如sql执行需要1分钟,现在效率低,要你优化到500ms(这个时候500行sql,你咋定位问题呢?定位问题怎能定位?)

10.mysqkl调优怎么做?怎么查看作业执行计划?(本身sql语句没有问题,可能数据存在问题,要不是表结构,要不逻辑问题)

11.此岗位非偏hive(公司企业有20-30个系统)找ETL,需要适合多数据库,做报表开发

相关推荐
黄雪超3 分钟前
Kafka——消费者组消费进度监控都怎么实现?
大数据·分布式·kafka
前端小巷子31 分钟前
Webpack 5模块联邦
前端·javascript·面试
前端双越老师31 分钟前
为何前端圈现在不关注源码了?
面试·前端框架·源码
江城开朗的豌豆41 分钟前
Vue和React中的key:为什么列表渲染必须加这玩意儿?
前端·vue.js·面试
虚伪的空想家1 小时前
记录es收集日志报错问题as the final mapping would have more than 1 type[XXX,doc]
大数据·elasticsearch·搜索引擎·容器·kubernetes·log-pilot
PAK向日葵9 小时前
【算法导论】如何攻克一道Hard难度的LeetCode题?以「寻找两个正序数组的中位数」为例
c++·算法·面试
数据与人工智能律师11 小时前
数字迷雾中的安全锚点:解码匿名化与假名化的法律边界与商业价值
大数据·网络·人工智能·云计算·区块链
mykyle13 小时前
Elasticsearch-ik分析器
大数据·elasticsearch·jenkins
weixin_lynhgworld15 小时前
淘宝扭蛋机小程序系统开发:重塑电商互动模式
大数据·小程序
倔强青铜三15 小时前
为什么 self 与 super() 成了 Python 的永恒痛点?
人工智能·python·面试