数仓开发-面试二

1.finebi使用

2.数据抽取中间件 flink,kettle

flink和kettle区别

3.flink本身的优点和缺点

4.flink容错机制

5.DS

6.数据库

7.主要找orcle、clickhourse

8.mysql离线查作业执行计划,如,你写个sql500,这个时候你怎么定位问题,查看问题。怎么执行作业执行计划

9.比如sql执行需要1分钟,现在效率低,要你优化到500ms(这个时候500行sql,你咋定位问题呢?定位问题怎能定位?)

10.mysqkl调优怎么做?怎么查看作业执行计划?(本身sql语句没有问题,可能数据存在问题,要不是表结构,要不逻辑问题)

11.此岗位非偏hive(公司企业有20-30个系统)找ETL,需要适合多数据库,做报表开发

相关推荐
sophie旭3 小时前
一道面试题,开始性能优化之旅(3)-- DNS查询+TCP(三)
前端·面试·性能优化
Elastic 中国社区官方博客3 小时前
AutoOps:简化自管理 Elasticsearch 的旅程
大数据·人工智能·elasticsearch·搜索引擎·全文检索
chatexcel3 小时前
ChatExcel将发布数据分析Mini AI 工作站
大数据·人工智能·数据分析
IT研究室3 小时前
大数据毕业设计选题推荐-基于大数据的全球产品库存数据分析与可视化系统-大数据-Spark-Hadoop-Bigdata
大数据·hadoop·数据分析·spark·毕业设计·源码·bigdata
代码充电宝3 小时前
LeetCode 算法题【简单】49. 字母异位词分组
java·算法·leetcode·面试·哈希算法
程序员的奶茶馆5 小时前
Python 字典速查:键值对操作与高频函数
python·面试
武子康5 小时前
大数据-115 - Flink DataStream Transformation Map、FlatMap、Filter 到 Window 的全面讲解
大数据·后端·flink
CChenhire5 小时前
活动展板设计:大尺寸 + 高分辨率,打印清晰
大数据
Terio_my6 小时前
Elasticsearch 索引创建与文档管理
大数据·elasticsearch·jenkins
大数据检索中心7 小时前
个人数据泄露有哪些法律与安全风险?
大数据·安全