数仓面试题

1.order by和sort by的区别

答案链接

2.什么是分区和分桶

答案链接

3.Hive内部表和外部表的区别

答案链接

4.hive的row_number()、rank()和dense_rank()的区别以及具体使用

答案链接

5.Hive sql 行列转换(行转列,列转行)

答案链接

6.hive面试题1

链接

7.hive面试题2

链接

相关推荐
isNotNullX9 小时前
数据怎么分层?从ODS、DW、ADS三大层一一拆解!
大数据·开发语言·数据仓库·分布式·spark
随心............10 小时前
hive的相关的优化
数据仓库·hive·hadoop
zhangjin122214 小时前
kettle从入门到精通 第九十七课 ETL之kettle kettle资源仓库的5种方式
数据仓库·etl·kettle插件·kettle资源仓库
liupenglove1 天前
自动驾驶数据仓库:时间片合并算法。
大数据·数据仓库·算法·elasticsearch·自动驾驶
LucianaiB2 天前
AI 时代的分布式多模态数据处理实践:我的 ODPS 实践之旅、思考与展望
大数据·数据仓库·人工智能·分布式·odps
༺水墨石༻3 天前
低版本hive(1.2.1)UDF实现清除历史分区数据
数据仓库·hive·hadoop
Leo.yuan4 天前
数据清洗(ETL/ELT)原理与工具选择指南:企业数字化转型的核心引擎
大数据·数据仓库·数据挖掘·数据分析·etl
isNotNullX4 天前
实时数仓和离线数仓还分不清楚?看完就懂了
大数据·数据库·数据仓库·人工智能·数据分析
Leo.yuan4 天前
数据分析师如何构建自己的底层逻辑?
大数据·数据仓库·人工智能·数据挖掘·数据分析