Hive安装笔记——备赛笔记——2024全国职业院校技能大赛“大数据应用开发”赛项——任务2:离线数据处理

将下发的ds_db01.sql数据库文件放置mysql中

12、编写Scala代码,使用Spark将MySQL的ds_db01库中表user_info的全量数据抽取到Hive的ods库中表user_info。字段名称、类型不变,同时添加静态分区,分区字段为etl_date,类型为String,且值为当前日期的前一天日期(分区字段格式为yyyyMMdd)。使用hive cli执行show partitions ods.user_info命令,将结果截图粘贴至答案表.docx中对应的任务序号下;
13、 编写Scala代码,使用Spark将MySQL的ds_db01库中表sku_info的全量数据抽取到Hive的ods库中表sku_info。字段名称、类型不变,同时添加静态分区,分区字段为etl_date,类型为String,且值为当前日期的前一天日期(分区字段格式为yyyyMMdd)。使用hive cli执行show partitions ods.sku_info命令,将结果截图粘贴至答案表.docx中对应的任务序号下;

|-------------------------------------|------------|
| 软件名称 | 版本 |
| ubuntu | 18.04 64 位 |
| Hadoop:hadoop-3.1.3.tar.gz | 3.1.3 |
| Jdk:jdk-8u212-linux-x64.tar.gz | 1.8 |
| Spark:spark-3.1.1-bin-hadoop3.2.tgz | 3.1.1 |
| Hive:apache-hive-3.1.2-bin.tar.gz | 3.1.2 |
| MySQL | 5.7 |
| Scala:scala-2.12.x.tgz | 2.12 |
| Vue.js | 3.2 |
| ECharts | 5.1 |
| JDBC驱动: mysql-connector-java-5.1.37.jar ||
| 集成开发工具:IDEA 2022 社区版 ||

一、Hive安装地址

1)Hive官网地址


Apache Hivehttps://hive.apache.org/

2)文档查看地址


GettingStarted - Apache Hive - Apache Software Foundationhttps://cwiki.apache.org/confluence/display/Hive/GettingStarted

3)下载地址


Index of /dist/hive (apache.org)http://archive.apache.org/dist/hive/

二、Hive安装部署

1. 把 **apache-hive-3.1.2-bin.tar.gz**上传到Linux的/export/software目录下
相关推荐
choice of18 小时前
Sentinel:阿里云高并发流量控制
笔记·spring cloud·sentinel
我星期八休息18 小时前
C++智能指针全面解析:原理、使用场景与最佳实践
java·大数据·开发语言·jvm·c++·人工智能·python
摇滚侠18 小时前
Spring Boot 3零基础教程,WEB 开发 整合 Thymeleaf 笔记36
java·spring boot·笔记
来生硬件工程师18 小时前
【STM32笔记】:P04 断言的使用
c语言·笔记·stm32·单片机·嵌入式硬件·硬件架构·硬件设计
Cathy Bryant19 小时前
大模型推理(九):采样温度
笔记·神经网络·机器学习·数学建模·transformer
阳光宅男@李光熠19 小时前
【质量管理】构建供应链韧性的第一道防线——高风险供应商的识别
笔记·学习
岑梓铭19 小时前
考研408《计算机组成原理》复习笔记,第五章(5)——CPU的【微程序控制器】
笔记·考研·408·计算机组成原理·计组
白云偷星子19 小时前
MySQL笔记13
数据库·笔记·mysql
optimistic_chen19 小时前
【Java EE进阶 --- SpringBoot】Mybatis - plus 操作数据库
数据库·spring boot·笔记·java-ee·mybatis·mybatis-plus
凉、介19 小时前
ARM 总线技术 —— AMBA 入门
arm开发·笔记·学习