Hive安装笔记——备赛笔记——2024全国职业院校技能大赛“大数据应用开发”赛项——任务2:离线数据处理

将下发的ds_db01.sql数据库文件放置mysql中

12、编写Scala代码,使用Spark将MySQL的ds_db01库中表user_info的全量数据抽取到Hive的ods库中表user_info。字段名称、类型不变,同时添加静态分区,分区字段为etl_date,类型为String,且值为当前日期的前一天日期(分区字段格式为yyyyMMdd)。使用hive cli执行show partitions ods.user_info命令,将结果截图粘贴至答案表.docx中对应的任务序号下;
13、 编写Scala代码,使用Spark将MySQL的ds_db01库中表sku_info的全量数据抽取到Hive的ods库中表sku_info。字段名称、类型不变,同时添加静态分区,分区字段为etl_date,类型为String,且值为当前日期的前一天日期(分区字段格式为yyyyMMdd)。使用hive cli执行show partitions ods.sku_info命令,将结果截图粘贴至答案表.docx中对应的任务序号下;

|-------------------------------------|------------|
| 软件名称 | 版本 |
| ubuntu | 18.04 64 位 |
| Hadoop:hadoop-3.1.3.tar.gz | 3.1.3 |
| Jdk:jdk-8u212-linux-x64.tar.gz | 1.8 |
| Spark:spark-3.1.1-bin-hadoop3.2.tgz | 3.1.1 |
| Hive:apache-hive-3.1.2-bin.tar.gz | 3.1.2 |
| MySQL | 5.7 |
| Scala:scala-2.12.x.tgz | 2.12 |
| Vue.js | 3.2 |
| ECharts | 5.1 |
| JDBC驱动: mysql-connector-java-5.1.37.jar ||
| 集成开发工具:IDEA 2022 社区版 ||

一、Hive安装地址

1)Hive官网地址


Apache Hivehttps://hive.apache.org/

2)文档查看地址


GettingStarted - Apache Hive - Apache Software Foundationhttps://cwiki.apache.org/confluence/display/Hive/GettingStarted

3)下载地址


Index of /dist/hive (apache.org)http://archive.apache.org/dist/hive/

二、Hive安装部署

1. 把 **apache-hive-3.1.2-bin.tar.gz**上传到Linux的/export/software目录下
相关推荐
freexyn19 分钟前
Matlab自学笔记七十六:表达式的展开、因式分解、化简、合并同类项
笔记·算法·matlab
Volunteer Technology28 分钟前
ES并发控制
大数据·elasticsearch·搜索引擎
小飞象—木兮1 小时前
《销售数据分析标准实践手册》:核心内涵与关键指标、落地销售数据分析的全流程···(附相关材料下载)
大数据·人工智能·数据挖掘·数据分析
盟接之桥2 小时前
什么是EDI(电子数据交换)|制造业场景解决方案
大数据·网络·安全·汽车·制造
孤雪心殇2 小时前
快速上手数仓基础知识
数据仓库·hive·spark
让我上个超影吧2 小时前
从Prompt工程到Harness工程:AI Agent落地的下一代软件工程范式
大数据·人工智能
IT摆渡者2 小时前
linux 系统安全检查
运维·网络·经验分享·笔记
学习3人组3 小时前
OEE(设备综合效率)的标准定义、公式、损失分类、以及在工位触屏/MES里怎么采集和统计
大数据·网络·数据库
财迅通Ai3 小时前
百通能源:2026年一季度营收稳步增长,资产结构持续优化
大数据·人工智能·能源·百通能源
千匠网络3 小时前
数智全链赋能,千匠网络钢铁能源供应链平台解决方案
大数据·人工智能