大数据技术基础编程、实验和案例----大数据课程综合实验案例

一、实验目的

(1)熟悉Linux系统、MySQL、Hadoop、HBase、Hive、Sqoop、R、Eclipse等系统和软件的安装和使用;

(2)了解大数据处理的基本流程;

(3)熟悉数据预处理方法;

(4)熟悉在不同类型数据库之间进行数据相互导入导出;

(5)熟悉使用Python,echarts进行可视化分析;

(6)熟悉使用idea编写Java程序操作HBase数据库。

二、实验平台

  1. 操作系统:Linux(建议Ubuntu16.04);
  2. Hadoop版本:2.7.1。

三、 实验步骤

(1)步骤零:实验环境准备

(2)步骤一:本地数据集上传到数据仓库Hive

(3) 步骤二:Hive数据分析

(4) 步骤三:Hive、MySQL、HBase数据互导

(5)步骤四:利用R进行数据可视化分析。

有问题的小伙伴可以在评论区提出喔~

相关推荐
IT北辰几秒前
VMware Workstation虚拟机kali环境如何连接usb网卡RT3070
linux
cheems95272 分钟前
【MySQL】SQL调优:数据库性能剖析
数据库·sql·mysql
努力有什么不好3 分钟前
SparkSQL如何查询外部hive数据
数据仓库·hive·hadoop
大任视点5 分钟前
太空能源风口来袭!海目星领跑太空光伏与固态设备赛道
大数据·人工智能
yumgpkpm10 分钟前
华为昇腾300T A2训练、微调Qwen过程,带保姆式命令,麒麟操作系统+鲲鹏CPU
hive·hadoop·华为·flink·spark·kafka·hbase
Gofarlic_OMS13 分钟前
Altium许可证状态自动化监控方案
大数据·运维·服务器·人工智能·自动化·github
郝亚军14 分钟前
Ubuntu启一个tcp server,client去连接
linux·服务器·数据库
A懿轩A15 分钟前
【MySQL 数据库】SQL 基础语法速成:SELECT / INSERT / UPDATE / DELETE 一篇上手增删改查
数据库·sql·mysql
努力有什么不好18 分钟前
Hadoop3.2.2伪分布式搭建
大数据·hadoop·分布式
蓝眸少年CY19 分钟前
Hadoop2 【源码编译】
hadoop