大数据技术基础编程、实验和案例----大数据课程综合实验案例

一、实验目的

(1)熟悉Linux系统、MySQL、Hadoop、HBase、Hive、Sqoop、R、Eclipse等系统和软件的安装和使用;

(2)了解大数据处理的基本流程;

(3)熟悉数据预处理方法;

(4)熟悉在不同类型数据库之间进行数据相互导入导出;

(5)熟悉使用Python,echarts进行可视化分析;

(6)熟悉使用idea编写Java程序操作HBase数据库。

二、实验平台

  1. 操作系统:Linux(建议Ubuntu16.04);
  2. Hadoop版本:2.7.1。

三、 实验步骤

(1)步骤零:实验环境准备

(2)步骤一:本地数据集上传到数据仓库Hive

(3) 步骤二:Hive数据分析

(4) 步骤三:Hive、MySQL、HBase数据互导

(5)步骤四:利用R进行数据可视化分析。

有问题的小伙伴可以在评论区提出喔~

相关推荐
wkm9564 分钟前
qt.qpa.xcb: could not connect to display解决方法
开发语言·qt·ubuntu
ghostwritten16 分钟前
k8s黑科技:Linux+Vagrant+VirtualBox开启Kubernetes奇幻之旅
linux·科技·kubernetes
the_nov37 分钟前
14.网络套接字TCP
linux·c++·网络协议
电星托马斯43 分钟前
C++中顺序容器vector、list和deque的使用方法
linux·c语言·c++·windows·笔记·学习·程序人生
IT成长日记1 小时前
【MySQL基础】 JSON函数入门
mysql·json·json函数
愚润求学2 小时前
【Linux】Linux权限
linux·服务器·语法
麻芝汤圆2 小时前
使用 MapReduce 进行高效数据清洗:从理论到实践
大数据·linux·服务器·网络·数据库·windows·mapreduce
天狼12222 小时前
第1章-3 MySQL的逻辑架构
mysql·逻辑架构
令狐少侠20112 小时前
Ubuntu 24.04.2 LTS 系统安装python,创建虚拟环境
linux·python·ubuntu
the_nov2 小时前
11.多线程-信号量-线程池
linux·c++