大数据技术基础编程、实验和案例----大数据课程综合实验案例

一、实验目的

(1)熟悉Linux系统、MySQL、Hadoop、HBase、Hive、Sqoop、R、Eclipse等系统和软件的安装和使用;

(2)了解大数据处理的基本流程;

(3)熟悉数据预处理方法;

(4)熟悉在不同类型数据库之间进行数据相互导入导出;

(5)熟悉使用Python,echarts进行可视化分析;

(6)熟悉使用idea编写Java程序操作HBase数据库。

二、实验平台

  1. 操作系统:Linux(建议Ubuntu16.04);
  2. Hadoop版本:2.7.1。

三、 实验步骤

(1)步骤零:实验环境准备

(2)步骤一:本地数据集上传到数据仓库Hive

(3) 步骤二:Hive数据分析

(4) 步骤三:Hive、MySQL、HBase数据互导

(5)步骤四:利用R进行数据可视化分析。

有问题的小伙伴可以在评论区提出喔~

相关推荐
AI营销快线4 分钟前
AI如何每日自动生成大量高质量营销素材?
大数据·人工智能
KKKlucifer20 分钟前
从 “人工标注” 到 “AI 驱动”:数据分类分级技术的效率革命
大数据·人工智能·分类
天远云服22 分钟前
Spring Boot 金融实战:如何清洗天远API的 KV 数组格式风控数据
大数据·api
我爱鸢尾花28 分钟前
第十四章聚类方法理论及Python实现
大数据·python·机器学习·数据挖掘·数据分析·聚类
梁萌37 分钟前
MySQL索引的使用技巧
数据库·mysql·索引·b+tree
Better Bench39 分钟前
Ubuntu aarch64\arm64系统安装vscode
linux·vscode·ubuntu
暴风游侠1 小时前
linux知识点-服务相关
linux·服务器·笔记
阿海5741 小时前
卸载nginx的shell脚本
linux·nginx
JANG10241 小时前
【Linux】常用指令
linux·服务器·javascript
DeeplyMind1 小时前
使用parted工具扩展QCOW2磁盘大小完整方案
linux·qemu·virtialization