大数据技术基础编程、实验和案例----大数据课程综合实验案例

一、实验目的

(1)熟悉Linux系统、MySQL、Hadoop、HBase、Hive、Sqoop、R、Eclipse等系统和软件的安装和使用;

(2)了解大数据处理的基本流程;

(3)熟悉数据预处理方法;

(4)熟悉在不同类型数据库之间进行数据相互导入导出;

(5)熟悉使用Python,echarts进行可视化分析;

(6)熟悉使用idea编写Java程序操作HBase数据库。

二、实验平台

  1. 操作系统:Linux(建议Ubuntu16.04);
  2. Hadoop版本:2.7.1。

三、 实验步骤

(1)步骤零:实验环境准备

(2)步骤一:本地数据集上传到数据仓库Hive

(3) 步骤二:Hive数据分析

(4) 步骤三:Hive、MySQL、HBase数据互导

(5)步骤四:利用R进行数据可视化分析。

有问题的小伙伴可以在评论区提出喔~

相关推荐
似水এ᭄往昔1 小时前
【Linux】自动化构建-make/Makefile
linux·运维·服务器·ubuntu
数据科学小丫1 小时前
Python 数据存储操作_数据存储、补充知识点:Python 与 MySQL交互
数据库·python·mysql
顶点多余1 小时前
Linux“信号“从硬件到软件详解
linux·运维·服务器
瀚高PG实验室2 小时前
rpm包安装报错:cannot open Packages index using db5 - Cannot allocate memory (12)
linux·运维·服务器·瀚高数据库
AI+程序员在路上3 小时前
嵌入式软件技术大全
linux·开发语言·arm开发·单片机
xianjian09123 小时前
MySQL 的 INSERT(插入数据)详解
android·数据库·mysql
RoboWizard3 小时前
本地AI主机批量部署 高效存储支撑全场景配置
大数据·人工智能
dingzd953 小时前
产品同质化严重如何用材质升级做出溢价空间
大数据·人工智能·跨境电商·内容营销
Snasph3 小时前
在Ubuntu上进行端口转发
linux·运维·ubuntu
@PHARAOH3 小时前
WHAT - AI 时代下的候选人
大数据·前端·人工智能