大数据技术基础编程、实验和案例----大数据课程综合实验案例

一、实验目的

(1)熟悉Linux系统、MySQL、Hadoop、HBase、Hive、Sqoop、R、Eclipse等系统和软件的安装和使用;

(2)了解大数据处理的基本流程;

(3)熟悉数据预处理方法;

(4)熟悉在不同类型数据库之间进行数据相互导入导出;

(5)熟悉使用Python,echarts进行可视化分析;

(6)熟悉使用idea编写Java程序操作HBase数据库。

二、实验平台

  1. 操作系统:Linux(建议Ubuntu16.04);
  2. Hadoop版本:2.7.1。

三、 实验步骤

(1)步骤零:实验环境准备

(2)步骤一:本地数据集上传到数据仓库Hive

(3) 步骤二:Hive数据分析

(4) 步骤三:Hive、MySQL、HBase数据互导

(5)步骤四:利用R进行数据可视化分析。

有问题的小伙伴可以在评论区提出喔~

相关推荐
core5125 分钟前
Hive实战(一)
数据仓库·hive·hadoop·架构·实战·配置·场景
最小的帆也能远航35 分钟前
2018年下半年 系统架构设计师 综合知识
linux·运维·服务器
华略创新36 分钟前
利用数据分析提升管理决策水平
大数据·数据分析·crm·管理系统·软件
pingao1413781 小时前
PG-210-HI 山洪预警系统呼叫端:筑牢山区应急预警 “安全防线”
大数据·人工智能·科技
疯子@1231 小时前
nacos1.3.2 ARM 版容器镜像制作
java·linux·docker·容器
庄小焱1 小时前
大数据存储域——Kafka设计原理
大数据·kafka·消息中间件
Empty_7771 小时前
Linux防火墙-Iptables
linux·运维·服务器
十年编程老舅1 小时前
‌C++左值与右值:从基础概念到核心应用‌
linux·c++·右值引用·c++17·c++左值·c++右值·左值引用
Elastic 中国社区官方博客2 小时前
带地图的 RAG:多模态 + 地理空间 在 Elasticsearch 中
大数据·人工智能·elasticsearch·搜索引擎·ai·语言模型·全文检索
飘忽不定的bug2 小时前
Ascend310B重构驱动run包
linux·ascend310