修改云主机配置 - 内存增容

文章目录

一、修改云主机配置缘由

  • 在今天的Spark课程中,我们深入学习了数据集和数据帧的操作方法。然而,我注意到云主机的内存几乎被耗尽,这导致了系统运行时的卡顿,有时甚至会导致Spark Shell的强制退出。为了确保课程的顺利进行,我需要对云主机的配置进行调整,特别是增加内存容量,以满足我们学习过程中对计算资源的需求。

二、修改云主机配置步骤

1、查看云主机概述

  • 内存使用情况:20GB用了12GB

2、查看master云主机

  • 云主机类型 - m1.medium

3、更改master云主机配置

  • 更多 ⟶ \longrightarrow ⟶ 配置变更 ⟶ \longrightarrow ⟶ 修改配置
  • 选择云主机类型 - m1.vlarge - 内存8GB
  • 勾选同意强制关机复选框,单击【确定】按钮,正在修改 - 配置/迁移
  • 确认修改配置/迁移
  • 弹出消息框要求用户确认
  • 单击【确定】按钮

4、查看master云主机

  • 云主机类型已成功改成m1.vlarge,8GB运行内存,正常运行中......

三、使用Spark Shell玩Saprk SQL

1、启动HDFS服务

  • 执行命令:start-dfs.sh

2、启动Spark集群

  • 执行命令:start-all.sh

3、启动集群模式Spark Shell

  • 执行命令:spark-shell --master spark://master:7077

4、读取文件生成单例数据帧

  • 执行命令:val df = spark.read.text("hdfs://master:9000/student/input/student.txt")

  • 执行命令:df.show

5、将单列数据帧转换成多列数据帧

scala 复制代码
val stuDF = df
  .withColumn("id", split(col("value"), ",")(0).cast("int"))
  .withColumn("name", split(col("value"), ",")(1))
  .withColumn("gender", split(col("value"), ",")(2))
  .withColumn("age", split(col("value"), ",")(3).cast("int"))
  .drop("value") // 删除原始的 value 列
  • 执行上述命令

  • 执行命令:stuDF.printSchema

  • 执行命令:stuDF.show

6、基于数据帧生成临时视图

  • 执行命令:stuDF.createOrReplaceTempView("student")

7、基于临时视图进行SQL查询

  • 执行命令:spark.sql("select * from student where gender = '女' and age > 20").show
相关推荐
我命由我1234511 小时前
Derby - Derby 服务器(Derby 概述、Derby 服务器下载与启动、Derby 连接数据库与创建数据表、Derby 数据库操作)
java·运维·服务器·数据库·后端·java-ee·后端框架
拥友LikT11 小时前
惠普DL380,Bios设置了U盘启动以后,读不到U盘(其他品牌服务器解决思路类似)
服务器·系统安装
我系真滴菜11 小时前
EMQX服务器调试
运维·服务器
电鱼智能的电小鱼11 小时前
基于电鱼 ARM 工控机的井下AI故障诊断方案——让煤矿远程监控更智能、更精准
网络·arm开发·人工智能·算法·边缘计算
含目的基因的质粒12 小时前
Python异常、模块、包
服务器·开发语言·python
AC是你的谎言13 小时前
HTTP和HTTPS
linux·网络·c++·网络协议·学习·http·https
2501_9387900713 小时前
从 0 到 1:解决 VsCode 远程连服务器后 Github Copilot 无法使用问题
服务器·vscode·github
江輕木14 小时前
如何使用宿主机软件共享网络给CentOS 7
linux·运维·服务器
IT曙光14 小时前
在华为TaiShan 200系列服务器基于CentOS 7.6/7.7创建虚拟机
运维·服务器·centos
刀客Doc14 小时前
刀客doc:亚马逊和谷歌的广告战争,开始打到云上了
网络