|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| ### Spark WordCount实验一 启动spark
1. 数据准备 创建建数据文件夹 进入data文件夹 创建文本文件 并查看是否创建成功 
文件内容
查看文件目录
|
| 启动pyspark
3、输入代码 从本地读入文本数据
读入1中创建好的data.txt文本文件。 并计算打印结果
### Spark WordCount实验二 切工作目录到Downloads文件夹下, 并用用vim命令新建data.txt 
编写代码
并把.py文件传输到Linux上
提交应用 切换到spark-submit所在目录下,然后提交wordcount.py代码。
运行结果 

|
| 总体还是比较简单就练习如何使用spark-submit命令提交独立的python程序时最后的输出wordcount01.py时有点问题 |
Spark wordcount实验
涡看你就不是好人呐2024-08-08 15:33
相关推荐
TM1Club5 分钟前
AI驱动的预测:新的竞争优势zhang133830890759 分钟前
CG-09H 超声波风速风向传感器 加热型 ABS材质 重量轻 没有机械部件电商API_180079052471 小时前
第三方淘宝商品详情 API 全维度调用指南:从技术对接到生产落地龙山云仓2 小时前
No140:AI世间故事-对话康德——先验哲学与AI理性:范畴、道德律与自主性躺柒3 小时前
读数字时代的网络风险管理:策略、计划与执行04风险指引体系独自归家的兔4 小时前
从 “局部凑活“ 到 “全局最优“:AI 规划能力的技术突破与产业落地实践海域云-罗鹏4 小时前
国内公司与英国总部数据中心/ERP系统互连,SD-WAN专线实操指南策知道5 小时前
依托政府工作报告准备省考【经验贴】Henry-SAP6 小时前
SAP(ERP) 组织结构业务视角解析冷崖7 小时前
消息队列-kafka(一)