Spark是基于scala的,当然它也可以支持java和scala还有python语言,我们这里会使用scala。
1.在Idea中安装插件,使得Idea中可以编写scala代码。
2.使用Maven创建项目,并在pom.xml文件中配置相关的依赖。


3.设置maven依赖项。修改pom.xml文件,添加如下:
4.下载依赖。添加完成之后,刷新Maven,它会帮助我们去下载依赖。
6.新建Scala类。如果这里没有看到Scala类的选项,就去检查第2步。

编写代码如下:

8.准备待统计的词频文件。在项目根目录下建立文件夹input,并穿件两个文本文件:word1.txt, word2.txt
9.运行代码。点击运行代码,生成代码如下
