scala的统计词频

package test23

import java.io.PrintWriter

import scala.io.Source

object test {

def main(args: Array[String]): Unit = {

//从文件1.txt中,读取内容

val content = Source.fromFile("1.txt").mkString

println(content)

//把字符串中的每个单词,拆出来

//正则表达式

//\\w+:大写字符表示:非字(不是一个字的字符。例如:空格,逗号,句号,换行。。。。)

// +:一个或者多个

val arr = content.split("\\w ")//得到一个字符串数组

arr.foreach(println)

//如果有一个字符串数组:

val arr1= Array("thank","you","much","thank","very")

val m1 = scala.collection.mutable.Map[String,Int]()

arr1.foreach(word =>{

//检查是否出现过

if(m1.contains(word)){

//把票数+1

m1(word)+=1

}else{

//票数为1

m1(word) = 1

}

})

//对于m1,他是一个Map(thank:10,is:5),现在需要对他进行排序,把出现次数最多的放在最前面,然后再输出

//(thank,10)

//只要排序之前结果的15个?在list中取出前15个

val sortedM1 = m1.toList.sortWith((a,b)=> a._2>b._2).filter(a=>a._1.length>2).slice(0,15)

//输出排序后的Map

// sortedM1.foreach { case (word, count) =>

// println(s"{word}:{count}")

//4.把结果保存到一个新文件中

//开始写入

val writer = new PrintWriter("3.txt")

//排序后输出Map

//把结果保存到一个新文件中

writer.println("统计结果是:")

sortedM1.foreach{case(word,cishu)=>println(s"{word}:{cishu}")}

writer.close()//结束写入

}

}

相关推荐
小邓睡不饱耶31 分钟前
使用Scala实现手机号码归属地查询系统
开发语言·windows·scala
知识即是力量ol40 分钟前
Git 实战指南:从分支管理到冲突解决
git·github·源代码管理
巴巴博一1 天前
抛弃 ESLint + Prettier?基于 Biome + Husky 的下一代前端工程化实践
代码规范
码界奇点2 天前
基于Gin与GORM的若依后台管理系统设计与实现
论文阅读·go·毕业设计·gin·源代码管理
码界奇点2 天前
基于Spring Boot和Vue3的无头内容管理系统设计与实现
java·spring boot·后端·vue·毕业设计·源代码管理
码界奇点2 天前
基于SSM框架的旅游门户网站系统的设计与实现
毕业设计·旅游·xss·源代码管理
码界奇点2 天前
基于Spring Boot和Activiti6的工作流OA系统设计与实现
java·spring boot·后端·车载系统·毕业设计·源代码管理
码界奇点2 天前
基于Spring Boot与Vue的学习教程网站系统设计与实现
vue.js·spring boot·学习·毕业设计·源代码管理
懵萌长颈鹿3 天前
命令模式 (Command Pattern)
命令模式
C澒3 天前
前端编码规范
前端·团队开发·代码规范