Scala全文单词统计

一:方法

package test5
import java.io.PrintWriter
import scala.io.Source
//可变的Map
import scala.collection.mutable
object test5_1 {
  def main(args: Array[String]): Unit = {
//1.读入文件
    val content = Source.fromFile("1.txt").mkString
//    println(content)

    //2.拆分字符串-->单词数组
//    val rs = content.split(",")正则表达式
//    W:表示非字符(,空格,?...)
//    W+:多个非字符
    val rs = content.split("\\w+")
//    println("-"*40)
//    rs.foreach(println)

    //3.统计出现的频率
    val wordsMap = mutable.Map[String,Int]()
    rs.foreach(w => {
      val word = w.toLowerCase()//全小写
      //是否出现
      if(wordsMap.contains(word)){
        wordsMap(word)+=1
      }else{
        wordsMap(word) = 1
      }
    })
    //4.根据出现的次数从高到低排序
    //Map不能直接排序,需要转成有序的集合
    val orderList = wordsMap.toList.sortWith((a,b)=>a._2>b._2)
    //输出Map

    //5.保存结果,涉及到写入文件
    val writer = new PrintWriter("output.txt")

    for (e<- orderList){
      println(e._1,e._2)
      writer.println(s"${e._1}:${e._2}次")

    }
    writer.close()//关闭
  }
}
相关推荐
码农君莫笑6 分钟前
Blazor项目中使用EF读写 SQLite 数据库
linux·数据库·sqlite·c#·.netcore·人机交互·visual studio
云空8 分钟前
《解锁 Python 数据挖掘的奥秘》
开发语言·python·数据挖掘
青莳吖18 分钟前
Java通过Map实现与SQL中的group by相同的逻辑
java·开发语言·sql
Buleall25 分钟前
期末考学C
java·开发语言
重生之绝世牛码27 分钟前
Java设计模式 —— 【结构型模式】外观模式详解
java·大数据·开发语言·设计模式·设计原则·外观模式
小蜗牛慢慢爬行33 分钟前
有关异步场景的 10 大 Spring Boot 面试问题
java·开发语言·网络·spring boot·后端·spring·面试
Algorithm157643 分钟前
云原生相关的 Go 语言工程师技术路线(含博客网址导航)
开发语言·云原生·golang
shinelord明1 小时前
【再谈设计模式】享元模式~对象共享的优化妙手
开发语言·数据结构·算法·设计模式·软件工程
呆呆小雅1 小时前
C#关键字volatile
java·redis·c#
Monly211 小时前
Java(若依):修改Tomcat的版本
java·开发语言·tomcat