Scala全文单词统计

一:方法

复制代码
package test5
import java.io.PrintWriter
import scala.io.Source
//可变的Map
import scala.collection.mutable
object test5_1 {
  def main(args: Array[String]): Unit = {
//1.读入文件
    val content = Source.fromFile("1.txt").mkString
//    println(content)

    //2.拆分字符串-->单词数组
//    val rs = content.split(",")正则表达式
//    W:表示非字符(,空格,?...)
//    W+:多个非字符
    val rs = content.split("\\w+")
//    println("-"*40)
//    rs.foreach(println)

    //3.统计出现的频率
    val wordsMap = mutable.Map[String,Int]()
    rs.foreach(w => {
      val word = w.toLowerCase()//全小写
      //是否出现
      if(wordsMap.contains(word)){
        wordsMap(word)+=1
      }else{
        wordsMap(word) = 1
      }
    })
    //4.根据出现的次数从高到低排序
    //Map不能直接排序,需要转成有序的集合
    val orderList = wordsMap.toList.sortWith((a,b)=>a._2>b._2)
    //输出Map

    //5.保存结果,涉及到写入文件
    val writer = new PrintWriter("output.txt")

    for (e<- orderList){
      println(e._1,e._2)
      writer.println(s"${e._1}:${e._2}次")

    }
    writer.close()//关闭
  }
}
相关推荐
mudtools9 小时前
.NET驾驭Word之力:理解Word对象模型核心 (Application, Document, Range)
c#·.net
侃侃_天下14 小时前
最终的信号类
开发语言·c++·算法
echoarts14 小时前
Rayon Rust中的数据并行库入门教程
开发语言·其他·算法·rust
Aomnitrix15 小时前
知识管理新范式——cpolar+Wiki.js打造企业级分布式知识库
开发语言·javascript·分布式
大飞pkz15 小时前
【设计模式】C#反射实现抽象工厂模式
设计模式·c#·抽象工厂模式·c#反射·c#反射实现抽象工厂模式
每天回答3个问题15 小时前
UE5C++编译遇到MSB3073
开发语言·c++·ue5
伍哥的传说15 小时前
Vite Plugin PWA – 零配置构建现代渐进式Web应用
开发语言·前端·javascript·web app·pwa·service worker·workbox
小莞尔16 小时前
【51单片机】【protues仿真】 基于51单片机八路抢答器系统
c语言·开发语言·单片机·嵌入式硬件·51单片机
我是菜鸟0713号16 小时前
Qt 中 OPC UA 通讯实战
开发语言·qt
JCBP_16 小时前
QT(4)
开发语言·汇编·c++·qt·算法