Scala读取单词的次数

复制代码
import scala.io.Source


//知识点:
//1.字符串.split("分隔符"):把字符串用指定的分隔符,拆分成多个部分,保存在数组中。

object Tset {
  def main(args: Array[String]): Unit = {
    //从文件1.txt读取内容
    val content = Source.fromFile("1.txt").mkString
    //println(content)

    //把字符串中的每个单词,折出来
    //正则表达式
    // \\w+:大写字符w表示:丰字(不是一个字的字符。例如:空格,逗号,句号,换行...)
    // +:一个或者多个
    val arr = content.split("\\w+")//得到是一个字符串数组

    //统计词频
    val m1 = scala.collection.mutable.Map[String,Int]()
    arr.foreach(word =>{
      //检查是否出现过
       if(m1.contains(word)){
         //出现票数+1
         m1(word) +=1
       }else{
         //没有出现票数不变
         m1(word)=1
       }
    })
    //对于m1,它是是一个Map(thank:10,is:5),现在需要对它进行排序,把出现次数最多的放在在前面,然后再输出
    //(think,10)
    //只需要排序之前的结果的前15个?在List中取出前15个?
    val sortedM1 = m1.toList.sortWith((a,b)=>a._2 > b._2).filter(a=>a._1.length>2).slice(0,15)

    //开始写入
    val writer = new java.io.PrintWriter("3.txt")
    //输出排序后的Map
    //把结果保持到一个新的文件中去
    writer.println("统计的结果是:")
    sortedM1.foreach{case (word,cishu) => writer.println(s"${word}:${cishu}")}
    writer.close() //结束写入
  }
}
相关推荐
howard20055 天前
1.6.1 掌握Scala数据结构 - 数组
scala·定长数组·变长数组
渣渣盟6 天前
Flink Table API与SQL流数据处理实战
大数据·sql·flink·scala
howard20059 天前
1.5 掌握Scala内建控制结构
scala·内建控制结构
howard20059 天前
1.1.2 Windows上安装Scala
scala·windows版本
allway210 天前
Debian Regular Expressions
运维·debian·scala
、BeYourself12 天前
Scala 字面量
开发语言·后端·scala
、BeYourself20 天前
Scala 数据类型
开发语言·后端·scala
howard200520 天前
1.2 Scala变量与数据类型
scala·变量·数据类型·常量