scala的统计词频

package test23

import java.io.PrintWriter

import scala.io.Source

object test {

def main(args: ArrayString): Unit = {

//从文件1.txt中,读取内容

val content = Source.fromFile("1.txt").mkString

println(content)

//把字符串中的每个单词,拆出来

//正则表达式

//\\w+:大写字符表示:非字(不是一个字的字符。例如:空格,逗号,句号,换行。。。。)

// +:一个或者多个

val arr = content.split("\\w ")//得到一个字符串数组

arr.foreach(println)

//如果有一个字符串数组:

val arr1= Array("thank","you","much","thank","very")

val m1 = scala.collection.mutable.MapString,Int()

arr1.foreach(word =>{

//检查是否出现过

if(m1.contains(word)){

//把票数+1

m1(word)+=1

}else{

//票数为1

m1(word) = 1

}

})

//对于m1,他是一个Map(thank:10,is:5),现在需要对他进行排序,把出现次数最多的放在最前面,然后再输出

//(thank,10)

//只要排序之前结果的15个?在list中取出前15个

val sortedM1 = m1.toList.sortWith((a,b)=> a._2>b._2).filter(a=>a._1.length>2).slice(0,15)

//输出排序后的Map

// sortedM1.foreach { case (word, count) =>

// println(s"{word}:{count}")

//4.把结果保存到一个新文件中

//开始写入

val writer = new PrintWriter("3.txt")

//排序后输出Map

//把结果保存到一个新文件中

writer.println("统计结果是:")

sortedM1.foreach{case(word,cishu)=>println(s"{word}:{cishu}")}

writer.close()//结束写入

}

}

相关推荐
JustHappy13 小时前
古法编程秘籍(五):什么是进程和线程?从软件到 CPU 的一次完整旅程
前端·后端·代码规范
折哥的程序人生 · 物流技术专研15 小时前
【电商多平台电子面单对接实战|第二篇】抖音代发电子面单对接:从“面条代码”到整洁架构的涅槃之路
设计模式·架构·系统架构·单元测试·代码规范·单一职责原则
冬奇Lab16 小时前
AI Agent 找代码:多仓库多技术栈下的代码定位工程
人工智能·agent·代码规范
柒和远方1 天前
每日一学V017:用 Prompt 做 NLP:解构赋值与 AI 全栈的第一次实战
javascript·架构·代码规范
2501_937154931 天前
酷秒神马 9.0(2026 新版)内核优化实测
源码·源代码管理·机顶盒
醉颜凉2 天前
Scala自定义Monad实战:从理论到应用的完整指南
大数据·算法·scala
那晚的她2 天前
Scala中Set集合
开发语言·后端·scala
IvanCodes2 天前
二、Scala流程控制:分支与循环
大数据·scala
Veggie262 天前
【Scala PyTorch深度学习】PyTorch On Scala系列课程 第十四章 29 PyTorch模型扩展自定义Module【AI Infra3】[PyTorch Scala硕士研一课程】
人工智能·深度学习·scala
Clf丶忆笙2 天前
搭建支持多语言开发的Quarkus环境:Java、Kotlin与Scala全栈指南
java·开发语言·云原生·kotlin·scala·quarkus