中文分词:Python、Golang、Java

常见的中文分词库

开源库 语言 说明
jieba Python 最好的 Python 中文分词组件
HanLP Python 一系列模型与算法组成的NLP工具包
FoolNLTK Python 可能是最准的开源中文分词
Jcseg Java 轻量级 Java 中文分词器
Ansj Java 基于 n-Gram+CRF+HMM 的中文分词的 Java 实现
word Java Java 分布式中文分词组件
huichen/sego Go 纯 go 实现中文分词 github
wangbin/jiebago Go 纯 go 实现 jiebago
go-ego/gse Go 借鉴前两者设计,纯 go 实现 github
yanyiwu/gojieba Go 核心算法底层由C++实现,不能跨平台编译 gojieba

参考
7个优秀的开源中文分词库推荐,实用性强!
golang 中文分词库比较

相关推荐
阿冲Runner23 分钟前
创建一个生产可用的线程池
java·后端
写bug写bug33 分钟前
你真的会用枚举吗
java·后端·设计模式
喵手1 小时前
如何利用Java的Stream API提高代码的简洁度和效率?
java·后端·java ee
-Xie-1 小时前
Maven(二)
java·开发语言·maven
IT利刃出鞘1 小时前
Java线程的6种状态和JVM状态打印
java·开发语言·jvm
天天摸鱼的java工程师2 小时前
Java 解析 JSON 文件:八年老开发的实战总结(从业务到代码)
java·后端·面试
白仑色2 小时前
Spring Boot 全局异常处理
java·spring boot·后端·全局异常处理·统一返回格式
喵手2 小时前
反射机制:你真的了解它的“能力”吗?
java·后端·java ee
kaika13 小时前
告别复杂配置!使用 1Panel 运行环境功能轻松搭建 Java 应用
java·1panel·建站·halo
有梦想的攻城狮3 小时前
Java 11中的Collections类详解
java·windows·python·java11·collections