中文分词:Python、Golang、Java

常见的中文分词库

开源库 语言 说明
jieba Python 最好的 Python 中文分词组件
HanLP Python 一系列模型与算法组成的NLP工具包
FoolNLTK Python 可能是最准的开源中文分词
Jcseg Java 轻量级 Java 中文分词器
Ansj Java 基于 n-Gram+CRF+HMM 的中文分词的 Java 实现
word Java Java 分布式中文分词组件
huichen/sego Go 纯 go 实现中文分词 github
wangbin/jiebago Go 纯 go 实现 jiebago
go-ego/gse Go 借鉴前两者设计,纯 go 实现 github
yanyiwu/gojieba Go 核心算法底层由C++实现,不能跨平台编译 gojieba

参考
7个优秀的开源中文分词库推荐,实用性强!
golang 中文分词库比较

相关推荐
努力努力再努力wz11 分钟前
【Linux网络系列】:JSON+HTTP,用C++手搓一个web计算器服务器!
java·linux·运维·服务器·c语言·数据结构·c++
魂梦翩跹如雨12 分钟前
死磕排序算法:手撕快速排序的四种姿势(Hoare、挖坑、前后指针 + 非递归)
java·数据结构·算法
带刺的坐椅8 小时前
Solon AI Skills 会是 Agent 的未来吗?
java·agent·langchain4j·solon-ai
jacGJ8 小时前
记录学习--文件读写
java·前端·学习
花间相见8 小时前
【JAVA开发】—— Nginx服务器
java·开发语言·nginx
扶苏-su8 小时前
Java---Properties 类
java·开发语言
cypking8 小时前
四、CRUD操作指南
java
2301_780669869 小时前
文件字节流输出、文件复制、关闭流的方法
java
剑锋所指,所向披靡!10 小时前
C++之类模版
java·jvm·c++
钟离墨笺10 小时前
Go语言--2go基础-->基本数据类型
开发语言·前端·后端·golang