中文分词:Python、Golang、Java

常见的中文分词库

开源库 语言 说明
jieba Python 最好的 Python 中文分词组件
HanLP Python 一系列模型与算法组成的NLP工具包
FoolNLTK Python 可能是最准的开源中文分词
Jcseg Java 轻量级 Java 中文分词器
Ansj Java 基于 n-Gram+CRF+HMM 的中文分词的 Java 实现
word Java Java 分布式中文分词组件
huichen/sego Go 纯 go 实现中文分词 github
wangbin/jiebago Go 纯 go 实现 jiebago
go-ego/gse Go 借鉴前两者设计,纯 go 实现 github
yanyiwu/gojieba Go 核心算法底层由C++实现,不能跨平台编译 gojieba

参考
7个优秀的开源中文分词库推荐,实用性强!
golang 中文分词库比较

相关推荐
choke2332 小时前
Python 基础语法精讲:数据类型、运算符与输入输出
java·linux·服务器
岁岁种桃花儿2 小时前
CentOS7 彻底卸载所有JDK/JRE + 重新安装JDK8(实操完整版,解决kafka/jps报错)
java·开发语言·kafka
roman_日积跬步-终至千里3 小时前
【Java并发】Java 线程池实战:警惕使用CompletableFuture.supplyAsync
java·开发语言·网络
毕设源码-钟学长3 小时前
【开题答辩全过程】以 基于Springboot的扶贫众筹平台为例,包含答辩的问题和答案
java·spring boot·后端
CodeSheep程序羊3 小时前
拼多多春节加班工资曝光,没几个敢给这个数的。
java·c语言·开发语言·c++·python·程序人生·职场和发展
我是咸鱼不闲呀3 小时前
力扣Hot100系列19(Java)——[动态规划]总结(上)(爬楼梯,杨辉三角,打家劫舍,完全平方数,零钱兑换)
java·leetcode·动态规划
加油,小猿猿4 小时前
Java开发日志-双数据库事务问题
java·开发语言·数据库
yuluo_YX4 小时前
Reactive 编程 - Java Reactor
java·python·apache
山岚的运维笔记4 小时前
SQL Server笔记 -- 第20章:TRY/CATCH
java·数据库·笔记·sql·microsoft·sqlserver
南极企鹅4 小时前
springBoot项目有几个端口
java·spring boot·后端