Pinyin4j介绍和简单使用

前言

Pinyin4j是一个Java库,用于将汉字转换为拼音。它是由中国清华大学的Tsinghua University和中国科学院计算技术研究所的研究人员开发的。Pinyin4j可以用于Java应用程序中,以便在需要时将汉字转换为拼音。例如,它可以用于中文输入法、文本编辑器、搜索引擎等。

这是它的具体网站,感兴趣的,可以自己去看一下
https://pinyin4j.sourceforge.net/

具体安装过程

  1. 在Maven官网去查询

  2. 引入相关依赖

java 复制代码
<!-- https://mvnrepository.com/artifact/com.belerweb/pinyin4j -->
<dependency>
    <groupId>com.belerweb</groupId>
    <artifactId>pinyin4j</artifactId>
    <version>2.5.1</version>
</dependency>

简单一些用法

其实Pinyin4j的简单用法,实际它的核心类就是PinyinHelper类,我接下来会展示一个简单的api使用方法.

java 复制代码
public class PinyinTest01 {
    public static void main(String[] args) {
        //1.展示单个汉字的字母拼写
        String[] res1=PinyinHelper.toHanyuPinyinStringArray('长');
        System.out.println(Arrays.toString(res1));
        String[] s = PinyinHelper.toHanyuPinyinStringArray('中');
        System.out.println(Arrays.toString(s));
    }
}

大家可以看见,我们上面的api方法,是可以获取到单个字符的拼写的.但为什么我们不直接获取一个字符串的拼写呢?

我去查了这个Pinyin4官网的api.发现了这样的一个事实

发现该方法已经被删除了,所以针对我们接下来做的文件搜索项目,我们要封装一下这个工具类,让它能够输入具体的字符串进行拼音转换.具体的思路如下:

我们首先要知道,我们要进行拼音转换首先要分为两种情况:1.全拼.2.首字符拼音

具体的步骤如下:

1.首先遍历字符串

2.遍历字符串之后,把每个字符串单独转译

3.转换之后的字符串保存到stringBuffer中,返回即可

具体代码如下:

java 复制代码
    public static String get(String src,boolean fullSpell){
        //1.如果是空字符串,则不处理.
        if (src == null && src.trim().length() ==0){
            return null;
        }
        //针对Pinyin4j 做出配置,就是针对lu的lv的配置 ->使用v来配置,
        HanyuPinyinOutputFormat format=new HanyuPinyinOutputFormat();
        format.setVCharType(HanyuPinyinVCharType.WITH_V);
        //2.如果字符串非空
        //遍历字符串的每个字符串,针对每个字符串进行转换,把转换得到的结果,拼接到StringBuilder里面
        StringBuffer stringBuffer=new StringBuffer();
        for (int i=0;i<src.length();i++){
            char ch=src.charAt(i);
            String[] tmp=null;
            try {
                tmp= PinyinHelper.toHanyuPinyinStringArray(ch,format);
            } catch (BadHanyuPinyinOutputFormatCombination e) {
                e.printStackTrace();
            }
            if (tmp == null || tmp.length ==0){
                //如果是空的字符,就说明转换失败了.
                //如果输入的字符,没有汉语拼音,自然就会转换失败.
                //保留原始字符,加入结果中
                stringBuffer.append(ch);
            }else if(fullSpell){
                //拼音结果为true,我们
                stringBuffer.append(tmp[0]);
            }else {
                //拼音结果为false
                //比如 卡 =["ka","qia"] 此时取0号元素,得到了"ka",再取0号字符
                stringBuffer.append(tmp[0].charAt(0));
            }
        }
        return stringBuffer.toString();
    }

    public static void main(String[] args) {
        System.out.println(get("长",true));
        System.out.println(get("彘二",true));
        System.out.println(get("彘二",false));
        System.out.println(get("⻓还",true));
        System.out.println(get("绿鲤⻥",true));
        System.out.println(get("abc",true));
        System.out.println(get("中华⼈⺠共和国",false));
        System.out.println(get("⻓还",false));
        System.out.println(get("abc",false));
//        System.out.println(get("中华⼈⺠共和国",true));
        System.out.println(get("中华人民共和国",true));
    }
}
相关推荐
一 乐2 分钟前
医疗管理|医院医疗管理系统|基于springboot+vue医疗管理系统设计与实现(源码+数据库+文档)
java·数据库·vue.js·spring boot·后端·医疗管理系统
say_fall4 分钟前
C语言容易被忽略的易错点(2)
c语言·开发语言
syker14 分钟前
NEWBASIC 2.06.7 API 帮助与用户使用手册
开发语言·人工智能·机器学习·自动化
Js_cold15 分钟前
Verilog运算符
开发语言·fpga开发·verilog
华仔啊17 分钟前
SpringBoot 2.x 和 3.x 的核心区别,这些变化你必须知道
java·spring boot·后端
laocooon52385788623 分钟前
大数的阶乘 C语言
java·数据结构·算法
努力还债的学术吗喽30 分钟前
【项目】pyqt5基于python的照片整蛊项目
开发语言·python·qt
m0_5695310135 分钟前
shell(4)--shell脚本中的循环:(if循环,for,while,until)和退出循环(continue,break, exit)
开发语言
不见长安在36 分钟前
分布式ID
java·分布式·分布式id
熊小猿38 分钟前
Redis 缓存怎么更新?—— 四种模型与一次“迟到的删除”
java·后端·spring