Pinyin4j介绍和简单使用

前言

Pinyin4j是一个Java库,用于将汉字转换为拼音。它是由中国清华大学的Tsinghua University和中国科学院计算技术研究所的研究人员开发的。Pinyin4j可以用于Java应用程序中,以便在需要时将汉字转换为拼音。例如,它可以用于中文输入法、文本编辑器、搜索引擎等。

这是它的具体网站,感兴趣的,可以自己去看一下
https://pinyin4j.sourceforge.net/

具体安装过程

  1. 在Maven官网去查询

  2. 引入相关依赖

java 复制代码
<!-- https://mvnrepository.com/artifact/com.belerweb/pinyin4j -->
<dependency>
    <groupId>com.belerweb</groupId>
    <artifactId>pinyin4j</artifactId>
    <version>2.5.1</version>
</dependency>

简单一些用法

其实Pinyin4j的简单用法,实际它的核心类就是PinyinHelper类,我接下来会展示一个简单的api使用方法.

java 复制代码
public class PinyinTest01 {
    public static void main(String[] args) {
        //1.展示单个汉字的字母拼写
        String[] res1=PinyinHelper.toHanyuPinyinStringArray('长');
        System.out.println(Arrays.toString(res1));
        String[] s = PinyinHelper.toHanyuPinyinStringArray('中');
        System.out.println(Arrays.toString(s));
    }
}

大家可以看见,我们上面的api方法,是可以获取到单个字符的拼写的.但为什么我们不直接获取一个字符串的拼写呢?

我去查了这个Pinyin4官网的api.发现了这样的一个事实

发现该方法已经被删除了,所以针对我们接下来做的文件搜索项目,我们要封装一下这个工具类,让它能够输入具体的字符串进行拼音转换.具体的思路如下:

我们首先要知道,我们要进行拼音转换首先要分为两种情况:1.全拼.2.首字符拼音

具体的步骤如下:

1.首先遍历字符串

2.遍历字符串之后,把每个字符串单独转译

3.转换之后的字符串保存到stringBuffer中,返回即可

具体代码如下:

java 复制代码
    public static String get(String src,boolean fullSpell){
        //1.如果是空字符串,则不处理.
        if (src == null && src.trim().length() ==0){
            return null;
        }
        //针对Pinyin4j 做出配置,就是针对lu的lv的配置 ->使用v来配置,
        HanyuPinyinOutputFormat format=new HanyuPinyinOutputFormat();
        format.setVCharType(HanyuPinyinVCharType.WITH_V);
        //2.如果字符串非空
        //遍历字符串的每个字符串,针对每个字符串进行转换,把转换得到的结果,拼接到StringBuilder里面
        StringBuffer stringBuffer=new StringBuffer();
        for (int i=0;i<src.length();i++){
            char ch=src.charAt(i);
            String[] tmp=null;
            try {
                tmp= PinyinHelper.toHanyuPinyinStringArray(ch,format);
            } catch (BadHanyuPinyinOutputFormatCombination e) {
                e.printStackTrace();
            }
            if (tmp == null || tmp.length ==0){
                //如果是空的字符,就说明转换失败了.
                //如果输入的字符,没有汉语拼音,自然就会转换失败.
                //保留原始字符,加入结果中
                stringBuffer.append(ch);
            }else if(fullSpell){
                //拼音结果为true,我们
                stringBuffer.append(tmp[0]);
            }else {
                //拼音结果为false
                //比如 卡 =["ka","qia"] 此时取0号元素,得到了"ka",再取0号字符
                stringBuffer.append(tmp[0].charAt(0));
            }
        }
        return stringBuffer.toString();
    }

    public static void main(String[] args) {
        System.out.println(get("长",true));
        System.out.println(get("彘二",true));
        System.out.println(get("彘二",false));
        System.out.println(get("⻓还",true));
        System.out.println(get("绿鲤⻥",true));
        System.out.println(get("abc",true));
        System.out.println(get("中华⼈⺠共和国",false));
        System.out.println(get("⻓还",false));
        System.out.println(get("abc",false));
//        System.out.println(get("中华⼈⺠共和国",true));
        System.out.println(get("中华人民共和国",true));
    }
}
相关推荐
不要再敲了1 小时前
JDBC从入门到面试:全面掌握Java数据库连接技术
java·数据库·面试
潇I洒1 小时前
若依4.8.1打包war后在Tomcat无法运行,404报错的一个解决方法
java·tomcat·ruoyi·若依·404
子午2 小时前
Python的uv包管理工具使用
开发语言·python·uv
Funcy2 小时前
XxlJob 源码分析05:执行器注册流程
java
Boop_wu2 小时前
[数据结构] 队列 (Queue)
java·jvm·算法
无敌的神原秋人2 小时前
关于Redis不同序列化压缩性能的对比
java·redis·缓存
HMBBLOVEPDX2 小时前
C++(静态函数)
开发语言·c++
Chan162 小时前
JVM从入门到实战:从字节码组成、类生命周期到双亲委派及打破双亲委派机制
java·jvm·spring boot·后端·intellij-idea
dpxiaolong3 小时前
RK3588 Android12默认移除导航栏
开发语言·python