Pinyin4j介绍和简单使用

前言

Pinyin4j是一个Java库,用于将汉字转换为拼音。它是由中国清华大学的Tsinghua University和中国科学院计算技术研究所的研究人员开发的。Pinyin4j可以用于Java应用程序中,以便在需要时将汉字转换为拼音。例如,它可以用于中文输入法、文本编辑器、搜索引擎等。

这是它的具体网站,感兴趣的,可以自己去看一下
https://pinyin4j.sourceforge.net/

具体安装过程

  1. 在Maven官网去查询

  2. 引入相关依赖

java 复制代码
<!-- https://mvnrepository.com/artifact/com.belerweb/pinyin4j -->
<dependency>
    <groupId>com.belerweb</groupId>
    <artifactId>pinyin4j</artifactId>
    <version>2.5.1</version>
</dependency>

简单一些用法

其实Pinyin4j的简单用法,实际它的核心类就是PinyinHelper类,我接下来会展示一个简单的api使用方法.

java 复制代码
public class PinyinTest01 {
    public static void main(String[] args) {
        //1.展示单个汉字的字母拼写
        String[] res1=PinyinHelper.toHanyuPinyinStringArray('长');
        System.out.println(Arrays.toString(res1));
        String[] s = PinyinHelper.toHanyuPinyinStringArray('中');
        System.out.println(Arrays.toString(s));
    }
}

大家可以看见,我们上面的api方法,是可以获取到单个字符的拼写的.但为什么我们不直接获取一个字符串的拼写呢?

我去查了这个Pinyin4官网的api.发现了这样的一个事实

发现该方法已经被删除了,所以针对我们接下来做的文件搜索项目,我们要封装一下这个工具类,让它能够输入具体的字符串进行拼音转换.具体的思路如下:

我们首先要知道,我们要进行拼音转换首先要分为两种情况:1.全拼.2.首字符拼音

具体的步骤如下:

1.首先遍历字符串

2.遍历字符串之后,把每个字符串单独转译

3.转换之后的字符串保存到stringBuffer中,返回即可

具体代码如下:

java 复制代码
    public static String get(String src,boolean fullSpell){
        //1.如果是空字符串,则不处理.
        if (src == null && src.trim().length() ==0){
            return null;
        }
        //针对Pinyin4j 做出配置,就是针对lu的lv的配置 ->使用v来配置,
        HanyuPinyinOutputFormat format=new HanyuPinyinOutputFormat();
        format.setVCharType(HanyuPinyinVCharType.WITH_V);
        //2.如果字符串非空
        //遍历字符串的每个字符串,针对每个字符串进行转换,把转换得到的结果,拼接到StringBuilder里面
        StringBuffer stringBuffer=new StringBuffer();
        for (int i=0;i<src.length();i++){
            char ch=src.charAt(i);
            String[] tmp=null;
            try {
                tmp= PinyinHelper.toHanyuPinyinStringArray(ch,format);
            } catch (BadHanyuPinyinOutputFormatCombination e) {
                e.printStackTrace();
            }
            if (tmp == null || tmp.length ==0){
                //如果是空的字符,就说明转换失败了.
                //如果输入的字符,没有汉语拼音,自然就会转换失败.
                //保留原始字符,加入结果中
                stringBuffer.append(ch);
            }else if(fullSpell){
                //拼音结果为true,我们
                stringBuffer.append(tmp[0]);
            }else {
                //拼音结果为false
                //比如 卡 =["ka","qia"] 此时取0号元素,得到了"ka",再取0号字符
                stringBuffer.append(tmp[0].charAt(0));
            }
        }
        return stringBuffer.toString();
    }

    public static void main(String[] args) {
        System.out.println(get("长",true));
        System.out.println(get("彘二",true));
        System.out.println(get("彘二",false));
        System.out.println(get("⻓还",true));
        System.out.println(get("绿鲤⻥",true));
        System.out.println(get("abc",true));
        System.out.println(get("中华⼈⺠共和国",false));
        System.out.println(get("⻓还",false));
        System.out.println(get("abc",false));
//        System.out.println(get("中华⼈⺠共和国",true));
        System.out.println(get("中华人民共和国",true));
    }
}
相关推荐
谙弆悕博士12 分钟前
【附C源码】二叉搜索树的C语言实现
c语言·开发语言·数据结构·算法·二叉树·项目实战·数据结构与算法
C+++Python14 分钟前
C++ 泛型编程 极简示例代码
开发语言·c++
Rust研习社21 分钟前
Ubuntu 全面拥抱 Rust 后,我意识到 Rust 社区要变了
linux·服务器·开发语言·后端·ubuntu·rust
宵时待雨25 分钟前
回溯算法专题2:二叉树中的深搜
开发语言·数据结构·c++·笔记·算法·深度优先
jiayong2330 分钟前
第 43 课:任务详情抽屉里的批量处理闭环与删除联动
java·开发语言·前端
likerhood31 分钟前
Java 访问修饰符:public、protected、private讲解
java·开发语言·javascript
Ting-yu34 分钟前
SpringCloud快速入门(5)---- 均衡负载
java·spring·spring cloud
学不思则罔1 小时前
ParallelStream并发陷阱解析
java·开发语言·windows
认真的小羽❅1 小时前
【Java并发编程】volatile关键字深度解析:从内存语义到实际应用
java·开发语言