jdk21使用Vosk实现语音文字转换,免费的语音识别

1.下载vosk的model

vosk官网:https://alphacephei.com/vosk/models

我这里使用较小的vosk-model-small-cn-0.22

2.添加相关pom文件

java 复制代码
 <!-- 获取音频信息 -->
        <dependency>
            <groupId>org</groupId>
            <artifactId>jaudiotagger</artifactId>
            <version>2.0.3</version>
        </dependency>

        <!-- 语音识别 -->
        <dependency>
            <groupId>net.java.dev.jna</groupId>
            <artifactId>jna</artifactId>
            <version>5.16.0</version>
        </dependency>
        <dependency>
            <groupId>com.alphacephei</groupId>
            <artifactId>vosk</artifactId>
            <version>0.3.45</version>
        </dependency>

3.代码

添加model和使用的音频,我这里用的wav格式的,不同格式的参数会不一样

java 复制代码
import org.vosk.LibVosk;
import org.vosk.LogLevel;
import org.vosk.Model;
import org.vosk.Recognizer;

import javax.sound.sampled.AudioSystem;
import javax.sound.sampled.UnsupportedAudioFileException;
import java.io.*; 

public class testVosk {
    public static void main(String[] argv) throws IOException, UnsupportedAudioFileException {
        LibVosk.setLogLevel(LogLevel.DEBUG);

        try (Model model = new Model("E:\\srk\\bigData\\vosk-model-small-cn-0.22");
             InputStream fis = AudioSystem.getAudioInputStream(new BufferedInputStream(new FileInputStream("C:\\Users\\Administrator\\Downloads\\mdhs1-5ob2k.wav")));
             Recognizer recognizer = new Recognizer(model, 16000)) {
            int bytes;
            byte[] b = new byte[4096];
            while ((bytes = fis.read(b)) >= 0) {
                if (recognizer.acceptWaveForm(b, bytes)) {
                    System.out.println(recognizer.getResult());
                } else {
                    System.out.println(recognizer.getPartialResult());
                }
            }
            String result = recognizer.getFinalResult();
            System.out.println(result);
        }

    }
}

4.可能遇到的问题

1.乱码,我搞了半天(捂脸)

因为jdk17以后编号的模式改了,所以在网上找了各种设置编码的格式都没有生效。

比如jvm设置 -Dfile.encoding=UTF-8都没生效。

-Dfile.encoding=UTF-8

jdk17以前的还是正常的。

解决方法:

  1. win系统控制面板找到"区域与语言设置"

  2. 在弹出框中选择更改系统区域设置

  3. 勾选beta使用utf-8

5.相关资料

  1. gitcode相关api
相关推荐
爱分享的飘哥3 分钟前
第三十五章:让AI绘画“动”起来:第一个AI视频诞生-AnimateDiff的时间卷积结构深度解析
人工智能·ai作画·ai视频生成·animatediff原理·时间卷积·video diffusion·sd动画
终端域名7 分钟前
机器人权利:真实还是虚幻,机器人权利研究如何可能,道德权利与法律权利
人工智能
污领巾7 分钟前
虚幻GAS底层原理解剖三 (GA)
java·游戏引擎·虚幻
科技圈快讯11 分钟前
AI+OA原生应用 麦当秀AIPPT
人工智能
C4程序员15 分钟前
北京JAVA基础面试30天打卡02
java·开发语言·面试
音视频牛哥24 分钟前
AIGC时代的视频基础设施:从数据采集到生成响应的全链路实践
人工智能·机器学习·aigc
好好研究24 分钟前
Java基础学习(一):类名规范、返回值、注释、数据类型
java·学习·算法
C++、Java和Python的菜鸟26 分钟前
第二章 矩阵
人工智能·算法·矩阵
胡琦博客27 分钟前
LLM Prompt与开源模型资源(2)提示工程关键技术
人工智能·prompt
音视频牛哥30 分钟前
低延迟 × 高识别:直播SDK与YOLO的融合应用架构解析
人工智能·opencv·计算机视觉