【文本 >>> 语音】⭐️SpringBoot 结合 jacob 简单实现一个文本朗读功能

目录

🍸前言

🍻一、环境准备

🍺二、依赖引入

💞️三、简单启动

🍹四、接口改造

[4.1 封装为一个工具类](#4.1 封装为一个工具类)

[4.2 暴露一个接口](#4.2 暴露一个接口)

[4.3 测试](#4.3 测试)

🌱五、扩展


🍸 前言

小伙伴们大家好,上次分享了一位读者使用国际化上下文 i18n 技术时遇到的兼容问题,也是成功帮他解决了问题,自己同时也学到这种使用方式;这次先放一放常用技术的学习,来看一个小工具,文本转语音,用 java 实现

🍻一、环境准备

一台语音功能没问题的设备(因为要借用机器的语音设备)

本地创建一个可以运行的 SpringBoot 项目,另外准备一个接口模拟工具即可

🍺二、依赖引入

jacob 是一个 Java COM (Component Object Model) 接口库,利用了 COM 接口来调用 Windows 的语音合成(TTS)服务,可以访问 Windows 的 Speech API 或者类似的语音合成工具,用于将文本转换为语音。

在项目的 pom.xml 文件中添加以下依赖,刷新 maven 触发自动下载

XML 复制代码
<dependency>
    <groupId>com.hynnet</groupId>
    <artifactId>jacob</artifactId>
    <version>1.18</version>
</dependency>

注:首次启动的时候可能会遇到如下报错

Exception in thread "main" java.lang.UnsatisfiedLinkError: no jacob-1.18-x64 in java.library.path

只需要手动下载解压后将文件放入到 JDK 的 bin 目录下即可

Release Release 1.18 · freemansoft/jacob-project · GitHub

查看自己 JDK 安装位置的命令如下:

💞️三、简单启动

使用语音功能的主要代码如下:

有四个参数,第一个参数是控制生成的 .mps 多媒体文件的输出位置;

第二个是所需语音阅读的文本内容

第三个第四个是控制语音元素的

java 复制代码
/**
     * 文本转音频
     *
     * @param path   音频生成路径(全路径,带文件名)(例:D:\\aa\\a.mp3)
     * @param text   文本内容
     * @param volume 音量大小 0 - 100
     * @param speed  语音朗读速度 -10 到 +10
     * @return 是否成功
     */
    public static boolean text(String path, String text, int volume, int speed) {
        try {

            // 调用dll朗读方法
            ActiveXComponent ax = new ActiveXComponent("Sapi.SpVoice");
            // 音量 0 - 100
            ax.setProperty("Volume", new Variant(volume));
            // 语音朗读速度 -10 到 +10
            ax.setProperty("Rate", new Variant(speed));
            // 输入的语言内容
            Dispatch dispatch = ax.getObject();
            // 本地执行朗读
            Dispatch.call(dispatch, "Speak", new Variant(text));

            //开始生成语音文件,构建文件流
            ax = new ActiveXComponent("Sapi.SpFileStream");
            Dispatch sfFileStream = ax.getObject();
            //设置文件生成格式
            ax = new ActiveXComponent("Sapi.SpAudioFormat");
            Dispatch fileFormat = ax.getObject();

            // 设置音频流格式
            Dispatch.put(fileFormat, "Type", new Variant(22));
            // 设置文件输出流格式
            Dispatch.putRef(sfFileStream, "Format", fileFormat);
            // 调用输出文件流打开方法,创建一个音频文件
            Dispatch.call(sfFileStream, "Open", new Variant(path), new Variant(3), new Variant(true));
            // 设置声音对应输出流为输出文件对象
            Dispatch.putRef(dispatch, "AudioOutputStream", sfFileStream);
            // 设置音量
            Dispatch.put(dispatch, "Volume", new Variant(volume));
            // 设置速度
            Dispatch.put(dispatch, "Rate", new Variant(speed));
            // 执行朗读
            Dispatch.call(dispatch, "Speak", new Variant(text));
            // 关闭输出文件
            Dispatch.call(sfFileStream, "Close");
            Dispatch.putRef(dispatch, "AudioOutputStream", null);

            // 关闭资源
            sfFileStream.safeRelease();
            fileFormat.safeRelease();
            // 关闭朗读的操作
            dispatch.safeRelease();
            ax.safeRelease();
            return true;
        } catch (Exception e) {
            e.printStackTrace();
        }
        return false;
    }

测试下,因为只有本地能听到语音,所以这里就用打印验证方法执行没有出错,结果如下:

🍹四、接口改造

本地测试,该依赖对接设备语音没有问题,在此基础上可以改造为一个接口,该接口的功能就是朗读接口传入的参数,改造后如下:

4.1 封装为一个工具类

这里把保存到本地的代码去掉了,因为只需要阅读即可,不用保留多媒体文件

java 复制代码
import com.jacob.activeX.ActiveXComponent;
import com.jacob.com.Dispatch;
import com.jacob.com.Variant;

/**
 * @author HuangBen 
 */
public class SpeakUtil {

    /**
     * 文本转音频
     *
     * @param text   文本内容
     * @return 是否成功
     */
    public static boolean text(String text) {
        try {

            // 调用dll朗读方法
            ActiveXComponent ax = new ActiveXComponent("Sapi.SpVoice");
            // 音量 0 - 100
            ax.setProperty("Volume", new Variant(50));
            // 语音朗读速度 -10 到 +10
            ax.setProperty("Rate", new Variant(0));
            // 输入的语言内容
            Dispatch dispatch = ax.getObject();
            // 本地执行朗读
            Dispatch.call(dispatch, "Speak", new Variant(text));
            
            // 关闭朗读的操作
            dispatch.safeRelease();
            ax.safeRelease();
            return true;
        } catch (Exception e) {
            e.printStackTrace();
        }
        return false;
    }

}
4.2 暴露一个接口

使用一个 get 请求简单模拟下即可,请求到达之后首先创建一个线程进行语音朗读,主线程进行打印,这是为了防止请求参数过长时,迟迟收不到响应

java 复制代码
    @GetMapping("/testVoice")
    public void testVoice(String word) {
        new Thread(() -> {
            SpeakUtil.text(word);
        }).start();
        System.out.println(word);
    }
4.3 测试

🌱五、扩展

这只是在本地测试使用的方式,实际上隐藏的问题还有很多,比如语音只能在本地机器触发,另外就是如果请求接口参数过长,多个请求同时来的话,可能处理不及时导致部分请求报错或者说无法语音,当然也有一些别的更成熟的依赖可以使用,比如谷歌(需要账号认证),本地只是小耍一下

文章到这里就结束了~

相关推荐
路在脚下@1 小时前
spring boot的配置文件属性注入到类的静态属性
java·spring boot·sql
啦啦右一1 小时前
Spring Boot | (一)Spring开发环境构建
spring boot·后端·spring
森屿Serien1 小时前
Spring Boot常用注解
java·spring boot·后端
苹果醋32 小时前
React源码02 - 基础知识 React API 一览
java·运维·spring boot·mysql·nginx
Hello.Reader2 小时前
深入解析 Apache APISIX
java·apache
盛派网络小助手3 小时前
微信 SDK 更新 Sample,NCF 文档和模板更新,更多更新日志,欢迎解锁
开发语言·人工智能·后端·架构·c#
菠萝蚊鸭3 小时前
Dhatim FastExcel 读写 Excel 文件
java·excel·fastexcel
旭东怪3 小时前
EasyPoi 使用$fe:模板语法生成Word动态行
java·前端·word
007php0073 小时前
Go语言zero项目部署后启动失败问题分析与解决
java·服务器·网络·python·golang·php·ai编程
∝请叫*我简单先生3 小时前
java如何使用poi-tl在word模板里渲染多张图片
java·后端·poi-tl