iOS如何实现语音转文字功能?

1.项目中添加权限

Privacy - Speech Recognition Usage Description : 需要语音识别权限才能实现语音转文字功能

2.添加头文件

#import <AVFoundation/AVFoundation.h>

#import<Speech/Speech.h>

3.实现语音转文字逻辑:

3.1 根据wav语音文件创建请求

objectivec 复制代码
    SFSpeechURLRecognitionRequest *recognitionRequest
    = [[SFSpeechURLRecognitionRequest alloc] initWithURL:[NSURL fileURLWithPath:wavFilePath]];

3.2 创建语言配置

objectivec 复制代码
    SFSpeechRecognizer *recongnizer

    = [[SFSpeechRecognizer alloc] initWithLocale:[[NSLocale alloc] initWithLocaleIdentifier:@"zh_CN"]];

3.2 根据请求和语言配置创建任务,同时设置代理<SFSpeechRecognitionTaskDelegate>对象为自己

objectivec 复制代码
    SFSpeechRecognitionTask *task =

    = [recongnizer recognitionTaskWithRequest:recognitionRequest delegate:self];

3.3 取消方法:

objectivec 复制代码
    [task cancel];

3.4 代理方法:

objectivec 复制代码
// Called for all recognitions, including non-final hypothesis
- (void)speechRecognitionTask:(SFSpeechRecognitionTask *)task didHypothesizeTranscription:(SFTranscription *)transcription{
    NSLog(@"转换中...");
}

// Called when recognition of all requested utterances is finished.
// If successfully is false, the error property of the task will contain error information
- (void)speechRecognitionTask:(SFSpeechRecognitionTask *)task didFinishSuccessfully:(BOOL)successfully{
    NSLog(@"转换完成 是否成功:%d",successfully);

}

以上为针对单个语音文件转文字的整体逻辑

在实际使用中,会涉及到多条语音转文字,此时有一个环节需要注意:

当我们进行多条语音转文字时,可以将上述逻辑封装为一个一个类个体,每进行一条语音转文字时,创建一个对象进行处理

用多个对象来进行各自的语音转文字行为.

但是!!!这是行不通的.

因为即使每一个语音转文字逻辑是一个对象个体,但依然在未处理完当前的任务时,处理下一个语音转文字,会导致当前的语音转文字行为直接终止,并失败.

所以,针对这块儿,可以做成队列形式,也就是当有多个语音转文字的操作时,我们是可以将这多个任务添加到队列中,并依次执行.(这里队列是用数组方式实现)

最后展示实际代码截图

调用方式:

具体demo可以参考链接

https://gitee.com/huanxin666/EMDemo-oc

语音消息长按可显示出转文字的按钮,点击转文字即可进行转换

效果如下

Demo演示iOS语音转文字实现

相关推荐
Luke Ewin8 小时前
Fun-ASR-Nano实时语音识别并区分说话人 | FunASR | 开源实时语音识别模型
人工智能·语音识别·asr·fun-asr
searchforAI10 小时前
2026年音视频笔记工具横评:通义听悟、讯飞听见、Get笔记、Ai好记
人工智能·笔记·gpt·aigc·音视频·语音识别·知识图谱
碧海银沙音频科技研究院12 小时前
音频算法移植与算法高效协同开发方法论
深度学习·算法·语音识别
nwsuaf_huasir13 小时前
RD图绘制-雷达回波模拟-距离多普勒图绘制
算法·matlab·语音识别
万岳科技程序员小金13 小时前
AI数字人系统源码开发教程|真人数字人APP与小程序搭建全流程解
人工智能·语音识别·ai数字人小程序·ai数字人系统源码·ai数字人软件开发·ai数字人平台搭建
李永奉13 小时前
杰理SDK开发-【BUG】软件开启音量同步连接华为、荣耀手机没有自动开启音量同步
单片机·嵌入式硬件·mcu·物联网·智能手机·bug·语音识别
Geometry Fu14 小时前
《智能终端与边缘计算》第八章 智能终端与边缘计算应用与案例分析(实时语音识别、图像处理与计算机视觉、推荐系统)
图像处理·边缘计算·语音识别·边缘计算应用
agicall.com1 天前
信电助 IP话机录音盒安装接线指南
语音识别·ip话机录音·网络电话机录音·sip话机录音
烟雨江南7851 天前
跨通道回声消除与离线ASR流式转写的物理级对齐:基于Kaldi与WebRTC Audio Processing的深度重构实践
人工智能·webrtc·语音识别·ai质检
开开心心_Every1 天前
能把网页藏在Word里的实用摸鱼工具
人工智能·科技·目标跟踪·pdf·计算机外设·语音识别·mllib