funasr

带鱼工作室3 个月前
语音识别·thread·funasr·paraformer
Something wrong with the VAD algorithm调用阿里语音识别模型 paraformer-large-zh 进行多线程推理时出现错误内容如下:代码调用使用funasr库加载,如下:
伊织code3 个月前
音频·markdown·提取·qwen·tts·funasr·audionotes
AudioNotes -将音频内容转 markdownAudioNotes 能够快速提取音视频的内容,并且调用大模型进行整理,成为一份结构化的markdown笔记,方便快速阅读。基于 FunASR 和 Qwen2 构建。
我就是全世界6 个月前
人工智能·语音识别·funasr
FunASR语音识别快速上手指南语音识别技术在人工智能领域扮演着至关重要的角色,它使得人机交互更加自然和便捷。FunASR,作为阿里巴巴开源的一款基础语音识别工具包,旨在弥合学术研究与实际应用之间的技术鸿沟。它不仅提供了强大的功能,如非自回归端到端的语音识别、语音端点检测、标点恢复等,还通过持续的优化和更新,推动了语音识别技术的创新与进步。
刘悦的技术博客10 个月前
whisper·语音识别·阿里云盘·funasr
中文语音识别转文字的王者,阿里达摩院FunAsr足可与Whisper相颉顽君不言语音识别技术则已,言则必称Whisper,没错,OpenAi开源的Whisper确实是世界主流语音识别技术的魁首,但在中文领域,有一个足以和Whisper相颉顽的项目,那就是阿里达摩院自研的FunAsr。
太空眼睛1 年前
docker·语音识别·funasr·达摩院·长音频·语音转写·离线
【FunASR】Paraformer语音识别-中文-通用-16k-离线-large-onnxGitHub源码地址: https://github.com/alibaba-damo-academy/FunASR
Daniel大人1 年前
whisper·funasr·语音转文字
关于python环境下的语音转文本,whisper或funASR因为前阵子,有需求要将语音转为文本再进行下一步操作。感觉这个技术也不算是什么新需求,但是一搜,都是大厂的api,或者是什么什么软件,由于想要免费的,同时也要嵌入在代码中,所以这些都不能用。、