funasr

逢生博客1 天前
人工智能·python·语音识别·funasr
阿里 FunASR 开源中文语音识别大模型应用示例(准确率比faster-whisper高)FunASR是一个基础语音识别工具包,提供多种功能,包括语音识别(ASR)、语音端点检测(VAD)、标点恢复、语言模型、说话人验证、说话人分离和多人对话语音识别等。FunASR提供了便捷的脚本和教程,支持预训练好的模型的推理与微调。 我们在ModelScope与huggingface上发布了大量开源数据集或者海量工业数据训练的模型,可以通过我们的模型仓库了解模型的详细信息。代表性的Paraformer非自回归端到端语音识别模型具有高精度、高效率、便捷部署的优点,支持快速构建语音识别服务,详细信息可以阅读(
FAILED
玩电脑的辣条哥6 天前
服务器·人工智能·ubuntu·asr·funasr
AI-Sphere-Butler之Ubuntu服务器如何部署FunASR服务AI-Sphere-ButlerWSL2英伟达4070ti 12GWin10Ubuntu22.04python>=3.8
FAILED
带鱼工作室7 个月前
语音识别·thread·funasr·paraformer
Something wrong with the VAD algorithm调用阿里语音识别模型 paraformer-large-zh 进行多线程推理时出现错误内容如下:代码调用使用funasr库加载,如下:
伊织code7 个月前
音频·markdown·提取·qwen·tts·funasr·audionotes
AudioNotes -将音频内容转 markdownAudioNotes 能够快速提取音视频的内容,并且调用大模型进行整理,成为一份结构化的markdown笔记,方便快速阅读。基于 FunASR 和 Qwen2 构建。
FAILED
我就是全世界1 年前
人工智能·语音识别·funasr
FunASR语音识别快速上手指南语音识别技术在人工智能领域扮演着至关重要的角色,它使得人机交互更加自然和便捷。FunASR,作为阿里巴巴开源的一款基础语音识别工具包,旨在弥合学术研究与实际应用之间的技术鸿沟。它不仅提供了强大的功能,如非自回归端到端的语音识别、语音端点检测、标点恢复等,还通过持续的优化和更新,推动了语音识别技术的创新与进步。
刘悦的技术博客1 年前
whisper·语音识别·阿里云盘·funasr
中文语音识别转文字的王者,阿里达摩院FunAsr足可与Whisper相颉顽君不言语音识别技术则已,言则必称Whisper,没错,OpenAi开源的Whisper确实是世界主流语音识别技术的魁首,但在中文领域,有一个足以和Whisper相颉顽的项目,那就是阿里达摩院自研的FunAsr。
FAILED
太空眼睛1 年前
docker·语音识别·funasr·达摩院·长音频·语音转写·离线
【FunASR】Paraformer语音识别-中文-通用-16k-离线-large-onnxGitHub源码地址: https://github.com/alibaba-damo-academy/FunASR
FAILED
Daniel大人1 年前
whisper·funasr·语音转文字
关于python环境下的语音转文本,whisper或funASR因为前阵子,有需求要将语音转为文本再进行下一步操作。感觉这个技术也不算是什么新需求,但是一搜,都是大厂的api,或者是什么什么软件,由于想要免费的,同时也要嵌入在代码中,所以这些都不能用。、
FAILED