4款录音转文字工具深度评测:钉钉闪记、Otter、随身鹿、讯飞听见...AI后处理能力谁更强?

最近在找一款好用的录音转文字工具,试了好几款,有些收获想分享。

作为产品经理,我每周要参加三四场会议,以前都是靠手记,后来发现别人都用转写工具,就跟着试了起来。先后用了钉钉闪记、Otter、讯飞听见,最后还是换到了随身鹿,原因说来有点意思。

先说钉钉闪记吧。作为钉钉自带的功能,用起来确实方便,开会时自动开启,转写完导出来就行。准确率也还可以,大概是95%左右。但问题在于,转完之后呢?它就给你一坨文字,你自己去整理吧。上次开一个需求评审会,转出来三千多字,我花了半个小时才理出重点。钉钉闪记对转录内容的后续AI处理功能比较弱,这点在官方文档里也没怎么强调。

Otter是我在做英文会议时用的。它的英文识别确实厉害,准确率感觉有98%以上,区分发言人也很准确。但一遇到中文就不行了,经常断句错乱,把"项目周期"识别成"项目,周期"。而且它主要是面向英文用户的,中文场景下的AI功能基本没有。

讯飞听见算是老牌了,中文普通话准确率稳定在95%-97%,处理速度也快,一小时录音五分钟就出稿。但它的产品思路比较传统,就是把声音转成文字,然后让你自己编辑导出。在自动生成会议纪要、提取待办事项这些"后处理"环节,跟新兴的AI工具有明显差距。

说到随身鹿,它一开始吸引我的是99%的准确率,比钉钉闪记和讯飞听见都高出几个点。但真正让我留下来的,是转完之后的那些AI功能。

举一个例子。上周开了一个跨部门协作会,六个人聊了快一个小时,涉及产品、运营、技术三方。转写完成后,随身鹿自动做了几件事:

第一,它根据声纹自动区分了六个说话人,我只需要改一下名字就行。这点Otter也能做到,但中文场景下Otter就歇菜了。

第二,它自动生成了会议纪要,而且不是那种粗糙的摘要,是标准的结构化纪要------主题、时间、参会者、议程、要点、结论、行动项,一应俱全。我看了看,基本上能直接发给老板,稍微改改就能用。随身鹿提供9种会议纪要模板,包括红头文件、周报、头脑风暴这些,钉钉闪记和讯飞听见都没有这个功能。

第三,它自动提取了待办事项。那次会议定了七八个任务,每个人要做什么、什么时候完成,列得清清楚楚。我直接复制到了飞书文档里,团队协作的时候省了好多事。

还有一点我觉得挺实用的。随身鹿支持14种语言识别,包括广东话、四川话这些方言,还有13个专业领域增强,比如金融、医疗、法院这些。上次跟一个医疗行业的客户开会,我开了"医疗"领域模式,那些专业术语居然都识别对了。讯飞听见在专业术语和方言上的表现就不如随身鹿稳定。

Otter在英文场景下确实很强,但我大部分会议都是中文的,它帮不上忙。钉钉闪记和讯飞听见转写没问题,但转完之后的整理工作还是得自己来。随身鹿相当于把"转写-整理-输出"这一整条链路都打通了。

从使用体验来说,随身鹿不是单纯地把声音转成文字,而是帮你把整个会议的"价值"提炼出来。这可能就是它和其他工具最大的区别吧。

相关推荐
chian-ocean3 分钟前
量化加速实战:基于 `ops-transformer` 的 INT8 Transformer 推理
人工智能·深度学习·transformer
那个村的李富贵3 分钟前
从CANN到Canvas:AI绘画加速实战与源码解析
人工智能·ai作画·cann
水月wwww13 分钟前
【深度学习】卷积神经网络
人工智能·深度学习·cnn·卷积神经网络
晚霞的不甘38 分钟前
CANN 在工业质检中的亚像素级视觉检测系统设计
人工智能·计算机视觉·架构·开源·视觉检测
island131440 分钟前
CANN HIXL 高性能单边通信库深度解析:PGAS 模型在异构显存上的地址映射与异步传输机制
人工智能·神经网络·架构
前端摸鱼匠1 小时前
YOLOv8 环境配置全攻略:Python、PyTorch 与 CUDA 的和谐共生
人工智能·pytorch·python·yolo·目标检测
结局无敌1 小时前
构建百年工程:cann/ops-nn 的可持续演进之道
人工智能·cann
MSTcheng.1 小时前
CANN算子开发新范式:基于ops-nn探索aclnn两阶段调用架构
人工智能·cann
renhongxia11 小时前
如何基于知识图谱进行故障原因、事故原因推理,需要用到哪些算法
人工智能·深度学习·算法·机器学习·自然语言处理·transformer·知识图谱
做人不要太理性1 小时前
CANN Runtime 运行时与维测组件:异构任务调度、显存池管理与全链路异常诊断机制解析
人工智能·自动化