动动嘴皮子就把事干了,Mic Air + TRAE SOLO 让我越来越懒

最近越来越发现,人还是喜欢懒惰的,包括我~

之前看钢铁侠的时候,就超级喜欢托尼和贾维斯对话交代任务的方式,动动嘴皮子,事情就搞定了,超级酷。

但一直没有一个特别适合的场景,最近我发现我好像找到了。

月初,TRAEInsta360 发布了联名款 Mic Air,有幸收到了一份。

之前没怎么使用过类似产品,所以先去看了一眼产品参数。看完有点懵,就让 AI 帮我翻译了一把

48kHz高精度收音:这就相当于声音的"分辨率",越高的参数意味着声音越保真。

一键 AI 降噪:这个倒是非常容易理解,嘈杂环境也可以精准拾音。

低延迟传输:声音从嘴里到设备里,要多久。

当然,到这里,还只是一个高参数的硬件。

接下来,我们就要聊聊为什么和 TRAE SOLO 联名这件事情了。

主要是因为 TRAE SOLO 中提供了语音录入、语音讨论两个功能。

语音录入

大家看到"语音录入"的第一印象估计就是语音转文字,这玩意还要拿出来说吗?

这话对了一部分。

TRAE SOLO 语音录入的本质也是语音转文字,但是它在基础的"转"上面增加了 AI 理解。

你的口头语、语气助词都会被 TRAE SOLO 智能地删掉,并且还会结合语义理解,帮你重新整理文字顺序,完成结构化转录,大大提高指令质量。

录音效果

转录后的效果

语音讨论

如果说"结构化转录"再怎么高级也还只是个录入方式的话,那"语音讨论"就有了一些变化。

这是它的界面,就像一个聊天框一样。

我们都知道,每个创意的构思、主题的讨论其实都不是一次性就形成的。

就像语音录入时,我们会带有语气词,会有结构错乱的情况。

当我们要处理一个活动、一个项目时,这些问题会被放大。

而"语音讨论"通过每次对话的"结构化转录",先是在讨论时消除一部分噪声,然后在讨论结束转入执行对话框时再次进行分析总结降噪,双重措施保证模型接收的输入更加高效。 我用了一段时间,现在已经喜欢上了这种"懒惰"的方式,我简单分享下我的场景。

打扫家务时的灵感落地

在干体力活动时,我的灵感特别容易迸发。但现在琐事太多,很容易把一些想法忘记。

于是,我在家里就一直戴着 Mic Air

浇花时忽然迸发的灵感,我可以直接通过它发送给 SOLO,然后,等我回到电脑再整理到自己的笔记中。

当然,主要是因为房子不太大,不然可能蓝牙传输就受限了,并且一个人自言自语,有点傻。

除此之外,没啥毛病。

办公室内也可以语音编程了

当我在家里适应了语音输入后,回到办公室让我打字编程,我瞬间理解了什么叫做"由奢入俭难"。

但一个人在家里,随便自言自语都没问题。

在办公室,要么会担心打扰别人,要么会担心别人把我误当成神经病,我只能轻轻地和 SOLO 低声交流。

好在 Mic Air 的降噪能力很强,不会让我叭叭半天后,看到一堆乱七八糟的识别结果。

录视频时的极致享受

大家应该都知道,我最近在录视频。

本来我感觉录制效果还可以,但是用了一阵 Mic Air 后,我再听我的视频声音时,就感觉有了一些噪音。

于是,有时候有点吹毛求疵的我,把一些视频,重新录了一遍。

以上只是我最近一阵使用的一些场景,希望可以给大家一点小灵感。

Voice Coding 的再次讨论,毕竟才没多久,希望大家可以多多探讨、尝试,挖掘出更多让我这种懒人喜欢的用法~

最后,大家周末愉快!!!

相关推荐
西陵1 小时前
Agent 为什么会陷入 Doom Loop?OpenClaw 的破解之道
前端·人工智能·ai编程
喜欢踢足球的老罗1 小时前
从移动开发转型 AI Agent 工程师:我做了一个开源学习系统
人工智能·学习
武汉唯众智创1 小时前
AI智能心理筛查拆解:三级漏斗式筛查算法+行业理论落地
人工智能·ai心理健康·校园心理健康·学生心理健康解决方案·校园心理健康平台·心理筛查
云天AI实战派2 小时前
AI 智能体全流程实战:从 0 搭一个门店运营助手,用 API + 工具搜索 + 编码代理做出可复现闭环
人工智能·ai·智能体
大连好光景2 小时前
BCELoss + sigmoid 换成 BCEWithLogitsLoss
人工智能·深度学习·机器学习
OpenApi.cc2 小时前
神经网络结构驱动+数据结构分析
数据结构·人工智能·神经网络
向量引擎2 小时前
告别多源向量API适配噩梦:一套通用中转层的设计与实践
人工智能·gpt·aigc·agi·api调用
my烂笔头2 小时前
单阶段 双阶段 目标检测的区别
人工智能·ai
程序员Aries2 小时前
LangChain 与大语言模型
人工智能·语言模型·langchain