技术栈
音频
声光界
15 天前
音频
·
交互
·
语音识别
·
数字人
·
语音前端技术
音驱数字人:OmniAvatar解锁智能交互新形态
——浙大&阿里OmniAvatar解锁智能交互新形态一句语音指令,能驱动数字人做出自然协调的全身动作、同步匹配的面部表情与口型,音频交互技术的边界正被不断打破。
奔跑吧 android
15 天前
音频
·
aosp15
·
车载audio
·
caraudioservice
·
caraudiomanager
·
车载音频开发
【车载audio】【CarAudioService 01】【深度解析 AAOS 音量回调机制:从 VHAL 信号到 UI 刷新的全链路分析】
在车载开发调试中,常遇到以下现象:测试通过 CAN 总线发送音量调节信号,底层的声音确实变大/变小了,但中控屏上的音量条 UI 却没有任何刷新。
xcLeigh
17 天前
音频
·
cpolar
·
语音
·
声音克隆
·
配音
·
index-tts
·
tts推理
告别配音难!Index-TTS 零样本克隆声音,搭配 cpolar 随时随地用超香
Index-TTS 作为一款工业级零样本文本转语音工具,核心功能是仅需几秒参考音频就能复刻出相似度极高的声音,还能灵活调节语速、音调与情感,支持中英双语,生成的语音自然度接近真人,适配 Windows 10 以上、M 芯片 Mac 及多款显卡,不管是自媒体创作者、企业培训人员还是游戏配音从业者,都能轻松上手,无需复杂的专业训练,低配电脑也能流畅运行,极大降低了专业语音合成的使用门槛。
民乐团扒谱机
18 天前
人工智能
·
音频
·
信号与系统
·
干涉
·
梳状滤波
【微实验】从声波涟漪到频率栅栏:梳状滤波的声学奥秘与工程启示
目录01 序章:厅堂中的回声暗语02 数学之舞:时延如何编织频率栅栏03 声学实践:从问题到解决方案04 技术启示:从理解到驯服
unbeliverpool
18 天前
人工智能
·
音频
·
语音识别
AudioRecord录音和AudioTrack播放
AudioRecord record = new AudioRecord( MediaRecorder.AudioSource.MIC, sampleRate, channelConfig, audioFormat, bufferSize);
unbeliverpool
18 天前
人工智能
·
音频
·
语音识别
TV蓝牙遥控器近场语音自研
一、近场语音功能实现过程 1.按下语音键,遥控器通过蓝牙协议通知TV端语音键按下的事件 2.BT模块检测按键信息,通知BT驱动启动录音数据传输;同时通知audio framework设备可用;通知亚马逊近场app开始录音 3.audio framework收到setwireDeviceConnection通知后,创建音频流进行探测,如果open/close成功,将设备加入到Available input devices管理 4.亚马逊近场app通过AudioRecord启动录音,在btle audio h
源文雨
19 天前
ffmpeg
·
bash
·
音视频
·
音频
·
unix
·
shell
·
音频编码
shell调用ffmpeg递归转换所有wav至flac的脚本
因为有需求所以 push AI 写的,经过多次修改后验证功能没有问题,可以适配任意文件名。直接上代码。
仙剑魔尊重楼
20 天前
windows
·
音频
·
录屏
·
音乐
·
fl studio
音乐制作电子软件FL Studio2025.2.4.5242中文版新功能介绍
FL Studio2025.2.4.5242中文版是制作电子音乐的首选软件,也是目前行业中最优秀的完整的软件音乐制作环境或数字音频工作站,中文也叫做水果软件,可以编曲、剪辑、录音、混音,让你的计算机成为全功能录音室。其软件内置众多电子合成音色,只Styrus可以让人激动许久,加之Harmless和Harmor两款重量级合成音色,让电子音色有更多选择,更多个性十足的效果器插件如Grossbeat、Pitcher、Newtone、Vocodex可以做出充满个性的节奏、人声效果,同时支持LOOP拼接等。
学嵌入式的小杨同学
22 天前
linux
·
c语言
·
开发语言
·
vscode
·
vim
·
音频
·
ux
【嵌入式 GUI 实战】LVGL+MP3 播放器:从环境搭建到图形界面开发全指南
大家好,我是专注嵌入式开发的小杨。前面我们用 C 语言实现了终端版 MP3 播放器,今天就给它升级迭代 —— 用 LVGL 打造可视化图形界面!LVGL 作为嵌入式领域最火的开源 GUI 库,能在 Linux、单片机等平台快速构建交互式界面,搭配 MP3 播放功能,就能实现一款兼具颜值和实用性的嵌入式多媒体播放器。
南檐巷上学
22 天前
fpga开发
·
音频
·
verilog
·
fpga
·
傅立叶分析
·
fft
·
快速傅里叶变换
基于FPGA的音频信号监测识别系统
本作品已经开源在github:https://github.com/lgddyza/FPGA-Based_Audio_Processing_and_Classificationhttps://github.com/lgddyza/FPGA-Based_Audio_Processing_and_Classification有参考使用本工程的同学,希望点个Star哦!
千峰之道
1 个月前
音频
·
娱乐
让聆听成为享受:专注音质的HiFi播放器 Tunely Play v0.0.3
Tunely Play,采用先进音频处理算法,实现原声精准还原。音色自然饱满,中正通透。三频衔接顺滑流畅,完整捕捉音乐的丰富细节与神韵,仿佛置身现场。
程序手艺人
1 个月前
音频
【日常开发】ESP32-S3快速开发 超级串口功能
日常开发中一直在分析杂音、破音一系列问题,遇到问题就需要dump音频数据,以往Android、Linux项目算力、内存足够强,音频链路的数据直接写入文件,通过adb pull 出来可以。 最近一直在基于RTOS 系统开发穿戴式产品,不管是算力、内存都是捉襟见肘,更别说adb了, 调试方式只有串口。 于是聪明的厂商们,就基于串口开发出了类似tgdb 、Audio Developer 传输音频工具,只能说能用,但不够好用,项目初期折腾了一段时间才跑通。日常串口波特率115200,传输音频数据波特率需要用3M
Nautiluss
1 个月前
人工智能
·
单片机
·
音频
·
语音识别
·
dsp开发
·
智能硬件
一起调试XVF3800麦克风阵列(十六)
EQ(均衡器) 是一种音频处理设备或算法,用于调节音频信号中特定频率范围(Frequency Bands)的增益(Gain)。其核心功能是通过对频率响应曲线进行补偿或修饰,达到平衡频段分布、改善音质或消除噪声的目的。
Nautiluss
1 个月前
linux
·
人工智能
·
音频
·
语音识别
·
dsp开发
一起调试XVF3800麦克风阵列(十四)
在音频前端处理中,AGC (Automatic Gain Control) 的核心作用是“补齐”音量:当人说话声音小时,AGC 会自动提高增益(Gain)。
gsls200808
1 个月前
内核
·
音频
·
alsa
·
固件
·
uac
·
ec20
·
移远
移远EC20对UAC音频设备识别分析
首先分析AT+QCFG="USBCFG",0x2C7C,0x0125,1,1,1,1,1,0,1这个指令
nimadan12
2 个月前
音频
**手机广播剧配音工具2025推荐,适配多场景的轻量化创作方
手机广播剧配音工具2025推荐,适配多场景的轻量化创作方案在2025年,随着移动端内容创作的全面爆发,手机广播剧配音工具已成为自媒体人、网文作者乃至个人创作者实现内容变现的关键一环。据《2025中国有声内容产业发展报告》显示,2025年移动端有声内容消费时长同比增长了35%,其中由个人创作者制作的广播剧类内容占比已突破28%。然而,高达70%的创作者在选配音工具时,普遍面临三大痛点:一是工具操作复杂,学习成本高;二是配音效果生硬,缺乏情感和角色感;三是多平台发布适配性差,影响传播效率。针对这些痛点,一款名
运筹vivo@
2 个月前
驱动开发
·
音频
音频基础到ALSA框架
类似微积分的思想,音频数字化将连续的信号值,分解为一段一段的数据,只要足够小就能记录下连续的数据信息。如下图所示:将1秒的连续信号分为44.1K个离散的信号。
Nautiluss
2 个月前
linux
·
人工智能
·
嵌入式硬件
·
音频
·
语音识别
·
dsp开发
一起调试XVF3800麦克风阵列(九)
PP_MGSCALE 控制远端活动期间的额外噪声抑制,用于平衡 :参考信号(far-end)是干净的播放音频
shandianchengzi
2 个月前
音频
·
媒体
·
声音
·
au
【记录】AU|什么是泛音和音高,在频谱上如何体现?人类和乐器的区别明显吗?走近基本知识:从泛音列到人声奥秘的声学探索
效果–生成–音调 可以生成对应音调的正弦波。视图-显示频谱音高 可以查看音高。多轨道可以这样调节音量。
Nautiluss
2 个月前
人工智能
·
单片机
·
音频
·
语音识别
·
dsp开发
·
智能硬件
一起调试XVF3800麦克风阵列(六)
上一章节我们使用工具分析了延时,这一次我们继续调试:默认 AUDIO_MGR_SYS_DELAY 的值为-32 测量演示如下图为41个样本(未在40以内):