wavenet

【信号分选】深度学习颠覆射频信号分离：UNet/WaveNet 性能碾压传统方法【附python代码】RF 挑战：数据驱动的射频信号分离挑战原文链接本文采用数据驱动方法，利用深度学习技术解决射频（RF）信号中的干扰抑制这一关键问题。核心贡献之一是推出了 RF 挑战数据集，这是一个公开可用、多样化的射频信号数据集，适用于射频信号问题的数据分析。我们采用简化的信号模型来开发和分析干扰抑制算法，并引入了一组精心设计的深度学习架构，结合关键的领域相关修改和传统基准解决方案，为这一复杂且普遍存在的问题建立了基准性能指标。通过对八种不同信号混合类型的广泛仿真，我们证明了 UNet 和 WaveNet 等架构相较于匹

基于 MindSpore 的 WaveNet 音乐生成：从数据预处理到生成音频的完整实践本文同步发布于MindSpore社区，欢迎加入MindSpore社区，一同探索更多可能！WaveNet 是一种典型的自回归生成模型，能够直接对原始波形建模。相比“先提特征再生成”的路线，WaveNet 直接在采样点级别学习概率分布，因此在音频生成/语音合成中能获得更自然的效果。本实践基于 MindSpore复现一个简化版 WaveNet，用少量音频数据训练后，生成一段新的音乐/音频片段。

带电的小王

TTS：论文--文本转语音系统及媒体应用概述更多内容：XiaoJ的知识星球文本到语音（TTS）技术利用深度学习生成逼真合成语音，已成为交互式媒体的关键创新。典型TTS系统包含文本分析、声学建模和声码器三大模块。本文综述了代表性深度学习TTS系统（如Tacotron 2、Transformer TTS、WaveNet 和 FastSpeech 1），并从骨干架构、输入类型、转换方式、声码器及主观评估（MOS）等方面进行对比。最后，针对实际应用提出了TTS系统开发建议。

李宏毅NLP-13-Vocoder无论频谱来自 TTS 还是 VC，都通过Vocoder将 “频域特征” 逆转为 “时域声波”，得到可听的语音。

小胡说人工智能

基于Python+WaveNet+MFCC+Tensorflow智能方言分类—深度学习算法应用（含全部工程源码）（四）博主前段时间发布了一篇有关方言识别和分类模型训练的博客，在读者的反馈中发现许多小伙伴对方言的辨识和分类表现出浓厚兴趣。鉴于此，博主决定专门撰写一篇关于方言分类的博客，以满足读者对这一主题的进一步了解和探索的需求。上篇博客可参考：

我是有底线的