技术栈

pytorch--基于语音的性别识别

Carry_NJ2023-12-16 10:47

pytorch官网

基于梅尔频谱的语音性别分类模型,训练了20epoch,准确率97%

提升点有很多:还可以基于声纹特征作为训练集、数据预处理的逻辑、transform的逻辑(修改transform会导致数据的张量维度变更,可能需要更改模型结构的部分参数)

代码地址

上一篇:分类这样写更优雅高效!
下一篇:【动手学深度学习】(十四)数据增广+微调
相关推荐
AI蜗牛之家
3 小时前
Qwen系列之Qwen3解读:最强开源模型的细节拆解
人工智能·python
王上上
3 小时前
【论文阅读30】Bi-LSTM(2024)
论文阅读·人工智能·lstm
whyeekkk
4 小时前
python打卡第48天
开发语言·python
YunTM
4 小时前
贝叶斯优化+LSTM+时序预测=Nature子刊!
人工智能·机器学习
舒一笑
5 小时前
智能体革命:企业如何构建自主决策的AI代理?
人工智能
SpikeKing
6 小时前
Server - 使用 Docker 配置 PyTorch 研发环境
pytorch·docker·llm
丁先生qaq
6 小时前
热成像实例分割电力设备数据集(3类,838张)
人工智能·计算机视觉·目标跟踪·数据集
Eiceblue
6 小时前
Python读取PDF:文本、图片与文档属性
数据库·python·pdf
红衣小蛇妖
6 小时前
神经网络-Day45
人工智能·深度学习·神经网络
weixin_52755040
6 小时前
初级程序员入门指南
javascript·python·算法
热门推荐
01【图像处理与机器视觉】XJTU期末考点02从零安装 LLaMA-Factory 微调 Qwen 大模型成功及所有的坑03KGG转MP3工具|非KGM文件|解密音频04海康Visionmaster-常见问题排查方法-启动阶段05YOLOv8入门 | 重要性能衡量指标、训练结果评价及分析及影响mAP的因素【发论文关注的指标】06【SpeedAI科研小助手】2分钟极速解决知网维普重复率、AIGC率过高,一键全文降!文件格式不变,公式都保留的!07SSv2数据集08Coze扣子平台完整体验和实践(附国内和国际版对比)09DeepSeek各版本说明与优缺点分析10【云原生】动态资源分配(DRA)深度洞察报告