【VFrame・云瑶 R1 国语声库公测】RVC1006Nvidia 训练全记录|私人闭源虚拟歌手养成

作者:龙沅可

本文完整记录VFrame 虚拟歌手・云瑶 R1 国语声库的训练全流程,基于RVC1006Nvidia训练、私人闭源发布,附训练参数、日志截图、显卡运行状态,同步开放声库公测与使用规范。

温馨提示:本次项目已与CV协商一致后才私人闭源,全程均在合法授权内操作,请勿将开源技术用于非法用途!


一、云瑶 虚拟歌手官方完整资料

所属:VFrame(独立新项目,与九州合唱团分离)训练平台:RVC1006Nvidia 声库性质:私人闭源虚拟歌手声库

基础信息

2.3 训练设备与硬件运行表现(对应 GPU 监控)

本次训练全程在个人主力老笔记本上完成,设备与运行状态如下:


三、训练日志与关键节点(对应图二、图四训练日志)

本次训练 100 轮全程稳定,loss 曲线正常收敛,无 NaN 异常值、无爆音风险、无特征丢失。


四、核心踩坑记录


五、云瑶_R1 声库使用规范(私人闭源版)


六、公测说明

云瑶_R1 国语声库正式开启公测,测试曲《远山少年》同步发布。

欢迎各位 AI 歌手爱好者体验、反馈音色 / 咬字 / 音准问题,后续将基于反馈迭代 R2 优化版本。

  • 姓名:云瑶
  • 性别:女
  • 年龄:17 岁
  • 生日:04 月 30 日
  • 身高:170

二、云瑶_R1 训练参数与环境配置(本次训练基于RVC1006Nvidia版本,全程为个人兴趣向制作,参数配置适配老款笔记本硬件,兼顾训练稳定性与音色还原度,所有设置均对应截图中的 WebUI 界面与硬件监控数据。)

2.1 核心训练参数配置(对应图一、图二训练界面)

表格

配置项 参数值
实验名 qb
目标采样率 40k
模型版本 v2
音高指导 开启
音高提取算法 PM(首相)
说话人 ID 0
CPU 进程数 4
训练批次(batch_size) 1
总训练轮数 100
模型保存频率 10 轮 / 次
缓存设置 关闭
预训练底模

2.2 数据集与预处理流程

  • 数据收集:万兴喵影
  • 数据处理:万兴喵影
  • 数据扩张(标准化):GPT-soVITS
  • 数据集规格:7 段 ×30s,单声道音频
  • 设备型号:微星 GL62M 7REX(2017 款黑色游戏本)
  • 处理器:Intel Core i7-7700HQ(4 核 8 线程,Kaby Lake)
  • 独立显卡:NVIDIA GeForce GTX 1050 Ti 4GB GDDR5(显卡状态:健康)
  • 显卡驱动:NVIDIA 581.80(580x 系列驱动)
  • 运行内存:8GB DDR4 2400MHz
  • 系统环境:Windows 10 家庭版 64 位
  • 实际训练时长:约 3 小时
  • 显卡运行温度:65℃~75℃
  • 显存占用:如图三所示(满载稳定无溢出)
  • 训练状态:全程无报错、无中断、无降频
  • 0~30 轮:音色初步成型,人声轮廓清晰
  • 30~70 轮:咬字优化,气声稳定,高音不飘
  • 70~100 轮:音色贴合 CV 原声,完成最终收敛最终提取G_7200.pth 为基础权重,转换为轻量化成品模型YunYaoR1v2.pth,为私人闭源最终版本。
  • **拟合风险:**这次使用的是GPT合成的TTS语音,标准咬字,可直接高轮数训练。
  • 老硬件显存优化 1050Ti 4GB 显存必须设置batch_size=1+ 关闭缓存,才能稳定跑完 100 轮。
  • 数据集标准化单人声库务必做好音频标准化,否则会出现咬字模糊、音准偏移问题。
  • 使用权限:个人非商用可免费使用,支持翻唱、练习、非盈利创作发布。
  • 闭源保护:本声库为私人闭源,严禁反编译、拆解、提取音色、二次训练。
  • 分发限制:严禁转载、共享、倒卖、二次分发声库文件。
  • 内容规范:禁止用于违法、低俗、侵权内容创作。
  • 标注要求:使用声库需标注「歌手:云瑶(VFrame)」。
  • 翻唱:云瑶
  • 试跑软件:流明
  • 人声分离:万兴喵影
  • 母带混音:Mixxx
  • 制作:龙沅可
  • 出品发行:龙洛工作室

形象设定

整体为蓝白基调二次元国风少女造型:

  • 发型:浅蓝渐变柔白长直发,齐刘海,鬓角垂落柔碎发,发间佩戴银质云纹发饰
  • 服饰:蓝白改良国风短襦裙,交领窄袖,裙摆绣流云暗纹,腰间系浅蓝飘带
  • 气质:清冷温柔、干净通透,如云端清歌的 16 岁国风少女

声库核心信息

  • 声线定位:清透少女音,中高音稳定,气声自然,咬字清晰
  • 适配曲风:国风抒情、古风、治愈系、流行、轻摇滚
  • 引擎迭代系列(VFrame 专属):R 系列(RVC):R1(首发)→ R2 → R3D 系列(DDSP-SVC):D1 → D2U 系列(UTAU):U1 → U2
  • 当前版本:云瑶_R1(RVC v2 标准训练版)

官方推荐推理参数

  • 音高算法:RMVPE(机械车辆预留)
  • 检索特征占比:0.78
  • 采样率:24kHz
  • 批量大小:1
  • 支持设备:CPU/GPU 通用

原始文件训练后的项目底模目录树如下

卷 开发E盘 的文件夹 PATH 列表

卷序列号为 000000C4 8C68:D95C

E:\RVC STUDIO\RVC1006NVIDIA (2)\LOGS\QB

│ added_IVF230_Flat_nprobe_1_qb_v2.index

│ config.json

│ D_1440.pth

│ D_2160.pth

│ D_2880.pth

│ D_3600.pth

│ D_4320.pth

│ D_5040.pth

│ D_5760.pth

│ D_6480.pth

│ D_720.pth

│ D_7200.pth

│ events.out.tfevents.1777440999.lyk12243672.19480.0

│ extract_f0_feature.log

│ filelist.txt

│ G_1440.pth

│ G_2160.pth

│ G_2880.pth

│ G_3600.pth

│ G_4320.pth

│ G_5040.pth

│ G_5760.pth

│ G_6480.pth

│ G_720.pth

│ G_7200.pth

│ preprocess.log

│ total_fea.npy

│ train.log

│ trained_IVF230_Flat_nprobe_1_qb_v2.index

├─0_gt_wavs

│ 0_0.spec.pt

│ 0_0.wav

│ 0_1.spec.pt

│ 0_1.wav

│ 0_11.spec.pt

│ 0_11.wav

│ 0_12.spec.pt

│ 0_12.wav

│ 0_13.spec.pt

│ 0_13.wav

│ 0_3.spec.pt

│ 0_3.wav

│ 0_5.spec.pt

│ 0_5.wav

│ 0_6.spec.pt

│ 0_6.wav

│ 0_7.spec.pt

│ 0_7.wav

│ 0_8.spec.pt

│ 0_8.wav

│ 0_9.spec.pt

│ 0_9.wav

│ 1_0.spec.pt

│ 1_0.wav

│ 1_1.spec.pt

│ 1_1.wav

│ 1_10.spec.pt

│ 1_10.wav

│ 1_12.spec.pt

│ 1_12.wav

│ 1_13.spec.pt

│ 1_13.wav

│ 1_3.spec.pt

│ 1_3.wav

│ 1_4.spec.pt

│ 1_4.wav

│ 1_6.wav

│ 1_7.spec.pt

│ 1_7.wav

│ 1_8.spec.pt

│ 1_8.wav

│ 2_0.spec.pt

│ 2_0.wav

│ 2_1.spec.pt

│ 2_1.wav

│ 2_10.spec.pt

│ 2_10.wav

│ 2_11.spec.pt

│ 2_11.wav

│ 2_12.spec.pt

│ 2_12.wav

│ 2_2.spec.pt

│ 2_2.wav

│ 2_4.spec.pt

│ 2_4.wav

│ 2_5.spec.pt

│ 2_5.wav

│ 2_7.spec.pt

│ 2_7.wav

│ 2_9.spec.pt

│ 2_9.wav

│ 3_0.spec.pt

│ 3_0.wav

│ 3_10.spec.pt

│ 3_10.wav

│ 3_12.spec.pt

│ 3_12.wav

│ 3_2.spec.pt

│ 3_2.wav

│ 3_3.spec.pt

│ 3_3.wav

│ 3_5.wav

│ 3_6.spec.pt

│ 3_6.wav

│ 3_8.spec.pt

│ 3_8.wav

│ 3_9.spec.pt

│ 3_9.wav

│ 4_1.spec.pt

│ 4_1.wav

│ 4_10.spec.pt

│ 4_10.wav

│ 4_11.spec.pt

│ 4_11.wav

│ 4_12.spec.pt

│ 4_12.wav

│ 4_13.spec.pt

│ 4_13.wav

│ 4_14.spec.pt

│ 4_14.wav

│ 4_3.spec.pt

│ 4_3.wav

│ 4_4.spec.pt

│ 4_4.wav

│ 4_6.spec.pt

│ 4_6.wav

│ 4_7.spec.pt

│ 4_7.wav

│ 4_9.spec.pt

│ 4_9.wav

│ 5_1.spec.pt

│ 5_1.wav

│ 5_11.wav

│ 5_12.spec.pt

│ 5_12.wav

│ 5_13.spec.pt

│ 5_13.wav

│ 5_15.spec.pt

│ 5_15.wav

│ 5_2.spec.pt

│ 5_2.wav

│ 5_4.spec.pt

│ 5_4.wav

│ 5_6.spec.pt

│ 5_6.wav

│ 5_8.spec.pt

│ 5_8.wav

│ 5_9.spec.pt

│ 5_9.wav

│ 6_0.spec.pt

│ 6_0.wav

│ 6_10.spec.pt

│ 6_10.wav

│ 6_11.spec.pt

│ 6_11.wav

│ 6_12.spec.pt

│ 6_12.wav

│ 6_14.spec.pt

│ 6_14.wav

│ 6_2.spec.pt

│ 6_2.wav

│ 6_3.spec.pt

│ 6_3.wav

│ 6_4.spec.pt

│ 6_4.wav

│ 6_5.spec.pt

│ 6_5.wav

│ 6_7.spec.pt

│ 6_7.wav

│ 6_8.spec.pt

│ 6_8.wav

│ 6_9.spec.pt

│ 6_9.wav

├─1_16k_wavs

│ 0_0.wav

│ 0_1.wav

│ 0_11.wav

│ 0_12.wav

│ 0_13.wav

│ 0_3.wav

│ 0_5.wav

│ 0_6.wav

│ 0_7.wav

│ 0_8.wav

│ 0_9.wav

│ 1_0.wav

│ 1_1.wav

│ 1_10.wav

│ 1_12.wav

│ 1_13.wav

│ 1_3.wav

│ 1_4.wav

│ 1_6.wav

│ 1_7.wav

│ 1_8.wav

│ 2_0.wav

│ 2_1.wav

│ 2_10.wav

│ 2_11.wav

│ 2_12.wav

│ 2_2.wav

│ 2_4.wav

│ 2_5.wav

│ 2_7.wav

│ 2_9.wav

│ 3_0.wav

│ 3_10.wav

│ 3_12.wav

│ 3_2.wav

│ 3_3.wav

│ 3_5.wav

│ 3_6.wav

│ 3_8.wav

│ 3_9.wav

│ 4_1.wav

│ 4_10.wav

│ 4_11.wav

│ 4_12.wav

│ 4_13.wav

│ 4_14.wav

│ 4_3.wav

│ 4_4.wav

│ 4_6.wav

│ 4_7.wav

│ 4_9.wav

│ 5_1.wav

│ 5_11.wav

│ 5_12.wav

│ 5_13.wav

│ 5_15.wav

│ 5_2.wav

│ 5_4.wav

│ 5_6.wav

│ 5_8.wav

│ 5_9.wav

│ 6_0.wav

│ 6_10.wav

│ 6_11.wav

│ 6_12.wav

│ 6_14.wav

│ 6_2.wav

│ 6_3.wav

│ 6_4.wav

│ 6_5.wav

│ 6_7.wav

│ 6_8.wav

│ 6_9.wav

├─2a_f0

│ 0_0.wav.npy

│ 0_1.wav.npy

│ 0_11.wav.npy

│ 0_12.wav.npy

│ 0_13.wav.npy

│ 0_3.wav.npy

│ 0_5.wav.npy

│ 0_6.wav.npy

│ 0_7.wav.npy

│ 0_8.wav.npy

│ 0_9.wav.npy

│ 1_0.wav.npy

│ 1_1.wav.npy

│ 1_10.wav.npy

│ 1_12.wav.npy

│ 1_13.wav.npy

│ 1_3.wav.npy

│ 1_4.wav.npy

│ 1_6.wav.npy

│ 1_7.wav.npy

│ 1_8.wav.npy

│ 2_0.wav.npy

│ 2_1.wav.npy

│ 2_10.wav.npy

│ 2_11.wav.npy

│ 2_12.wav.npy

│ 2_2.wav.npy

│ 2_4.wav.npy

│ 2_5.wav.npy

│ 2_7.wav.npy

│ 2_9.wav.npy

│ 3_0.wav.npy

│ 3_10.wav.npy

│ 3_12.wav.npy

│ 3_2.wav.npy

│ 3_3.wav.npy

│ 3_5.wav.npy

│ 3_6.wav.npy

│ 3_8.wav.npy

│ 3_9.wav.npy

│ 4_1.wav.npy

│ 4_10.wav.npy

│ 4_11.wav.npy

│ 4_12.wav.npy

│ 4_13.wav.npy

│ 4_14.wav.npy

│ 4_3.wav.npy

│ 4_4.wav.npy

│ 4_6.wav.npy

│ 4_7.wav.npy

│ 4_9.wav.npy

│ 5_1.wav.npy

│ 5_11.wav.npy

│ 5_12.wav.npy

│ 5_13.wav.npy

│ 5_15.wav.npy

│ 5_2.wav.npy

│ 5_4.wav.npy

│ 5_6.wav.npy

│ 5_8.wav.npy

│ 5_9.wav.npy

│ 6_0.wav.npy

│ 6_10.wav.npy

│ 6_11.wav.npy

│ 6_12.wav.npy

│ 6_14.wav.npy

│ 6_2.wav.npy

│ 6_3.wav.npy

│ 6_4.wav.npy

│ 6_5.wav.npy

│ 6_7.wav.npy

│ 6_8.wav.npy

│ 6_9.wav.npy

├─2b-f0nsf

│ 0_0.wav.npy

│ 0_1.wav.npy

│ 0_11.wav.npy

│ 0_12.wav.npy

│ 0_13.wav.npy

│ 0_3.wav.npy

│ 0_5.wav.npy

│ 0_6.wav.npy

│ 0_7.wav.npy

│ 0_8.wav.npy

│ 0_9.wav.npy

│ 1_0.wav.npy

│ 1_1.wav.npy

│ 1_10.wav.npy

│ 1_12.wav.npy

│ 1_13.wav.npy

│ 1_3.wav.npy

│ 1_4.wav.npy

│ 1_6.wav.npy

│ 1_7.wav.npy

│ 1_8.wav.npy

│ 2_0.wav.npy

│ 2_1.wav.npy

│ 2_10.wav.npy

│ 2_11.wav.npy

│ 2_12.wav.npy

│ 2_2.wav.npy

│ 2_4.wav.npy

│ 2_5.wav.npy

│ 2_7.wav.npy

│ 2_9.wav.npy

│ 3_0.wav.npy

│ 3_10.wav.npy

│ 3_12.wav.npy

│ 3_2.wav.npy

│ 3_3.wav.npy

│ 3_5.wav.npy

│ 3_6.wav.npy

│ 3_8.wav.npy

│ 3_9.wav.npy

│ 4_1.wav.npy

│ 4_10.wav.npy

│ 4_11.wav.npy

│ 4_12.wav.npy

│ 4_13.wav.npy

│ 4_14.wav.npy

│ 4_3.wav.npy

│ 4_4.wav.npy

│ 4_6.wav.npy

│ 4_7.wav.npy

│ 4_9.wav.npy

│ 5_1.wav.npy

│ 5_11.wav.npy

│ 5_12.wav.npy

│ 5_13.wav.npy

│ 5_15.wav.npy

│ 5_2.wav.npy

│ 5_4.wav.npy

│ 5_6.wav.npy

│ 5_8.wav.npy

│ 5_9.wav.npy

│ 6_0.wav.npy

│ 6_10.wav.npy

│ 6_11.wav.npy

│ 6_12.wav.npy

│ 6_14.wav.npy

│ 6_2.wav.npy

│ 6_3.wav.npy

│ 6_4.wav.npy

│ 6_5.wav.npy

│ 6_7.wav.npy

│ 6_8.wav.npy

│ 6_9.wav.npy

├─3_feature768

│ 0_0.npy

│ 0_1.npy

│ 0_11.npy

│ 0_12.npy

│ 0_13.npy

│ 0_3.npy

│ 0_5.npy

│ 0_6.npy

│ 0_7.npy

│ 0_8.npy

│ 0_9.npy

│ 1_0.npy

│ 1_1.npy

│ 1_10.npy

│ 1_12.npy

│ 1_13.npy

│ 1_3.npy

│ 1_4.npy

│ 1_6.npy

│ 1_7.npy

│ 1_8.npy

│ 2_0.npy

│ 2_1.npy

│ 2_10.npy

│ 2_11.npy

│ 2_12.npy

│ 2_2.npy

│ 2_4.npy

│ 2_5.npy

│ 2_7.npy

│ 2_9.npy

│ 3_0.npy

│ 3_10.npy

│ 3_12.npy

│ 3_2.npy

│ 3_3.npy

│ 3_5.npy

│ 3_6.npy

│ 3_8.npy

│ 3_9.npy

│ 4_1.npy

│ 4_10.npy

│ 4_11.npy

│ 4_12.npy

│ 4_13.npy

│ 4_14.npy

│ 4_3.npy

│ 4_4.npy

│ 4_6.npy

│ 4_7.npy

│ 4_9.npy

│ 5_1.npy

│ 5_11.npy

│ 5_12.npy

│ 5_13.npy

│ 5_15.npy

│ 5_2.npy

│ 5_4.npy

│ 5_6.npy

│ 5_8.npy

│ 5_9.npy

│ 6_0.npy

│ 6_10.npy

│ 6_11.npy

│ 6_12.npy

│ 6_14.npy

│ 6_2.npy

│ 6_3.npy

│ 6_4.npy

│ 6_5.npy

│ 6_7.npy

│ 6_8.npy

│ 6_9.npy

└─eval

events.out.tfevents.1777440999.lyk12243672.19480.1

训练日志(json):

{

"data": {

"filter_length": 2048,

"hop_length": 400,

"max_wav_value": 32768.0,

"mel_fmax": null,

"mel_fmin": 0.0,

"n_mel_channels": 125,

"sampling_rate": 40000,

"win_length": 2048

},

"model": {

"filter_channels": 768,

"gin_channels": 256,

"hidden_channels": 192,

"inter_channels": 192,

"kernel_size": 3,

"n_heads": 2,

"n_layers": 6,

"p_dropout": 0,

"resblock": "1",

"resblock_dilation_sizes": [

1, 3, 5 \], \[ 1, 3, 5 \], \[ 1, 3, 5

],

"resblock_kernel_sizes": [

3,

7,

11

],

"spk_embed_dim": 109,

"upsample_initial_channel": 512,

"upsample_kernel_sizes": [

16,

16,

4,

4

],

"upsample_rates": [

10,

10,

2,

2

],

"use_spectral_norm": false

},

"train": {

"batch_size": 4,

"betas": [

0.8,

0.99

],

"c_kl": 1.0,

"c_mel": 45,

"epochs": 20000,

"eps": 1e-09,

"fp16_run": true,

"init_lr_ratio": 1,

"learning_rate": 0.0001,

"log_interval": 200,

"lr_decay": 0.999875,

"seed": 1234,

"segment_size": 12800,

"warmup_epochs": 0

}

}

相关推荐
AI医影跨模态组学3 小时前
如何将影像组学特征与非小细胞肺癌脑转移瘤免疫微环境中的干扰素通路及CD8+ T细胞浸润建立关联,并解释与预后、免疫治疗响应的机制联系
人工智能·论文·医学·医学影像·影像组学·医学科研
qq_411262424 小时前
基于 ESP32-S3 + VB6824 的四博 A1 AI 智能拍学机方案:事件驱动架构、拍照识别与语音交互实现
人工智能·智能音箱
ting94520004 小时前
动手学深度学习(PyTorch版)深度详解(6):现代卷积神经网络-从经典模型到图像分类实战
人工智能·分类·cnn
@不误正业4 小时前
第12章-端侧AI操作系统概述
人工智能
Maynor9964 小时前
Codex 中国站正式上线!
人工智能·gpt·macos·github
qq_411262424 小时前
四博 CozyLife AI 中控方案:基于 ESP32-C5 双频 Wi-Fi + 4G 打造智能家居语音控制入口
人工智能·智能家居
Change is good4 小时前
桌面型软件(如UE)AI测试工具
人工智能
jkyy20144 小时前
AI赋能智慧座舱:健康有益重构移动健康空间,定义出行健康新范式
大数据·人工智能·物联网·健康医疗
superstarsupers4 小时前
宫庭海出席2026横琴-澳门国际数字艺术博览会 畅谈AI虚拟偶像产业新生态
人工智能·百度