【VFrame・云瑶 R1 国语声库公测】RVC1006Nvidia 训练全记录｜私人闭源虚拟歌手养成

作者：龙沅可

本文完整记录VFrame 虚拟歌手・云瑶 R1 国语声库的训练全流程，基于RVC1006Nvidia训练、私人闭源发布，附训练参数、日志截图、显卡运行状态，同步开放声库公测与使用规范。

温馨提示：本次项目已与CV协商一致后才私人闭源，全程均在合法授权内操作，请勿将开源技术用于非法用途！

一、云瑶虚拟歌手官方完整资料

所属：VFrame（独立新项目，与九州合唱团分离）训练平台：RVC1006Nvidia 声库性质：私人闭源虚拟歌手声库

基础信息

2.3 训练设备与硬件运行表现（对应 GPU 监控）

本次训练全程在个人主力老笔记本上完成，设备与运行状态如下：

三、训练日志与关键节点（对应图二、图四训练日志）

本次训练 100 轮全程稳定，loss 曲线正常收敛，无 NaN 异常值、无爆音风险、无特征丢失。

四、核心踩坑记录

五、云瑶_R1 声库使用规范（私人闭源版）

六、公测说明

云瑶_R1 国语声库正式开启公测，测试曲《远山少年》同步发布。

欢迎各位 AI 歌手爱好者体验、反馈音色 / 咬字 / 音准问题，后续将基于反馈迭代 R2 优化版本。

姓名：云瑶
性别：女
年龄：17 岁
生日：04 月 30 日
身高：170

二、云瑶_R1 训练参数与环境配置（本次训练基于RVC1006Nvidia版本，全程为个人兴趣向制作，参数配置适配老款笔记本硬件，兼顾训练稳定性与音色还原度，所有设置均对应截图中的 WebUI 界面与硬件监控数据。）

2.1 核心训练参数配置（对应图一、图二训练界面）

表格

配置项	参数值
实验名	qb
目标采样率	40k
模型版本	v2
音高指导	开启
音高提取算法	PM（首相）
说话人 ID	0
CPU 进程数	4
训练批次（batch_size）	1
总训练轮数	100
模型保存频率	10 轮 / 次
缓存设置	关闭
预训练底模	无

2.2 数据集与预处理流程

数据收集：万兴喵影
数据处理：万兴喵影
数据扩张（标准化）：GPT-soVITS
数据集规格：7 段 ×30s，单声道音频
设备型号：微星 GL62M 7REX（2017 款黑色游戏本）
处理器：Intel Core i7-7700HQ（4 核 8 线程，Kaby Lake）
独立显卡：NVIDIA GeForce GTX 1050 Ti 4GB GDDR5（显卡状态：健康）
显卡驱动：NVIDIA 581.80（580x 系列驱动）
运行内存：8GB DDR4 2400MHz
系统环境：Windows 10 家庭版 64 位
实际训练时长：约 3 小时
显卡运行温度：65℃~75℃
显存占用：如图三所示（满载稳定无溢出）
训练状态：全程无报错、无中断、无降频
0~30 轮：音色初步成型，人声轮廓清晰
30~70 轮：咬字优化，气声稳定，高音不飘
70~100 轮：音色贴合 CV 原声，完成最终收敛最终提取G_7200.pth 为基础权重，转换为轻量化成品模型YunYaoR1v2.pth，为私人闭源最终版本。
**拟合风险：**这次使用的是GPT合成的TTS语音，标准咬字，可直接高轮数训练。
老硬件显存优化 1050Ti 4GB 显存必须设置batch_size=1+ 关闭缓存，才能稳定跑完 100 轮。
数据集标准化单人声库务必做好音频标准化，否则会出现咬字模糊、音准偏移问题。
使用权限：个人非商用可免费使用，支持翻唱、练习、非盈利创作发布。
闭源保护：本声库为私人闭源，严禁反编译、拆解、提取音色、二次训练。
分发限制：严禁转载、共享、倒卖、二次分发声库文件。
内容规范：禁止用于违法、低俗、侵权内容创作。
标注要求：使用声库需标注「歌手：云瑶（VFrame）」。
翻唱：云瑶
试跑软件：流明
人声分离：万兴喵影
母带混音：Mixxx
制作：龙沅可
出品发行：龙洛工作室

形象设定

整体为蓝白基调二次元国风少女造型：

发型：浅蓝渐变柔白长直发，齐刘海，鬓角垂落柔碎发，发间佩戴银质云纹发饰
服饰：蓝白改良国风短襦裙，交领窄袖，裙摆绣流云暗纹，腰间系浅蓝飘带
气质：清冷温柔、干净通透，如云端清歌的 16 岁国风少女

声库核心信息

声线定位：清透少女音，中高音稳定，气声自然，咬字清晰
适配曲风：国风抒情、古风、治愈系、流行、轻摇滚
引擎迭代系列（VFrame 专属）：R 系列（RVC）：R1（首发）→ R2 → R3D 系列（DDSP-SVC）：D1 → D2U 系列（UTAU）：U1 → U2
当前版本：云瑶_R1（RVC v2 标准训练版）

官方推荐推理参数

音高算法：RMVPE（机械车辆预留）
检索特征占比：0.78
采样率：24kHz
批量大小：1
支持设备：CPU/GPU 通用

原始文件训练后的项目底模目录树如下

卷开发E盘的文件夹 PATH 列表

卷序列号为 000000C4 8C68:D95C

E:\RVC STUDIO\RVC1006NVIDIA (2)\LOGS\QB

│ added_IVF230_Flat_nprobe_1_qb_v2.index

│ config.json

│ D_1440.pth

│ D_2160.pth

│ D_2880.pth

│ D_3600.pth

│ D_4320.pth

│ D_5040.pth

│ D_5760.pth

│ D_6480.pth

│ D_720.pth

│ D_7200.pth

│ events.out.tfevents.1777440999.lyk12243672.19480.0

│ extract_f0_feature.log

│ filelist.txt

│ G_1440.pth

│ G_2160.pth

│ G_2880.pth

│ G_3600.pth

│ G_4320.pth

│ G_5040.pth

│ G_5760.pth

│ G_6480.pth

│ G_720.pth

│ G_7200.pth

│ preprocess.log

│ total_fea.npy

│ train.log

│ trained_IVF230_Flat_nprobe_1_qb_v2.index

│

├─0_gt_wavs

│ 0_0.spec.pt

│ 0_0.wav

│ 0_1.spec.pt

│ 0_1.wav

│ 0_11.spec.pt

│ 0_11.wav

│ 0_12.spec.pt

│ 0_12.wav

│ 0_13.spec.pt

│ 0_13.wav

│ 0_3.spec.pt

│ 0_3.wav

│ 0_5.spec.pt

│ 0_5.wav

│ 0_6.spec.pt

│ 0_6.wav

│ 0_7.spec.pt

│ 0_7.wav

│ 0_8.spec.pt

│ 0_8.wav

│ 0_9.spec.pt

│ 0_9.wav

│ 1_0.spec.pt

│ 1_0.wav

│ 1_1.spec.pt

│ 1_1.wav

│ 1_10.spec.pt

│ 1_10.wav

│ 1_12.spec.pt

│ 1_12.wav

│ 1_13.spec.pt

│ 1_13.wav

│ 1_3.spec.pt

│ 1_3.wav

│ 1_4.spec.pt

│ 1_4.wav

│ 1_6.wav

│ 1_7.spec.pt

│ 1_7.wav

│ 1_8.spec.pt

│ 1_8.wav

│ 2_0.spec.pt

│ 2_0.wav

│ 2_1.spec.pt

│ 2_1.wav

│ 2_10.spec.pt

│ 2_10.wav

│ 2_11.spec.pt

│ 2_11.wav

│ 2_12.spec.pt

│ 2_12.wav

│ 2_2.spec.pt

│ 2_2.wav

│ 2_4.spec.pt

│ 2_4.wav

│ 2_5.spec.pt

│ 2_5.wav

│ 2_7.spec.pt

│ 2_7.wav

│ 2_9.spec.pt

│ 2_9.wav

│ 3_0.spec.pt

│ 3_0.wav

│ 3_10.spec.pt

│ 3_10.wav

│ 3_12.spec.pt

│ 3_12.wav

│ 3_2.spec.pt

│ 3_2.wav

│ 3_3.spec.pt

│ 3_3.wav

│ 3_5.wav

│ 3_6.spec.pt

│ 3_6.wav

│ 3_8.spec.pt

│ 3_8.wav

│ 3_9.spec.pt

│ 3_9.wav

│ 4_1.spec.pt

│ 4_1.wav

│ 4_10.spec.pt

│ 4_10.wav

│ 4_11.spec.pt

│ 4_11.wav

│ 4_12.spec.pt

│ 4_12.wav

│ 4_13.spec.pt

│ 4_13.wav

│ 4_14.spec.pt

│ 4_14.wav

│ 4_3.spec.pt

│ 4_3.wav

│ 4_4.spec.pt

│ 4_4.wav

│ 4_6.spec.pt

│ 4_6.wav

│ 4_7.spec.pt

│ 4_7.wav

│ 4_9.spec.pt

│ 4_9.wav

│ 5_1.spec.pt

│ 5_1.wav

│ 5_11.wav

│ 5_12.spec.pt

│ 5_12.wav

│ 5_13.spec.pt

│ 5_13.wav

│ 5_15.spec.pt

│ 5_15.wav

│ 5_2.spec.pt

│ 5_2.wav

│ 5_4.spec.pt

│ 5_4.wav

│ 5_6.spec.pt

│ 5_6.wav

│ 5_8.spec.pt

│ 5_8.wav

│ 5_9.spec.pt

│ 5_9.wav

│ 6_0.spec.pt

│ 6_0.wav

│ 6_10.spec.pt

│ 6_10.wav

│ 6_11.spec.pt

│ 6_11.wav

│ 6_12.spec.pt

│ 6_12.wav

│ 6_14.spec.pt

│ 6_14.wav

│ 6_2.spec.pt

│ 6_2.wav

│ 6_3.spec.pt

│ 6_3.wav

│ 6_4.spec.pt

│ 6_4.wav

│ 6_5.spec.pt

│ 6_5.wav

│ 6_7.spec.pt

│ 6_7.wav

│ 6_8.spec.pt

│ 6_8.wav

│ 6_9.spec.pt

│ 6_9.wav

│

├─1_16k_wavs

│ 0_0.wav

│ 0_1.wav

│ 0_11.wav

│ 0_12.wav

│ 0_13.wav

│ 0_3.wav

│ 0_5.wav

│ 0_6.wav

│ 0_7.wav

│ 0_8.wav

│ 0_9.wav

│ 1_0.wav

│ 1_1.wav

│ 1_10.wav

│ 1_12.wav

│ 1_13.wav

│ 1_3.wav

│ 1_4.wav

│ 1_6.wav

│ 1_7.wav

│ 1_8.wav

│ 2_0.wav

│ 2_1.wav

│ 2_10.wav

│ 2_11.wav

│ 2_12.wav

│ 2_2.wav

│ 2_4.wav

│ 2_5.wav

│ 2_7.wav

│ 2_9.wav

│ 3_0.wav

│ 3_10.wav

│ 3_12.wav

│ 3_2.wav

│ 3_3.wav

│ 3_5.wav

│ 3_6.wav

│ 3_8.wav

│ 3_9.wav

│ 4_1.wav

│ 4_10.wav

│ 4_11.wav

│ 4_12.wav

│ 4_13.wav

│ 4_14.wav

│ 4_3.wav

│ 4_4.wav

│ 4_6.wav

│ 4_7.wav

│ 4_9.wav

│ 5_1.wav

│ 5_11.wav

│ 5_12.wav

│ 5_13.wav

│ 5_15.wav

│ 5_2.wav

│ 5_4.wav

│ 5_6.wav

│ 5_8.wav

│ 5_9.wav

│ 6_0.wav

│ 6_10.wav

│ 6_11.wav

│ 6_12.wav

│ 6_14.wav

│ 6_2.wav

│ 6_3.wav

│ 6_4.wav

│ 6_5.wav

│ 6_7.wav

│ 6_8.wav

│ 6_9.wav

│

├─2a_f0

│ 0_0.wav.npy

│ 0_1.wav.npy

│ 0_11.wav.npy

│ 0_12.wav.npy

│ 0_13.wav.npy

│ 0_3.wav.npy

│ 0_5.wav.npy

│ 0_6.wav.npy

│ 0_7.wav.npy

│ 0_8.wav.npy

│ 0_9.wav.npy

│ 1_0.wav.npy

│ 1_1.wav.npy

│ 1_10.wav.npy

│ 1_12.wav.npy

│ 1_13.wav.npy

│ 1_3.wav.npy

│ 1_4.wav.npy

│ 1_6.wav.npy

│ 1_7.wav.npy

│ 1_8.wav.npy

│ 2_0.wav.npy

│ 2_1.wav.npy

│ 2_10.wav.npy

│ 2_11.wav.npy

│ 2_12.wav.npy

│ 2_2.wav.npy

│ 2_4.wav.npy

│ 2_5.wav.npy

│ 2_7.wav.npy

│ 2_9.wav.npy

│ 3_0.wav.npy

│ 3_10.wav.npy

│ 3_12.wav.npy

│ 3_2.wav.npy

│ 3_3.wav.npy

│ 3_5.wav.npy

│ 3_6.wav.npy

│ 3_8.wav.npy

│ 3_9.wav.npy

│ 4_1.wav.npy

│ 4_10.wav.npy

│ 4_11.wav.npy

│ 4_12.wav.npy

│ 4_13.wav.npy

│ 4_14.wav.npy

│ 4_3.wav.npy

│ 4_4.wav.npy

│ 4_6.wav.npy

│ 4_7.wav.npy

│ 4_9.wav.npy

│ 5_1.wav.npy

│ 5_11.wav.npy

│ 5_12.wav.npy

│ 5_13.wav.npy

│ 5_15.wav.npy

│ 5_2.wav.npy

│ 5_4.wav.npy

│ 5_6.wav.npy

│ 5_8.wav.npy

│ 5_9.wav.npy

│ 6_0.wav.npy

│ 6_10.wav.npy

│ 6_11.wav.npy

│ 6_12.wav.npy

│ 6_14.wav.npy

│ 6_2.wav.npy

│ 6_3.wav.npy

│ 6_4.wav.npy

│ 6_5.wav.npy

│ 6_7.wav.npy

│ 6_8.wav.npy

│ 6_9.wav.npy

│

├─2b-f0nsf

│ 0_0.wav.npy

│ 0_1.wav.npy

│ 0_11.wav.npy

│ 0_12.wav.npy

│ 0_13.wav.npy

│ 0_3.wav.npy

│ 0_5.wav.npy

│ 0_6.wav.npy

│ 0_7.wav.npy

│ 0_8.wav.npy

│ 0_9.wav.npy

│ 1_0.wav.npy

│ 1_1.wav.npy

│ 1_10.wav.npy

│ 1_12.wav.npy

│ 1_13.wav.npy

│ 1_3.wav.npy

│ 1_4.wav.npy

│ 1_6.wav.npy

│ 1_7.wav.npy

│ 1_8.wav.npy

│ 2_0.wav.npy

│ 2_1.wav.npy

│ 2_10.wav.npy

│ 2_11.wav.npy

│ 2_12.wav.npy

│ 2_2.wav.npy

│ 2_4.wav.npy

│ 2_5.wav.npy

│ 2_7.wav.npy

│ 2_9.wav.npy

│ 3_0.wav.npy

│ 3_10.wav.npy

│ 3_12.wav.npy

│ 3_2.wav.npy

│ 3_3.wav.npy

│ 3_5.wav.npy

│ 3_6.wav.npy

│ 3_8.wav.npy

│ 3_9.wav.npy

│ 4_1.wav.npy

│ 4_10.wav.npy

│ 4_11.wav.npy

│ 4_12.wav.npy

│ 4_13.wav.npy

│ 4_14.wav.npy

│ 4_3.wav.npy

│ 4_4.wav.npy

│ 4_6.wav.npy

│ 4_7.wav.npy

│ 4_9.wav.npy

│ 5_1.wav.npy

│ 5_11.wav.npy

│ 5_12.wav.npy

│ 5_13.wav.npy

│ 5_15.wav.npy

│ 5_2.wav.npy

│ 5_4.wav.npy

│ 5_6.wav.npy

│ 5_8.wav.npy

│ 5_9.wav.npy

│ 6_0.wav.npy

│ 6_10.wav.npy

│ 6_11.wav.npy

│ 6_12.wav.npy

│ 6_14.wav.npy

│ 6_2.wav.npy

│ 6_3.wav.npy

│ 6_4.wav.npy

│ 6_5.wav.npy

│ 6_7.wav.npy

│ 6_8.wav.npy

│ 6_9.wav.npy

│

├─3_feature768

│ 0_0.npy

│ 0_1.npy

│ 0_11.npy

│ 0_12.npy

│ 0_13.npy

│ 0_3.npy

│ 0_5.npy

│ 0_6.npy

│ 0_7.npy

│ 0_8.npy

│ 0_9.npy

│ 1_0.npy

│ 1_1.npy

│ 1_10.npy

│ 1_12.npy

│ 1_13.npy

│ 1_3.npy

│ 1_4.npy

│ 1_6.npy

│ 1_7.npy

│ 1_8.npy

│ 2_0.npy

│ 2_1.npy

│ 2_10.npy

│ 2_11.npy

│ 2_12.npy

│ 2_2.npy

│ 2_4.npy

│ 2_5.npy

│ 2_7.npy

│ 2_9.npy

│ 3_0.npy

│ 3_10.npy

│ 3_12.npy

│ 3_2.npy

│ 3_3.npy

│ 3_5.npy

│ 3_6.npy

│ 3_8.npy

│ 3_9.npy

│ 4_1.npy

│ 4_10.npy

│ 4_11.npy

│ 4_12.npy

│ 4_13.npy

│ 4_14.npy

│ 4_3.npy

│ 4_4.npy

│ 4_6.npy

│ 4_7.npy

│ 4_9.npy

│ 5_1.npy

│ 5_11.npy

│ 5_12.npy

│ 5_13.npy

│ 5_15.npy

│ 5_2.npy

│ 5_4.npy

│ 5_6.npy

│ 5_8.npy

│ 5_9.npy

│ 6_0.npy

│ 6_10.npy

│ 6_11.npy

│ 6_12.npy

│ 6_14.npy

│ 6_2.npy

│ 6_3.npy

│ 6_4.npy

│ 6_5.npy

│ 6_7.npy

│ 6_8.npy

│ 6_9.npy

│

└─eval

events.out.tfevents.1777440999.lyk12243672.19480.1

训练日志（json）：

{

"data": {

"filter_length": 2048,

"hop_length": 400,

"max_wav_value": 32768.0,

"mel_fmax": null,

"mel_fmin": 0.0,

"n_mel_channels": 125,

"sampling_rate": 40000,

"win_length": 2048

"model": {

"filter_channels": 768,

"gin_channels": 256,

"hidden_channels": 192,

"inter_channels": 192,

"kernel_size": 3,

"n_heads": 2,

"n_layers": 6,

"p_dropout": 0,

"resblock": "1",

"resblock_dilation_sizes": [

1, 3, 5 \], \[ 1, 3, 5 \], \[ 1, 3, 5

"resblock_kernel_sizes": [

"spk_embed_dim": 109,

"upsample_initial_channel": 512,

"upsample_kernel_sizes": [

16,

"upsample_rates": [

10,

"use_spectral_norm": false

"train": {

"batch_size": 4,

"betas": [

0.8,

0.99

"c_kl": 1.0,

"c_mel": 45,

"epochs": 20000,

"eps": 1e-09,

"fp16_run": true,

"init_lr_ratio": 1,

"learning_rate": 0.0001,

"log_interval": 200,

"lr_decay": 0.999875,

"seed": 1234,

"segment_size": 12800,

"warmup_epochs": 0

}