胡桃讲编程：麻宫雅典娜 97 RVCv2 第一代（R1）开源发布文档

作者：龙沅可

温馨提示：本项目为非官方同人二创作品，全程秉持公益开源原则，无任何商业运营行为。请所有使用者严格遵守国家法律法规与开源协议，合理运用本套开源模型与技术资源，坚决杜绝非法用途与违规使用行为。本模型原 IP 版权归 SNK 所有，仅用于技术交流、个人学习与非盈利同人创作。

一、项目整体概述

作为柴框云智算・低配卡 RVC 公益开源项目 的经典复古独立分支，本次发布的麻宫雅典娜 97R1 国语声库与此前的 15R2 版本为并行迭代的两条产品线：15R2 面向现代高清游戏声线、主打极致低配推理优化；本 97R1 版本则聚焦《拳皇 97》经典复古声线，还原初代作品中标志性的人声质感，满足怀旧同人创作、复古游戏配音、老派 ACG 内容二次创作的需求。

本声库同样遵循项目 "让低配电脑也能流畅使用 RVC" 的核心初心，采用云端算力完成高精度训练，同时针对 4GB 及以下显存老旧显卡、纯 CPU 设备做全流程适配，全版本 RVC WebUI 与主流创作平台均可无缝接入。

二、声库基础信息、声优与配套文件

1. 核心基础信息

声库全称：柴云智算 - 虚拟歌手・麻宫雅典娜 97R1 国语声库（公益开源版 RVCv2 第一代）
所属项目：柴框云智算・低配卡 RVC 公益开源项目（经典复古分支）
声库版本：R1（RVC v2 第一代）
训练平台：云 RVC AutuDL
训练硬件：NVIDIA GeForce RTX 4090 D
原始权重文件 ：G_400.pth
索引原始文件名 ：added_IVF14_Flat_nprobe_1_Athena Asamiya97R1_v2.index
版权归属：原 IP 及音源版权归 SNK 所有，本模型为非商用公益二创成果
开源链接：https://115cdn.com/s/swshf4c3nam?password=h3d1\&

2. 角色声优明细（多版本对照）

本声库原型声优（KOF97 街机原版） 日文声优：栗栖由纪奈（栗栖ゆきな / Yukina Kurisu）。该声优为《拳皇 97》麻宫雅典娜专属配音，声线具备鲜明的 90 年代街机复古质感，音调高亢、元气十足，是本款 97R1 声库重点复刻的人声基底。
正统续作 & 衍生手游通用声优 自《拳皇 98》开始，麻宫雅典娜日语声优固定为池泽春菜（池澤春菜 / Haruna Ikezawa），该配音沿用至《拳皇 15》、《拳皇全明星》等正统作品。

3. 完整配套文件清单

下载包内共包含 3 个核心文件，部署时需全部对应放置：

主模型权重：Athena Asamiya97R1.pth
特征索引文件：Athena Asamiya97R1.index
官方使用说明书：麻宫雅典娜97R1-使用说明书.txt

三、声线定位与适配场景

本声库基于《拳皇 97》原版游戏语音训练，高度还原经典版本中麻宫雅典娜的清亮少女声线，保留复古作品独有的人声质感与咬字风格，人声通透度、辨识度突出，适配以下创作场景：

复古游戏同人配音、怀旧向二创内容制作
老派 ACG 歌曲翻唱、复古流行音乐合成
经典 IP 同人剧情、有声短漫配音
个人非盈利技术学习、RVC 参数调优研究

补充参考：若需制作《拳魂觉醒（小 y 渠道服）》相关衍生声库，其日语声线风格趋近拳皇 98 及后续作品，可参考 15R2 版本参数与音色特点。

四、全套参数明细

（一）全局训练配置 config.json

本声库原生采样率为 48kHz，底层网络结构针对复古人声特征做适配优化，以下为完整配置参数与核心释义，非专业调试请勿修改：

复制代码

{ "train": { "log_interval": 200, // 日志打印间隔：每200步输出训练日志 "seed": 1234, // 固定随机种子，保证模型效果可复现 "epochs": 20000, // 理论最大训练轮数 "learning_rate": 1e-4, // 基础学习率：0.0001 "betas": [0.8, 0.99], // 优化器动量参数 "eps": 1e-9, // 数值稳定系数 "batch_size": 4, // 训练批次大小 "fp16_run": true, // 开启半精度运算，降低显存占用 "lr_decay": 0.999875, // 学习率衰减系数 "segment_size": 17280, // 音频切片长度，适配48k采样率 "init_lr_ratio": 1, // 初始学习率倍率 "warmup_epochs": 0, // 无预热训练轮数 "c_mel": 45, // Mel损失权重 "c_kl": 1.0 // KL散度损失权重 }, "data": { "max_wav_value": 32768.0, // WAV音频最大幅值 "sampling_rate": 48000, // 模型原生训练采样率（48kHz） "filter_length": 2048, // 滤波窗口长度 "hop_length": 480, // 帧移长度，适配48k采样率 "win_length": 2048, // 滑动窗口长度 "n_mel_channels": 128, // Mel频谱通道数 "mel_fmin": 0.0, // Mel最低频率 "mel_fmax": null // Mel最高频率（无限制） }, "model": { "inter_channels": 192, "hidden_channels": 192, "filter_channels": 768, "n_heads": 2, // 注意力头数 "n_layers": 6, // 网络层数 "kernel_size": 3, "p_dropout": 0, // 丢弃率为0，无随机丢弃 "resblock": "1", // 残差块类型 "resblock_kernel_sizes": [3,7,11], "resblock_dilation_sizes": [[1,3,5], [1,3,5], [1,3,5]], "upsample_rates": [12,10,2,2], // 上采样倍率，适配48k采样 "upsample_initial_channel": 512, "upsample_kernel_sizes": [24,20,4,4], "use_spectral_norm": false, // 不启用谱归一化 "gin_channels": 256, "spk_embed_dim": 109 // 说话人嵌入维度 } }

（二）实测训练核心参数

本模型全程从零训练，未加载任何预训练底模，所有参数均经过云端环境实测验证：

基础标识 ：实验名Athena Asamiya97R1，RVC v2 版本，单人声库说话人 ID 固定为 0，音高指导功能默认开启
训练流程参数：原生目标采样率 48kHz，总训练轮数 200 epoch，每 50 轮自动保存一次模型文件；单卡训练批次为 23，CPU 进程数设置为 150 以最大化音频处理效率；全程关闭显存缓存，兼容低配设备部署
音高提取算法：训练阶段采用 MVPE_GPU（机械车辆预留算法），保障复古声线的音准与细节还原
数据集与预处理：音源取自《拳皇 97》原版游戏语音，使用万兴喵影完成录制、切片与标准化处理；数据集规格为 1 段 ×10s 单声道纯净音频，训练前已完成人声降噪、音量统一等预处理操作。使用前建议对输入音频做标准化处理，防止音准偏移、咬字模糊等问题。

（三）官方推荐推理参数（必设，保障音色效果）

为兼顾复古声线还原度与低配设备运行稳定性，推理时建议严格遵循以下配置：

通用基础参数：音高提取算法选用 RMVPE，检索特征占比推介为 0.78，批量大小（batch_size）设为 1，开启音高指导
硬件适配方案
1. 8GB 及以上显存显卡：CPU/GPU 均可推理，默认参数即可流畅运行
2. 4GB 及以下老旧显卡：强制 batch_size=1 并关闭显存缓存，杜绝显存溢出
3. 纯 CPU 设备：保持默认参数即可运行，推理速度略有下降，音色质感不受影响
平台兼容性：全版本 RVC WebUI（2026 版、20240604 版、1006 版、Replay 版、MAX 版等）均兼容，同时支持接入流明平台使用

五、模型部署安装教程

本声库部署逻辑与主流 RVC 模型一致，新手可快速完成配置，步骤如下：

文件放置
1. 将 Athena Asamiya97R1.pth 复制到 RVC WebUI 根目录的 weights 文件夹内
2. 将索引文件 Athena Asamiya97R1.index 放入 logs/Athena Asamiya97R1/ 目录，无对应文件夹可手动新建
3. 将配套 config.json 放置至对应实验配置目录
加载验证 ：启动 RVC WebUI，在模型下拉列表中选择 Athena Asamiya97R1，索引文件会自动匹配加载，加载完成即可正常使用
跨平台使用：导入流明平台时，直接上传模型文件，沿用上述推理参数即可

六、开源使用规范与合规声明

1. 使用权限说明

✅ 允许范围：个人免费使用、非商用翻唱、怀旧同人创作、技术交流学习、非盈利公开分享、参数二次调优
❌ 禁止范围：任何商业盈利用途、收费分发、模型倒卖、反编译拆解、提取音色、闭源二次发布、商用盗用

2. 内容与标注规范

严禁使用本模型生成违法、暴力、色情、低俗及侵权内容，使用者自行承担违规使用的法律责任
公开发布基于本声库的作品时，必须标注：歌手：麻宫雅典娜 97

3. 公测与反馈

本声库目前处于公益公测阶段，若使用中遇到音色偏差、咬字异常、设备兼容性问题，可通过 B 站、CSDN、项目官方渠道反馈，后续将根据反馈持续优化迭代。

七、多版本声库选型 & 音源声优总览

1. 97R1 与 15R2 版本选型参考

|-------|--------------|--------------------|
| 对比维度 | 麻宫雅典娜 97R1 | 麻宫雅典娜 15R2 |
| 音源版本 | 拳皇 97 经典复古声线 | 拳皇 15 现代高清声线 |
| 原生采样率 | 48kHz | 40kHz（主推 24kHz 推理） |
| 版本定位 | 复古怀旧分支 | 主力优化分支 |
| 训练轮数 | 200 epoch | 100 epoch |
| 适配场景 | 怀旧二创、复古配音 | 通用翻唱、全场景创作 |
| 低配友好度 | 良好 | 极致优化 |

偏好经典复古质感、主打怀旧同人创作，选择 97R1；
追求通用翻唱效果、极致低配推理体验，选择 15R2。

2. 全系列声优汇总（文档溯源专用）

|---------------------|-------|------------|
| 音源来源 | 日语声优 | 对应声库 |
| 拳皇 97（街机原版） | 栗栖由纪奈 | 麻宫雅典娜 97R1 |
| 拳皇 98~ 拳皇 15（正统系列） | 池泽春菜 | 麻宫雅典娜 15R2 |

本系列项目初衷是降低 AI 语音技术的使用门槛，让每一台低配电脑都能体验 RVC 模型的魅力。也希望广大技术爱好者一同守护开源环境，合理合规使用开源成果，共同交流学习 AI 语音合成相关技术。

胡桃讲编程：麻宫雅典娜 97 RVCv2 第一代（R1）开源发布文档 | 经典复古分支