作者:龙沅可
温馨提示:本项目为非官方同人二创作品,全程秉持公益开源原则,无任何商业运营行为。请所有使用者严格遵守国家法律法规与开源协议,合理运用本套开源模型与技术资源,坚决杜绝非法用途与违规使用行为。本模型原 IP 版权归 SNK 所有,仅用于技术交流、个人学习与非盈利同人创作。
一、项目整体概述
作为柴框云智算・低配卡 RVC 公益开源项目 的经典复古独立分支,本次发布的麻宫雅典娜 97R1 国语声库与此前的 15R2 版本为并行迭代的两条产品线:15R2 面向现代高清游戏声线、主打极致低配推理优化;本 97R1 版本则聚焦《拳皇 97》经典复古声线,还原初代作品中标志性的人声质感,满足怀旧同人创作、复古游戏配音、老派 ACG 内容二次创作的需求。
本声库同样遵循项目 "让低配电脑也能流畅使用 RVC" 的核心初心,采用云端算力完成高精度训练,同时针对 4GB 及以下显存老旧显卡、纯 CPU 设备做全流程适配,全版本 RVC WebUI 与主流创作平台均可无缝接入。
二、声库基础信息、声优与配套文件
1. 核心基础信息
-
声库全称:柴云智算 - 虚拟歌手・麻宫雅典娜 97R1 国语声库(公益开源版 RVCv2 第一代)
-
所属项目:柴框云智算・低配卡 RVC 公益开源项目(经典复古分支)
-
声库版本:R1(RVC v2 第一代)
-
训练平台:云 RVC AutuDL
-
训练硬件:NVIDIA GeForce RTX 4090 D
-
原始权重文件 :
G_400.pth -
索引原始文件名 :
added_IVF14_Flat_nprobe_1_Athena Asamiya97R1_v2.index -
版权归属:原 IP 及音源版权归 SNK 所有,本模型为非商用公益二创成果
2. 角色声优明细(多版本对照)
-
本声库原型声优(KOF97 街机原版) 日文声优:栗栖由纪奈(栗栖ゆきな / Yukina Kurisu)。该声优为《拳皇 97》麻宫雅典娜专属配音,声线具备鲜明的 90 年代街机复古质感,音调高亢、元气十足,是本款 97R1 声库重点复刻的人声基底。
-
正统续作 & 衍生手游通用声优 自《拳皇 98》开始,麻宫雅典娜日语声优固定为池泽春菜(池澤春菜 / Haruna Ikezawa),该配音沿用至《拳皇 15》、《拳皇全明星》等正统作品。
3. 完整配套文件清单
下载包内共包含 3 个核心文件,部署时需全部对应放置:
-
主模型权重:
Athena Asamiya97R1.pth -
特征索引文件:
Athena Asamiya97R1.index -
官方使用说明书:
麻宫雅典娜97R1-使用说明书.txt
三、声线定位与适配场景
本声库基于《拳皇 97》原版游戏语音训练,高度还原经典版本中麻宫雅典娜的清亮少女声线,保留复古作品独有的人声质感与咬字风格,人声通透度、辨识度突出,适配以下创作场景:
-
复古游戏同人配音、怀旧向二创内容制作
-
老派 ACG 歌曲翻唱、复古流行音乐合成
-
经典 IP 同人剧情、有声短漫配音
-
个人非盈利技术学习、RVC 参数调优研究
补充参考:若需制作《拳魂觉醒(小 y 渠道服)》相关衍生声库,其日语声线风格趋近拳皇 98 及后续作品,可参考 15R2 版本参数与音色特点。
四、全套参数明细
(一)全局训练配置 config.json
本声库原生采样率为 48kHz,底层网络结构针对复古人声特征做适配优化,以下为完整配置参数与核心释义,非专业调试请勿修改:
{ "train": { "log_interval": 200, // 日志打印间隔:每200步输出训练日志 "seed": 1234, // 固定随机种子,保证模型效果可复现 "epochs": 20000, // 理论最大训练轮数 "learning_rate": 1e-4, // 基础学习率:0.0001 "betas": [0.8, 0.99], // 优化器动量参数 "eps": 1e-9, // 数值稳定系数 "batch_size": 4, // 训练批次大小 "fp16_run": true, // 开启半精度运算,降低显存占用 "lr_decay": 0.999875, // 学习率衰减系数 "segment_size": 17280, // 音频切片长度,适配48k采样率 "init_lr_ratio": 1, // 初始学习率倍率 "warmup_epochs": 0, // 无预热训练轮数 "c_mel": 45, // Mel损失权重 "c_kl": 1.0 // KL散度损失权重 }, "data": { "max_wav_value": 32768.0, // WAV音频最大幅值 "sampling_rate": 48000, // 模型原生训练采样率(48kHz) "filter_length": 2048, // 滤波窗口长度 "hop_length": 480, // 帧移长度,适配48k采样率 "win_length": 2048, // 滑动窗口长度 "n_mel_channels": 128, // Mel频谱通道数 "mel_fmin": 0.0, // Mel最低频率 "mel_fmax": null // Mel最高频率(无限制) }, "model": { "inter_channels": 192, "hidden_channels": 192, "filter_channels": 768, "n_heads": 2, // 注意力头数 "n_layers": 6, // 网络层数 "kernel_size": 3, "p_dropout": 0, // 丢弃率为0,无随机丢弃 "resblock": "1", // 残差块类型 "resblock_kernel_sizes": [3,7,11], "resblock_dilation_sizes": [[1,3,5], [1,3,5], [1,3,5]], "upsample_rates": [12,10,2,2], // 上采样倍率,适配48k采样 "upsample_initial_channel": 512, "upsample_kernel_sizes": [24,20,4,4], "use_spectral_norm": false, // 不启用谱归一化 "gin_channels": 256, "spk_embed_dim": 109 // 说话人嵌入维度 } }
(二)实测训练核心参数
本模型全程从零训练,未加载任何预训练底模,所有参数均经过云端环境实测验证:
-
基础标识 :实验名
Athena Asamiya97R1,RVC v2 版本,单人声库说话人 ID 固定为 0,音高指导功能默认开启 -
训练流程参数:原生目标采样率 48kHz,总训练轮数 200 epoch,每 50 轮自动保存一次模型文件;单卡训练批次为 23,CPU 进程数设置为 150 以最大化音频处理效率;全程关闭显存缓存,兼容低配设备部署
-
音高提取算法:训练阶段采用 MVPE_GPU(机械车辆预留算法),保障复古声线的音准与细节还原
-
数据集与预处理:音源取自《拳皇 97》原版游戏语音,使用万兴喵影完成录制、切片与标准化处理;数据集规格为 1 段 ×10s 单声道纯净音频,训练前已完成人声降噪、音量统一等预处理操作。使用前建议对输入音频做标准化处理,防止音准偏移、咬字模糊等问题。
(三)官方推荐推理参数(必设,保障音色效果)
为兼顾复古声线还原度与低配设备运行稳定性,推理时建议严格遵循以下配置:
-
通用基础参数:音高提取算法选用 RMVPE,检索特征占比推介为 0.78,批量大小(batch_size)设为 1,开启音高指导
-
硬件适配方案
-
8GB 及以上显存显卡:CPU/GPU 均可推理,默认参数即可流畅运行
-
4GB 及以下老旧显卡:强制 batch_size=1 并关闭显存缓存,杜绝显存溢出
-
纯 CPU 设备:保持默认参数即可运行,推理速度略有下降,音色质感不受影响
-
-
平台兼容性:全版本 RVC WebUI(2026 版、20240604 版、1006 版、Replay 版、MAX 版等)均兼容,同时支持接入流明平台使用
五、模型部署安装教程
本声库部署逻辑与主流 RVC 模型一致,新手可快速完成配置,步骤如下:
-
文件放置
-
将
Athena Asamiya97R1.pth复制到 RVC WebUI 根目录的weights文件夹内 -
将索引文件
Athena Asamiya97R1.index放入logs/Athena Asamiya97R1/目录,无对应文件夹可手动新建 -
将配套
config.json放置至对应实验配置目录
-
-
加载验证 :启动 RVC WebUI,在模型下拉列表中选择
Athena Asamiya97R1,索引文件会自动匹配加载,加载完成即可正常使用 -
跨平台使用:导入流明平台时,直接上传模型文件,沿用上述推理参数即可
六、开源使用规范与合规声明
1. 使用权限说明
-
✅ 允许范围:个人免费使用、非商用翻唱、怀旧同人创作、技术交流学习、非盈利公开分享、参数二次调优
-
❌ 禁止范围:任何商业盈利用途、收费分发、模型倒卖、反编译拆解、提取音色、闭源二次发布、商用盗用
2. 内容与标注规范
-
严禁使用本模型生成违法、暴力、色情、低俗及侵权内容,使用者自行承担违规使用的法律责任
-
公开发布基于本声库的作品时,必须标注:歌手:麻宫雅典娜 97
3. 公测与反馈
本声库目前处于公益公测阶段,若使用中遇到音色偏差、咬字异常、设备兼容性问题,可通过 B 站、CSDN、项目官方渠道反馈,后续将根据反馈持续优化迭代。
七、多版本声库选型 & 音源声优总览
1. 97R1 与 15R2 版本选型参考
|-------|--------------|--------------------|
| 对比维度 | 麻宫雅典娜 97R1 | 麻宫雅典娜 15R2 |
| 音源版本 | 拳皇 97 经典复古声线 | 拳皇 15 现代高清声线 |
| 原生采样率 | 48kHz | 40kHz(主推 24kHz 推理) |
| 版本定位 | 复古怀旧分支 | 主力优化分支 |
| 训练轮数 | 200 epoch | 100 epoch |
| 适配场景 | 怀旧二创、复古配音 | 通用翻唱、全场景创作 |
| 低配友好度 | 良好 | 极致优化 |
-
偏好经典复古质感、主打怀旧同人创作,选择 97R1;
-
追求通用翻唱效果、极致低配推理体验,选择 15R2。
2. 全系列声优汇总(文档溯源专用)
|---------------------|-------|------------|
| 音源来源 | 日语声优 | 对应声库 |
| 拳皇 97(街机原版) | 栗栖由纪奈 | 麻宫雅典娜 97R1 |
| 拳皇 98~ 拳皇 15(正统系列) | 池泽春菜 | 麻宫雅典娜 15R2 |
本系列项目初衷是降低 AI 语音技术的使用门槛,让每一台低配电脑都能体验 RVC 模型的魅力。也希望广大技术爱好者一同守护开源环境,合理合规使用开源成果,共同交流学习 AI 语音合成相关技术。