1. 背景

提取游戏语音用于炼丹训练集

2. 方法

2.1 提取语音包

某游戏语音包位置:A 2-jigen Game/A 2-jigen Game/A 2-jigen Game_Data/StreamingAssets/Audio/GeneratedSoundBanks/Windows/Japanese
具体文件结构为:

  • 10xx.pck 主线剧情
  • 20xx.pck 角色传说任务
  • 30xx.pck 邀约
  • 50xx.pck 我们终将重逢等
  • External 活动语音等

pck文件,需要通过Extractor v2.5提取。下载

2.2 提取后语音包解密

通过vgmstream CLI进行。Git
cmd批量执行命令行

FOR %F IN (*.wav) DO "path/to/test.exe" "%~nxF"

#3. 补充
有人做了语音识别,可参考快速找到想要的文件。注意,各游戏版本对应关系不同。bilibili
哪怕是传说任务,也有一堆非主角的话,特别是派蒙,记得删。
如果有精力,可以跑个人声聚类模型来自动区分说话人,但是我懒。