开源语音合成模型

该项目是由 Fish Audio 开发的基于 VQGAN+Llama 的文本转语音模型,它仅需 4GB 显存即可在个人设备上轻松运行和微调(16GB),支持中英日语和音色调整,语音合成效果出色。
Warning Message
  • 请登录后再使用此功能
  • 已有用户?登录 未注册? 注册