上海交通大学开源了一个非常牛批的语音生成模型 F5-TTS。刚好这几天AI音频和播客火爆，这下瞌睡送枕头了。模型特点有：零样本 (Zero-shot) 声音克隆速度控制（基于总时长）可以控制合成语音的情感表现长文本合成支持中文和英文多语言合成在 10 万小时数据上训练最重要的是支持商用

@op7418@x.good.news

上海交通大学开源了一个非常牛批的语音生成模型 F5-TTS。

刚好这几天AI音频和播客火爆，这下瞌睡送枕头了。

模型特点有：

零样本 (Zero-shot) 声音克隆
速度控制（基于总时长）
可以控制合成语音的情感表现
长文本合成
支持中文和英文多语言合成
在 10 万小时数据上训练
最重要的是支持商用

查看详情

@op7418@x.good.news

0/480