帖文详情
avatar
@op7418@x.good.news
上海交通大学开源了一个非常牛批的语音生成模型 F5-TTS。

刚好这几天AI音频和播客火爆,这下瞌睡送枕头了。

模型特点有:

零样本 (Zero-shot) 声音克隆
速度控制(基于总时长)
可以控制合成语音的情感表现
长文本合成
支持中文和英文多语言合成
在 10 万小时数据上训练
最重要的是支持商用
查看详情
@op7418@x.good.news
0/480
加载中