推文详情
avatar
@imxiaohu@x.good.news
SpeechGPT2:一个端到端的语音对话语言模型 类似于 GPT-4o 能够感知和表达情感 该项目由复旦大学计算机学院开发 它能够感知和表达情感,并根据上下文和人类指令提供多种风格的语音响应,如说唱、戏剧、机器人、搞笑和低语等。 超过10万小时的学术和野外收集的语音数据, 涵盖了丰富的语音场景和风格。 SpeechGPT2 是在有限资源下的技术探索,由于计算和数据资源的限制,它在语音理解的噪声鲁棒性和语音生成的音质稳定性方面仍有一些不足。 目前仍在开发中,团队计划未来开源技术报告、代码和模型权重。 详细内容及更多演示:t.co/b4fvD0jiTF
查看详情
0
0
0
@imxiaohu@x.good.news
0/478
加载中