OpenAI 刚刚公布了 Voice Engine,一种利用文本和 15 秒音频样本就可以生成接近说话者音色的自然语音的生成模型。

OpenAI 刚刚公布了 Voice Engine,一种利用文本和 15 秒音频样本就可以生成接近说话者音色的自然语音的生成模型。

这一模型早在 2022 年就已开发,目前驱动了 OpenAI 的 TTS、ChatGPT Voice 以及 Read Aloud。

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索