OpenAI 刚刚公布了 Voice Engine,一种利用文本和 15 秒音频样本就可以生成接近说话者音色的自然语音的生成模型。
这一模型早在 2022 年就已开发,目前驱动了 OpenAI 的 TTS、ChatGPT Voice 以及 Read Aloud。
OpenAI 刚刚公布了 Voice Engine,一种利用文本和 15 秒音频样本就可以生成接近说话者音色的自然语音的生成模型。
这一模型早在 2022 年就已开发,目前驱动了 OpenAI 的 TTS、ChatGPT Voice 以及 Read Aloud。
扫码打开当前页
之前