我想生成音频的时候同时可以返回对应字符的时间戳,方便后期制作 srt 使用,这个好像没看到不知道如何实现,之前 azure 有这个功能,还挺好用的,这个 model 可以实现吗
我想生成音频的时候同时可以返回对应字符的时间戳,方便后期制作 srt 使用,这个好像没看到不知道如何实现,之前 azure 有这个功能,还挺好用的,这个 model 可以实现吗