QuickTTS é uma ferramenta de Texto-para-Fala (TTS) poderosa e versátil, construída com uma interface Gradio limpa e intuitiva. Atendendo a pedidos da comunidade, este projeto foi desenvolvido para ser uma solução completa para geração de áudio, dublagem e muito mais.
_Interface principal mostrando a seleção de provedores e as opções de áudio._
_Interface de SRT mostrando a seleção de provedores e as opções de áudio e progressão._
QuickTTS vai além da simples geração de áudio, oferecendo um conjunto de ferramentas robusto para diversas necessidades:
- Múltiplos Provedores de TTS: Escolha entre a vasta gama de vozes de alta qualidade do Edge-TTS ou as populares e virais vozes do TikTok TTS.
- Suporte Global: Gere áudio em dezenas de idiomas e dialetos, com centenas de vozes masculinas e femininas para escolher.
- Sincronização de Legendas (.SRT): Carregue um arquivo de legenda (
.srt) e gere automaticamente um arquivo de áudio perfeitamente sincronizado, ideal para dublagens de vídeos, cursos e outros projetos. - Processamento em Lote: Converta o conteúdo de arquivos de texto (
.txt) inteiros em um único arquivo de áudio com facilidade. - Ajustes Finos de Áudio: Controle a velocidade, o tom e o volume do áudio gerado pelo Edge-TTS.
- Remoção Inteligente de Silêncio: Opcionalmente, remova pausas e silêncios indesejados do áudio final para um resultado mais dinâmico.
- Exemplos Integrados: Comece rapidamente com exemplos de SRT pré-configurados para testar a funcionalidade de dublagem com um único clique.
- Interface em Tempo Real: Acompanhe o progresso do processamento de arquivos SRT com uma barra de progresso interativa diretamente na interface.
Você pode usar o QuickTTS de três maneiras fáceis, sem precisar instalar nada localmente se não quiser.
Acesse a versão pública e sempre disponível diretamente no seu navegador. Ideal para testar rapidamente as funcionalidades do Edge-TTS.
- Acessar QuickTTS no Hugging Face
Nota: A funcionalidade do TikTok TTS é bloqueada no Hugging Face devido a restrições de rede.
Para usar todas as funcionalidades, incluindo o TikTok TTS, o Google Colab é a melhor opção online.
- Abrir no Google Colab](https://colab.research.google.com/drive/1XtHdHqnMxjuuXPZkhpCLJIweV09n7YJF?usp=sharing)
- Basta clicar no link, e depois em "Executar tudo" (ou executar as células uma por uma). Um link público será gerado para você acessar a interface.
Para a melhor performance e uso offline, clone e execute o projeto na sua própria máquina.
-
Pré-requisitos:
- Python 3.9+
- FFmpeg (essencial para manipulação de áudio). Instruções de instalação aqui.
-
Clone o repositório:
git clone https://github.com/RafaelGodoyEbert/QuickTTS.git cd QuickTTS -
Instale as dependências:
pip install -r requirements.txt
-
Execute o aplicativo:
python app.py
- Ou, no Windows, simplesmente execute o arquivo
webui.bat.
- Ou, no Windows, simplesmente execute o arquivo
-
Acesse o aplicativo no seu navegador através da URL local fornecida (geralmente
http://127.0.0.1:7860).
Contribuições são sempre bem-vindas! Se você tem uma ideia para uma nova funcionalidade, encontrou um bug ou quer melhorar o código, sinta-se à vontade para:
- Abrir uma Issue para discutir sua ideia.
- Enviar um Pull Request com suas melhorias.
Este projeto só foi possível graças às excelentes bibliotecas de código aberto desenvolvidas pela comunidade:
- edge-tts por rany2
- TikTok-Voice-TTS por mark-rez
- E, claro, à equipe do Gradio por tornar a criação de interfaces de ML tão acessível.
Desenvolvido com ❤️ por Rafael Godoy Ebert.
Se você gostou deste projeto e ele foi útil para você, considere apoiar meu trabalho. Qualquer valor ajuda a manter a motivação para criar e manter ferramentas como esta!