🇧🇷 Awesome UGC Ads Brazil

O primeiro dataset aberto de anúncios UGC em português (pt-BR) — focado em ganchos (hooks), CTAs e estrutura narrativa.

Por que existe?

Não havia um dataset simples e público em pt-BR. Ajuda creators, growth e devs a estudar padrões que funcionam em vídeo curto.

Instalação

Instale as dependências:

pip install -r requirements.txt

O script usa yt-dlp para baixar vídeos e openai-whisper para transcrição. ffmpeg deve estar instalado no sistema.

Como usar

Análise básica

python3 scripts/analyze_hooks.py

Análise por IA (Vercel AI SDK / OpenAI)

Configure a variável de ambiente com sua chave (use .env):

cp env.example .env
# edite .env e coloque sua chave
source .env

Instale dependências Node (uma vez):

npm install

Rode a análise por id do data/ads.jsonl:

npm run analyze -- --id br_001

Ou filtre pelo link do vídeo:

npm run analyze -- --url-contains instagram.com/reel/DNnnsPVu8rv

Parâmetros úteis:

--model: modelo OpenAI (padrão: gpt-4o-mini ou OPENAI_MODEL)
--temperature: temperatura (padrão: 0.2)
--file: caminho customizado para ads.jsonl

O resultado é impresso como JSON no terminal. No modo streaming, o JSON aparece token a token.

Ingestão de novos anúncios

python3 ingest/ingest_url.py --url "https://instagram.com/reel/VIDEO_ID/" --ugc-type review --brand "NomeMarca" --category "beleza" --terms-ok true

Parâmetros:

--url: URL do vídeo (Instagram, YouTube, etc.)
--ugc-type: Tipo do conteúdo (testimonial, unboxing, review, etc.)
--brand: Nome da marca
--category: Categoria do produto
--terms-ok: Aceitou os termos (true/false)

Solução de problemas

Erro "No module named 'pydub'"

O script usa ffmpeg diretamente agora. Se ainda der erro, instale ffmpeg:

# macOS com Homebrew
brew install ffmpeg

# Ubuntu/Debian
sudo apt install ffmpeg

# Outros sistemas, veja documentação do ffmpeg

Erro "No module named 'faster_whisper'"

Trocamos para openai-whisper porque faster-whisper tinha problemas de compilação. Se der erro de import:

pip uninstall faster-whisper
pip install openai-whisper

Erro de compilação com av/ctypes

Se der erro de compilação relacionado a av ou ctypes, o problema é provavelmente com faster-whisper. Use openai-whisper:

pip uninstall faster-whisper av
pip install openai-whisper

Vídeo não baixa

Verifique se a URL está correta e se yt-dlp consegue acessar. Alguns sites bloqueiam downloads automatizados.

Transcrição falha

Whisper precisa de GPU para ser rápido. Em CPU pode ser lento. Use um modelo menor se precisar:

python3 ingest/ingest_url.py --model tiny --url "..."

Modelos disponíveis: tiny, base, small, medium, large

Estrutura do projeto

data/
  ads.jsonl          # Dataset principal
  taxonomy.md        # Categorias e tipos

ingest/
  ingest_url.py      # Script de ingestão

scripts/
  analyze_hooks.py   # Análise básica
  validate.py        # Validação do dataset

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
data		data
ingest		ingest
scripts		scripts
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
env.example		env.example
package-lock.json		package-lock.json
package.json		package.json
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

🇧🇷 Awesome UGC Ads Brazil

Por que existe?

Instalação

Como usar

Análise básica

Análise por IA (Vercel AI SDK / OpenAI)

Ingestão de novos anúncios

Solução de problemas

Erro "No module named 'pydub'"

Erro "No module named 'faster_whisper'"

Erro de compilação com av/ctypes

Vídeo não baixa

Transcrição falha

Estrutura do projeto

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

License

Conty-App/awesome-ugc-ads-brazil

Folders and files

Latest commit

History

Repository files navigation

🇧🇷 Awesome UGC Ads Brazil

Por que existe?

Instalação

Como usar

Análise básica

Análise por IA (Vercel AI SDK / OpenAI)

Ingestão de novos anúncios

Solução de problemas

Erro "No module named 'pydub'"

Erro "No module named 'faster_whisper'"

Erro de compilação com av/ctypes

Vídeo não baixa

Transcrição falha

Estrutura do projeto

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages