Skip to content

Conty-App/awesome-ugc-ads-brazil

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

🇧🇷 Awesome UGC Ads Brazil

O primeiro dataset aberto de anúncios UGC em português (pt-BR) — focado em ganchos (hooks), CTAs e estrutura narrativa.

Por que existe?

Não havia um dataset simples e público em pt-BR. Ajuda creators, growth e devs a estudar padrões que funcionam em vídeo curto.

Instalação

  1. Instale as dependências:
pip install -r requirements.txt

O script usa yt-dlp para baixar vídeos e openai-whisper para transcrição. ffmpeg deve estar instalado no sistema.

Como usar

Análise básica

python3 scripts/analyze_hooks.py

Análise por IA (Vercel AI SDK / OpenAI)

  1. Configure a variável de ambiente com sua chave (use .env):
cp env.example .env
# edite .env e coloque sua chave
source .env
  1. Instale dependências Node (uma vez):
npm install
  1. Rode a análise por id do data/ads.jsonl:
npm run analyze -- --id br_001

Ou filtre pelo link do vídeo:

npm run analyze -- --url-contains instagram.com/reel/DNnnsPVu8rv

Parâmetros úteis:

  • --model: modelo OpenAI (padrão: gpt-4o-mini ou OPENAI_MODEL)
  • --temperature: temperatura (padrão: 0.2)
  • --file: caminho customizado para ads.jsonl

O resultado é impresso como JSON no terminal. No modo streaming, o JSON aparece token a token.

Ingestão de novos anúncios

python3 ingest/ingest_url.py --url "https://instagram.com/reel/VIDEO_ID/" --ugc-type review --brand "NomeMarca" --category "beleza" --terms-ok true

Parâmetros:

  • --url: URL do vídeo (Instagram, YouTube, etc.)
  • --ugc-type: Tipo do conteúdo (testimonial, unboxing, review, etc.)
  • --brand: Nome da marca
  • --category: Categoria do produto
  • --terms-ok: Aceitou os termos (true/false)

Solução de problemas

Erro "No module named 'pydub'"

O script usa ffmpeg diretamente agora. Se ainda der erro, instale ffmpeg:

# macOS com Homebrew
brew install ffmpeg

# Ubuntu/Debian
sudo apt install ffmpeg

# Outros sistemas, veja documentação do ffmpeg

Erro "No module named 'faster_whisper'"

Trocamos para openai-whisper porque faster-whisper tinha problemas de compilação. Se der erro de import:

pip uninstall faster-whisper
pip install openai-whisper

Erro de compilação com av/ctypes

Se der erro de compilação relacionado a av ou ctypes, o problema é provavelmente com faster-whisper. Use openai-whisper:

pip uninstall faster-whisper av
pip install openai-whisper

Vídeo não baixa

Verifique se a URL está correta e se yt-dlp consegue acessar. Alguns sites bloqueiam downloads automatizados.

Transcrição falha

Whisper precisa de GPU para ser rápido. Em CPU pode ser lento. Use um modelo menor se precisar:

python3 ingest/ingest_url.py --model tiny --url "..."

Modelos disponíveis: tiny, base, small, medium, large

Estrutura do projeto

data/
  ads.jsonl          # Dataset principal
  taxonomy.md        # Categorias e tipos

ingest/
  ingest_url.py      # Script de ingestão

scripts/
  analyze_hooks.py   # Análise básica
  validate.py        # Validação do dataset

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors