Green Deck

AI-Powered Intelligent Flashcard Generator

English

Overview

Green Deck is an open-source AI-powered flashcard generator that automatically creates high-quality study cards from text, PDFs, and documents. It integrates seamlessly with Anki for spaced repetition learning and supports multiple LLM providers including local models via Ollama.

Why Green Deck?

Smart Generation: Uses LLMs to create both Basic and Cloze deletion cards
Quality Filtering: Multi-stage pipeline ensures only high-quality cards reach your deck
Local-First: Run entirely offline with Ollama, or use cloud providers (OpenAI, Perplexity)
Direct Anki Sync: Upload cards directly to Anki without manual import/export
Document Support: Extract text from PDFs, Word, PowerPoint, Excel, and images (OCR)

Features

Flashcard Generation

Multiple Card Types: Basic (Q&A) and Cloze deletion ({{c1::answer}})
Multi-Provider LLM Support:
- Ollama (local, free)
- OpenAI (GPT-4, GPT-3.5)
- Perplexity (Sonar models)
Quality Pipeline:
- Source validation (ensures cards match source text)
- Content relevance filtering
- Quality scoring algorithm
- Language detection (PT, EN, ES)
Card Rewriting: Densify, simplify, or split cards with AI assistance

Text Analysis

Semantic Chunking: Intelligent text segmentation using embeddings
Topic Segmentation: Automatic detection of definitions, examples, concepts, formulas, procedures, and comparisons
Visual Highlighting: Color-coded topic overlay in the editor

Document Processing

Supported Formats:
- PDF files
- Microsoft Office (Word, PowerPoint, Excel)
- Markup (HTML, Markdown, AsciiDoc)
- Images with OCR (PNG, JPG, TIFF, BMP)
Page Selection: Preview and extract specific pages
Quality Levels: Raw, cleaned, or LLM-refined extraction

Anki Integration

Deck Management: List, create, and manage decks
Card Operations: Add, update, suspend, and bulk-select cards
Field Migration: Safely move content between note type layouts
Card Translation: Translate cards using LLM with language detection

Dashboard & Analytics

Real-Time Statistics: Card generation metrics and deck performance
Visualizations: Charts, KPIs, and trend analysis
History Tracking: Browse past analyses and generated cards

Tech Stack

Layer	Technology
Backend	FastAPI, Python 3.11+, Uvicorn
Frontend	Vue 3, Vite, PrimeVue, Quill Editor
Database	DuckDB (serverless SQL)
AI/ML	Ollama, OpenAI API, Perplexity API
Document Processing	Docling (multi-format extraction)
Anki Bridge	AnkiConnect

Installation

Prerequisites

Python 3.11+
Node.js 20+ (recommended: use nvm)
Ollama (for local LLM)
Anki with AnkiConnect addon

Quick Start

# 1. Clone the repository
git clone https://github.com/Erick-Bryan-Cubas/green-deck.git
cd green-deck

# 2. Install frontend dependencies and build
cd frontend
npm install
npm run build
cd ..

# 3. Create and activate virtual environment
python3 -m venv srs-venv
source srs-venv/bin/activate  # Linux/macOS
# or
.\srs-venv\Scripts\activate  # Windows

# Install Python dependencies 
## 4. 1. PIP
pip install -r requirements.txt
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu124

## Poetry (optional)
sudo apt install python3-poetry # Linux
# or
pipx install poetry # Windows

poetry add fastapi "uvicorn[standard]>=0.32.0" httpx python-dotenv numpy langid duckdb python-multipart
poetry add --group dev ruff pytest pytest-asyncio
poetry source add --priority=explicit pytorch-cu124 https://download.pytorch.org/whl/cu124
poetry add --source pytorch-cu124 torch torchvision torchaudio
poetry install

# 5. Start the application
python run.py

## with Poetry
poetry run python run.py
# Or
poetry self add poetry-plugin-shell
poetry shell
python run.py

The application will be available at http://localhost:3000

Docker Deployment

Quick Start with Docker

# Clone the repository
git clone https://github.com/Erick-Bryan-Cubas/green-deck.git
cd green-deck

# Copy and configure environment
cp .env.example .env
# Edit .env as needed (see Docker configuration below)

# Build and run
docker compose -p green-deck -f docker/docker-compose.yml up -d

# View logs
docker compose -p green-deck -f docker/docker-compose.yml logs -f green-deck

The application will be available at http://localhost:3000

Docker Configuration

When running in Docker, configure these variables in your .env file:

Variable	Docker Value	Description
`OLLAMA_HOST`	`http://host.docker.internal:11434`	Access Ollama on host machine
`ANKI_CONNECT_URL`	`http://host.docker.internal:8765`	Access Anki on host machine
`ENVIRONMENT`	`production`	Set to production for Docker

Document Processing Configuration

Green Deck supports extracting text from various document formats (PDF, DOCX, PPTX, etc.) with configurable timeout limits for large files. You can adjust these timeouts in your .env file:

Variable	Default	Description
`DOCUMENT_EXTRACTION_TIMEOUT`	`180`	Maximum time (seconds) for full document extraction (3 minutes)
`DOCUMENT_PREVIEW_TIMEOUT`	`90`	Maximum time (seconds) for document preview (90 seconds)

Recommendations:

Small deployments (personal use): 120-180 seconds
Medium deployments (team use): 180-240 seconds
Large files (100+ pages): 300 seconds or use page selection

Tips for large files:

Select specific pages instead of extracting the entire document
Use the "pdfplumber" extractor (faster but less formatting)
Split large documents into smaller files

Real-time Progress: When extracting documents, you'll see a real-time progress bar showing:

Percentage complete (e.g., "45%")
Current status (e.g., "Processing page 23 of 150...")
Cancel button to abort long-running extractions

Running with Ollama Container

To run Ollama as a Docker container alongside Green Deck:

  docker compose -p green-deck -f docker/docker-compose.yml -f docker/docker-compose.ollama.yml up -d

Then pull your models:

docker exec ollama ollama pull qwen2.5:7b
docker exec ollama ollama pull nomic-embed-text

Development with Docker

For development with hot-reload:

docker compose -p green-deck -f docker/docker-compose.yml -f docker/docker-compose.dev.yml up -d

This mounts your local app/ directory for live code changes.

Rebuilding After Updates

After pulling new changes or modifying the code, rebuild the containers to apply updates:

# Rebuild and restart all containers
docker compose -p green-deck -f docker/docker-compose.yml up -d --build

# Or rebuild a specific service
docker compose -p green-deck -f docker/docker-compose.yml build green-deck
docker compose -p green-deck -f docker/docker-compose.yml up -d green-deck

# Force rebuild without cache (useful for major updates)
docker compose -p green-deck -f docker/docker-compose.yml build --no-cache
docker compose -p green-deck -f docker/docker-compose.yml up -d

Data Persistence

Docker volumes are used to persist data:

green-deck-data: DuckDB database and generated files

To backup your data:

docker run --rm -v green-deck-data:/data -v $(pwd):/backup alpine tar czf /backup/green-deck-backup.tar.gz /data

Docker Troubleshooting

Cannot connect to Ollama:

Ensure Ollama is running on your host machine
On Linux, the extra_hosts config in docker/docker-compose.yml handles host.docker.internal
Check firewall settings allow connections from Docker

Cannot connect to Anki:

Ensure Anki is running with AnkiConnect addon installed
AnkiConnect must be configured to accept connections from Docker's IP range

GPU not detected:

Ensure NVIDIA Container Toolkit is installed
Verify with: docker run --rm --gpus all nvidia/cuda:12.4.0-base-ubuntu22.04 nvidia-smi

Ollama Setup

# Pull the models you want to use
# Check available models at https://ollama.ai/library

# (Optional) Create custom flashcard model
ollama create qwen-flashcard -f models/qwen_flashcard_finetuned/Modelfile

Environment Variables

Variable	Description	Default
`OLLAMA_HOST`	Ollama server URL	`http://localhost:11434`
`OLLAMA_MODEL`	Generation model	`qwen-flashcard`
`OLLAMA_ANALYSIS_MODEL`	Analysis/embedding model	`nomic-embed-text`
`ANKI_CONNECT_URL`	AnkiConnect URL	`http://localhost:8765`
`PORT`	Server port	`3000`

Usage

Basic Workflow

Input Text: Paste or type text in the editor, or upload a document
Analyze: Click "Analyze" to segment text into topics
Generate: Select text and click "Generate Cards"
Review: Preview generated cards and filter as needed
Export: Upload directly to Anki or copy to clipboard

Using Cloud Providers

Add your API keys in the settings panel:

OpenAI: Enter your API key for GPT-4/GPT-3.5 access
Perplexity: Enter your API key for Sonar model access

API Reference

Card Generation

POST /api/generate-cards-stream - Generate flashcards with streaming
POST /api/analyze-text-stream - Analyze text with embeddings
POST /api/segment-topics - Segment text into topics
POST /api/rewrite-card - Rewrite card (densify/simplify/split)

Documents

POST /api/documents/extract - Extract text from document
POST /api/documents/preview-pages - Preview document pages

Anki

GET /api/anki-decks - List all decks
POST /api/upload-to-anki - Upload cards to deck
POST /api/anki-translate - Translate cards

Health

GET /api/health - System health check
WS /ws/status - WebSocket for real-time status

Contributing

Contributions are welcome! Please feel free to submit a Pull Request.

Fork the repository
Create your feature branch (git checkout -b feature/amazing-feature)
Commit your changes (git commit -m 'Add amazing feature')
Push to the branch (git push origin feature/amazing-feature)
Open a Pull Request

License

This project is licensed under the MIT License - see the LICENSE file for details.

Português

Visão Geral

Green Deck é um gerador de flashcards open-source com inteligência artificial que cria automaticamente cartões de estudo de alta qualidade a partir de texto, PDFs e documentos. Integra-se perfeitamente com o Anki para aprendizado por repetição espaçada e suporta múltiplos provedores de LLM, incluindo modelos locais via Ollama.

Por que Green Deck?

Geração Inteligente: Usa LLMs para criar cartões Básicos e Cloze
Filtragem de Qualidade: Pipeline multi-estágio garante que apenas cartões de alta qualidade cheguem ao seu deck
Local-First: Execute totalmente offline com Ollama, ou use provedores cloud (OpenAI, Perplexity)
Sincronização Direta com Anki: Envie cartões diretamente para o Anki sem importação/exportação manual
Suporte a Documentos: Extraia texto de PDFs, Word, PowerPoint, Excel e imagens (OCR)

Funcionalidades

Geração de Flashcards

Múltiplos Tipos de Cartão: Básico (Pergunta/Resposta) e Cloze ({{c1::resposta}})
Suporte Multi-Provedor LLM:
- Ollama (local, gratuito)
- OpenAI (GPT-4, GPT-3.5)
- Perplexity (modelos Sonar)
Pipeline de Qualidade:
- Validação de fonte (garante que cartões correspondam ao texto fonte)
- Filtragem de relevância de conteúdo
- Algoritmo de pontuação de qualidade
- Detecção de idioma (PT, EN, ES)
Reescrita de Cartões: Densifique, simplifique ou divida cartões com assistência de IA

Análise de Texto

Chunking Semântico: Segmentação inteligente de texto usando embeddings
Segmentação de Tópicos: Detecção automática de definições, exemplos, conceitos, fórmulas, procedimentos e comparações
Destaque Visual: Sobreposição de tópicos com cores no editor

Processamento de Documentos

Formatos Suportados:
- Arquivos PDF
- Microsoft Office (Word, PowerPoint, Excel)
- Markup (HTML, Markdown, AsciiDoc)
- Imagens com OCR (PNG, JPG, TIFF, BMP)
Seleção de Páginas: Visualize e extraia páginas específicas
Níveis de Qualidade: Extração bruta, limpa ou refinada por LLM

Integração com Anki

Gerenciamento de Decks: Liste, crie e gerencie decks
Operações com Cartões: Adicione, atualize, suspenda e selecione cartões em massa
Migração de Campos: Mova conteúdo entre layouts de tipos de nota com segurança
Tradução de Cartões: Traduza cartões usando LLM com detecção de idioma

Dashboard e Análises

Estatísticas em Tempo Real: Métricas de geração de cartões e desempenho de decks
Visualizações: Gráficos, KPIs e análise de tendências
Histórico: Navegue por análises e cartões gerados anteriormente

Stack Tecnológico

Camada	Tecnologia
Backend	FastAPI, Python 3.11+, Uvicorn
Frontend	Vue 3, Vite, PrimeVue, Quill Editor
Banco de Dados	DuckDB (SQL serverless)
IA/ML	Ollama, OpenAI API, Perplexity API
Processamento de Documentos	Docling (extração multi-formato)
Bridge Anki	AnkiConnect

Instalação

Pré-requisitos

Python 3.11+
Node.js 20+ (recomendado: use nvm)
Ollama (para LLM local)
Anki com addon AnkiConnect

Início Rápido

# 1. Clone o repositório
git clone https://github.com/Erick-Bryan-Cubas/green-deck.git
cd green-deck

# 2. Instale as dependências do frontend e faça o build
cd frontend
npm install
npm run build
cd ..

# 3. Crie e ative o ambiente virtual
python3 -m venv srs-venv
source srs-venv/bin/activate  # Linux/macOS
# ou
.\srs-venv\Scripts\activate  # Windows

# Instale as dependências Python 
## 4. 1. PIP
pip install -r requirements.txt
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu124

## Poetry (opcional)
sudo apt install python3-poetry # Linux
# ou
pipx install poetry # Windows

poetry add fastapi "uvicorn[standard]>=0.32.0" httpx python-dotenv numpy langid duckdb python-multipart
poetry add --group dev ruff pytest pytest-asyncio
poetry source add --priority=explicit pytorch-cu124 https://download.pytorch.org/whl/cu124
poetry add --source pytorch-cu124 torch torchvision torchaudio
poetry install

# 5. Inicie a aplicação
python run.py

## com Poetry
poetry run python run.py
# Ou
poetry self add poetry-plugin-shell
poetry shell
python run.py

A aplicação estará disponível em http://localhost:3000

Deploy com Docker

Início Rápido com Docker

# Clone o repositório
git clone https://github.com/Erick-Bryan-Cubas/green-deck.git
cd green-deck

# Copie e configure o ambiente
cp .env.example .env
# Edite o .env conforme necessário (veja configuração Docker abaixo)

# Build e execução
docker compose -f docker/docker-compose.yml up -d --build

# Ver logs
docker compose -f docker/docker-compose.yml logs -f green-deck

A aplicação estará disponível em http://localhost:3000

Configuração Docker

Ao rodar com Docker, configure estas variáveis no seu arquivo .env:

Variável	Valor Docker	Descrição
`OLLAMA_HOST`	`http://host.docker.internal:11434`	Acessa Ollama na máquina host
`ANKI_CONNECT_URL`	`http://host.docker.internal:8765`	Acessa Anki na máquina host
`ENVIRONMENT`	`production`	Define como produção para Docker

Executando com Container Ollama

Para rodar Ollama como container Docker junto com Green Deck:

docker compose -f docker/docker-compose.yml -f docker/docker-compose.ollama.yml up -d

Depois baixe seus modelos:

docker exec ollama ollama pull qwen2.5:7b
docker exec ollama ollama pull nomic-embed-text

Desenvolvimento com Docker

Para desenvolvimento com hot-reload:

docker compose -p green-deck -f docker/docker-compose.yml -f docker/docker-compose.dev.yml up -d

Isso monta seu diretório local app/ para mudanças em tempo real.

Reconstruir Após Atualizações

Após baixar novas mudanças ou modificar o código, reconstrua os containers para aplicar as atualizações:

# Reconstruir e reiniciar todos os containers
docker compose -p green-deck -f docker/docker-compose.yml up -d --build

# Ou reconstruir um serviço específico
docker compose -p green-deck -f docker/docker-compose.yml build green-deck
docker compose -p green-deck -f docker/docker-compose.yml up -d green-deck

# Forçar reconstrução sem cache (útil para atualizações maiores)
docker compose -p green-deck -f docker/docker-compose.yml build --no-cache
docker compose -p green-deck -f docker/docker-compose.yml up -d

Persistência de Dados

Volumes Docker são usados para persistir dados:

green-deck-data: Banco DuckDB e arquivos gerados

Para fazer backup dos dados:

docker run --rm -v green-deck-data:/data -v $(pwd):/backup alpine tar czf /backup/green-deck-backup.tar.gz /data

Solução de Problemas Docker

Não conecta ao Ollama:

Certifique-se que Ollama está rodando na máquina host
No Linux, a config extra_hosts no docker/docker-compose.yml gerencia o host.docker.internal
Verifique se o firewall permite conexões do Docker

Não conecta ao Anki:

Certifique-se que Anki está rodando com addon AnkiConnect instalado
AnkiConnect deve estar configurado para aceitar conexões da faixa IP do Docker

GPU não detectada:

Certifique-se que NVIDIA Container Toolkit está instalado
Verifique com: docker run --rm --gpus all nvidia/cuda:12.4.0-base-ubuntu22.04 nvidia-smi

Configuração do Ollama

# Baixe os modelos que deseja usar
# Confira os modelos disponíveis em https://ollama.ai/library

# (Opcional) Crie modelo personalizado para flashcards
ollama create qwen-flashcard -f models/qwen_flashcard_finetuned/Modelfile

Variáveis de Ambiente

Variável	Descrição	Padrão
`OLLAMA_HOST`	URL do servidor Ollama	`http://localhost:11434`
`OLLAMA_MODEL`	Modelo de geração	`qwen-flashcard`
`OLLAMA_ANALYSIS_MODEL`	Modelo de análise/embedding	`nomic-embed-text`
`ANKI_CONNECT_URL`	URL do AnkiConnect	`http://localhost:8765`
`PORT`	Porta do servidor	`3000`

Como Usar

Fluxo Básico

Insira Texto: Cole ou digite texto no editor, ou faça upload de um documento
Analise: Clique em "Analisar" para segmentar o texto em tópicos
Gere: Selecione o texto e clique em "Gerar Cartões"
Revise: Visualize os cartões gerados e filtre conforme necessário
Exporte: Envie diretamente para o Anki ou copie para a área de transferência

Usando Provedores Cloud

Adicione suas chaves de API no painel de configurações:

OpenAI: Insira sua chave de API para acesso ao GPT-4/GPT-3.5
Perplexity: Insira sua chave de API para acesso aos modelos Sonar

Referência da API

Geração de Cartões

POST /api/generate-cards-stream - Gerar flashcards com streaming
POST /api/analyze-text-stream - Analisar texto com embeddings
POST /api/segment-topics - Segmentar texto em tópicos
POST /api/rewrite-card - Reescrever cartão (densificar/simplificar/dividir)

Documentos

POST /api/documents/extract - Extrair texto de documento
POST /api/documents/preview-pages - Visualizar páginas do documento

Anki

GET /api/anki-decks - Listar todos os decks
POST /api/upload-to-anki - Enviar cartões para deck
POST /api/anki-translate - Traduzir cartões

Saúde

GET /api/health - Verificação de saúde do sistema
WS /ws/status - WebSocket para status em tempo real

Contribuindo

Contribuições são bem-vindas! Sinta-se à vontade para enviar um Pull Request.

Faça um fork do repositório
Crie sua branch de feature (git checkout -b feature/recurso-incrivel)
Faça commit das suas alterações (git commit -m 'Adiciona recurso incrível')
Faça push para a branch (git push origin feature/recurso-incrivel)
Abra um Pull Request

Licença

Este projeto está licenciado sob a Licença MIT - veja o arquivo LICENSE para detalhes.

Made with 💚 for the learning community

Name		Name	Last commit message	Last commit date
Latest commit History 161 Commits
.github		.github
app		app
docker		docker
docs/rules		docs/rules
frontend		frontend
ollama		ollama
scripts		scripts
tests		tests
.dockerignore		.dockerignore
.env.example		.env.example
.gitignore		.gitignore
CHANGELOG.md		CHANGELOG.md
LICENSE		LICENSE
README.md		README.md
poetry.lock		poetry.lock
pyproject.toml		pyproject.toml
requirements.txt		requirements.txt
run.py		run.py

Uh oh!

License

Erick-Bryan-Cubas/green-deck

Folders and files

Latest commit

History

Repository files navigation

Green Deck

English

Overview

Why Green Deck?

Features

Flashcard Generation

Text Analysis

Document Processing

Anki Integration

Dashboard & Analytics

Tech Stack

Installation

Prerequisites

Quick Start

Docker Deployment

Quick Start with Docker

Docker Configuration

Document Processing Configuration

Running with Ollama Container

Development with Docker

Rebuilding After Updates

Data Persistence

Docker Troubleshooting

Ollama Setup

Environment Variables

Usage

Basic Workflow

Using Cloud Providers

API Reference

Card Generation

Documents

Anki

Health

Contributing

License

Português

Visão Geral

Por que Green Deck?

Funcionalidades

Geração de Flashcards

Análise de Texto

Processamento de Documentos

Integração com Anki

Dashboard e Análises

Stack Tecnológico

Instalação

Pré-requisitos

Início Rápido

Deploy com Docker

Início Rápido com Docker

Configuração Docker

Executando com Container Ollama

Desenvolvimento com Docker

Reconstruir Após Atualizações

Persistência de Dados

Solução de Problemas Docker

Configuração do Ollama

Variáveis de Ambiente

Como Usar

Fluxo Básico

Usando Provedores Cloud

Referência da API

Geração de Cartões

Documentos

Anki

Saúde

Contribuindo

Licença

About

Topics

Resources

License

Uh oh!

Packages