Skip to content

Latest commit

 

History

History
91 lines (76 loc) · 2.93 KB

File metadata and controls

91 lines (76 loc) · 2.93 KB

Status projektu: Content Context Vector Analyzer

Data: 2025-12-22

Co zostało zrobione

Struktura projektu (100%)

context-vector-embeddings/
├── app.py                      # Główna aplikacja Streamlit
├── requirements.txt            # Zależności (zainstalowane)
├── CLAUDE.md                   # Instrukcje projektu
├── config/
│   └── settings.py             # Progi similarity, konfiguracja
├── core/
│   ├── models.py               # Dataclasses (ExtractedContent, etc.)
│   ├── parsers/
│   │   ├── html_parser.py      # Parser HTML (BeautifulSoup)
│   │   └── markdown_parser.py  # Parser Markdown
│   ├── embeddings/
│   │   └── ollama_client.py    # Klient Ollama API
│   ├── analysis/
│   │   ├── similarity.py       # Cosine similarity
│   │   └── checklist_evaluator.py  # CV-001 do CV-019
│   ├── suggestions/
│   │   └── llm_suggester.py    # Sugestie LLM
│   └── storage/
│       ├── duckdb_store.py     # DuckDB vector store
│       └── cache_manager.py    # Cache z TTL
├── visualization/
│   ├── scatter_plot.py         # 2D PCA/UMAP
│   ├── heatmap.py              # Similarity matrix
│   └── hierarchy_tree.py       # Drzewo hierarchii
└── docs/
    └── Content Context Vector Checklist.md

Funkcje zaimplementowane

  • Parser HTML/Markdown
  • Klient Ollama (embeddings + LLM)
  • Wybór modeli z dostępnych w Ollama (selectbox)
  • Analiza similarity (cosine)
  • Checklist evaluator (CV-001 do CV-019)
  • Wizualizacje (scatter, heatmap, tree)
  • Sugestie LLM
  • DuckDB vector store
  • Cache z czyszczeniem
  • Tryb debug

Co wymaga naprawy

Aplikacja uruchamia się ale sypie błędami. Prawdopodobne problemy:

  1. Import errors (ścieżki modułów)
  2. Brak __init__.py w niektórych katalogach
  3. Możliwe problemy z typami w numpy/pandas

Jak kontynuować

Uruchomienie

cd /Users/romek/Documents/Cline/context-vector-embeddings
source venv/bin/activate
streamlit run app.py

Debug

  1. Włącz "Tryb Debug" w sidebar
  2. Sprawdź logi w konsoli gdzie uruchomiłeś streamlit
  3. Błędy pojawiają się przy kliknięciu "Analizuj"

Kluczowe pliki do sprawdzenia

  • app.py - główna logika
  • core/models.py - dataclasses
  • core/parsers/markdown_parser.py - parser MD (będziesz testować z MD)

Kontekst dla nowej konwersacji

Kontynuuję projekt Content Context Vector Analyzer.

Projekt: /Users/romek/Documents/Cline/context-vector-embeddings
Cel: Aplikacja Streamlit do analizy Content Context Vector z embeddingami Ollama

Status: Struktura zaimplementowana, aplikacja uruchamia się ale ma błędy runtime.

Przeczytaj:
1. CLAUDE.md - instrukcje projektu
2. STATUS.md - ten plik
3. app.py - główna aplikacja

Zadanie: Debug i napraw błędy. Testuj z plikami Markdown.