Retrieval-Augmented Generation

This project implements a Retrieval-Augmented Generation (RAG) workflow that uses,

🚀 Features

This RAG system is built with a hybrid retrieval architecture combining multiple search strategies:

ChromaDB Vector Search: Retrieves documents based on semantic similarity using dense embeddings from a Chroma collection.
BM25 Lexical Search: Identifies relevant documents using traditional keyword-based matching with BM25 scoring.
Hybrid Retrieval: Integrates results from both semantic and lexical searches using Reciprocal Rank Fusion (RRF) for balanced and robust retrieval.

Create a .env file in the project root:

TAVILY_API_KEY=your_tavily_api_key
LANGFUSE_PUBLIC_KEY=your_langfuse_public_key
LANGFUSE_SECRET_KEY=your_langfuse_secret_key

Name		Name	Last commit message	Last commit date
Latest commit History 22 Commits
.idea		.idea
config		config
notebooks		notebooks
src		src
utils		utils
.gitignore		.gitignore
README.md		README.md
environment old.yaml		environment old.yaml
environment.yaml		environment.yaml
ingest.py		ingest.py
main.py		main.py