Hybrid Search + Recommendation System (TensorFlow / TFRS) — with Ranking + CLIP + Eval + Config

This repo implements a two-stage hybrid retrieval system on the Yelp Open Dataset:

Stage 1 (Retrieval): Two-tower model (TFRS Retrieval)
Stage 2 (Ranking): Feature-rich ranker (TFRS Ranking) re-scores top-N candidates
Optional Multimodal: Precomputed CLIP image embeddings wired into candidate and ranking models
Evaluation: Recall@K and NDCG@K scripts for retrieval-only and reranked output
Reproducibility: YAML-based experiment config + global seeding

What “Hybrid” means here

You can run:

Search-only: user_id="ANON" + query_text="ramen"
Rec-only: user_id=REAL_USER + query_text=""
Hybrid: user_id=REAL_USER + query_text="late night coffee"

The query tower mixes user embedding + query text embedding; candidate tower mixes business id + business text (+ optional image embedding).

Project structure

hybrid-yelp-recsys/
├── README.md
├── DOCUMENTATION.md
├── requirements.txt
├── train.py
├── configs/
│   └── config.yaml
├── modeling/
│   ├── config_utils.py
│   ├── data_pipeline.py
│   ├── retrieval_model.py
│   ├── ranking_model.py
│   └── hybrid_engine.py
└── scripts/
    ├── compute_clip_embeddings.py
    ├── evaluate_retrieval.py
    ├── evaluate_ranking.py
    └── metrics.py

Setup

pip install -r requirements.txt

Put Yelp files here:

data/yelp/
  yelp_academic_dataset_business.json
  yelp_academic_dataset_review.json
  (optional) yelp_academic_dataset_photo.json

Run: Retrieval + Ranking training (default)

python train.py --config configs/config.yaml

Outputs are written under experiment.output_dir in the config.

Evaluation

Retrieval-only (stage 1):

python scripts/evaluate_retrieval.py --config configs/config.yaml

Full pipeline (retrieval → rerank):

python scripts/evaluate_ranking.py --config configs/config.yaml

CLIP image branch (optional)

Download Yelp photos separately (Yelp provides photos as a separate artifact).
Precompute per-business CLIP embeddings:

python scripts/compute_clip_embeddings.py   --photo_json data/yelp/yelp_academic_dataset_photo.json   --images_dir /path/to/yelp_photos   --out_csv outputs/business_image_embeddings.csv

Enable images in configs/config.yaml:

features:
  use_image_embeddings: true

Run training/eval with:

python train.py --config configs/config.yaml --image_embeddings outputs/business_image_embeddings.csv
python scripts/evaluate_ranking.py --config configs/config.yaml --image_embeddings outputs/business_image_embeddings.csv

Notes / limitations (intentional)

The CLIP step is offline precompute to keep TF training simple and fast.
The evaluation uses leave-last-out (per-user) with binary relevance (held-out item).
This is research-prototype quality: the interfaces are clean, but production hardening is out of scope.

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
api		api
configs		configs
db		db
modeling		modeling
scripts		scripts
.gitignore		.gitignore
DOCUMENTATION.md		DOCUMENTATION.md
README.md		README.md
README_PG.md		README_PG.md
docker-compose.yml		docker-compose.yml
hybrid-yelp-recsys_full_pipeline.ipynb		hybrid-yelp-recsys_full_pipeline.ipynb
requirements.txt		requirements.txt
train.py		train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Hybrid Search + Recommendation System (TensorFlow / TFRS) — with Ranking + CLIP + Eval + Config

What “Hybrid” means here

Project structure

Setup

Run: Retrieval + Ranking training (default)

Evaluation

CLIP image branch (optional)

Notes / limitations (intentional)

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Hybrid Search + Recommendation System (TensorFlow / TFRS) — with Ranking + CLIP + Eval + Config

What “Hybrid” means here

Project structure

Setup

Run: Retrieval + Ranking training (default)

Evaluation

CLIP image branch (optional)

Notes / limitations (intentional)

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages