Skip to content

AI-powered autonomous equity research agent. Multi-source analysis (Yahoo Finance, SEC 10-K, Reddit, news) with LangGraph orchestration, hybrid RAG, and real-time market data. Generates professional research reports via Telegram bot or REST API. Deployed on Azure Container Apps.

License

Notifications You must be signed in to change notification settings

nolancacheux/Rag-Equity-Research-Agent

Repository files navigation

Equity Research Agent

AI-powered autonomous quantitative analyst

CI Python 3.11+ uv License: MIT


Author: Nolan Cacheux Β· LinkedIn


Overview

An autonomous AI agent that performs professional-grade equity research by aggregating and analyzing multiple data sources in real-time. Built with LangGraph for orchestration, hybrid RAG for document analysis, and deployed on Azure Container Apps.

Demo

Architecture

Azure Dashboard

What It Does

User: "Analyze NVIDIA's position. Compare P/E with AMD, check 10-K for China risks."

The agent autonomously:

  1. Fetches real-time market data (price, P/E, market cap)
  2. Downloads and searches SEC 10-K filings using hybrid RAG
  3. Analyzes earnings call transcripts
  4. Aggregates social sentiment from Reddit
  5. Compares metrics with industry peers
  6. Generates a professional research report

Architecture

πŸ—οΈ High-Level System Design (click to expand)
β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
β”‚                              USER INTERFACES                                 β”‚
β”œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€
β”‚                                                                              β”‚
β”‚     β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”              β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”                          β”‚
β”‚     β”‚   Telegram   β”‚              β”‚   REST API   β”‚                          β”‚
β”‚     β”‚     Bot      β”‚              β”‚   (FastAPI)  β”‚                          β”‚
β”‚     β””β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”€β”˜              β””β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”€β”˜                          β”‚
β”‚            β”‚                             β”‚                                   β”‚
β”‚            β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜                                   β”‚
β”‚                          β–Ό                                                   β”‚
β”‚            β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”                                       β”‚
β”‚            β”‚    LangGraph Engine     β”‚                                       β”‚
β”‚            β”‚   (Research Pipeline)   β”‚                                       β”‚
β”‚            β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜                                       β”‚
β”‚                          β”‚                                                   β”‚
β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”Όβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜
                           β”‚
β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”Όβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
β”‚                          β–Ό            AGENT LAYER                            β”‚
β”œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€
β”‚                                                                              β”‚
β”‚  β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”  β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”  β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”  β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”        β”‚
β”‚  β”‚   Market    β”‚  β”‚  Document   β”‚  β”‚    News     β”‚  β”‚  Earnings   β”‚        β”‚
β”‚  β”‚    Data     β”‚  β”‚   Reader    β”‚  β”‚  Sentiment  β”‚  β”‚    Call     β”‚        β”‚
β”‚  β”‚   Agent     β”‚  β”‚   Agent     β”‚  β”‚   Agent     β”‚  β”‚   Agent     β”‚        β”‚
β”‚  β””β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”˜  β””β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”˜  β””β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”˜  β””β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”˜        β”‚
β”‚         β”‚                β”‚                β”‚                β”‚                β”‚
β”‚  β”Œβ”€β”€β”€β”€β”€β”€β”΄β”€β”€β”€β”€β”€β”€β”  β”Œβ”€β”€β”€β”€β”€β”€β”΄β”€β”€β”€β”€β”€β”€β”  β”Œβ”€β”€β”€β”€β”€β”€β”΄β”€β”€β”€β”€β”€β”€β”  β”Œβ”€β”€β”€β”€β”€β”€β”΄β”€β”€β”€β”€β”€β”€β”        β”‚
β”‚  β”‚   Reddit    β”‚  β”‚    Peer     β”‚  β”‚    Risk     β”‚  β”‚ Synthesizer β”‚        β”‚
β”‚  β”‚  Sentiment  β”‚  β”‚ Comparison  β”‚  β”‚   Scoring   β”‚  β”‚   Agent     β”‚        β”‚
β”‚  β”‚   Agent     β”‚  β”‚   Agent     β”‚  β”‚   Agent     β”‚  β”‚             β”‚        β”‚
β”‚  β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜  β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜  β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜  β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜        β”‚
β”‚                                                                              β”‚
β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜
                           β”‚
β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”Όβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
β”‚                          β–Ό            DATA LAYER                             β”‚
β”œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€
β”‚                                                                              β”‚
β”‚  β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”  β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”  β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”  β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”        β”‚
β”‚  β”‚   Yahoo     β”‚  β”‚     SEC     β”‚  β”‚   Reddit    β”‚  β”‚ DuckDuckGo  β”‚        β”‚
β”‚  β”‚  Finance    β”‚  β”‚   EDGAR     β”‚  β”‚     API     β”‚  β”‚   Search    β”‚        β”‚
β”‚  β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜  β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜  β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜  β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜        β”‚
β”‚                                                                              β”‚
β”‚  β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”        β”‚
β”‚  β”‚                    RAG Pipeline (Hybrid Search)                  β”‚        β”‚
β”‚  β”‚  β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”    β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”    β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”    β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”      β”‚        β”‚
β”‚  β”‚  β”‚ Chunker β”‚ -> β”‚  BM25   β”‚ -> β”‚  Dense  β”‚ -> β”‚Reranker β”‚      β”‚        β”‚
β”‚  β”‚  β”‚         β”‚    β”‚ Sparse  β”‚    β”‚Embeddingβ”‚    β”‚  (RRF)  β”‚      β”‚        β”‚
β”‚  β”‚  β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜    β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜    β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜    β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜      β”‚        β”‚
β”‚  β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜        β”‚
β”‚                                                                              β”‚
β”‚  β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”  β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”  β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”                         β”‚
β”‚  β”‚   Qdrant    β”‚  β”‚  In-Memory  β”‚  β”‚    Groq     β”‚                         β”‚
β”‚  β”‚ Vector DB   β”‚  β”‚   Cache     β”‚  β”‚  LLM API    β”‚                         β”‚
β”‚  β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜  β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜  β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜                         β”‚
β”‚                                                                              β”‚
β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜
πŸ”„ LangGraph Research Pipeline (click to expand)
                              β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
                              β”‚    START    β”‚
                              β””β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”˜
                                     β”‚
                                     β–Ό
                         β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
                         β”‚    Parse Query        β”‚
                         β”‚  (Extract tickers,    β”‚
                         β”‚   identify intent)    β”‚
                         β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜
                                     β”‚
                                     β–Ό
                         β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
                         β”‚   Market Data Agent   β”‚
                         β”‚  (Fetch quotes,       β”‚
                         β”‚   financials)         β”‚
                         β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜
                                     β”‚
                        β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”΄β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
                        β–Ό                         β–Ό
            β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”   β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
            β”‚  Document Analysis? β”‚   β”‚   Skip Documents    β”‚
            β”‚        YES          β”‚   β”‚        NO           β”‚
            β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜   β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜
                       β”‚                         β”‚
                       β–Ό                         β”‚
            β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”              β”‚
            β”‚  Document Reader    β”‚              β”‚
            β”‚  (SEC 10-K RAG)     β”‚              β”‚
            β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜              β”‚
                       β”‚                         β”‚
                       β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜
                                    β”‚
                                    β–Ό
                    β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
                    β”‚      Parallel Analysis        β”‚
                    β”œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€
                    β”‚  β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”  β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”    β”‚
                    β”‚  β”‚  News   β”‚  β”‚ Reddit  β”‚    β”‚
                    β”‚  β”‚Sentimentβ”‚  β”‚Sentimentβ”‚    β”‚
                    β”‚  β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜  β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜    β”‚
                    β”‚  β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”  β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”    β”‚
                    β”‚  β”‚Earnings β”‚  β”‚  Peer   β”‚    β”‚
                    β”‚  β”‚  Calls  β”‚  β”‚Compare  β”‚    β”‚
                    β”‚  β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜  β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜    β”‚
                    β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜
                                    β”‚
                                    β–Ό
                         β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
                         β”‚   Synthesizer Agent   β”‚
                         β”‚  (Generate report,    β”‚
                         β”‚   executive summary)  β”‚
                         β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜
                                     β”‚
                                     β–Ό
                              β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
                              β”‚     END     β”‚
                              β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜
☁️ Azure Deployment Architecture (click to expand)
β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
β”‚                              AZURE CLOUD                                     β”‚
β”œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€
β”‚                                                                              β”‚
β”‚    β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”       β”‚
β”‚    β”‚              Container Apps Environment                         β”‚       β”‚
β”‚    β”‚                  (equity-research-env)                          β”‚       β”‚
β”‚    β”‚  β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”  β”‚       β”‚
β”‚    β”‚  β”‚                                                          β”‚  β”‚       β”‚
β”‚    β”‚  β”‚  β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”  β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”  β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”     β”‚  β”‚       β”‚
β”‚    β”‚  β”‚  β”‚  API App    β”‚  β”‚  Bot App    β”‚  β”‚   Qdrant    β”‚     β”‚  β”‚       β”‚
β”‚    β”‚  β”‚  β”‚  (FastAPI)  β”‚  β”‚ (Telegram)  β”‚  β”‚ (Vector DB) β”‚     β”‚  β”‚       β”‚
β”‚    β”‚  β”‚  β”‚  Port 8000  β”‚  β”‚  Polling    β”‚  β”‚  Port 6333  β”‚     β”‚  β”‚       β”‚
β”‚    β”‚  β”‚  β””β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”˜  β””β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”˜  β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜     β”‚  β”‚       β”‚
β”‚    β”‚  β”‚         β”‚                β”‚                              β”‚  β”‚       β”‚
β”‚    β”‚  β”‚         β”‚    Internal    β”‚                              β”‚  β”‚       β”‚
β”‚    β”‚  β”‚         │◄──  Network  ───                              β”‚  β”‚       β”‚
β”‚    β”‚  β”‚         β”‚                β”‚                              β”‚  β”‚       β”‚
β”‚    β”‚  β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”Όβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”Όβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜  β”‚       β”‚
β”‚    β”‚            β”‚                β”‚                                  β”‚       β”‚
β”‚    β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”Όβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”Όβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜       β”‚
β”‚                 β”‚                β”‚                                           β”‚
β”‚    β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”Όβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”Όβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”       β”‚
β”‚    β”‚            β”‚                β”‚                                   β”‚       β”‚
β”‚    β”‚  β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β–Όβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”  β”Œβ”€β”€β–Όβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”                  β”‚       β”‚
β”‚    β”‚  β”‚ Container Registryβ”‚  β”‚   Key Vault      β”‚                  β”‚       β”‚
β”‚    β”‚  β”‚ (equityresearchacrβ”‚  β”‚ (Secrets)        β”‚                  β”‚       β”‚
β”‚    β”‚  β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜  β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜                  β”‚       β”‚
β”‚    β”‚                                                                β”‚       β”‚
β”‚    β”‚  β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”  β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”                  β”‚       β”‚
β”‚    β”‚  β”‚  Log Analytics    β”‚  β”‚  Storage Account β”‚                  β”‚       β”‚
β”‚    β”‚  β”‚  (Monitoring)     β”‚  β”‚  (Terraform)     β”‚                  β”‚       β”‚
β”‚    β”‚  β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜  β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜                  β”‚       β”‚
β”‚    β”‚                                                                β”‚       β”‚
β”‚    β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜       β”‚
β”‚                                                                              β”‚
β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜

                                    β”‚
         β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”Όβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
         β”‚                          β”‚                          β”‚
         β–Ό                          β–Ό                          β–Ό
β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”      β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”      β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
β”‚  Telegram API   β”‚      β”‚    Groq API     β”‚      β”‚  External Data  β”‚
β”‚                 β”‚      β”‚   (LLM/Free)    β”‚      β”‚  (Yahoo, SEC)   β”‚
β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜      β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜      β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜
πŸš€ CI/CD Pipeline (click to expand)
β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”     β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”     β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”     β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
β”‚     Push     │────>β”‚     Lint     │────>β”‚    Tests     │────>β”‚   Security   β”‚
β”‚   to main    β”‚     β”‚    (Ruff)    β”‚     β”‚   (pytest)   β”‚     β”‚   (Bandit)   β”‚
β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜     β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜     β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜     β””β”€β”€β”€β”€β”€β”€β”¬β”€β”€β”€β”€β”€β”€β”€β”˜
                                                                       β”‚
                                                                       β–Ό
β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”     β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”     β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”     β”Œβ”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”
β”‚   Deploy     β”‚<────│  Push to     β”‚<────│    Build     β”‚<────│  Terraform   β”‚
β”‚  to Azure    β”‚     β”‚    ACR       β”‚     β”‚   Images     β”‚     β”‚   Validate   β”‚
β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜     β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜     β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜     β””β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”€β”˜

Features

Category Feature Description
Analysis Multi-source Research Aggregates Yahoo Finance, SEC filings, news, social sentiment
Analysis Hybrid RAG BM25 sparse + dense embeddings with RRF fusion
Analysis DCF Valuation Discounted cash flow fair value calculation
Analysis Risk Scoring 10-K risk factor analysis (1-10 scale)
Data Real-time Quotes Live prices, P/E, market cap, volume
Data SEC 10-K/10-Q Automatic download and indexing
Data Earnings Calls Transcript analysis and summarization
Social Reddit Sentiment WSB, r/stocks, r/investing aggregation
Tools Peer Comparison Side-by-side competitor metrics
Tools Watchlist Personal stock tracking with alerts
Tools Price Alerts Notifications on price/P/E thresholds

Quick Start

Prerequisites

  • Python 3.11+
  • uv package manager
  • Docker & Docker Compose

Installation

# Clone repository
git clone https://github.com/nolancacheux/Rag-Equity-Research-Agent.git
cd Rag-Equity-Research-Agent

# Install dependencies with uv
uv venv && source .venv/bin/activate
uv pip install -e ".[dev]"

# Configure environment
cp .env.example .env
# Edit .env: Add GROQ_API_KEY (free at console.groq.com)

Run Locally

# Start infrastructure
docker-compose up -d qdrant

# Start API server
uvicorn src.api.main:app --reload --port 8000

# Start Telegram bot (separate terminal)
python -m src.telegram.bot

Development

# Run tests with coverage
uv run pytest --cov=src --cov-report=html

# Lint and format
uv run ruff check --fix src/
uv run ruff format src/

# Type checking
uv run mypy src/

API Reference

πŸ“‘ Core Endpoints
Method Endpoint Description
GET /health Health check
GET /quote/{ticker} Real-time stock quote
GET /compare/{tickers} Compare multiple stocks
POST /analyze Full research analysis
πŸ”§ Analysis Tools
Method Endpoint Description
GET /dcf/{ticker} DCF fair value calculation
GET /risk/{ticker} 10-K risk score (1-10)
GET /peers/{ticker} Peer comparison
GET /reddit/{ticker} Reddit sentiment
GET /earnings/{ticker} Earnings call summary
πŸ“‹ Watchlist
Method Endpoint Description
GET /watchlist/{user_id} Get user's watchlist
POST /watchlist/{user_id}/add Add stock to watchlist
POST /watchlist/{user_id}/alert Create price alert

Telegram Bot Commands

Command Description
/start Welcome message and menu
/q NVDA Quick stock quote
/analyze <query> Full research analysis
/compare NVDA,AMD Compare stocks
/dcf NVDA DCF valuation
/risk NVDA Risk score
/peers NVDA Peer comparison
/watchlist View/manage watchlist
/alert NVDA above 150 Set price alert

Configuration

βš™οΈ Environment Variables
Variable Required Description
GROQ_API_KEY Yes Groq API key (free tier)
TELEGRAM_BOT_TOKEN Yes Telegram bot token
QDRANT_URL No Qdrant URL (default: localhost:6333)
AZURE_OPENAI_* No Azure OpenAI credentials (optional)
LANGCHAIN_API_KEY No LangSmith tracing (optional)

Azure Deployment

Note: Deployment is triggered manually via GitHub Actions (workflow_dispatch).
Go to Actions β†’ Build and Deploy β†’ Run workflow after configuring secrets.

πŸ” GitHub Secrets Required
AZURE_CREDENTIALS          # Service principal JSON
AZURE_CLIENT_ID           # SP client ID
AZURE_CLIENT_SECRET       # SP secret
AZURE_SUBSCRIPTION_ID     # Subscription ID
AZURE_TENANT_ID           # Tenant ID
ACR_LOGIN_SERVER          # equityresearchacr.azurecr.io
ACR_USERNAME              # ACR admin username
ACR_PASSWORD              # ACR admin password
TELEGRAM_BOT_TOKEN        # Bot token
GROQ_API_KEY              # Groq API key
🌍 Deploy with Terraform
cd terraform
terraform init
terraform plan
terraform apply
πŸ’° Estimated Costs
Resource Monthly Cost
Container Apps (Consumption) $0-10
Container Registry (Basic) $5
Log Analytics $0-5
Total ~$5-20

Tech Stack

Layer Technologies
LLM Groq (Llama 3.3 70B), Azure OpenAI
Orchestration LangGraph, LangChain
RAG Qdrant, BM25, Hybrid Search, Reranking
Data Sources Yahoo Finance, SEC EDGAR, Reddit, DuckDuckGo
Backend FastAPI, Pydantic
Bot python-telegram-bot
Infrastructure Docker, Azure Container Apps, Terraform
CI/CD GitHub Actions
Quality uv, Ruff, pytest, Bandit

Project Structure

πŸ“ Directory Layout
Rag-Equity-Research-Agent/
β”œβ”€β”€ src/
β”‚   β”œβ”€β”€ agents/           # LangGraph agents
β”‚   β”‚   β”œβ”€β”€ graph.py      # Main orchestration
β”‚   β”‚   β”œβ”€β”€ market_data.py
β”‚   β”‚   β”œβ”€β”€ document_reader.py
β”‚   β”‚   β”œβ”€β”€ news_sentiment.py
β”‚   β”‚   β”œβ”€β”€ reddit_agent.py
β”‚   β”‚   β”œβ”€β”€ earnings_agent.py
β”‚   β”‚   β”œβ”€β”€ peer_agent.py
β”‚   β”‚   β”œβ”€β”€ risk_agent.py
β”‚   β”‚   └── synthesizer.py
β”‚   β”œβ”€β”€ services/         # Business logic
β”‚   β”‚   β”œβ”€β”€ dcf_valuation.py
β”‚   β”‚   β”œβ”€β”€ risk_scoring.py
β”‚   β”‚   └── watchlist.py
β”‚   β”œβ”€β”€ tools/            # Data fetchers
β”‚   β”‚   β”œβ”€β”€ yfinance_tool.py
β”‚   β”‚   β”œβ”€β”€ sec_edgar_tool.py
β”‚   β”‚   β”œβ”€β”€ search_tool.py
β”‚   β”‚   └── reddit_sentiment_tool.py
β”‚   β”œβ”€β”€ rag/              # RAG pipeline
β”‚   β”‚   β”œβ”€β”€ chunking.py
β”‚   β”‚   β”œβ”€β”€ hybrid_search.py
β”‚   β”‚   β”œβ”€β”€ vector_store.py
β”‚   β”‚   └── reranker.py
β”‚   β”œβ”€β”€ api/              # FastAPI app
β”‚   β”‚   └── main.py
β”‚   └── telegram/         # Telegram bot
β”‚       β”œβ”€β”€ bot.py
β”‚       β”œβ”€β”€ handlers.py
β”‚       └── keyboards.py
β”œβ”€β”€ terraform/            # Infrastructure as Code
β”œβ”€β”€ tests/                # Test suite (205 tests)
β”œβ”€β”€ pyproject.toml        # Project config
β”œβ”€β”€ Dockerfile.api        # API container
β”œβ”€β”€ Dockerfile.bot        # Bot container
└── docker-compose.yml    # Local development

Security

  • No hardcoded secrets - All credentials via environment variables
  • Rate limiting - API endpoints protected with SlowAPI
  • Input validation - Pydantic models for all inputs
  • Security scanning - Bandit in CI pipeline
  • Dependency auditing - Regular updates via Dependabot

License

MIT License - see LICENSE


Contributing

  1. Fork the repository
  2. Create a feature branch (git checkout -b feat/amazing-feature)
  3. Commit changes (git commit -m 'feat: add amazing feature')
  4. Push to branch (git push origin feat/amazing-feature)
  5. Open a Pull Request

Made with ❀️ by Nolan Cacheux

About

AI-powered autonomous equity research agent. Multi-source analysis (Yahoo Finance, SEC 10-K, Reddit, news) with LangGraph orchestration, hybrid RAG, and real-time market data. Generates professional research reports via Telegram bot or REST API. Deployed on Azure Container Apps.

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 2

  •  
  •