Add session state management for deep research

codelion · codelion · commit 85c205a1f3e6 · 2025-07-24T23:16:13.000+08:00
Introduces session_state.py to manage browser sessions for concurrent deep research requests, ensuring thread safety and proper cleanup. Updates DeepResearcher to use unique session IDs and centralized session management, and improves search query extraction logic in web_search_plugin.py for more robust handling of search commands.
diff --git a/optillm/plugins/deep_research/research_engine.py b/optillm/plugins/deep_research/research_engine.py
@@ -17,6 +17,8 @@
 from optillm.plugins.web_search_plugin import run as web_search_run, BrowserSessionManager
 from optillm.plugins.readurls_plugin import run as readurls_run
 from optillm.plugins.memory_plugin import run as memory_run
+from optillm.plugins.deep_research.session_state import get_session_manager, close_session
+import uuid
 
 
 def clean_reasoning_tags(text: str) -> str:
@@ -228,6 +230,8 @@ def __init__(self, client, model: str, max_iterations: int = 8, max_sources: int
         self.model = model
         self.max_iterations = max_iterations
         self.max_sources = max_sources
+        self.session_id = str(uuid.uuid4())  # Unique session ID for this research
+        self.session_manager = None  # Will be set when research starts
         self.research_state = {
             "queries": [],
             "sources": [],
@@ -388,8 +392,12 @@ def perform_web_search(self, queries: List[str]) -> str:
         all_results = []
         
         # Check if session manager is available
-        if not hasattr(self, 'session_manager'):
+        if not hasattr(self, 'session_manager') or self.session_manager is None:
+            # Log warning - this shouldn't happen in normal flow
+            print(f"⚠️  Warning: session_manager not available in perform_web_search (session_id: {getattr(self, 'session_id', 'N/A')})")
             self.session_manager = None
+        else:
+            print(f"📊 Using existing session manager for web search (session_id: {self.session_id}, manager: {id(self.session_manager)})")
         
         # Perform individual searches for each query to avoid truncation issues
         for i, query in enumerate(queries):
@@ -717,7 +725,9 @@ def perform_gap_targeted_search(self, gaps: List[Dict[str, str]]) -> str:
         all_results = []
         
         # Check if session manager is available
-        if not hasattr(self, 'session_manager'):
+        if not hasattr(self, 'session_manager') or self.session_manager is None:
+            # Log warning - this shouldn't happen in normal flow
+            print("⚠️  Warning: session_manager not available in perform_web_search")
             self.session_manager = None
         
         # Sort gaps by priority - HIGH priority first (placeholder tags)
@@ -1006,86 +1016,91 @@ def research(self, system_prompt: str, initial_query: str) -> Tuple[str, int]:
         4. Quality-guided termination
         """
         
-        # Use a single browser session for all searches in this research
-        with BrowserSessionManager(headless=False, timeout=30) as session_manager:
-            print("🔬 Starting deep research with single browser session")
-            self.session_manager = session_manager  # Store for use in search methods
+        # Get or create a browser session for this research session
+        self.session_manager = get_session_manager(self.session_id, headless=False, timeout=30)
+        if self.session_manager:
+            print(f"🔬 Starting deep research with session ID: {self.session_id} (DeepResearcher instance: {id(self)})")
+        else:
+            print("⚠️ Failed to create browser session, proceeding without web search")
             
-            try:
-                # PHASE 1: INITIALIZATION - Generate preliminary draft (updatable skeleton)
-                print("TTD-DR: Generating preliminary draft...")
-                self.current_draft = self.generate_preliminary_draft(system_prompt, initial_query)
+        try:
+            # PHASE 1: INITIALIZATION - Generate preliminary draft (updatable skeleton)
+            print("TTD-DR: Generating preliminary draft...")
+            self.current_draft = self.generate_preliminary_draft(system_prompt, initial_query)
+            self.draft_history.append(self.current_draft)
+        
+            # PHASE 2: ITERATIVE DENOISING LOOP
+            for iteration in range(self.max_iterations):
+                self.research_state["iteration"] = iteration + 1
+                print(f"TTD-DR: Denoising iteration {iteration + 1}/{self.max_iterations}")
+                
+                # STEP 1: Analyze current draft for gaps (draft-guided search)
+                print("  - Analyzing draft gaps...")
+                gaps = self.analyze_draft_gaps(self.current_draft, initial_query)
+                self.gap_analysis_history.append(gaps)
+                
+                if not gaps:
+                    print("  - No significant gaps found, research complete")
+                    break
+                
+                # STEP 2: Perform gap-targeted retrieval
+                print(f"  - Performing targeted search for {len(gaps)} gaps...")
+                retrieval_content = self.perform_gap_targeted_search(gaps)
+                
+                # STEP 3: Extract and fetch URLs from search results
+                print("  - Extracting and fetching content...")
+                content_with_urls, sources = self.extract_and_fetch_urls(retrieval_content)
+                
+                # Register sources for citations
+                for source in sources:
+                    if 'url' in source:
+                        self.citation_counter += 1
+                        self.citations[self.citation_counter] = source
+                
+                # STEP 4: DENOISING - Integrate retrieved info with current draft
+                print("  - Performing denoising step...")
+                previous_draft = self.current_draft
+                self.current_draft = self.denoise_draft_with_retrieval(
+                    self.current_draft, content_with_urls, initial_query
+                )
                 self.draft_history.append(self.current_draft)
-        
-                # PHASE 2: ITERATIVE DENOISING LOOP
-                for iteration in range(self.max_iterations):
-                    self.research_state["iteration"] = iteration + 1
-                    print(f"TTD-DR: Denoising iteration {iteration + 1}/{self.max_iterations}")
-                    
-                    # STEP 1: Analyze current draft for gaps (draft-guided search)
-                    print("  - Analyzing draft gaps...")
-                    gaps = self.analyze_draft_gaps(self.current_draft, initial_query)
-                    self.gap_analysis_history.append(gaps)
-                    
-                    if not gaps:
-                        print("  - No significant gaps found, research complete")
-                        break
-                    
-                    # STEP 2: Perform gap-targeted retrieval
-                    print(f"  - Performing targeted search for {len(gaps)} gaps...")
-                    retrieval_content = self.perform_gap_targeted_search(gaps)
-                    
-                    # STEP 3: Extract and fetch URLs from search results
-                    print("  - Extracting and fetching content...")
-                    content_with_urls, sources = self.extract_and_fetch_urls(retrieval_content)
-                    
-                    # Register sources for citations
-                    for source in sources:
-                        if 'url' in source:
-                            self.citation_counter += 1
-                            self.citations[self.citation_counter] = source
-                    
-                    # STEP 4: DENOISING - Integrate retrieved info with current draft
-                    print("  - Performing denoising step...")
-                    previous_draft = self.current_draft
-                    self.current_draft = self.denoise_draft_with_retrieval(
-                        self.current_draft, content_with_urls, initial_query
-                    )
-                    self.draft_history.append(self.current_draft)
-                    
-                    # STEP 5: Evaluate quality improvement
-                    print("  - Evaluating draft quality...")
-                    quality_scores = self.evaluate_draft_quality(
-                        self.current_draft, previous_draft, initial_query
-                    )
-                    
-                    # STEP 6: Component self-evolution based on feedback
-                    self.update_component_fitness(quality_scores)
-                    
-                    # STEP 7: Check termination conditions
-                    completeness = quality_scores.get('completeness', 0.0)
-                    improvement = quality_scores.get('improvement', 0.0)
-                    
-                    print(f"  - Quality scores: Completeness={completeness:.2f}, Improvement={improvement:.2f}")
-                    
-                    # Terminate if high quality achieved or minimal improvement
-                    # More lenient termination to ensure complete research
-                    if completeness > 0.9 or (improvement < 0.03 and completeness > 0.7):
-                        print("  - Quality threshold reached, research complete")
-                        break
-                    
-                    # Store current state for tracking
-                    self.research_state["content"].append(content_with_urls)
-                    self.research_state["sources"].extend([s['url'] for s in sources if 'url' in s])
                 
-                # PHASE 3: FINALIZATION - Polish the final draft
-                print("TTD-DR: Finalizing research report...")
-                final_report = self.finalize_research_report(system_prompt, initial_query, self.current_draft)
+                # STEP 5: Evaluate quality improvement
+                print("  - Evaluating draft quality...")
+                quality_scores = self.evaluate_draft_quality(
+                    self.current_draft, previous_draft, initial_query
+                )
+                
+                # STEP 6: Component self-evolution based on feedback
+                self.update_component_fitness(quality_scores)
+                
+                # STEP 7: Check termination conditions
+                completeness = quality_scores.get('completeness', 0.0)
+                improvement = quality_scores.get('improvement', 0.0)
+                
+                print(f"  - Quality scores: Completeness={completeness:.2f}, Improvement={improvement:.2f}")
                 
-                return final_report, self.total_tokens
+                # Terminate if high quality achieved or minimal improvement
+                # More lenient termination to ensure complete research
+                if completeness > 0.9 or (improvement < 0.03 and completeness > 0.7):
+                    print("  - Quality threshold reached, research complete")
+                    break
+                
+                # Store current state for tracking
+                self.research_state["content"].append(content_with_urls)
+                self.research_state["sources"].extend([s['url'] for s in sources if 'url' in s])
+            
+            # PHASE 3: FINALIZATION - Polish the final draft
+            print("TTD-DR: Finalizing research report...")
+            final_report = self.finalize_research_report(system_prompt, initial_query, self.current_draft)
+            
+            return final_report, self.total_tokens
                 
-            finally:
-                # Clean up session manager reference
+        finally:
+            # Clean up browser session
+            if self.session_manager:
+                print(f"🏁 Closing research session: {self.session_id}")
+                close_session(self.session_id)
                 self.session_manager = None
     
     def finalize_research_report(self, system_prompt: str, original_query: str, final_draft: str) -> str:
diff --git a/optillm/plugins/deep_research/session_state.py b/optillm/plugins/deep_research/session_state.py
@@ -0,0 +1,113 @@
+"""
+Session state management for deep research to handle concurrent requests
+"""
+
+import threading
+import time
+from typing import Dict, Optional
+from optillm.plugins.web_search_plugin import BrowserSessionManager
+
+class ResearchSessionState:
+    """
+    Thread-safe session state manager for deep research.
+    Ensures only one browser session is active per research query.
+    """
+    def __init__(self):
+        self._sessions: Dict[str, BrowserSessionManager] = {}
+        self._lock = threading.Lock()
+        self._session_timestamps: Dict[str, float] = {}
+        self._max_session_age = 300  # 5 minutes
+    
+    def get_or_create_session(self, session_id: str, headless: bool = False, timeout: int = 30) -> Optional[BrowserSessionManager]:
+        """
+        Get an existing session or create a new one for the given session ID.
+        """
+        with self._lock:
+            print(f"🔍 Session state: {len(self._sessions)} active sessions, checking for ID: {session_id}")
+            
+            # Clean up old sessions
+            self._cleanup_old_sessions()
+            
+            # Check if session exists and is active
+            if session_id in self._sessions:
+                session = self._sessions[session_id]
+                print(f"📋 Found existing session for ID: {session_id}, active: {session.is_active()}, instance: {id(session)}")
+                if session.is_active():
+                    print(f"♻️  Reusing existing browser session for research ID: {session_id}")
+                    return session
+                else:
+                    # Session exists but is not active, remove it
+                    print(f"🔄 Removing inactive session for research ID: {session_id}")
+                    del self._sessions[session_id]
+                    if session_id in self._session_timestamps:
+                        del self._session_timestamps[session_id]
+            
+            # Create new session
+            print(f"🌐 Creating new browser session for research ID: {session_id}")
+            session = BrowserSessionManager(headless=headless, timeout=timeout)
+            session.get_or_create_searcher()  # Initialize the browser
+            
+            self._sessions[session_id] = session
+            self._session_timestamps[session_id] = time.time()
+            
+            print(f"✅ Created new session instance: {id(session)} for ID: {session_id}")
+            print(f"📊 Total active sessions: {len(self._sessions)}")
+            
+            return session
+    
+    def remove_session(self, session_id: str):
+        """
+        Remove and close a session.
+        """
+        with self._lock:
+            if session_id in self._sessions:
+                session = self._sessions[session_id]
+                try:
+                    session.close()
+                except Exception as e:
+                    print(f"⚠️ Error closing session {session_id}: {e}")
+                
+                del self._sessions[session_id]
+                if session_id in self._session_timestamps:
+                    del self._session_timestamps[session_id]
+                
+                print(f"🏁 Removed session for research ID: {session_id}")
+    
+    def _cleanup_old_sessions(self):
+        """
+        Clean up sessions older than max_session_age.
+        """
+        current_time = time.time()
+        sessions_to_remove = []
+        
+        for session_id, timestamp in self._session_timestamps.items():
+            if current_time - timestamp > self._max_session_age:
+                sessions_to_remove.append(session_id)
+        
+        for session_id in sessions_to_remove:
+            print(f"🧹 Cleaning up old session: {session_id}")
+            if session_id in self._sessions:
+                try:
+                    self._sessions[session_id].close()
+                except:
+                    pass
+                del self._sessions[session_id]
+            del self._session_timestamps[session_id]
+
+
+# Global session state instance
+_session_state = ResearchSessionState()
+
+
+def get_session_manager(session_id: str, headless: bool = False, timeout: int = 30) -> Optional[BrowserSessionManager]:
+    """
+    Get or create a browser session for the given session ID.
+    """
+    return _session_state.get_or_create_session(session_id, headless, timeout)
+
+
+def close_session(session_id: str):
+    """
+    Close and remove a session.
+    """
+    _session_state.remove_session(session_id)
diff --git a/optillm/plugins/web_search_plugin.py b/optillm/plugins/web_search_plugin.py