MementoRC
diff --git a/‎src/uckn/core/atoms/faceted_search_manager.py‎
Lines changed: 199 additions & 0 deletions b/‎src/uckn/core/atoms/faceted_search_manager.py‎
Lines changed: 199 additions & 0 deletions
diff --git a/‎src/uckn/core/atoms/personalized_ranking.py‎
Lines changed: 194 additions & 0 deletions b/‎src/uckn/core/atoms/personalized_ranking.py‎
Lines changed: 194 additions & 0 deletions
@@ -0,0 +1,199 @@
+"""
+UCKN Faceted Search Manager Atom
+
+Manages dynamic faceted search capabilities including technology stack filtering,
+temporal filters, quality metrics, and other dynamic filters based on document metadata.
+"""
+
+import logging
+from datetime import datetime
+from typing import Dict, Any, List, Optional
+from collections import defaultdict
+
+
+class FacetedSearchManager:
+    """
+    Manages faceted search capabilities for UCKN knowledge patterns.
+    
+    Provides dynamic filtering based on:
+    - Technology stack compatibility
+    - Temporal filters (pattern age, update frequency)
+    - Quality metrics (success rates, usage statistics)
+    - Pattern complexity levels
+    - Source/origin filters
+    """
+
+    def __init__(self, logger: Optional[logging.Logger] = None):
+        self.logger = logger or logging.getLogger(__name__)
+        self._facet_cache = {}
+        self._cache_expiry = {}
+
+    def extract_facets(self, documents: List[Dict[str, Any]]) -> Dict[str, Any]:
+        """
+        Extract available facets from a collection of documents.
+        
+        Args:
+            documents: List of documents with metadata
+            
+        Returns:
+            Dictionary of facets with possible values and counts
+        """
+        facets = {
+            "technology_stack": defaultdict(int),
+            "complexity": defaultdict(int),
+            "pattern_type": defaultdict(int),
+            "success_rate_range": defaultdict(int),
+            "age_range": defaultdict(int),
+            "language": defaultdict(int),
+            "framework": defaultdict(int),
+            "source": defaultdict(int)
+        }
+        
+        for doc in documents:
+            metadata = doc.get("metadata", {})
+            
+            # Technology stack facets
+            tech_stack = metadata.get("technology_stack", [])
+            if isinstance(tech_stack, str):
+                tech_stack = [tech_stack]
+            for tech in tech_stack:
+                facets["technology_stack"][tech.lower()] += 1
+            
+            # Complexity facets
+            complexity = metadata.get("complexity", "unknown")
+            facets["complexity"][complexity] += 1
+            
+            # Pattern type facets
+            pattern_type = metadata.get("pattern_type", metadata.get("type", "unknown"))
+            facets["pattern_type"][pattern_type] += 1
+            
+            # Success rate ranges
+            success_rate = metadata.get("success_rate", 0.0)
+            if isinstance(success_rate, (int, float)):
+                if success_rate >= 0.9:
+                    facets["success_rate_range"]["excellent (90%+)"] += 1
+                elif success_rate >= 0.75:
+                    facets["success_rate_range"]["good (75-89%)"] += 1
+                elif success_rate >= 0.5:
+                    facets["success_rate_range"]["moderate (50-74%)"] += 1
+                else:
+                    facets["success_rate_range"]["low (<50%)"] += 1
+            
+            # Age ranges
+            created_at = metadata.get("created_at")
+            if created_at:
+                try:
+                    if isinstance(created_at, str):
+                        created_date = datetime.fromisoformat(created_at.replace('Z', '+00:00'))
+                    else:
+                        created_date = created_at
+                    
+                    age_days = (datetime.now().replace(tzinfo=created_date.tzinfo) - created_date).days
+                    
+                    if age_days <= 30:
+                        facets["age_range"]["recent (< 1 month)"] += 1
+                    elif age_days <= 90:
+                        facets["age_range"]["fresh (1-3 months)"] += 1
+                    elif age_days <= 365:
+                        facets["age_range"]["mature (3-12 months)"] += 1
+                    else:
+                        facets["age_range"]["established (> 1 year)"] += 1
+                except (ValueError, TypeError):
+                    facets["age_range"]["unknown"] += 1
+            
+            # Language facets
+            language = metadata.get("language", metadata.get("programming_language"))
+            if language:
+                facets["language"][language.lower()] += 1
+            
+            # Framework facets
+            framework = metadata.get("framework")
+            if framework:
+                if isinstance(framework, list):
+                    for fw in framework:
+                        facets["framework"][fw.lower()] += 1
+                else:
+                    facets["framework"][framework.lower()] += 1
+            
+            # Source facets
+            source = metadata.get("source", metadata.get("origin", "unknown"))
+            facets["source"][source] += 1
+        
+        # Convert defaultdicts to regular dicts and sort by count
+        result = {}
+        for facet_name, facet_values in facets.items():
+            if facet_values:
+                result[facet_name] = dict(sorted(facet_values.items(), key=lambda x: x[1], reverse=True))
+        
+        return result
+
+    def apply_facet_filters(
+        self, 
+        documents: List[Dict[str, Any]], 
+        filters: Dict[str, Any]
+    ) -> List[Dict[str, Any]]:
+        """
+        Apply facet filters to a list of documents.
+        
+        Args:
+            documents: List of documents to filter
+            filters: Dictionary of filters to apply
+            
+        Returns:
+            Filtered list of documents
+        """
+        if not filters:
+            return documents
+        
+        filtered_docs = []
+        
+        for doc in documents:
+            metadata = doc.get("metadata", {})
+            include_doc = True
+            
+            # Technology stack filter
+            if "technology_stack" in filters:
+                required_techs = filters["technology_stack"]
+                if isinstance(required_techs, str):
+                    required_techs = [required_techs]
+                
+                doc_techs = metadata.get("technology_stack", [])
+                if isinstance(doc_techs, str):
+                    doc_techs = [doc_techs]
+                
+                doc_techs_lower = [tech.lower() for tech in doc_techs]
+                if not any(tech.lower() in doc_techs_lower for tech in required_techs):
+                    include_doc = False
+            
+            # Complexity filter
+            if include_doc and "complexity" in filters:
+                required_complexity = filters["complexity"]
+                doc_complexity = metadata.get("complexity", "unknown")
+                if isinstance(required_complexity, list):
+                    if doc_complexity not in required_complexity:
+                        include_doc = False
+                else:
+                    if doc_complexity != required_complexity:
+                        include_doc = False
+            
+            # Pattern type filter
+            if include_doc and "pattern_type" in filters:
+                required_types = filters["pattern_type"]
+                if isinstance(required_types, str):
+                    required_types = [required_types]
+                
+                doc_type = metadata.get("pattern_type", metadata.get("type", "unknown"))
+                if doc_type not in required_types:
+                    include_doc = False
+            
+            # Success rate range filter
+            if include_doc and "min_success_rate" in filters:
+                min_rate = filters["min_success_rate"]
+                doc_rate = metadata.get("success_rate", 0.0)
+                if isinstance(doc_rate, (int, float)) and doc_rate < min_rate:
+                    include_doc = False
+            
+            if include_doc:
+                filtered_docs.append(doc)
+        
+        return filtered_docs
@@ -0,0 +1,194 @@
+"""
+UCKN Personalized Ranking Atom
+
+Provides personalized search result ranking based on user history, preferences,
+and behavioral patterns to improve search relevance for individual users.
+"""
+
+import logging
+from datetime import datetime
+from typing import Dict, Any, List, Optional
+from collections import defaultdict
+
+
+class PersonalizedRanking:
+    """
+    Manages personalized ranking of search results based on user behavior.
+    
+    Features:
+    - User interaction tracking (clicks, views, ratings)
+    - Technology preference learning
+    - Pattern usage history
+    - Temporal decay of preferences
+    """
+
+    def __init__(self, logger: Optional[logging.Logger] = None):
+        self.logger = logger or logging.getLogger(__name__)
+        self.user_profiles = {}
+        self.interaction_weights = {
+            "view": 1.0,
+            "click": 2.0,
+            "download": 3.0,
+            "rate": 4.0,
+            "share": 2.5,
+            "bookmark": 3.5
+        }
+
+    def track_interaction(
+        self, 
+        user_id: str, 
+        pattern_id: str, 
+        interaction_type: str,
+        pattern_metadata: Optional[Dict[str, Any]] = None,
+        rating: Optional[float] = None
+    ) -> None:
+        """
+        Track user interaction with a pattern.
+        
+        Args:
+            user_id: Unique user identifier
+            pattern_id: Pattern that was interacted with
+            interaction_type: Type of interaction (view, click, download, rate, etc.)
+            pattern_metadata: Metadata of the pattern
+            rating: Optional rating if interaction_type is 'rate'
+        """
+        if user_id not in self.user_profiles:
+            self.user_profiles[user_id] = {
+                "interactions": [],
+                "technology_preferences": defaultdict(float),
+                "pattern_type_preferences": defaultdict(float),
+                "complexity_preferences": defaultdict(float),
+                "language_preferences": defaultdict(float),
+                "successful_patterns": set(),
+                "bookmarked_patterns": set(),
+                "last_activity": None
+            }
+        
+        profile = self.user_profiles[user_id]
+        
+        # Record the interaction
+        interaction = {
+            "pattern_id": pattern_id,
+            "type": interaction_type,
+            "timestamp": datetime.now(),
+            "metadata": pattern_metadata or {},
+            "rating": rating
+        }
+        profile["interactions"].append(interaction)
+        profile["last_activity"] = datetime.now()
+        
+        # Update preferences based on interaction
+        if pattern_metadata:
+            weight = self.interaction_weights.get(interaction_type, 1.0)
+            
+            # Apply rating multiplier
+            if rating:
+                weight *= (rating / 5.0)  # Assume 5-star rating scale
+            
+            # Update technology preferences
+            tech_stack = pattern_metadata.get("technology_stack", [])
+            if isinstance(tech_stack, str):
+                tech_stack = [tech_stack]
+            for tech in tech_stack:
+                profile["technology_preferences"][tech.lower()] += weight
+            
+            # Update pattern type preferences
+            pattern_type = pattern_metadata.get("pattern_type", pattern_metadata.get("type"))
+            if pattern_type:
+                profile["pattern_type_preferences"][pattern_type] += weight
+            
+            # Update complexity preferences
+            complexity = pattern_metadata.get("complexity")
+            if complexity:
+                profile["complexity_preferences"][complexity] += weight
+            
+            # Update language preferences
+            language = pattern_metadata.get("language", pattern_metadata.get("programming_language"))
+            if language:
+                profile["language_preferences"][language.lower()] += weight
+        
+        # Track special interactions
+        if interaction_type == "bookmark":
+            profile["bookmarked_patterns"].add(pattern_id)
+        elif interaction_type == "rate" and rating and rating >= 4.0:
+            profile["successful_patterns"].add(pattern_id)
+
+    def personalize_ranking(
+        self, 
+        user_id: str, 
+        search_results: List[Dict[str, Any]]
+    ) -> List[Dict[str, Any]]:
+        """
+        Re-rank search results based on user preferences.
+        
+        Args:
+            user_id: User identifier
+            search_results: List of search results to re-rank
+            
+        Returns:
+            Re-ranked search results with personalization scores
+        """
+        if user_id not in self.user_profiles or not search_results:
+            return search_results
+        
+        profile = self.user_profiles[user_id]
+        
+        # Calculate personalization scores for each result
+        personalized_results = []
+        for result in search_results:
+            metadata = result.get("metadata", {})
+            base_score = result.get("similarity_score", 0.0)
+            
+            personalization_score = self._calculate_personalization_score(
+                metadata, profile
+            )
+            
+            # Combine base score with personalization (weighted average)
+            combined_score = 0.7 * base_score + 0.3 * personalization_score
+            
+            result_copy = result.copy()
+            result_copy["personalization_score"] = personalization_score
+            result_copy["combined_score"] = combined_score
+            
+            personalized_results.append(result_copy)
+        
+        # Sort by combined score
+        personalized_results.sort(key=lambda x: x["combined_score"], reverse=True)
+        
+        return personalized_results
+
+    def _calculate_personalization_score(
+        self, 
+        pattern_metadata: Dict[str, Any], 
+        user_profile: Dict[str, Any]
+    ) -> float:
+        """
+        Calculate personalization score for a pattern based on user preferences.
+        """
+        score_components = []
+        
+        # Technology stack preference score
+        tech_prefs = user_profile.get("technology_preferences", {})
+        if tech_prefs:
+            pattern_techs = pattern_metadata.get("technology_stack", [])
+            if isinstance(pattern_techs, str):
+                pattern_techs = [pattern_techs]
+            
+            tech_score = 0.0
+            for tech in pattern_techs:
+                tech_score += tech_prefs.get(tech.lower(), 0.0)
+            
+            if tech_score > 0 and tech_prefs:
+                tech_score = min(tech_score / max(tech_prefs.values()), 1.0)
+                score_components.append(tech_score)
+        
+        # Pattern type preference score
+        type_prefs = user_profile.get("pattern_type_preferences", {})
+        if type_prefs:
+            pattern_type = pattern_metadata.get("pattern_type", pattern_metadata.get("type"))
+            if pattern_type:
+                type_score = type_prefs.get(pattern_type, 0.0)
+                type_score = min(type_score / max(type_prefs.values()), 1.0)
+                score_components.append(type_score)
+        
+        return sum(score_components) / len(score_components) if score_components else 0.5