Convert to pydantic and update docs

nkanu17 · nkanu17 · commit b9fe3d92fd09 · 2025-10-21T11:03:33.000-04:00
diff --git a/docs/api/schema.rst b/docs/api/schema.rst
@@ -262,7 +262,7 @@ FLAT - Brute-force exact search. **Best for small datasets (<10K vectors) requir
    :color: info
 
    **Use FLAT when:**
-    - Small datasets (<10K vectors) where exact results are required
+    - Small datasets (<100K vectors) where exact results are required
     - Search accuracy is critical and approximate results are not acceptable
     - Baseline comparisons when evaluating approximate algorithms
     - Simple use cases where setup simplicity is more important than performance
@@ -317,7 +317,7 @@ Algorithm Selection Guide
      - Memory Usage
      - Trade-offs
    * - **FLAT**
-     - Small datasets (<10K vectors)
+     - Small datasets (<100K vectors)
      - 100% recall, O(n) search
      - Minimal overhead
      - Exact but slow for large data
diff --git a/docs/user_guide/index.md b/docs/user_guide/index.md
@@ -22,4 +22,5 @@ User guides provide helpful resources for using RedisVL and its different compon
 07_message_history
 08_semantic_router
 09_svs_vamana
+10_embeddings_cache
 ```
diff --git a/redisvl/schema/fields.py b/redisvl/schema/fields.py
@@ -9,7 +9,7 @@
     - NumericField: Numeric values for range queries and sorting
     - GeoField: Geographic coordinates for location-based search
     - VectorField: Vector embeddings for semantic similarity search
-        - FlatVectorField: Brute-force exact search (100% recall)
+        - FlatVectorField: Exact search (100% recall)
         - HNSWVectorField: Approximate nearest neighbor search (fast, high recall)
         - SVSVectorField: Compressed vector search with memory savings
 
@@ -489,7 +489,7 @@ def as_redis_field(self) -> RedisField:
 
 
 class FlatVectorField(BaseField):
-    """Vector field with FLAT (brute-force) indexing for exact nearest neighbor search."""
+    """Vector field with FLAT (exact search) indexing for exact nearest neighbor search."""
 
     type: Literal[FieldTypes.VECTOR] = FieldTypes.VECTOR
     attrs: FlatVectorFieldAttributes
diff --git a/redisvl/utils/compression.py b/redisvl/utils/compression.py
@@ -1,10 +1,12 @@
 """SVS-VAMANA compression configuration utilities."""
 
-from typing import Literal, Optional, TypedDict, cast
+from typing import Literal, Optional
 
+from pydantic import BaseModel, Field
 
-class SVSConfig(TypedDict, total=False):
-    """SVS-VAMANA configuration dictionary.
+
+class SVSConfig(BaseModel):
+    """SVS-VAMANA configuration model.
 
     Attributes:
         algorithm: Always "svs-vamana"
@@ -16,13 +18,15 @@ class SVSConfig(TypedDict, total=False):
         search_window_size: Query-time candidates
     """
 
-    algorithm: Literal["svs-vamana"]
-    datatype: str
-    compression: str
-    reduce: int  # only for LeanVec
-    graph_max_degree: int
-    construction_window_size: int
-    search_window_size: int
+    algorithm: Literal["svs-vamana"] = "svs-vamana"
+    datatype: Optional[str] = None
+    compression: Optional[str] = None
+    reduce: Optional[int] = Field(
+        default=None, description="Reduced dimensionality (only for LeanVec)"
+    )
+    graph_max_degree: Optional[int] = None
+    construction_window_size: Optional[int] = None
+    search_window_size: Optional[int] = None
 
 
 class CompressionAdvisor:
@@ -35,9 +39,9 @@ class CompressionAdvisor:
     Examples:
         >>> # Get recommendations for high-dimensional vectors
         >>> config = CompressionAdvisor.recommend(dims=1536, priority="balanced")
-        >>> config["compression"]
+        >>> config.compression
         'LeanVec4x8'
-        >>> config["reduce"]
+        >>> config.reduce
         768
 
         >>> # Estimate memory savings
@@ -95,14 +99,14 @@ def recommend(
         Examples:
             >>> # High-dimensional embeddings (e.g., OpenAI ada-002)
             >>> config = CompressionAdvisor.recommend(dims=1536, priority="memory")
-            >>> config["compression"]
+            >>> config.compression
             'LeanVec4x8'
-            >>> config["reduce"]
+            >>> config.reduce
             768
 
             >>> # Lower-dimensional embeddings
             >>> config = CompressionAdvisor.recommend(dims=384, priority="speed")
-            >>> config["compression"]
+            >>> config.compression
             'LVQ4x8'
         """
         if dims <= 0:
@@ -118,34 +122,25 @@ def recommend(
             }
 
             if priority == "memory":
-                return cast(
-                    SVSConfig,
-                    {
-                        **base,
-                        "compression": "LeanVec4x8",
-                        "reduce": dims // 2,
-                        "search_window_size": 20,
-                    },
+                return SVSConfig(
+                    **base,
+                    compression="LeanVec4x8",
+                    reduce=dims // 2,
+                    search_window_size=20,
                 )
             elif priority == "speed":
-                return cast(
-                    SVSConfig,
-                    {
-                        **base,
-                        "compression": "LeanVec4x8",
-                        "reduce": max(256, dims // 4),
-                        "search_window_size": 40,
-                    },
+                return SVSConfig(
+                    **base,
+                    compression="LeanVec4x8",
+                    reduce=max(256, dims // 4),
+                    search_window_size=40,
                 )
             else:  # balanced
-                return cast(
-                    SVSConfig,
-                    {
-                        **base,
-                        "compression": "LeanVec4x8",
-                        "reduce": dims // 2,
-                        "search_window_size": 30,
-                    },
+                return SVSConfig(
+                    **base,
+                    compression="LeanVec4x8",
+                    reduce=dims // 2,
+                    search_window_size=30,
                 )
 
         # Lower-dimensional vectors - use LVQ
@@ -159,11 +154,11 @@ def recommend(
             }
 
             if priority == "memory":
-                return cast(SVSConfig, {**base, "compression": "LVQ4"})
+                return SVSConfig(**base, compression="LVQ4")
             elif priority == "speed":
-                return cast(SVSConfig, {**base, "compression": "LVQ4x8"})
+                return SVSConfig(**base, compression="LVQ4x8")
             else:  # balanced
-                return cast(SVSConfig, {**base, "compression": "LVQ4x4"})
+                return SVSConfig(**base, compression="LVQ4x4")
 
     @staticmethod
     def estimate_memory_savings(
diff --git a/tests/unit/test_compression_advisor.py b/tests/unit/test_compression_advisor.py