fixing vector search when not using 1024 dims

orneryd · orneryd · commit 0158fd3873d4 · 2025-12-16T13:21:17.000-07:00
diff --git a/cmd/nornicdb/main.go b/cmd/nornicdb/main.go
@@ -237,6 +237,21 @@ func runServe(cmd *cobra.Command, args []string) error {
 		cfg = config.LoadFromEnv()
 	}
 
+	// YAML config file is the source of truth for embedding settings
+	// Always use config file values if they are set (non-zero/non-empty)
+	if cfg.Memory.EmbeddingDimensions > 0 {
+		embeddingDim = cfg.Memory.EmbeddingDimensions
+	}
+	if cfg.Memory.EmbeddingProvider != "" {
+		embeddingProvider = cfg.Memory.EmbeddingProvider
+	}
+	if cfg.Memory.EmbeddingModel != "" {
+		embeddingModel = cfg.Memory.EmbeddingModel
+	}
+	if cfg.Memory.EmbeddingAPIURL != "" {
+		embeddingURL = cfg.Memory.EmbeddingAPIURL
+	}
+
 	// Override with CLI flags if provided
 	if memoryLimit != "" {
 		cfg.Memory.RuntimeLimitStr = memoryLimit
diff --git a/macos/MenuBarApp/NornicDBMenuBar.swift b/macos/MenuBarApp/NornicDBMenuBar.swift
@@ -882,6 +882,7 @@ class ConfigManager: ObservableObject {
     @Published var encryptionKeychainAccessDenied: Bool = false  // Track if user denied Keychain access
     
     @Published var embeddingModel: String = "bge-m3.gguf"
+    @Published var embeddingDimensions: Int = 1024  // Read from config, default 1024 for bge-m3
     @Published var heimdallModel: String = "qwen2.5-0.5b-instruct.gguf"
     @Published var availableModels: [String] = []
     
@@ -950,6 +951,15 @@ class ConfigManager: ObservableObject {
         }
         return nil
     }
+    
+    /// Get an integer value from a YAML section
+    private func getYAMLInt(key: String, from section: String) -> Int? {
+        if let stringValue = getYAMLString(key: key, from: section) {
+            return Int(stringValue)
+        }
+        return nil
+    }
+    
     private let firstRunPath = NSString(string: "~/.nornicdb/.first_run").expandingTildeInPath
     private let launchAgentPath = NSString(string: "~/Library/LaunchAgents/com.nornicdb.server.plist").expandingTildeInPath
     private let modelsPath = "/usr/local/var/nornicdb/models"
@@ -1007,6 +1017,12 @@ class ConfigManager: ObservableObject {
                 useAppleIntelligence = provider == "openai" && url.contains("localhost:\(ConfigManager.appleEmbeddingPort)")
                 print("✅ Loaded use Apple Intelligence: \(useAppleIntelligence)")
             }
+            
+            // Load embedding dimensions from config
+            if let dims = getYAMLInt(key: "dimensions", from: embeddingSection), dims > 0 {
+                embeddingDimensions = dims
+                print("✅ Loaded embedding dimensions: \(dims)")
+            }
         }
         
         // Load kmeans section
@@ -1743,7 +1759,7 @@ struct SettingsView: View {
                 <key>NORNICDB_EMBEDDING_MODEL</key>
                 <string>\(config.useAppleIntelligence ? "apple-ml-embeddings" : config.embeddingModel)</string>
                 <key>NORNICDB_EMBEDDING_DIMENSIONS</key>
-                <string>\(config.useAppleIntelligence ? "\(ConfigManager.appleEmbeddingDimensions)" : "1024")</string>
+                <string>\(config.useAppleIntelligence ? "\(ConfigManager.appleEmbeddingDimensions)" : "\(config.embeddingDimensions)")</string>
                 <key>NORNICDB_EMBEDDING_API_KEY</key>
                 <string>\(config.useAppleIntelligence ? ConfigManager.getAppleIntelligenceAPIKey() : "")</string>
                 <key>NORNICDB_KMEANS_CLUSTERING_ENABLED</key>
@@ -2635,7 +2651,7 @@ struct FirstRunWizard: View {
                                 <key>NORNICDB_EMBEDDING_MODEL</key>
                                 <string>\(config.useAppleIntelligence ? "apple-ml-embeddings" : config.embeddingModel)</string>
                                 <key>NORNICDB_EMBEDDING_DIMENSIONS</key>
-                                <string>\(config.useAppleIntelligence ? "\(ConfigManager.appleEmbeddingDimensions)" : "1024")</string>
+                                <string>\(config.useAppleIntelligence ? "\(ConfigManager.appleEmbeddingDimensions)" : "\(config.embeddingDimensions)")</string>
                                 <key>NORNICDB_EMBEDDING_API_KEY</key>
                                 <string>\(config.useAppleIntelligence ? ConfigManager.getAppleIntelligenceAPIKey() : "")</string>
                                 <key>NORNICDB_KMEANS_CLUSTERING_ENABLED</key>
diff --git a/pkg/cypher/executor.go b/pkg/cypher/executor.go
@@ -208,6 +208,10 @@ type StorageExecutor struct {
 	// onNodeCreated is called when a node is created or updated via CREATE/MERGE
 	// This allows the embed queue to be notified of new content requiring embeddings
 	onNodeCreated NodeCreatedCallback
+
+	// defaultEmbeddingDimensions is the configured embedding dimensions for vector indexes
+	// Used as default when CREATE VECTOR INDEX doesn't specify dimensions
+	defaultEmbeddingDimensions int
 }
 
 // QueryEmbedder generates embeddings for search queries.
@@ -276,6 +280,21 @@ func (e *StorageExecutor) SetNodeCreatedCallback(cb NodeCreatedCallback) {
 	e.onNodeCreated = cb
 }
 
+// SetDefaultEmbeddingDimensions sets the default dimensions for vector indexes.
+// This is used when CREATE VECTOR INDEX doesn't specify dimensions in OPTIONS.
+func (e *StorageExecutor) SetDefaultEmbeddingDimensions(dims int) {
+	e.defaultEmbeddingDimensions = dims
+}
+
+// GetDefaultEmbeddingDimensions returns the configured default embedding dimensions.
+// Returns 1024 as fallback if not configured.
+func (e *StorageExecutor) GetDefaultEmbeddingDimensions() int {
+	if e.defaultEmbeddingDimensions > 0 {
+		return e.defaultEmbeddingDimensions
+	}
+	return 1024 // Fallback only if not configured
+}
+
 // notifyNodeCreated calls the onNodeCreated callback if set.
 // This is called internally after node creation/update operations.
 func (e *StorageExecutor) notifyNodeCreated(nodeID string) {
@@ -1386,7 +1405,7 @@ func (e *StorageExecutor) executeDelete(ctx context.Context, cypher string) (*Ex
 	if strings.HasPrefix(upperDeleteClause, "DELETE ") {
 		deleteClause = deleteClause[7:] // len("DELETE ")
 	}
-	
+
 	// Strip RETURN clause from deleteVars if present
 	returnInDelete := findKeywordIndex(deleteClause, "RETURN")
 	if returnInDelete > 0 {
diff --git a/pkg/cypher/schema.go b/pkg/cypher/schema.go
@@ -287,8 +287,8 @@ func (e *StorageExecutor) executeCreateVectorIndex(ctx context.Context, cypher s
 	label := matches[3]
 	property := matches[5]
 
-	// Parse OPTIONS if present
-	dimensions := 1024         // Default
+	// Parse OPTIONS if present - use configured default dimensions
+	dimensions := e.GetDefaultEmbeddingDimensions()
 	similarityFunc := "cosine" // Default
 
 	if strings.Contains(cypher, "OPTIONS") {
diff --git a/pkg/embed/embed.go b/pkg/embed/embed.go
@@ -145,7 +145,7 @@ func DefaultOllamaConfig() *Config {
 		Provider:   "ollama",
 		APIURL:     "http://localhost:11434",
 		APIPath:    "/api/embeddings",
-		Model:      "mxbai-embed-large",
+		Model:      "bge-m3",
 		Dimensions: 1024,
 		Timeout:    30 * time.Second,
 	}
@@ -241,12 +241,12 @@ type OllamaEmbedder struct {
 //
 //	// Uses localhost:11434 by default
 //	embedder := embed.NewOllama(nil)
-//	
+//
 //	vec, err := embedder.Embed(ctx, "Hello world")
 //	if err != nil {
 //		log.Fatal(err)
 //	}
-//	
+//
 //	fmt.Printf("Generated %d-dimensional embedding\n", len(vec))
 //	// Output: Generated 1024-dimensional embedding
 //
@@ -255,9 +255,9 @@ type OllamaEmbedder struct {
 //	config := embed.DefaultOllamaConfig()
 //	config.Model = "nomic-embed-text"
 //	config.Dimensions = 768
-//	
+//
 //	embedder := embed.NewOllama(config)
-//	
+//
 //	// Good for English text
 //	vec, _ := embedder.Embed(ctx, "The quick brown fox")
 //	fmt.Printf("Nomic embedding: %d dims\n", len(vec)) // 768
@@ -267,9 +267,9 @@ type OllamaEmbedder struct {
 //	config := embed.DefaultOllamaConfig()
 //	config.APIURL = "http://ollama-server.internal:11434"
 //	config.Timeout = 60 * time.Second
-//	
+//
 //	embedder := embed.NewOllama(config)
-//	
+//
 //	// Connect to remote Ollama instance
 //	vec, err := embedder.Embed(ctx, "distributed embeddings")
 //	if err != nil {
@@ -279,19 +279,19 @@ type OllamaEmbedder struct {
 // Example 4 - Batch Processing for Efficiency:
 //
 //	embedder := embed.NewOllama(nil)
-//	
+//
 //	documents := []string{
 //		"Document 1 about AI",
 //		"Document 2 about ML",
 //		"Document 3 about NLP",
 //	}
-//	
+//
 //	// Process in batch
 //	embeddings, err := embedder.EmbedBatch(ctx, documents)
 //	if err != nil {
 //		log.Fatal(err)
 //	}
-//	
+//
 //	// Store embeddings in database
 //	for i, emb := range embeddings {
 //		storeEmbedding(documents[i], emb)
@@ -313,10 +313,10 @@ type OllamaEmbedder struct {
 //   - OFFLINE (works without internet)
 //
 // How it works:
-//   1. Install Ollama: `ollama run mxbai-embed-large`
-//   2. Ollama runs on localhost:11434
-//   3. Send text, get back 1024 numbers
-//   4. Use numbers to find similar text
+//  1. Install Ollama: `ollama run mxbai-embed-large`
+//  2. Ollama runs on localhost:11434
+//  3. Send text, get back 1024 numbers
+//  4. Use numbers to find similar text
 //
 // Models Available:
 //   - mxbai-embed-large: 1024 dims, best quality (default)
@@ -337,7 +337,8 @@ type OllamaEmbedder struct {
 //   - Memory: ~500MB-2GB for model
 //
 // Thread Safety:
-//   Safe to call from multiple goroutines.
+//
+//	Safe to call from multiple goroutines.
 func NewOllama(config *Config) *OllamaEmbedder {
 	if config == nil {
 		config = DefaultOllamaConfig()
@@ -508,12 +509,12 @@ type OpenAIEmbedder struct {
 //
 //	apiKey := os.Getenv("OPENAI_API_KEY") // sk-...
 //	embedder := embed.NewOpenAI(embed.DefaultOpenAIConfig(apiKey))
-//	
+//
 //	vec, err := embedder.Embed(ctx, "artificial intelligence")
 //	if err != nil {
 //		log.Fatal(err)
 //	}
-//	
+//
 //	fmt.Printf("Generated %d-dimensional embedding\n", len(vec))
 //	// Output: Generated 1536-dimensional embedding
 //
@@ -522,9 +523,9 @@ type OpenAIEmbedder struct {
 //	config := embed.DefaultOpenAIConfig(apiKey)
 //	config.Model = "text-embedding-3-large"
 //	config.Dimensions = 3072 // Maximum quality
-//	
+//
 //	embedder := embed.NewOpenAI(config)
-//	
+//
 //	// Higher quality embeddings for critical applications
 //	vec, _ := embedder.Embed(ctx, "complex semantic meaning")
 //	fmt.Printf("High-quality: %d dims\n", len(vec)) // 3072
@@ -534,9 +535,9 @@ type OpenAIEmbedder struct {
 //	config := embed.DefaultOpenAIConfig(apiKey)
 //	config.Model = "text-embedding-3-small"
 //	config.Dimensions = 1536
-//	
+//
 //	embedder := embed.NewOpenAI(config)
-//	
+//
 //	// 5x cheaper than text-embedding-3-large
 //	// $0.02 per 1M tokens vs $0.13 per 1M tokens
 //	vec, _ := embedder.Embed(ctx, "cost effective")
@@ -545,9 +546,9 @@ type OpenAIEmbedder struct {
 //
 //	config := embed.DefaultOpenAIConfig(apiKey)
 //	config.Timeout = 30 * time.Second
-//	
+//
 //	embedder := embed.NewOpenAI(config)
-//	
+//
 //	texts := []string{"doc1", "doc2", "doc3"}
 //	embeddings, err := embedder.EmbedBatch(ctx, texts)
 //	if err != nil {
@@ -568,9 +569,9 @@ type OpenAIEmbedder struct {
 //		Model:      "text-embedding-ada-002",
 //		Dimensions: 1536,
 //	}
-//	
+//
 //	embedder := embed.NewOpenAI(config)
-//	
+//
 //	// Works with multiple languages
 //	embeddings, _ := embedder.EmbedBatch(ctx, []string{
 //		"Hello world",           // English
@@ -602,20 +603,20 @@ type OpenAIEmbedder struct {
 //
 // Models & Pricing (2024):
 //
-//   text-embedding-3-small:
-//   - 1536 dimensions
-//   - $0.02 per 1M tokens (~750k words)
-//   - Best for: Cost-sensitive applications
+//	text-embedding-3-small:
+//	- 1536 dimensions
+//	- $0.02 per 1M tokens (~750k words)
+//	- Best for: Cost-sensitive applications
 //
-//   text-embedding-3-large:
-//   - 3072 dimensions (can truncate to 256-3072)
-//   - $0.13 per 1M tokens
-//   - Best for: Maximum quality
+//	text-embedding-3-large:
+//	- 3072 dimensions (can truncate to 256-3072)
+//	- $0.13 per 1M tokens
+//	- Best for: Maximum quality
 //
-//   text-embedding-ada-002 (legacy):
-//   - 1536 dimensions
-//   - $0.10 per 1M tokens
-//   - Still works but use v3 instead
+//	text-embedding-ada-002 (legacy):
+//	- 1536 dimensions
+//	- $0.10 per 1M tokens
+//	- Still works but use v3 instead
 //
 // Rate Limits:
 //   - Free tier: 3 RPM (requests per minute)
@@ -634,7 +635,8 @@ type OpenAIEmbedder struct {
 //   - Use batch processing to reduce costs
 //
 // Thread Safety:
-//   Safe to call from multiple goroutines.
+//
+//	Safe to call from multiple goroutines.
 func NewOpenAI(config *Config) *OpenAIEmbedder {
 	if config == nil {
 		config = DefaultOpenAIConfig("")
diff --git a/pkg/nornicdb/db.go b/pkg/nornicdb/db.go
@@ -389,7 +389,7 @@ func DefaultConfig() *Config {
 		EncryptionPassword:           "",                    // Must be set if encryption enabled
 		BoltPort:                     7687,
 		HTTPPort:                     7474,
-		KmeansClusterInterval:        15 * time.Minute,      // Run k-means every 15 min (skips if no changes)
+		KmeansClusterInterval:        15 * time.Minute, // Run k-means every 15 min (skips if no changes)
 	}
 }
 
@@ -445,9 +445,9 @@ type DB struct {
 	embedWorkerConfig *EmbedWorkerConfig // Configurable via ENV vars
 
 	// K-means clustering timer (runs on schedule instead of trigger)
-	clusterTicker            *time.Ticker
-	clusterTickerStop        chan struct{}
-	lastClusteredEmbedCount  int // Track embedding count at last clustering
+	clusterTicker           *time.Ticker
+	clusterTickerStop       chan struct{}
+	lastClusteredEmbedCount int // Track embedding count at last clustering
 
 	// Encryption flag - when true, all data is encrypted at BadgerDB level
 	encryptionEnabled bool
@@ -865,6 +865,11 @@ func Open(dataDir string, config *Config) (*DB, error) {
 	// Initialize Cypher executor
 	db.cypherExecutor = cypher.NewStorageExecutor(db.storage)
 
+	// Configure executor with embedding dimensions for vector index creation
+	if config.EmbeddingDimensions > 0 {
+		db.cypherExecutor.SetDefaultEmbeddingDimensions(config.EmbeddingDimensions)
+	}
+
 	// Load function plugins from configured directory
 	// Heimdall plugins will be loaded later by the server after Heimdall is initialized
 	if db.config.PluginsDir != "" {
@@ -2909,7 +2914,9 @@ func (db *DB) CreateIndex(ctx context.Context, label, property, indexType string
 	case "fulltext":
 		return schema.AddFulltextIndex(indexName, []string{label}, []string{property})
 	case "vector":
-		return schema.AddVectorIndex(indexName, label, property, 1024, "cosine")
+		// Use configured embedding dimensions instead of hardcoded value
+		dims := db.config.EmbeddingDimensions
+		return schema.AddVectorIndex(indexName, label, property, dims, "cosine")
 	case "range":
 		return schema.AddRangeIndex(indexName, label, property)
 	default:
diff --git a/pkg/search/search.go b/pkg/search/search.go
diff --git a/ui/src/pages/Browser.tsx b/ui/src/pages/Browser.tsx