Add base fulltext helpers (#24589)

kunga · github-actions[bot] · commit 413205cd12ed · 2025-09-29T10:37:54.000Z
diff --git a/.github/last_commit.txt b/.github/last_commit.txt
@@ -1 +1 @@
-835e2f5f88c3c3e25f26ca50788d94f003a344dd
+ee3cb799508e266feaecb150d9baf075dd586714
diff --git a/src/api/protos/ydb_table.proto b/src/api/protos/ydb_table.proto
@@ -172,76 +172,76 @@ message FulltextIndexSettings {
     // Represents text analyzers settings
     message Analyzers {
         // See Tokenizer enum
-        Tokenizer tokenizer = 1;
+        optional Tokenizer tokenizer = 1;
     
         // Language used for language-sensitive operations like stopword filtering
         // Example: language = "english"
         // By default is not specified and no language-specific logic is applied
-        string language = 2;
+        optional string language = 2;
     
         // Whether to convert tokens to lowercase
         // Example:
         //   Token: "Quick"
         //   Output: "quick"
-        bool use_filter_lowercase = 100;
+        optional bool use_filter_lowercase = 100;
     
         // Whether to remove common stopwords like "the", "a", "is"
         // Example: language = "english"
         //   Tokens: ["the", "quick", "brown"]
         //   Output: ["quick", "brown"]
-        bool use_filter_stopwords = 110;
+        optional bool use_filter_stopwords = 110;
     
         // Whether to apply character n-gram indexing to each token
         // Must be used with filter_ngram_min_length and filter_ngram_max_length
         // Example: filter_ngram_min_length = 3, filter_ngram_max_length = 4
         //   Token: "search"
         //   Output: ["sea", "ear", "arc", "rch", "sear", "earc", "arch"]
-        bool use_filter_ngram = 120;
+        optional bool use_filter_ngram = 120;
     
         // Whether to apply edge n-gram indexing (prefix-based) to each token
         // Used with filter_ngram_min_length and filter_ngram_max_length
         // Example: filter_ngram_min_length = 3, filter_ngram_max_length = 4
         //   Token: "search"
         //   Output: ["sea", "sear"]
-        bool use_filter_edge_ngram = 121;
+        optional bool use_filter_edge_ngram = 121;
     
         // Minimum length of n-grams to generate (inclusive)
         // Must be used with use_filter_ngram or use_filter_edge_ngram
         // Default value is 3
-        int32 filter_ngram_min_length = 122 [(Ydb.value) = ">= 0"];
+        optional int32 filter_ngram_min_length = 122 [(Ydb.value) = ">= 0"];
     
         // Maximum length of n-grams to generate (inclusive)
         // Must be used with use_filter_ngram or use_filter_edge_ngram
         // Default value is 4
-        int32 filter_ngram_max_length = 123 [(Ydb.value) = ">= 0"];
+        optional int32 filter_ngram_max_length = 123 [(Ydb.value) = ">= 0"];
     
         // Whether to filter tokens by their length
         // Must be used with filter_length_min or filter_length_max
         // Example: filter_length_min = 4, filter_length_max = 6
         //   Tokens: ["foo", "fooba", "foobar", "foobarbaz"]
         //   Output: ["fooba", "foobar"]
-        bool use_filter_length = 130;
+        optional bool use_filter_length = 130;
     
         // Minimum token length to keep (inclusive)
         // Must be used with use_filter_length
-        int32 filter_length_min = 131 [(Ydb.value) = ">= 0"];
+        optional int32 filter_length_min = 131 [(Ydb.value) = ">= 0"];
     
         // Maximum token length to keep (inclusive)
         // Must be used with use_filter_length
-        int32 filter_length_max = 132 [(Ydb.value) = ">= 0"];
+        optional int32 filter_length_max = 132 [(Ydb.value) = ">= 0"];
     }
 
     // Represents text analyzers settings for a specific column
     message ColumnAnalyzers {
         // Name of the column to be indexed
-        string column = 1;
+        optional string column = 1;
 
         // Analyzer settings specific to this column
         Analyzers analyzers = 2;
     }
 
     // See Layout enum
-    Layout layout = 1;
+    optional Layout layout = 1;
 
     // List of columns and their fulltext settings
     // Currently, this list should contain a single entry

Original file line number	Diff line number	Diff line change
`@@ -1 +1 @@`
`1`		`-835e2f5f88c3c3e25f26ca50788d94f003a344dd`
	`1`	`+ee3cb799508e266feaecb150d9baf075dd586714`