add number of learning iteration option.

aikiriao · aikiriao · commit 954cd0ac7d71 · 2025-09-22T21:49:16.000+09:00
diff --git a/include/srla.h b/include/srla.h
@@ -7,7 +7,7 @@
 #define SRLA_FORMAT_VERSION         9
 
 /* コーデックバージョン */
-#define SRLA_CODEC_VERSION          16
+#define SRLA_CODEC_VERSION          17
 
 /* ヘッダサイズ */
 #define SRLA_HEADER_SIZE            30
diff --git a/include/srla_encoder.h b/include/srla_encoder.h
@@ -13,6 +13,7 @@ struct SRLAEncodeParameter {
     uint32_t max_num_samples_per_block; /* ブロックあたり最大サンプル数 */
     uint32_t num_lookahead_samples; /* 先読みサンプル数 */
     uint32_t ltp_order; /* LTP次数 */
+    uint32_t num_svr_filter_learning_iteration; /* SVRフィルタ学習繰り返し回数 */
     uint8_t preset; /* エンコードパラメータプリセット */
 };
 
diff --git a/libs/srla_encoder/src/srla_encoder.c b/libs/srla_encoder/src/srla_encoder.c
@@ -42,6 +42,7 @@ struct SRLAEncoder {
     uint32_t lb_num_samples_per_block; /* ブロックサンプル数の下限 */
     uint32_t max_num_parameters; /* 最大パラメータ数 */
     uint32_t ltp_order; /* LTP次数 */
+    uint32_t num_svr_filter_learning_iteration; /* SVR学習繰り返し回数 */
     uint8_t set_parameter; /* パラメータセット済み？ */
     struct LPCCalculator *lpcc; /* LPC計算ハンドル */
     struct SRLAPreemphasisFilter **pre_emphasis; /* プリエンファシスフィルタ */
@@ -745,6 +746,8 @@ SRLAApiResult SRLAEncoder_SetEncodeParameter(
     encoder->num_lookahead_samples = parameter->num_lookahead_samples;
     /* LTP次数設定 */
     encoder->ltp_order = parameter->ltp_order;
+    /* SVR学習繰り返し回数設定 */
+    encoder->num_svr_filter_learning_iteration = parameter->num_svr_filter_learning_iteration;
 
     /* ヘッダ設定 */
     encoder->header = tmp_header;
@@ -1084,7 +1087,7 @@ static SRLAError SRLAEncoder_ComputeCoefficientsPerChannel(
             /* SVRによるLPC係数計算 */
             if ((ret = LPCCalculator_CalculateLPCCoefficientsSVR(encoder->lpcc,
                 buffer_double, num_samples,
-                double_coef, tmp_lpc_lpc_coef_order, parameter_preset->svr_max_num_iterations,
+                double_coef, tmp_lpc_lpc_coef_order, encoder->num_svr_filter_learning_iteration,
                 LPC_WINDOWTYPE_WELCH, SRLA_LPC_RIDGE_REGULARIZATION_PARAMETER,
                 parameter_preset->margin_list, parameter_preset->margin_list_size)) != LPC_APIRESULT_OK) {
                 return SRLA_ERROR_NG;
diff --git a/libs/srla_internal/include/srla_internal.h b/libs/srla_internal/include/srla_internal.h
@@ -94,7 +94,6 @@ struct SRLAParameterPreset {
     uint32_t max_num_parameters; /* 最大パラメータ数 */
     SRLAChannelProcessMethodTactics ch_process_method_tactics; /* マルチチャンネル処理の決定法 */
     SRLAChannelLPCOrderDecisionTactics lpc_order_tactics; /* LPCの次数決定法 */
-    uint32_t svr_max_num_iterations; /* SVRの最大繰り返し回数 */
     const double *margin_list; /* マージンリスト */
     uint32_t margin_list_size; /* マージンリストサイズ */
 };
diff --git a/libs/srla_internal/src/srla_internal.c b/libs/srla_internal/src/srla_internal.c
@@ -28,13 +28,13 @@ static const double margin_list[] = { 0.0, 1.0 / 4096, 1.0 / 1024, 1.0 / 256, 1.
 
 /* パラメータプリセット配列 */
 const struct SRLAParameterPreset g_srla_parameter_preset[] = {
-    {   0, SRLA_CH_PROCESS_METHOD_TACTICS_ADAPTIVE,             SRLA_LPC_ORDER_DECISION_TACTICS_MAX_FIXED, 0, SRLA_DEFINE_ARRAY_AND_NUM_ELEMTNS_TUPLE(margin_list) },
-    {   8, SRLA_CH_PROCESS_METHOD_TACTICS_ADAPTIVE, SRLA_LPC_ORDER_DECISION_TACTICS_BRUTEFORCE_ESTIMATION, 0, SRLA_DEFINE_ARRAY_AND_NUM_ELEMTNS_TUPLE(margin_list) },
-    {  16, SRLA_CH_PROCESS_METHOD_TACTICS_ADAPTIVE, SRLA_LPC_ORDER_DECISION_TACTICS_BRUTEFORCE_ESTIMATION, 0, SRLA_DEFINE_ARRAY_AND_NUM_ELEMTNS_TUPLE(margin_list) },
-    {  32, SRLA_CH_PROCESS_METHOD_TACTICS_ADAPTIVE, SRLA_LPC_ORDER_DECISION_TACTICS_BRUTEFORCE_ESTIMATION, 0, SRLA_DEFINE_ARRAY_AND_NUM_ELEMTNS_TUPLE(margin_list) },
-    {  64, SRLA_CH_PROCESS_METHOD_TACTICS_ADAPTIVE, SRLA_LPC_ORDER_DECISION_TACTICS_BRUTEFORCE_ESTIMATION, 0, SRLA_DEFINE_ARRAY_AND_NUM_ELEMTNS_TUPLE(margin_list) },
-    { 128, SRLA_CH_PROCESS_METHOD_TACTICS_ADAPTIVE, SRLA_LPC_ORDER_DECISION_TACTICS_BRUTEFORCE_ESTIMATION, 0, SRLA_DEFINE_ARRAY_AND_NUM_ELEMTNS_TUPLE(margin_list) },
-    { 255, SRLA_CH_PROCESS_METHOD_TACTICS_ADAPTIVE, SRLA_LPC_ORDER_DECISION_TACTICS_BRUTEFORCE_ESTIMATION, 0, SRLA_DEFINE_ARRAY_AND_NUM_ELEMTNS_TUPLE(margin_list) },
+    {   0, SRLA_CH_PROCESS_METHOD_TACTICS_ADAPTIVE,             SRLA_LPC_ORDER_DECISION_TACTICS_MAX_FIXED, SRLA_DEFINE_ARRAY_AND_NUM_ELEMTNS_TUPLE(margin_list) },
+    {   8, SRLA_CH_PROCESS_METHOD_TACTICS_ADAPTIVE, SRLA_LPC_ORDER_DECISION_TACTICS_BRUTEFORCE_ESTIMATION, SRLA_DEFINE_ARRAY_AND_NUM_ELEMTNS_TUPLE(margin_list) },
+    {  16, SRLA_CH_PROCESS_METHOD_TACTICS_ADAPTIVE, SRLA_LPC_ORDER_DECISION_TACTICS_BRUTEFORCE_ESTIMATION, SRLA_DEFINE_ARRAY_AND_NUM_ELEMTNS_TUPLE(margin_list) },
+    {  32, SRLA_CH_PROCESS_METHOD_TACTICS_ADAPTIVE, SRLA_LPC_ORDER_DECISION_TACTICS_BRUTEFORCE_ESTIMATION, SRLA_DEFINE_ARRAY_AND_NUM_ELEMTNS_TUPLE(margin_list) },
+    {  64, SRLA_CH_PROCESS_METHOD_TACTICS_ADAPTIVE, SRLA_LPC_ORDER_DECISION_TACTICS_BRUTEFORCE_ESTIMATION, SRLA_DEFINE_ARRAY_AND_NUM_ELEMTNS_TUPLE(margin_list) },
+    { 128, SRLA_CH_PROCESS_METHOD_TACTICS_ADAPTIVE, SRLA_LPC_ORDER_DECISION_TACTICS_BRUTEFORCE_ESTIMATION, SRLA_DEFINE_ARRAY_AND_NUM_ELEMTNS_TUPLE(margin_list) },
+    { 255, SRLA_CH_PROCESS_METHOD_TACTICS_ADAPTIVE, SRLA_LPC_ORDER_DECISION_TACTICS_BRUTEFORCE_ESTIMATION, SRLA_DEFINE_ARRAY_AND_NUM_ELEMTNS_TUPLE(margin_list) },
 };
 SRLA_STATIC_ASSERT(SRLA_NUM_ARRAY_ELEMENTS(g_srla_parameter_preset) == SRLA_NUM_PARAMETER_PRESETS);
 
diff --git a/tools/srla_codec/srla_codec.c b/tools/srla_codec/srla_codec.c
@@ -16,6 +16,8 @@
 #define DEFALUT_LOOKAHEAD_SAMPLES_FACTOR 4
 /* デフォルトの可変ブロック分割数 */
 #define DEFALUT_NUM_VARIABLE_BLOCK_DIVISIONS 1
+/* デフォルトのSVRによるフィルタ同定の学習繰り返し回数 */
+#define DEFALUT_NUM_SVR_FILTER_LEARNING_ITERATIONS 0
 /* パラメータプリセットの最大インデックス */
 #define SRLA_MAX_PARAMETER_PRESETS_INDEX 6
 #if SRLA_MAX_PARAMETER_PRESETS_INDEX != (SRLA_NUM_PARAMETER_PRESETS - 1)
@@ -49,6 +51,8 @@ static struct CommandLineParserSpecification command_line_spec[] = {
         COMMAND_LINE_PARSER_TRUE, NULL, COMMAND_LINE_PARSER_FALSE },
     { 'P', "long-term-prediction", "Specify long term (pitch) prediction order (must be odd number, default:0 (disabled))",
         COMMAND_LINE_PARSER_TRUE, NULL, COMMAND_LINE_PARSER_FALSE },
+    {   0, "svr-filter-learning-iteration", "Specify the number of itration in filter computation using SVR (default:" TOSTRING(DEFALUT_NUM_SVR_FILTER_LEARNING_ITERATIONS) ")",
+        COMMAND_LINE_PARSER_TRUE, NULL, COMMAND_LINE_PARSER_FALSE },
     {   0, "no-checksum-check", "Whether to NOT check checksum at decoding (default:no)",
         COMMAND_LINE_PARSER_FALSE, NULL, COMMAND_LINE_PARSER_FALSE },
     { 'h', "help", "Show command help message",
@@ -69,7 +73,8 @@ static void encode_block_callback(
 
 /* エンコード 成功時は0、失敗時は0以外を返す */
 static int do_encode(const char *in_filename, const char *out_filename,
-    uint32_t encode_preset_no, uint32_t max_num_block_samples, uint32_t variable_block_num_divisions, uint32_t lookahead_samples_factor, uint32_t ltp_order)
+    uint32_t encode_preset_no, uint32_t max_num_block_samples, uint32_t variable_block_num_divisions,
+    uint32_t lookahead_samples_factor, uint32_t ltp_order, uint32_t num_svr_filter_learning_iteration)
 {
     FILE *out_fp;
     struct WAVFile *in_wav;
@@ -108,6 +113,7 @@ static int do_encode(const char *in_filename, const char *out_filename,
     parameter.min_num_samples_per_block = max_num_block_samples >> variable_block_num_divisions;
     parameter.max_num_samples_per_block = max_num_block_samples;
     parameter.num_lookahead_samples = lookahead_samples_factor * max_num_block_samples;
+    parameter.num_svr_filter_learning_iteration = num_svr_filter_learning_iteration;
     parameter.ltp_order = ltp_order;
     /* プリセットの反映 */
     parameter.preset = (uint8_t)encode_preset_no;
@@ -307,6 +313,7 @@ int main(int argc, char** argv)
         uint32_t variable_block_num_divisions = DEFALUT_NUM_VARIABLE_BLOCK_DIVISIONS;
         uint32_t lookahead_samples_factor = DEFALUT_LOOKAHEAD_SAMPLES_FACTOR;
         uint32_t ltp_order = 0;
+        uint32_t num_svr_filter_learning_iteration = DEFALUT_NUM_SVR_FILTER_LEARNING_ITERATIONS;
         /* エンコードプリセット番号取得 */
         if (CommandLineParser_GetOptionAcquired(command_line_spec, "mode") == COMMAND_LINE_PARSER_TRUE) {
             char *e;
@@ -381,9 +388,19 @@ int main(int argc, char** argv)
                 return 1;
             }
         }
+        if (CommandLineParser_GetOptionAcquired(command_line_spec, "svr-filter-learning-iteration") == COMMAND_LINE_PARSER_TRUE) {
+            char *e;
+            const char *lstr = CommandLineParser_GetArgumentString(command_line_spec, "svr-filter-learning-iteration");
+            num_svr_filter_learning_iteration = (uint32_t)strtol(lstr, &e, 10);
+            if (*e != '\0') {
+                fprintf(stderr, "%s: invalid number of lookahead samples. (irregular character found in %s at %s)\n", argv[0], lstr, e);
+                return 1;
+            }
+        }
         /* 一括エンコード実行 */
         if (do_encode(input_file, output_file,
-            encode_preset_no, max_num_block_samples, variable_block_num_divisions, lookahead_samples_factor, ltp_order) != 0) {
+            encode_preset_no, max_num_block_samples, variable_block_num_divisions,
+            lookahead_samples_factor, ltp_order, num_svr_filter_learning_iteration) != 0) {
             fprintf(stderr, "%s: failed to encode %s. \n", argv[0], input_file);
             return 1;
         }