Updated ConGen Code

w11wo · w11wo · commit 889b2aeeef98 · 2024-01-23T05:47:57.000Z
diff --git a/unsupervised_learning/ConGen/README.md b/unsupervised_learning/ConGen/README.md
@@ -60,6 +60,24 @@ python train_con_gen.py \
     --teacher-temp 0.5
 ```
 
+### Multilingual e5 Small
+
+```sh
+python train_con_gen.py \
+    --model-name intfloat/multilingual-e5-small \
+    --train-dataset-name LazarusNLP/wikipedia_id_20230520 \
+    --max-seq-length 128 --min-text-length 150 --max-text-length 500 \
+    --max-train-samples 1000000 \
+    --num-epochs 20 \
+    --train-batch-size 128 \
+    --early-stopping-patience 7 \
+    --learning-rate 1e-4 \
+    --teacher-model-name sentence-transformers/paraphrase-multilingual-mpnet-base-v2 \
+    --queue-size 65536 \
+    --student-temp 0.5 \
+    --teacher-temp 0.5
+```
+
 ## Results
 
 ### STSB-MT-ID
diff --git a/unsupervised_learning/ConGen/train_con_gen.py b/unsupervised_learning/ConGen/train_con_gen.py
@@ -183,7 +183,7 @@ def main(args: Args):
         epochs=args.num_epochs,
         warmup_steps=warmup_steps,
         show_progress_bar=True,
-        optimizer_params={"lr": args.learning_rate, "eps": 1e-6, "correct_bias": False},
+        optimizer_params={"lr": args.learning_rate, "eps": 1e-6},
         output_path=args.output_path,
         save_best_model=True,
         early_stopping_patience=args.early_stopping_patience,