[training] compute normalised wer

sanchit-gandhi · sanchit-gandhi · commit aca3f5e4520c · 2024-05-22T10:17:56.000+01:00
diff --git a/training/eval.py b/training/eval.py
@@ -29,8 +29,10 @@ def wer(asr_model_name_or_path, prompts, audios, device, per_device_eval_batch_s
         batch_size=int(per_device_eval_batch_size),
     )
 
-    word_error = 100 * metric.compute(
-        predictions=[t["text"].lower() for t in transcriptions], references=[t.lower() for t in prompts]
-    )
+    normalizer = asr_pipeline.tokenizer.normalize
+    normalized_predictions = [normalizer(t["text"]) for t in transcriptions]
+    normalized_references = [normalizer(t) for t in prompts]
+
+    word_error = 100 * metric.compute(predictions=normalized_predictions, references=normalized_references)
 
     return word_error, [t["text"] for t in transcriptions]