perf: optimize model transfer with non-blocking flag

MrPandir · MrPandir · commit 7c795104aa31 · 2025-04-15T17:55:49.000+02:00
diff --git a/app/model.py b/app/model.py
@@ -130,7 +130,9 @@ def wrapper(*args, **kwargs):
 
 
 tokenizer = AutoTokenizer.from_pretrained(model_path)
-model = AutoModelForSequenceClassification.from_pretrained(model_path).to(device)
+model = AutoModelForSequenceClassification.from_pretrained(model_path).to(
+    device, non_blocking=True
+)
 
 
 @measure_time