up

metascroy · metascroy · commit b8fbb6ce597c · 2025-06-13T11:45:35.000-07:00
diff --git a/examples/models/llava/export_llava.py b/examples/models/llava/export_llava.py
@@ -216,6 +216,7 @@ def quant_embedding(model):
     print("qval_copy", qval_copy)
     print("qval", qval)
     print("MATCHING", (qval_copy == qval).to(torch.float32).mean())
+    print("MAX DIFF", (qval_copy.to(torch.int32) - qval.to(torch.int32)).abs().max())
 
     print("scale_copy", scale_copy)
     print("scale", scale)
@@ -246,7 +247,7 @@ def quant_embedding(model):
     
     print("token_embedding_ep_copy", token_embedding_ep_copy)
     print("token_embedding_ep", token_embedding_ep)
-    return token_embedding_ep
+    return token_embedding_ep_copy
 
 
 def export_all(llava_model: LlavaModel):