up

metascroy · metascroy · commit 73c08f5a81df · 2025-06-24T10:23:00.000-07:00
diff --git a/examples/models/llava/export_llava.py b/examples/models/llava/export_llava.py
@@ -210,6 +210,7 @@ def quant_embedding(model):
     print("qval_copy", qval_copy)
     print("qval", qval)
     print("MATCHING", (qval_copy == qval).to(torch.float32).mean())
+    print("MAX DIFF", (qval_copy.to(torch.int32) - qval.to(torch.int32)).abs().max())
 
     print("scale_copy", scale_copy)
     print("scale", scale)
@@ -240,7 +241,7 @@ def quant_embedding(model):
     
     print("token_embedding_ep_copy", token_embedding_ep_copy)
     print("token_embedding_ep", token_embedding_ep)
-    return token_embedding_ep
+    return token_embedding_ep_copy
 
 
 def export_all(llava_model: LlavaModel):