NVIDIA · ajrasane · Sep 25, 2025 · Sep 24, 2025 · Sep 24, 2025 · Sep 25, 2025
diff --git a/modelopt/onnx/autocast/precisionconverter.py b/modelopt/onnx/autocast/precisionconverter.py
@@ -200,6 +200,9 @@ def convert(
         # Remove redundant casts
         self._cleanup()
 
+        if self.keep_io_types:
+            self._restore_original_io_types()
+
         self._sanity_check()
 
         return self.model
@@ -210,6 +213,22 @@ def _ensure_types_are_defined(self):
             if vi.type.tensor_type.elem_type == onnx.TensorProto.UNDEFINED:
                 vi.type.tensor_type.elem_type = self.low_precision_type.onnx_type
 
+    def _restore_original_io_types(self):
+        """Restore original I/O types."""
+
+        def restore_tensor_type(tensor):
+            if tensor.name in self.original_network_io:
+                original_type = self.original_network_io[tensor.name]
+                if tensor.type.tensor_type.elem_type != original_type:
+                    tensor.type.tensor_type.elem_type = original_type
+                    # Update value_info_map if tensor exists there
+                    if tensor.name in self.value_info_map:
+                        self.value_info_map[tensor.name].type.tensor_type.elem_type = original_type
+
+        # Restore input and output types
+        for tensor in self.model.graph.input + self.model.graph.output:
+            restore_tensor_type(tensor)
+
     def _propagate_types_shapes_custom_ops(self, model):
         """Propagate types and shapes after insertion of 'Cast' nodes or other graph modifications."""
         logger.info("Propagating tensor shapes and types in model with custom ops.")