Lint

jackzhxng · jackzhxng · commit 9cdfb4381c1a · 2024-12-17T19:57:03.000-08:00
diff --git a/examples/models/llama3_2_vision/runner/native.py b/examples/models/llama3_2_vision/runner/native.py
@@ -18,8 +18,10 @@
     TorchTuneLlamaRunner,
 )
 
-from executorch.extension.pybindings.portable_lib import _load_for_executorch
-from executorch.extension.pybindings.portable_lib import _load_for_executorch_from_buffer
+from executorch.extension.pybindings.portable_lib import (
+    _load_for_executorch,
+    _load_for_executorch_from_buffer,
+)
 
 # Load custom ops and quantized ops.
 from executorch.extension.pybindings import portable_lib  # noqa # usort: skip
diff --git a/exir/passes/init_mutable_buffer_pass.py b/exir/passes/init_mutable_buffer_pass.py
@@ -9,6 +9,7 @@
 from executorch.exir.pass_base import ExportPass, NodeMetadata, ProxyValue
 from executorch.exir.passes.spec_prop_pass import make_spec
 
+
 class InitMutableBufferPass(ExportPass):
     def __init__(self) -> None:
         super().__init__()
@@ -18,4 +19,3 @@ def placeholder(self, name: str, arg, meta):
             meta["et_init_buffer"] = True
 
         return super().placeholder(name, arg, meta)
-
diff --git a/exir/program/_program.py b/exir/program/_program.py
@@ -34,6 +34,7 @@
     OpReplacePass,
 )
 from executorch.exir.passes.external_constants_pass import external_constants_pass
+from executorch.exir.passes.init_mutable_buffer_pass import InitMutableBufferPass
 from executorch.exir.passes.insert_write_back_for_buffers_pass import (
     insert_write_back_for_buffers_pass,
 )
@@ -46,7 +47,6 @@
 from executorch.exir.passes.replace_view_copy_with_view_pass import (
     ReplaceViewCopyWithViewPass,
 )
-from executorch.exir.passes.init_mutable_buffer_pass import InitMutableBufferPass
 from executorch.exir.passes.spec_prop_pass import SpecPropPass
 from executorch.exir.passes.weights_to_outputs_pass import weights_to_outputs_pass
 from executorch.exir.print_program import pretty_print, print_program
diff --git a/extension/llm/modules/test/test_kv_cache.py b/extension/llm/modules/test/test_kv_cache.py
@@ -4,13 +4,19 @@
 # This source code is licensed under the BSD-style license found in the
 # LICENSE file in the root directory of this source tree.
 
+import tempfile
 import unittest
 from typing import Callable, Tuple
 
 import torch
-
 from executorch.exir import EdgeCompileConfig, to_edge
+
+from executorch.extension.export_util.utils import save_pte_program
 from executorch.extension.llm.modules.kv_cache import KVCache as InferenceKVCache
+
+from executorch.extension.pybindings.portable_lib import (
+    _load_for_executorch_from_buffer,
+)
 from executorch.runtime import Runtime
 from torch.testing import assert_close
 from torchtune.modules.kv_cache import KVCache
@@ -67,21 +73,10 @@ def _test_kv_cache(self, et_cache_module: Callable):
             prefill_seq_len, self.batch_size, self.num_kv_heads, self.head_dim
         )
 
-        print()
-        print("Prefilling...")
-        print()
-        
         et_res = et_cache_module(k_val, v_val)
         tt_res = self.tt_kv_cache.update(k_val_trans, v_val_trans)
         tt_res_transposed = (tt_res[0].transpose(1, 2), tt_res[1].transpose(1, 2))
 
-        print()
-        print("Final tt kv_cache.cache_pos")
-        print(self.tt_kv_cache.cache_pos)
-        print("Final tt kv_cache.k_cache")
-        print(self.tt_kv_cache.k_cache)
-        print()
-
         # Check torchtune matches executorch.
         assert_close(et_res, tt_res_transposed)
 
@@ -112,7 +107,6 @@ def _test_kv_cache(self, et_cache_module: Callable):
 
         self.assertTrue(et_k_cache[0][prefill_seq_len + 1][0][0] == 0)
 
-
     def export_kv_cache(
         self,
         kv_cache: torch.nn.Module,
@@ -179,9 +173,6 @@ def test_kv_cache_executorch(self):
         )
         et_program = edge_program.to_executorch()
 
-        """DEBUG the executorch program"""
-        et_program.dump_executorch_program(verbose=True)
-        
         runtime = Runtime.get()
         program = runtime.load_program(et_program.buffer)
         method = program.load_method("forward")
@@ -192,3 +183,27 @@ def wrapped_callable(k_val: torch.Tensor, v_val: torch.Tensor) -> torch.Tensor:
 
         self._test_kv_cache(wrapped_callable)
 
+    def test_kv_cache_executorch_from_file(self):
+        exported_kv_cache = self.export_kv_cache(self.et_kv_cache)
+        edge_program = to_edge(
+            exported_kv_cache,
+            compile_config=EdgeCompileConfig(
+                _core_aten_ops_exception_list=[torch.ops.aten._assert_async.msg],
+                _check_ir_validity=False,
+            ),
+        )
+        et_program = edge_program.to_executorch()
+
+        with tempfile.TemporaryDirectory() as tempdir:
+            pte_path = save_pte_program(et_program, "test_et_kv_cache", tempdir)
+            with open(pte_path, "rb") as f:
+                model_bytes = f.read()
+            loaded_et_program = _load_for_executorch_from_buffer(model_bytes)
+
+            # Since method.execute expects a tuple of args.
+            def wrapped_callable(
+                k_val: torch.Tensor, v_val: torch.Tensor
+            ) -> torch.Tensor:
+                return loaded_et_program.forward((k_val, v_val))
+
+            self._test_kv_cache(wrapped_callable)

Original file line number	Diff line number	Diff line change
`@@ -34,6 +34,7 @@`
`34`	`34`	`OpReplacePass,`
`35`	`35`	`)`
`36`	`36`	`from executorch.exir.passes.external_constants_pass import external_constants_pass`
	`37`	`+from executorch.exir.passes.init_mutable_buffer_pass import InitMutableBufferPass`
`37`	`38`	`from executorch.exir.passes.insert_write_back_for_buffers_pass import (`
`38`	`39`	`insert_write_back_for_buffers_pass,`
`39`	`40`	`)`
`@@ -46,7 +47,6 @@`
`46`	`47`	`from executorch.exir.passes.replace_view_copy_with_view_pass import (`
`47`	`48`	`ReplaceViewCopyWithViewPass,`
`48`	`49`	`)`
`49`		`-from executorch.exir.passes.init_mutable_buffer_pass import InitMutableBufferPass`
`50`	`50`	`from executorch.exir.passes.spec_prop_pass import SpecPropPass`
`51`	`51`	`from executorch.exir.passes.weights_to_outputs_pass import weights_to_outputs_pass`
`52`	`52`	`from executorch.exir.print_program import pretty_print, print_program`