Add tests

ArvindSridhar · narendasan · commit 532efed01084 · 2021-08-19T22:24:16.000-07:00
Signed-off-by: Arvind Sridhar &lt;arvindsridhar@berkeley.edu&gt;
diff --git a/core/lowering/lowering.cpp b/core/lowering/lowering.cpp
@@ -25,17 +25,21 @@ void LowerBlock(torch::jit::Block* b) {
 }
 
 void LowerGraph(std::shared_ptr<torch::jit::Graph>& g, LowerInfo lower_info) {
-  passes::MarkNodesForFallback(g, false);
-  passes::UnpackHardSwish(g);
   torch::jit::EliminateRedundantGuards(g);
   torch::jit::RemoveListMutation(g);
   torch::jit::RemoveTensorMutation(g);
   torch::jit::CreateFunctionalGraphs(g);
   torch::jit::InlineFunctionalGraphs(g);
   torch::jit::PeepholeOptimize(g, false);
-  passes::EliminateExceptionOrPassPattern(g);
   torch::jit::FuseLinear(g);
   torch::jit::LowerAllTuples(g);
+  if (!lower_info.disable_cse) {
+    torch::jit::EliminateCommonSubexpression(g);
+  }
+  torch::jit::EliminateDeadCode(g);
+  passes::MarkNodesForFallback(g, true);
+  passes::UnpackHardSwish(g);
+  passes::EliminateExceptionOrPassPattern(g);
   passes::ReduceToOperation(g);
   passes::RemoveContiguous(g);
   passes::RemoveDropout(g);
@@ -44,9 +48,6 @@ void LowerGraph(std::shared_ptr<torch::jit::Graph>& g, LowerInfo lower_info) {
   passes::Conv3DToConvolution(g);
   passes::FuseAddMMBranches(g);
   passes::RemoveBNDimCheck(g);
-  if (!lower_info.disable_cse) {
-    torch::jit::EliminateCommonSubexpression(g);
-  }
   // torch::jit::UnrollLoops(g);
   passes::UnpackAddMM(g);
   // passes::UnpackBatchNorm(g);
@@ -56,8 +57,6 @@ void LowerGraph(std::shared_ptr<torch::jit::Graph>& g, LowerInfo lower_info) {
   passes::RemoveNOPs(g);
   passes::AliasOperators(g);
   passes::SiluToSigmoidMultipication(g);
-  torch::jit::EliminateDeadCode(g);
-  passes::MarkNodesForFallback(g, true);
   LOG_GRAPH(*g);
 }
 
diff --git a/tests/core/conversion/evaluators/test_aten_evaluators.cpp b/tests/core/conversion/evaluators/test_aten_evaluators.cpp
@@ -3,6 +3,7 @@
 #include "gtest/gtest.h"
 #include "tests/util/util.h"
 #include "torch/csrc/jit/ir/irparser.h"
+#include "torch/torch.h"
 
 TEST(Evaluators, DivIntEvaluatesCorrectly) {
   const auto graph = R"IR(
diff --git a/tests/core/lowering/BUILD b/tests/core/lowering/BUILD
@@ -11,6 +11,22 @@ lowering_test(
     name = "test_linear_to_addmm",
 )
 
+cc_test(
+  name = "test_module_level_fallback",
+  srcs = ["test_module_level_fallback.cpp"],
+  deps = [
+      "//tests/util",
+      "//core",
+      "@googletest//:gtest_main",
+  ] + select({
+      ":use_pre_cxx11_abi":  ["@libtorch_pre_cxx11_abi//:libtorch"],
+      "//conditions:default":  ["@libtorch//:libtorch"],
+  }),
+  data = [
+      "//tests/modules:jit_models"
+  ]
+)
+
 lowering_test(
     name = "test_remove_contiguous_pass",
 )
@@ -47,6 +63,7 @@ test_suite(
     name = "lowering_tests",
     tests = [
         ":test_linear_to_addmm",
+        ":test_module_level_fallback",
         ":test_operator_aliasing_pass",
         ":test_remove_contiguous_pass",
         ":test_remove_detach_pass",
diff --git a/tests/core/lowering/test_module_level_fallback.cpp b/tests/core/lowering/test_module_level_fallback.cpp
@@ -0,0 +1,142 @@
+#include <string>
+#include <unordered_set>
+#include "core/compiler.h"
+#include "core/lowering/lowering.h"
+#include "gtest/gtest.h"
+#include "tests/util/util.h"
+#include "torch/script.h"
+
+TEST(Lowering, LowerResNet18ModuleFallbackCorrectly) {
+  torch::jit::script::Module mod;
+  try {
+    mod = torch::jit::load("tests/modules/resnet18_traced.jit.pt");
+  } catch (const c10::Error& e) {
+    std::cerr << "error loading the model\n";
+    return;
+  }
+
+  const std::vector<std::vector<int64_t>> input_shapes = {{1, 3, 224, 224}};
+  std::vector<torch::jit::IValue> jit_inputs_ivalues;
+  std::vector<torch::jit::IValue> trt_inputs_ivalues;
+  for (auto in_shape : input_shapes) {
+    auto in = at::randint(5, in_shape, {at::kCUDA});
+    jit_inputs_ivalues.push_back(in.clone());
+    trt_inputs_ivalues.push_back(in.clone());
+  }
+
+  std::vector<trtorch::core::ir::Input> input_ranges{trtorch::core::ir::Input({1, 3, 224, 224})};
+  trtorch::core::CompileSpec cfg(input_ranges);
+  cfg.partition_info.enabled = true;
+  cfg.lower_info.forced_fallback_modules.push_back("torchvision.models.resnet.BasicBlock");
+
+  auto jit_results = mod.forward(jit_inputs_ivalues).toTensor();
+  auto trt_mod = trtorch::core::CompileGraph(mod, cfg);
+
+  auto g = trt_mod.get_method("forward").graph();
+  auto nodes = g->block()->nodes();
+  std::size_t count = 0;
+  for (const auto n : nodes) {
+    auto has_compile_attribute = n->hasAttribute(c10::Symbol::attr("to_compile"));
+    if (has_compile_attribute && n->i(c10::Symbol::attr("to_compile")) == (int64_t) false) {
+      count++;
+    }
+  }
+  ASSERT_TRUE(count == 62);
+
+  auto trt_results = trt_mod.forward(trt_inputs_ivalues).toTensor();
+  ASSERT_TRUE(trtorch::tests::util::almostEqual(jit_results, trt_results, 2e-6));
+}
+
+TEST(Lowering, LowerAndPartitionSimpleModuleFallbackCorrectly) {
+  torch::jit::script::Module mod;
+  try {
+    mod = torch::jit::load("tests/modules/module_fallback_scripted.jit.pt");
+  } catch (const c10::Error& e) {
+    std::cerr << "error loading the model\n";
+    return;
+  }
+
+  const std::vector<std::vector<int64_t>> input_shapes = {{1, 1, 16, 16}};
+  std::vector<torch::jit::IValue> jit_inputs_ivalues;
+  std::vector<torch::jit::IValue> trt_inputs_ivalues;
+  for (auto in_shape : input_shapes) {
+    auto in = at::randint(5, in_shape, {at::kCUDA});
+    jit_inputs_ivalues.push_back(in.clone());
+    trt_inputs_ivalues.push_back(in.clone());
+  }
+
+  std::vector<trtorch::core::ir::Input> input_ranges{trtorch::core::ir::Input({1, 1, 16, 16})};
+  trtorch::core::CompileSpec cfg(input_ranges);
+  cfg.partition_info.enabled = true;
+  cfg.lower_info.forced_fallback_modules.push_back("ModuleFallbackSub");
+
+  auto jit_results = mod.forward(jit_inputs_ivalues).toTensor();
+  auto trt_mod = trtorch::core::CompileGraph(mod, cfg);
+
+  auto g = trt_mod.get_method("forward").graph();
+  auto nodes = g->block()->nodes();
+  std::size_t curr_node = 0;
+  for (const auto n : nodes) {
+    if (curr_node == 5) {
+      ASSERT_TRUE(n->kind() == torch::jit::aten::conv2d);
+      ASSERT_TRUE(n->i(c10::Symbol::attr("to_compile")) == (int64_t) false);
+    } else if (curr_node == 6) {
+      ASSERT_TRUE(n->kind() == torch::jit::aten::relu);
+      ASSERT_TRUE(n->i(c10::Symbol::attr("to_compile")) == (int64_t) false);
+    } else if (curr_node == 7) {
+      ASSERT_TRUE(n->kind() == torch::jit::prim::GetAttr);
+      ASSERT_TRUE(n->s(c10::Symbol::attr("name")).find("trt_engine") != std::string::npos);
+    }
+    curr_node++;
+  }
+
+  auto trt_results = trt_mod.forward(trt_inputs_ivalues).toTensor();
+  ASSERT_TRUE(trtorch::tests::util::almostEqual(jit_results, trt_results, 2e-6));
+}
+
+TEST(Lowering, LowerAndPartitionMobileNetModuleFallbackCorrectly) {
+  torch::jit::script::Module mod;
+  try {
+    mod = torch::jit::load("tests/modules/mobilenet_v2_traced.jit.pt");
+  } catch (const c10::Error& e) {
+    std::cerr << "error loading the model\n";
+    return;
+  }
+
+  const std::vector<std::vector<int64_t>> input_shapes = {{1, 3, 224, 224}};
+  std::vector<torch::jit::IValue> jit_inputs_ivalues;
+  std::vector<torch::jit::IValue> trt_inputs_ivalues;
+  for (auto in_shape : input_shapes) {
+    auto in = at::randint(5, in_shape, {at::kCUDA});
+    jit_inputs_ivalues.push_back(in.clone());
+    trt_inputs_ivalues.push_back(in.clone());
+  }
+
+  std::vector<trtorch::core::ir::Input> input_ranges{trtorch::core::ir::Input({1, 3, 224, 224})};
+  trtorch::core::CompileSpec cfg(input_ranges);
+  cfg.partition_info.enabled = true;
+  cfg.partition_info.min_block_size = 5;
+  cfg.lower_info.forced_fallback_modules.push_back("torchvision.models.mobilenetv2.ConvBNActivation");
+
+  auto jit_results = mod.forward(jit_inputs_ivalues).toTensor();
+  auto trt_mod = trtorch::core::CompileGraph(mod, cfg);
+
+  auto g = trt_mod.get_method("forward").graph();
+  auto nodes = g->block()->nodes();
+  std::size_t trt_count = 0;
+  std::size_t fallback_count = 0;
+  for (const auto n : nodes) {
+    auto has_name_attribute = n->hasAttribute(c10::Symbol::attr("name"));
+    auto has_compile_attribute = n->hasAttribute(c10::Symbol::attr("to_compile"));
+    if (has_name_attribute && n->s(c10::Symbol::attr("name")).find("trt_engine") != std::string::npos) {
+      trt_count++;
+    } else if (has_compile_attribute && n->i(c10::Symbol::attr("to_compile")) == (int64_t) false) {
+      fallback_count++;
+    }
+  }
+  ASSERT_TRUE(trt_count == 1);
+  ASSERT_TRUE(fallback_count == 105);
+
+  auto trt_results = trt_mod.forward(trt_inputs_ivalues).toTensor();
+  ASSERT_TRUE(trtorch::tests::util::almostEqual(jit_results, trt_results, 2e-6));
+}
diff --git a/tests/modules/hub.py b/tests/modules/hub.py
@@ -97,6 +97,31 @@ def forward(self, x):
 trace_model = torch.jit.trace(model, x)
 torch.jit.save(trace_model, "pooling_traced.jit.pt")
 
+# Sample Nested Module (for module-level fallback testing)
+class ModuleFallbackSub(nn.Module):
+
+    def __init__(self):
+        super(ModuleFallbackSub, self).__init__()
+        self.conv = nn.Conv2d(1, 3, 3)
+        self.relu = nn.ReLU()
+
+    def forward(self, x):
+        return self.relu(self.conv(x))
+
+class ModuleFallbackMain(nn.Module):
+
+    def __init__(self):
+        super(ModuleFallbackMain, self).__init__()
+        self.layer1 = ModuleFallbackSub()
+        self.conv = nn.Conv2d(3, 6, 3)
+        self.relu = nn.ReLU()
+
+    def forward(self, x):
+        return self.relu(self.conv(self.layer1(x)))
+
+module_fallback_model = ModuleFallbackMain().eval().cuda()
+module_fallback_script_model = torch.jit.script(module_fallback_model)
+torch.jit.save(module_fallback_script_model, "module_fallback_scripted.jit.pt")
 
 # Sample Conditional Model (for testing partitioning and fallback in conditionals)
 class FallbackIf(torch.nn.Module):