Merge pull request #236 from NVIDIA/dynamic_batch

narendasan · web-flow · commit ca3ee6dafa1c · 2021-02-23T16:25:08.000-07:00
fix(aten::flatten): Fixing flatten converter to handle dynamic batch
diff --git a/core/conversion/converters/impl/expand.cpp b/core/conversion/converters/impl/expand.cpp
@@ -196,94 +196,91 @@ bool add_expand_dynamic(
 
 auto expand_registrations TRTORCH_UNUSED =
     RegisterNodeConversionPatterns()
-        .pattern(
-            {"aten::expand(Tensor(a) self, int[] size, *, bool implicit=False) -> (Tensor(a))",
-             [](ConversionCtx* ctx, const torch::jit::Node* n, args& args) -> bool {
-               auto in = args[0].ITensor();
-               auto input_dims = in->getDimensions();
-               auto expanded_size = args[1].unwrapToIntList();
-               auto expandedDims = util::toDims(expanded_size);
-               LOG_DEBUG("(expand layer) Expand input from " << input_dims << " to " << expandedDims);
-               if (ctx->input_is_dynamic) {
-                 at::Tensor thExpanded_size = torch::tensor(expanded_size.vec(), torch::kInt32);
-                 auto expandedDimsTensor = tensor_to_const(ctx, thExpanded_size);
-                 return add_expand_dynamic(ctx, n, in, expandedDimsTensor, expandedDims, true);
-               } else {
-                 return add_expand(ctx, n, in, expandedDims);
-               }
-             }})
-        .pattern(
-            {"aten::expand_as(Tensor(a) self, Tensor other) -> (Tensor(a))",
-             [](ConversionCtx* ctx, const torch::jit::Node* n, args& args) -> bool {
-               auto in = args[0].ITensor();
-               auto input_dims = in->getDimensions();
-               auto targetTensor = args[1].ITensor();
-               auto targetDims = targetTensor->getDimensions();
-               LOG_DEBUG("(expand_as layer) Expand input from " << input_dims << " to " << targetDims);
-               if (ctx->input_is_dynamic) {
-                 return add_expand_dynamic(
-                     ctx, n, in, ctx->net->addShape(*targetTensor)->getOutput(0), targetDims, false);
-               } else {
-                 return add_expand(ctx, n, in, targetDims);
-               }
-             }})
-        .pattern(
-            {"aten::repeat(Tensor self, int[] repeats) -> (Tensor)",
-             [](ConversionCtx* ctx, const torch::jit::Node* n, args& args) -> bool {
-               auto in = args[0].ITensor();
-               auto input_dims = in->getDimensions();
-               auto repeats = args[1].unwrapToIntList().vec();
-               int repeats_rank = repeats.size();
-               TRTORCH_CHECK(
-                   repeats_rank >= input_dims.nbDims,
-                   "Number of repeat dimensions cannot be smaller than number of input dimensions");
-               auto num_expand_dims = repeats_rank - input_dims.nbDims;
+        .pattern({"aten::expand(Tensor(a) self, int[] size, *, bool implicit=False) -> (Tensor(a))",
+                  [](ConversionCtx* ctx, const torch::jit::Node* n, args& args) -> bool {
+                    auto in = args[0].ITensor();
+                    auto input_dims = in->getDimensions();
+                    auto expanded_size = args[1].unwrapToIntList();
+                    auto expandedDims = util::toDims(expanded_size);
+                    LOG_DEBUG("(expand layer) Expand input from " << input_dims << " to " << expandedDims);
+                    if (ctx->input_is_dynamic) {
+                      at::Tensor thExpanded_size = torch::tensor(expanded_size.vec(), torch::kInt32);
+                      auto expandedDimsTensor = tensor_to_const(ctx, thExpanded_size);
+                      return add_expand_dynamic(ctx, n, in, expandedDimsTensor, expandedDims, true);
+                    } else {
+                      return add_expand(ctx, n, in, expandedDims);
+                    }
+                  }})
+        .pattern({"aten::expand_as(Tensor(a) self, Tensor other) -> (Tensor(a))",
+                  [](ConversionCtx* ctx, const torch::jit::Node* n, args& args) -> bool {
+                    auto in = args[0].ITensor();
+                    auto input_dims = in->getDimensions();
+                    auto targetTensor = args[1].ITensor();
+                    auto targetDims = targetTensor->getDimensions();
+                    LOG_DEBUG("(expand_as layer) Expand input from " << input_dims << " to " << targetDims);
+                    if (ctx->input_is_dynamic) {
+                      return add_expand_dynamic(
+                          ctx, n, in, ctx->net->addShape(*targetTensor)->getOutput(0), targetDims, false);
+                    } else {
+                      return add_expand(ctx, n, in, targetDims);
+                    }
+                  }})
+        .pattern({"aten::repeat(Tensor self, int[] repeats) -> (Tensor)",
+                  [](ConversionCtx* ctx, const torch::jit::Node* n, args& args) -> bool {
+                    auto in = args[0].ITensor();
+                    auto input_dims = in->getDimensions();
+                    auto repeats = args[1].unwrapToIntList().vec();
+                    int repeats_rank = repeats.size();
+                    TRTORCH_CHECK(
+                        repeats_rank >= input_dims.nbDims,
+                        "Number of repeat dimensions cannot be smaller than number of input dimensions");
+                    auto num_expand_dims = repeats_rank - input_dims.nbDims;
 
-               if (ctx->input_is_dynamic) {
-                 int input_rank = input_dims.nbDims;
-                 int output_rank = repeats_rank;
-                 auto new_input_shape_tensor = concat(output_rank, input_rank, ctx, in);
+                    if (ctx->input_is_dynamic) {
+                      int input_rank = input_dims.nbDims;
+                      int output_rank = repeats_rank;
+                      auto new_input_shape_tensor = concat(output_rank, input_rank, ctx, in);
 
-                 // Add a reshape layer to expand dims
-                 auto shuffle = ctx->net->addShuffle(*in);
-                 shuffle->setInput(1, *new_input_shape_tensor);
-                 in = shuffle->getOutput(0);
-               } else {
-                 if (num_expand_dims > 0) {
-                   nvinfer1::Dims reshape_dims;
-                   reshape_dims.nbDims = repeats.size();
-                   for (int i = 0; i < num_expand_dims; i++) {
-                     reshape_dims.d[i] = 1;
-                   }
-                   for (int i = 0; i < input_dims.nbDims; i++) {
-                     reshape_dims.d[num_expand_dims + i] = input_dims.d[i];
-                   }
-                   // Add a reshape layer to expand dims
-                   auto reshape_layer = ctx->net->addShuffle(*in);
-                   reshape_layer->setReshapeDimensions(reshape_dims);
-                   in = reshape_layer->getOutput(0);
-                   LOG_DEBUG("Input reshaped to : " << in->getDimensions() << " from " << input_dims);
-                 }
-                 LOG_DEBUG("Repeats: " << repeats);
-               }
+                      // Add a reshape layer to expand dims
+                      auto shuffle = ctx->net->addShuffle(*in);
+                      shuffle->setInput(1, *new_input_shape_tensor);
+                      in = shuffle->getOutput(0);
+                    } else {
+                      if (num_expand_dims > 0) {
+                        nvinfer1::Dims reshape_dims;
+                        reshape_dims.nbDims = repeats.size();
+                        for (int i = 0; i < num_expand_dims; i++) {
+                          reshape_dims.d[i] = 1;
+                        }
+                        for (int i = 0; i < input_dims.nbDims; i++) {
+                          reshape_dims.d[num_expand_dims + i] = input_dims.d[i];
+                        }
+                        // Add a reshape layer to expand dims
+                        auto reshape_layer = ctx->net->addShuffle(*in);
+                        reshape_layer->setReshapeDimensions(reshape_dims);
+                        in = reshape_layer->getOutput(0);
+                        LOG_DEBUG("Input reshaped to : " << in->getDimensions() << " from " << input_dims);
+                      }
+                      LOG_DEBUG("Repeats: " << repeats);
+                    }
 
-               // Concat across all repeat axes.
-               // TODO: Implementation might not be performant. Explore other strategies to improve performance.
-               for (int i = repeats.size() - 1; i >= 0; --i) {
-                 std::vector<nvinfer1::ITensor*> tensors_vec;
-                 for (int j = 0; j < repeats[i]; j++) {
-                   tensors_vec.push_back(in);
-                 }
-                 auto concat_layer = ctx->net->addConcatenation(tensors_vec.data(), tensors_vec.size());
-                 concat_layer->setAxis(i);
-                 in = concat_layer->getOutput(0);
-               }
+                    // Concat across all repeat axes.
+                    // TODO: Implementation might not be performant. Explore other strategies to improve performance.
+                    for (int i = repeats.size() - 1; i >= 0; --i) {
+                      std::vector<nvinfer1::ITensor*> tensors_vec;
+                      for (int j = 0; j < repeats[i]; j++) {
+                        tensors_vec.push_back(in);
+                      }
+                      auto concat_layer = ctx->net->addConcatenation(tensors_vec.data(), tensors_vec.size());
+                      concat_layer->setAxis(i);
+                      in = concat_layer->getOutput(0);
+                    }
 
-               auto out = ctx->AssociateValueAndTensor(n->outputs()[0], in);
+                    auto out = ctx->AssociateValueAndTensor(n->outputs()[0], in);
 
-               LOG_DEBUG("Repeat layer output tensor shape: " << out->getDimensions());
-               return true;
-             }});
+                    LOG_DEBUG("Repeat layer output tensor shape: " << out->getDimensions());
+                    return true;
+                  }});
 
 } // namespace
 } // namespace impl
diff --git a/core/conversion/converters/impl/shuffle.cpp b/core/conversion/converters/impl/shuffle.cpp
@@ -11,28 +11,33 @@ namespace {
 
 static auto shuffle_registrations TRTORCH_UNUSED =
     RegisterNodeConversionPatterns()
-        .pattern({"aten::flatten.using_ints(Tensor self, int start_dim=0, int end_dim=-1) -> (Tensor)",
-                  [](ConversionCtx* ctx, const torch::jit::Node* n, args& args) -> bool {
-                    auto in = args[0].ITensorOrFreeze(ctx);
-                    auto start_dim = args[1].unwrapToInt();
-                    auto end_dim = args[2].unwrapToInt();
-                    auto in_shape = util::toVec(in->getDimensions());
-                    std::vector<int64_t> out_shape;
-                    if (ctx->input_is_dynamic) {
-                      out_shape = std::vector<int64_t>({in_shape[0], -1});
-                    } else {
-                      out_shape = torch::flatten(torch::rand(in_shape), start_dim, end_dim).sizes().vec();
-                    }
+        .pattern(
+            {"aten::flatten.using_ints(Tensor self, int start_dim=0, int end_dim=-1) -> (Tensor)",
+             [](ConversionCtx* ctx, const torch::jit::Node* n, args& args) -> bool {
+               auto in = args[0].ITensorOrFreeze(ctx);
+               auto start_dim = args[1].unwrapToInt();
+               auto end_dim = args[2].unwrapToInt();
+               auto in_shape = util::toVec(in->getDimensions());
+               std::vector<int64_t> out_shape;
+               if (ctx->input_is_dynamic && in_shape[0] != -1) {
+                 out_shape = std::vector<int64_t>({in_shape[0], -1});
+               } else if (ctx->input_is_dynamic && in_shape[0] == -1) {
+                 out_shape = std::vector<int64_t>(
+                     {-1,
+                      -1 * std::accumulate(std::begin(in_shape), std::end(in_shape), 1, std::multiplies<int64_t>())});
+               } else {
+                 out_shape = torch::flatten(torch::rand(in_shape), start_dim, end_dim).sizes().vec();
+               }
 
-                    auto shuffle = ctx->net->addShuffle(*in);
-                    TRTORCH_CHECK(shuffle, "Unable to create shuffle layer from node: " << *n);
-                    shuffle->setReshapeDimensions(util::toDims(out_shape));
-                    shuffle->setName(util::node_info(n).c_str());
+               auto shuffle = ctx->net->addShuffle(*in);
+               TRTORCH_CHECK(shuffle, "Unable to create shuffle layer from node: " << *n);
+               shuffle->setReshapeDimensions(util::toDims(out_shape));
+               shuffle->setName(util::node_info(n).c_str());
 
-                    auto out_tensor = ctx->AssociateValueAndTensor(n->outputs()[0], shuffle->getOutput(0));
-                    LOG_DEBUG("Output tensor shape: " << out_tensor->getDimensions());
-                    return true;
-                  }})
+               auto out_tensor = ctx->AssociateValueAndTensor(n->outputs()[0], shuffle->getOutput(0));
+               LOG_DEBUG("Output tensor shape: " << out_tensor->getDimensions());
+               return true;
+             }})
         .pattern({"aten::reshape(Tensor self, int[] shape) -> (Tensor)",
                   [](ConversionCtx* ctx, const torch::jit::Node* n, args& args) -> bool {
                     auto in = args[0].ITensorOrFreeze(ctx);
diff --git a/tests/core/conversion/converters/test_pooling.cpp b/tests/core/conversion/converters/test_pooling.cpp
@@ -402,7 +402,7 @@ TEST(Converters, ATenAdaptiveAvgPool2DConvertsCorrectlyWithDynamicInput) {
 
   auto trt_in = at::clone(in);
   params = trtorch::core::conversion::get_named_params(g->inputs(), {});
-  auto trt_results = trtorch::tests::util::RunGraphEngineDynamic(g, params, {trt_in});
+  auto trt_results = trtorch::tests::util::RunGraphEngineDynamic(g, params, {trt_in}, false);
 
   ASSERT_TRUE(trtorch::tests::util::almostEqual(jit_results[0], trt_results[0], 2e-6));
 }
diff --git a/tests/core/conversion/converters/test_shuffle.cpp b/tests/core/conversion/converters/test_shuffle.cpp
@@ -186,7 +186,30 @@ TEST(Converters, ATenFlattenConvertsCorrectlyWithDynamicInput) {
 
   in = at::clone(in);
   params = trtorch::core::conversion::get_named_params(g->inputs(), {});
-  auto trt_results = trtorch::tests::util::RunGraphEngineDynamic(g, params, {in});
+  auto trt_results = trtorch::tests::util::RunGraphEngineDynamic(g, params, {in}, false);
+  auto trt = trt_results[0].reshape_as(jit_results[0]);
+
+  ASSERT_TRUE(trtorch::tests::util::almostEqual(jit_results[0], trt, 2e-6));
+}
+
+TEST(Converters, ATenFlattenConvertsCorrectlyWithDynamicBatch) {
+  const auto graph = R"IR(
+    graph(%0 : Tensor):
+      %1 : int = prim::Constant[value=0]()
+      %2 : int = prim::Constant[value=1]()
+      %3 : Tensor = aten::flatten(%0, %1, %2)
+      return (%3))IR";
+
+  auto g = std::make_shared<torch::jit::Graph>();
+  torch::jit::parseIR(graph, &*g);
+
+  auto in = at::randint(0, 5, {2, 3}, {at::kCUDA});
+  auto params = trtorch::core::conversion::get_named_params(g->inputs(), {});
+  auto jit_results = trtorch::tests::util::RunGraph(g, params, {in});
+
+  in = at::clone(in);
+  params = trtorch::core::conversion::get_named_params(g->inputs(), {});
+  auto trt_results = trtorch::tests::util::RunGraphEngineDynamic(g, params, {in}, true);
   auto trt = trt_results[0].reshape_as(jit_results[0]);
 
   ASSERT_TRUE(trtorch::tests::util::almostEqual(jit_results[0], trt, 2e-6));
diff --git a/tests/util/run_graph_engine.cpp b/tests/util/run_graph_engine.cpp
@@ -23,19 +23,29 @@ std::vector<core::conversion::InputRange> toInputRanges(std::vector<at::Tensor>
   return std::move(a);
 }
 
-std::vector<core::conversion::InputRange> toInputRangesDynamic(std::vector<at::Tensor> ten) {
+std::vector<core::conversion::InputRange> toInputRangesDynamic(std::vector<at::Tensor> ten, bool dynamic_batch) {
   std::vector<core::conversion::InputRange> a;
 
   for (auto i : ten) {
     auto opt = core::util::toVec(i.sizes());
 
-    std::vector<int64_t> min_range(opt);
-    std::vector<int64_t> max_range(opt);
+    if (dynamic_batch) {
+      std::vector<int64_t> min_range(opt);
+      std::vector<int64_t> max_range(opt);
 
-    min_range[1] = ceil(opt[1] / 2.0);
-    max_range[1] = 2 * opt[1];
+      min_range[0] = ceil(opt[0] / 2.0);
+      max_range[0] = 2 * opt[0];
 
-    a.push_back(core::conversion::InputRange(min_range, opt, max_range));
+      a.push_back(core::conversion::InputRange(min_range, opt, max_range));
+    } else {
+      std::vector<int64_t> min_range(opt);
+      std::vector<int64_t> max_range(opt);
+
+      min_range[1] = ceil(opt[1] / 2.0);
+      max_range[1] = 2 * opt[1];
+
+      a.push_back(core::conversion::InputRange(min_range, opt, max_range));
+    }
   }
 
   return std::move(a);
@@ -63,9 +73,10 @@ std::vector<at::Tensor> RunGraphEngine(
 std::vector<at::Tensor> RunGraphEngineDynamic(
     std::shared_ptr<torch::jit::Graph>& g,
     core::conversion::GraphParams& named_params,
-    std::vector<at::Tensor> inputs) {
+    std::vector<at::Tensor> inputs,
+    bool dynamic_batch) {
   LOG_DEBUG("Running TRT version");
-  auto in = toInputRangesDynamic(inputs);
+  auto in = toInputRangesDynamic(inputs, dynamic_batch);
   auto info = core::conversion::ConversionInfo(in);
   info.engine_settings.workspace_size = 1 << 20;
   std::string eng = core::conversion::ConvertBlockToEngine(g->block(), info, named_params);
diff --git a/tests/util/util.h b/tests/util/util.h
@@ -35,7 +35,8 @@ std::vector<at::Tensor> RunGraphEngine(
 std::vector<at::Tensor> RunGraphEngineDynamic(
     std::shared_ptr<torch::jit::Graph>& g,
     core::conversion::GraphParams& named_params,
-    std::vector<at::Tensor> inputs);
+    std::vector<at::Tensor> inputs,
+    bool dynamic_batch = false);
 
 // Run the forward method of a module and return results
 torch::jit::IValue RunModuleForward(torch::jit::Module& mod, std::vector<torch::jit::IValue> inputs);

Original file line number	Diff line number	Diff line change
`@@ -402,7 +402,7 @@ TEST(Converters, ATenAdaptiveAvgPool2DConvertsCorrectlyWithDynamicInput) {`
`402`	`402`
`403`	`403`	`auto trt_in = at::clone(in);`
`404`	`404`	`params = trtorch::core::conversion::get_named_params(g->inputs(), {});`
`405`		`- auto trt_results = trtorch::tests::util::RunGraphEngineDynamic(g, params, {trt_in});`
	`405`	`+ auto trt_results = trtorch::tests::util::RunGraphEngineDynamic(g, params, {trt_in}, false);`
`406`	`406`
`407`	`407`	`ASSERT_TRUE(trtorch::tests::util::almostEqual(jit_results[0], trt_results[0], 2e-6));`
`408`	`408`	`}`