PaddlePaddle
diff --git a/‎lite/backends/nnadapter/nnadapter/include/nnadapter/optimizer/pattern_matcher.h
Lines changed: 4 additions & 0 deletions b/‎lite/backends/nnadapter/nnadapter/include/nnadapter/optimizer/pattern_matcher.h
Lines changed: 4 additions & 0 deletions
diff --git a/‎lite/backends/nnadapter/nnadapter/include/nnadapter/utility/modeling.h
Lines changed: 15 additions & 4 deletions b/‎lite/backends/nnadapter/nnadapter/include/nnadapter/utility/modeling.h
Lines changed: 15 additions & 4 deletions
diff --git a/‎lite/backends/nnadapter/nnadapter/src/driver/huawei_ascend_npu/optimizer/fix_multiple_outputs_ops.cc
Lines changed: 1 addition & 1 deletion b/‎lite/backends/nnadapter/nnadapter/src/driver/huawei_ascend_npu/optimizer/fix_multiple_outputs_ops.cc
Lines changed: 1 addition & 1 deletion
diff --git a/‎lite/backends/nnadapter/nnadapter/src/driver/huawei_ascend_npu/optimizer/fix_no_inputs_ops.cc
Lines changed: 2 additions & 1 deletion b/‎lite/backends/nnadapter/nnadapter/src/driver/huawei_ascend_npu/optimizer/fix_no_inputs_ops.cc
Lines changed: 2 additions & 1 deletion
diff --git a/‎lite/backends/nnadapter/nnadapter/src/driver/huawei_ascend_npu/optimizer/fix_reduce_ops_scalar_output.cc
Lines changed: 1 addition & 1 deletion b/‎lite/backends/nnadapter/nnadapter/src/driver/huawei_ascend_npu/optimizer/fix_reduce_ops_scalar_output.cc
Lines changed: 1 addition & 1 deletion
diff --git a/‎lite/backends/nnadapter/nnadapter/src/driver/huawei_kirin_npu/optimizer/fix_multiple_outputs_ops.cc
Lines changed: 1 addition & 1 deletion b/‎lite/backends/nnadapter/nnadapter/src/driver/huawei_kirin_npu/optimizer/fix_multiple_outputs_ops.cc
Lines changed: 1 addition & 1 deletion
diff --git a/‎lite/backends/nnadapter/nnadapter/src/driver/rockchip_npu/optimizer/fix_ops.cc
Lines changed: 2 additions & 1 deletion b/‎lite/backends/nnadapter/nnadapter/src/driver/rockchip_npu/optimizer/fix_ops.cc
Lines changed: 2 additions & 1 deletion
diff --git a/‎lite/backends/nnadapter/nnadapter/src/optimizer/pattern_matcher.cc
Lines changed: 36 additions & 0 deletions b/‎lite/backends/nnadapter/nnadapter/src/optimizer/pattern_matcher.cc
Lines changed: 36 additions & 0 deletions
diff --git a/‎lite/backends/nnadapter/nnadapter/src/utility/modeling.cc
Lines changed: 45 additions & 5 deletions b/‎lite/backends/nnadapter/nnadapter/src/utility/modeling.cc
Lines changed: 45 additions & 5 deletions
diff --git a/‎lite/core/optimizer/mir/elimination/fill_constant_calc_offline_pass.cc
Lines changed: 11 additions & 11 deletions b/‎lite/core/optimizer/mir/elimination/fill_constant_calc_offline_pass.cc
Lines changed: 11 additions & 11 deletions
@@ -98,6 +98,10 @@ class PatternMatcher {
                                      int index = -1);
     Pattern* IsOperationOutputOperand(NNAdapterOperationType type,
                                       int index = -1);
+    Pattern* IsModelInputOperand();
+    Pattern* IsModelOutputOperand();
+    Pattern* IsNotModelInputOperand();
+    Pattern* IsNotModelOutputOperand();
     Pattern* CheckInputCount(int num);
     Pattern* CheckOutputCount(int num);
     // Mark the pattern matched node to be deleted, so its inlinks and outlinks
 
@@ -186,10 +186,14 @@ core::Operand* InsertReshapeOperation(
     const NNAdapterOperandDimensionType& input_dimensions,
     std::vector<int32_t> shape = {});
 // Append or insert a dummy add operation, set the addend to a zero operand
-core::Operand* AppendDummyOperation(core::Model* model,
-                                    core::Operand* input_operand);
-core::Operand* InsertDummyOperation(core::Model* model,
-                                    core::Operand* output_operand);
+core::Operand* AppendDummyAddOperation(core::Model* model,
+                                       core::Operand* input_operand);
+core::Operand* InsertDummyAddOperation(core::Model* model,
+                                       core::Operand* output_operand);
+core::Operand* AppendDummySubOperation(core::Model* model,
+                                       core::Operand* input_operand);
+core::Operand* InsertDummySubOperation(core::Model* model,
+                                       core::Operand* output_operand);
 // Append or insert a unary activiation or other operation which has only one
 // input and output operand
 core::Operand* AppendUnaryOperation(core::Model* model,
@@ -206,6 +210,13 @@ core::Operand* AppendRequantOperation(core::Model* model,
 core::Operand* InsertRequantOperation(core::Model* model,
                                       core::Operand* output_operand,
                                       void* input_quant_params);
+// Append or insert a softmax operation
+core::Operand* AppendSoftmaxOperation(core::Model* model,
+                                      core::Operand* input_operand,
+                                      int32_t axis);
+core::Operand* InsertSoftmaxOperation(core::Model* model,
+                                      core::Operand* output_operand,
+                                      int32_t axis);
 
 // Sort the operations of the specified model in topological order
 std::vector<const core::Operation*> SortOperationsInTopologicalOrder(
 
@@ -41,7 +41,7 @@ void FixMultipleOutputsOps(core::Model* model) {
           auto output_operand = output_operands[i];
           if (IsModelOutputOperand(output_operand)) {
             auto dummy_output_operand =
-                InsertDummyOperation(model, output_operand);
+                InsertDummyAddOperation(model, output_operand);
             UpdateOperationOutputOperands(
                 operation, output_operand, dummy_output_operand);
           }
 
@@ -33,7 +33,8 @@ void FixNoInputsOps(core::Model* model) {
       auto output_operand = model->output_operands[i];
       if (IsModelOutputOperand(output_operand)) {
         output_operand->type.lifetime = NNADAPTER_CONSTANT_COPY;
-        auto dummy_output_operand = AppendDummyOperation(model, output_operand);
+        auto dummy_output_operand =
+            AppendDummyAddOperation(model, output_operand);
         UpdateModelOutputOperands(model, output_operand, dummy_output_operand);
       }
     }
 
@@ -36,7 +36,7 @@ static void ReduceOpsAddDummyOperation(core::Model* model,
   auto reduce_all =
       axes_size == static_cast<int>(input_operand->type.dimensions.count);
   if (!keep_dim && reduce_all && IsModelOutputOperand(output_operand)) {
-    auto dummy_output_operand = InsertDummyOperation(model, output_operand);
+    auto dummy_output_operand = InsertDummyAddOperation(model, output_operand);
     UpdateOperationOutputOperands(
         operation, output_operand, dummy_output_operand);
   }
 
@@ -37,7 +37,7 @@ void FixMultipleOutputsOps(core::Model* model) {
           auto output_operand = output_operands[i];
           if (IsModelOutputOperand(output_operand)) {
             auto dummy_output_operand =
-                InsertDummyOperation(model, output_operand);
+                InsertDummyAddOperation(model, output_operand);
             UpdateOperationOutputOperands(
                 operation, output_operand, dummy_output_operand);
           }
 
@@ -47,7 +47,8 @@ static void FixRELUDepthwiseConv2D(core::Model* model,
     bool is_depthwise_mode = group != 1 && input_channel_size == group &&
                              output_channel_size % input_channel_size == 0;
     if (is_depthwise_mode) {
-      auto dummy_output_operand = InsertDummyOperation(model, output_operand);
+      auto dummy_output_operand =
+          InsertDummyAddOperation(model, output_operand);
       UpdateOperationOutputOperands(
           operation, output_operand, dummy_output_operand);
       break;
 
@@ -179,6 +179,42 @@ PatternMatcher::Pattern::IsOperationOutputOperand(NNAdapterOperationType type,
   return this;
 }
 
+NNADAPTER_EXPORT PatternMatcher::Pattern *
+PatternMatcher::Pattern::IsModelInputOperand() {
+  IsOperand();
+  conditions.emplace_back([=](const Node *node) {
+    return nnadapter::IsModelInputOperand(node->operand);
+  });
+  return this;
+}
+
+NNADAPTER_EXPORT PatternMatcher::Pattern *
+PatternMatcher::Pattern::IsModelOutputOperand() {
+  IsOperand();
+  conditions.emplace_back([=](const Node *node) {
+    return nnadapter::IsModelOutputOperand(node->operand);
+  });
+  return this;
+}
+
+NNADAPTER_EXPORT PatternMatcher::Pattern *
+PatternMatcher::Pattern::IsNotModelInputOperand() {
+  IsOperand();
+  conditions.emplace_back([=](const Node *node) {
+    return !nnadapter::IsModelInputOperand(node->operand);
+  });
+  return this;
+}
+
+NNADAPTER_EXPORT PatternMatcher::Pattern *
+PatternMatcher::Pattern::IsNotModelOutputOperand() {
+  IsOperand();
+  conditions.emplace_back([=](const Node *node) {
+    return !nnadapter::IsModelOutputOperand(node->operand);
+  });
+  return this;
+}
+
 NNADAPTER_EXPORT PatternMatcher::Pattern *PatternMatcher::Pattern::IsOperation(
     NNAdapterOperationType type) {
   conditions.emplace_back([type](const Node *node) {
 
@@ -732,6 +732,7 @@ NNADAPTER_EXPORT core::Operand* InsertReshapeOperation(
 
 core::Operand* AddDummyOperation(core::Model* model,
                                  core::Operand* reference_operand,
+                                 NNAdapterOperationType operation_type,
                                  bool after = true) {
   auto target_operand = AddOperand(model);
   CopyOperandType(&target_operand->type, reference_operand->type);
@@ -754,7 +755,7 @@ core::Operand* AddDummyOperation(core::Model* model,
   auto fuse_code_operand = AddInt32ConstantOperand(model, 0);
   // Insert a new ADD operation
   auto dummy_add_operation = AddOperation(model);
-  dummy_add_operation->type = NNADAPTER_ADD;
+  dummy_add_operation->type = operation_type;
   dummy_add_operation->input_operands = {
       after ? reference_operand : target_operand,
       zero_operand,
@@ -764,14 +765,24 @@ core::Operand* AddDummyOperation(core::Model* model,
   return target_operand;
 }
 
-NNADAPTER_EXPORT core::Operand* AppendDummyOperation(
+NNADAPTER_EXPORT core::Operand* AppendDummyAddOperation(
     core::Model* model, core::Operand* input_operand) {
-  return AddDummyOperation(model, input_operand, true);
+  return AddDummyOperation(model, input_operand, NNADAPTER_ADD, true);
 }
 
-NNADAPTER_EXPORT core::Operand* InsertDummyOperation(
+NNADAPTER_EXPORT core::Operand* InsertDummyAddOperation(
     core::Model* model, core::Operand* output_operand) {
-  return AddDummyOperation(model, output_operand, false);
+  return AddDummyOperation(model, output_operand, NNADAPTER_ADD, false);
+}
+
+NNADAPTER_EXPORT core::Operand* AppendDummySubOperation(
+    core::Model* model, core::Operand* input_operand) {
+  return AddDummyOperation(model, input_operand, NNADAPTER_SUB, true);
+}
+
+NNADAPTER_EXPORT core::Operand* InsertDummySubOperation(
+    core::Model* model, core::Operand* output_operand) {
+  return AddDummyOperation(model, output_operand, NNADAPTER_SUB, false);
 }
 
 core::Operand* AddUnaryOperation(core::Model* model,
@@ -884,6 +895,35 @@ NNADAPTER_EXPORT core::Operand* InsertRequantOperation(
   return AddRequantOperation(model, output_operand, input_quant_params, false);
 }
 
+core::Operand* AddSoftmaxOperation(core::Model* model,
+                                   core::Operand* reference_operand,
+                                   int32_t axis = -1,
+                                   bool after = true) {
+  auto target_operand = AddOperand(model);
+  CopyOperandType(&target_operand->type, reference_operand->type);
+  if (!IsTemporaryShapeOperand(reference_operand)) {
+    target_operand->type.lifetime = NNADAPTER_TEMPORARY_VARIABLE;
+  }
+  auto softmax_operation = AddOperation(model);
+  softmax_operation->type = NNADAPTER_SOFTMAX;
+  auto axis_operand = AddInt32ConstantOperand(model, axis);
+  softmax_operation->input_operands = {
+      after ? reference_operand : target_operand, axis_operand};
+  softmax_operation->output_operands = {after ? target_operand
+                                              : reference_operand};
+  return target_operand;
+}
+
+NNADAPTER_EXPORT core::Operand* AppendSoftmaxOperation(
+    core::Model* model, core::Operand* input_operand, int32_t axis) {
+  return AddSoftmaxOperation(model, input_operand, axis, true);
+}
+
+NNADAPTER_EXPORT core::Operand* InsertSoftmaxOperation(
+    core::Model* model, core::Operand* output_operand, int32_t axis) {
+  return AddSoftmaxOperation(model, output_operand, axis, false);
+}
+
 #define SORT_OPERATIONS_IN_TOPOLOGICAL_ORDER(T)                               \
   NNADAPTER_EXPORT std::vector<T core::Operation*>                            \
   SortOperationsInTopologicalOrder(T core::Model* model) {                    \
 
@@ -56,8 +56,8 @@ void FillConstantCalcOfflinePass::RemoveFillConstantPattern(
       }
     }
     if (has_extra_producers) {
-      LOG(WARNING)
-          << "Unsupported for op output var containing multiple producers";
+      VLOG(5) << "WARNING: Unsupported for op output var containing multiple "
+                 "producers";
       continue;
     }
     std::set<const Node*> nodes2rm_;
@@ -68,24 +68,24 @@ void FillConstantCalcOfflinePass::RemoveFillConstantPattern(
          !op_desc->Input("ValueTensor").empty()) ||
         (op_desc->HasInput("str_value") &&
          !op_desc->GetAttr<std::string>("str_value").empty())) {
-      LOG(WARNING) << "Unsupported ValueTensor input or str_value input for "
-                      "fill_contant op.";
+      VLOG(5) << "WARNING: Unsupported ValueTensor input or str_value input "
+                 "for fill_contant op.";
       continue;
     } else if (!op_desc->HasAttr("value")) {
-      LOG(WARNING)
-          << "One of ValueTensor, str_value(attr) or value(attr) must be set.";
+      VLOG(5) << "WARNING: One of ValueTensor, str_value(attr) or value(attr) "
+                 "must be set.";
       continue;
     }
     if ((op_desc->HasInput("ShapeTensor") &&
          !op_desc->Input("ShapeTensor").empty()) ||
         (op_desc->HasInput("ShapeTensorList") &&
          !op_desc->Input("ShapeTensorList").empty())) {
-      LOG(WARNING) << "Unsupported ShapeTensor or ShapeTensorList input for "
-                      "fill_contant op.";
+      VLOG(5) << "WARNING: Unsupported ShapeTensor or ShapeTensorList input "
+                 "for fill_contant op.";
       continue;
     } else if (!op_desc->HasAttr("shape")) {
-      LOG(WARNING)
-          << "One of ShapeTensor, ShapeTensorList or shape(attr) must be set.";
+      VLOG(5) << "WARNING: One of ShapeTensor, ShapeTensorList or shape(attr) "
+                 "must be set.";
       continue;
     }
     // Get fill_constant's attr
@@ -110,7 +110,7 @@ void FillConstantCalcOfflinePass::RemoveFillConstantPattern(
         FillConstData<float>(out_t, static_cast<float>(value));
         break;
       default:
-        LOG(WARNING) << "Unsupported dtype for fill_constant op: " << dtype;
+        VLOG(5) << "WARNING: Unsupported dtype for fill_constant op: " << dtype;
         continue;
     }
     // Offline calc fill_constant, only retain output tensor as persistable
Original file line number	Diff line number	Diff line change
`@@ -41,7 +41,7 @@ void FixMultipleOutputsOps(core::Model* model) {`
`41`	`41`	`auto output_operand = output_operands[i];`
`42`	`42`	`if (IsModelOutputOperand(output_operand)) {`
`43`	`43`	`auto dummy_output_operand =`
`44`		`- InsertDummyOperation(model, output_operand);`
	`44`	`+ InsertDummyAddOperation(model, output_operand);`
`45`	`45`	`UpdateOperationOutputOperands(`
`46`	`46`	`operation, output_operand, dummy_output_operand);`
`47`	`47`	`}`
Original file line number	Diff line number	Diff line change
`@@ -33,7 +33,8 @@ void FixNoInputsOps(core::Model* model) {`
`33`	`33`	`auto output_operand = model->output_operands[i];`
`34`	`34`	`if (IsModelOutputOperand(output_operand)) {`
`35`	`35`	`output_operand->type.lifetime = NNADAPTER_CONSTANT_COPY;`
`36`		`- auto dummy_output_operand = AppendDummyOperation(model, output_operand);`
	`36`	`+ auto dummy_output_operand =`
	`37`	`+ AppendDummyAddOperation(model, output_operand);`
`37`	`38`	`UpdateModelOutputOperands(model, output_operand, dummy_output_operand);`
`38`	`39`	`}`
`39`	`40`	`}`
Original file line number	Diff line number	Diff line change
`@@ -36,7 +36,7 @@ static void ReduceOpsAddDummyOperation(core::Model* model,`
`36`	`36`	`auto reduce_all =`
`37`	`37`	`axes_size == static_cast<int>(input_operand->type.dimensions.count);`
`38`	`38`	`if (!keep_dim && reduce_all && IsModelOutputOperand(output_operand)) {`
`39`		`- auto dummy_output_operand = InsertDummyOperation(model, output_operand);`
	`39`	`+ auto dummy_output_operand = InsertDummyAddOperation(model, output_operand);`
`40`	`40`	`UpdateOperationOutputOperands(`
`41`	`41`	`operation, output_operand, dummy_output_operand);`
`42`	`42`	`}`
Original file line number	Diff line number	Diff line change
`@@ -37,7 +37,7 @@ void FixMultipleOutputsOps(core::Model* model) {`
`37`	`37`	`auto output_operand = output_operands[i];`
`38`	`38`	`if (IsModelOutputOperand(output_operand)) {`
`39`	`39`	`auto dummy_output_operand =`
`40`		`- InsertDummyOperation(model, output_operand);`
	`40`	`+ InsertDummyAddOperation(model, output_operand);`
`41`	`41`	`UpdateOperationOutputOperands(`
`42`	`42`	`operation, output_operand, dummy_output_operand);`
`43`	`43`	`}`