[DeepRec] Support multi-model deployment in SessionGroup. (#13)

shanshanpt · web-flow · commit 1e6006927716 · 2022-12-19T10:44:53.000+08:00
diff --git a/WORKSPACE b/WORKSPACE
@@ -11,8 +11,8 @@ load("//tensorflow_serving:repo.bzl", "tensorflow_http_archive")
 
 tensorflow_http_archive(
     name = "org_tensorflow",
-    sha256 = "46ad5154cec11995d5feba1401b6d0d72be457e48a9776bfce04b13c009ac412",
-    git_commit = "0fe26688a57eee31bda56a57d8f05e7071c78c9b",
+    sha256 = "95c2e401a57024a57fcf757498f0e962519e6967381b630d6afc3a4a80c7ee37",
+    git_commit = "4b8c11fa0c72e1b3483ef8b1960c4790dda0e437",
 )
 
 load("@bazel_tools//tools/build_defs/repo:http.bzl", "http_archive")
diff --git a/tensorflow_serving/config/model_server_config.proto b/tensorflow_serving/config/model_server_config.proto
@@ -65,6 +65,9 @@ message ModelConfig {
   //
   // (This can be changed once a model is in serving.)
   LoggingConfig logging_config = 6;
+
+  // model_id in multi-models.
+  int32 model_id = 9;
 }
 
 // Static list of models to be loaded for serving.
diff --git a/tensorflow_serving/core/servable_data.h b/tensorflow_serving/core/servable_data.h
@@ -65,12 +65,16 @@ class ServableData {
   // !this->ok().
   T ConsumeDataOrDie();
 
+  void SetModelId(int id) { model_id_ = id; }
+  int GetModelId() const { return model_id_; }
+
  private:
   ServableData() = delete;
 
   const ServableId id_;
   const Status status_;
   T data_;
+  int model_id_ = 0;
 };
 
 // Helper static method to create a ServableData object. Caller may skip
diff --git a/tensorflow_serving/core/source_adapter.h b/tensorflow_serving/core/source_adapter.h
@@ -135,6 +135,10 @@ class UnarySourceAdapter : public SourceAdapter<InputType, OutputType> {
   // Converts a single InputType instance into a corresponding OutputType
   // instance.
   virtual Status Convert(const InputType& data, OutputType* converted_data) = 0;
+  virtual Status Convert(const InputType& data, int model_id,
+      OutputType* converted_data) {
+    return Convert(data, converted_data);
+  }
 };
 
 // A source adapter that converts every incoming ServableData<InputType> item
@@ -210,7 +214,8 @@ UnarySourceAdapter<InputType, OutputType>::Adapt(
   for (const ServableData<InputType>& version : versions) {
     if (version.status().ok()) {
       OutputType adapted_data;
-      Status adapt_status = Convert(version.DataOrDie(), &adapted_data);
+      Status adapt_status = Convert(version.DataOrDie(),
+          version.GetModelId(), &adapted_data);
       if (adapt_status.ok()) {
         adapted_versions.emplace_back(
             ServableData<OutputType>{version.id(), std::move(adapted_data)});
diff --git a/tensorflow_serving/core/test_util/session_test_util.cc b/tensorflow_serving/core/test_util/session_test_util.cc
@@ -62,7 +62,7 @@ class DelegatingSessionFactory : public SessionFactory {
 
   Status NewSessionGroup(const SessionOptions& options,
                          SessionGroup** out_session_group,
-                         int session_num = 1) {
+                         const SessionGroupMetadata& metadata) {
     return errors::Internal(
         "NewSessionGroup method not implemented in DelegatingSessionFactory.");
   }
diff --git a/tensorflow_serving/example/config_files/README b/tensorflow_serving/example/config_files/README
@@ -0,0 +1,3 @@
+Usage:
+
+CUDA_VISIBLE_DEVICES=0,1 tensorflow_model_server --use_session_group=true --model_config_file=session_group_multi_models_config --platform_config_file=session_group_multi_models_platform_config
diff --git a/tensorflow_serving/example/config_files/models.config b/tensorflow_serving/example/config_files/models.config
@@ -0,0 +1,12 @@
+model_config_list:{
+    config:{
+      name:"pb1",
+      base_path:"/data/workspace/serving-model/multi_wdl_model/pb1",
+      model_platform:"tensorflow"
+    },
+    config:{
+      name:"pb2",
+      base_path:"/data/workspace/serving-model/multi_wdl_model/pb2",
+      model_platform:"tensorflow"
+    },
+}
diff --git a/tensorflow_serving/example/config_files/platform_config b/tensorflow_serving/example/config_files/platform_config
@@ -0,0 +1,17 @@
+platform_configs {
+  key: "tensorflow"
+  value {
+    source_adapter_config {
+      [type.googleapis.com/tensorflow.serving.SavedModelBundleSourceAdapterConfig] {
+        legacy_config {
+          session_config {
+            gpu_options {
+              allow_growth: true
+            }
+          }
+        }
+      }
+    }
+  }
+}
+
diff --git a/tensorflow_serving/example/config_files/session_group_multi_models_config b/tensorflow_serving/example/config_files/session_group_multi_models_config
@@ -0,0 +1,14 @@
+model_config_list:{
+    config:{
+      name:"pb1",
+      base_path:"/data/workspace/serving-model/multi_wdl_model/pb1",
+      model_platform:"tensorflow",
+      model_id: 0
+    },
+    config:{
+      name:"pb2",
+      base_path:"/data/workspace/serving-model/multi_wdl_model/pb2",
+      model_platform:"tensorflow",
+      model_id: 1
+    },
+}
diff --git a/tensorflow_serving/example/config_files/session_group_multi_models_platform_config b/tensorflow_serving/example/config_files/session_group_multi_models_platform_config
@@ -0,0 +1,36 @@
+platform_configs {
+  key: "tensorflow"
+  value {
+    source_adapter_config {
+      [type.googleapis.com/tensorflow.serving.SavedModelBundleV2SourceAdapterConfig] {
+        legacy_config {
+          model_session_config {
+            session_config {
+              gpu_options {
+                allow_growth: true
+              }
+              intra_op_parallelism_threads: 8
+              inter_op_parallelism_threads: 8
+              use_per_session_threads: true
+              use_per_session_stream: true
+            }
+            session_num: 2
+          }
+          model_session_config {
+            session_config {
+              gpu_options {
+                allow_growth: true
+              }
+              intra_op_parallelism_threads: 16
+              inter_op_parallelism_threads: 16
+              use_per_session_threads: true
+              use_per_session_stream: true
+            }
+            session_num: 4
+          }
+        }
+      }
+    }
+  }
+}
+
diff --git a/tensorflow_serving/model_servers/main.cc b/tensorflow_serving/model_servers/main.cc
@@ -153,6 +153,9 @@ int main(int argc, char** argv) {
       tensorflow::Flag("use_per_session_threads",
                        &options.use_per_session_threads,
                       "Use thread pool per session or not."),
+      tensorflow::Flag("use_session_group",
+                       &options.use_session_group,
+                      "Use session_group or not."),
       tensorflow::Flag("session_num_per_group",
                        &options.session_num_per_group,
                        "Session num for a session group, "
diff --git a/tensorflow_serving/model_servers/server.cc b/tensorflow_serving/model_servers/server.cc
@@ -257,17 +257,19 @@ Status CreatePlatformConfigMapV2(const Server::Options& server_options,
   const bool use_saved_model = true;
 
   SessionGroupBundleConfig session_bundle_config;
+  auto model_session_config =
+      session_bundle_config.add_model_session_config();
 
   // session num
-  session_bundle_config.set_session_num(
+  model_session_config->set_session_num(
       server_options.session_num_per_group);
 
   // use_per_session_threads
-  session_bundle_config.mutable_session_config()
+  model_session_config->mutable_session_config()
       ->set_use_per_session_threads(
           server_options.use_per_session_threads);
 
-  session_bundle_config.mutable_session_config()
+  model_session_config->mutable_session_config()
       ->set_use_per_session_stream(
           server_options.use_multi_stream);
 
@@ -287,35 +289,34 @@ Status CreatePlatformConfigMapV2(const Server::Options& server_options,
         "server_options.batching_parameters_file is set without setting "
         "server_options.enable_batching to true.");
   }
-
-  session_bundle_config.mutable_session_config()
+  model_session_config->mutable_session_config()
       ->mutable_gpu_options()
       ->set_per_process_gpu_memory_fraction(
           server_options.per_process_gpu_memory_fraction);
 
   if (server_options.tensorflow_intra_op_parallelism > 0 &&
       server_options.tensorflow_inter_op_parallelism > 0 &&
-      server_options.tensorflow_session_parallelism > 0){
+      server_options.tensorflow_session_parallelism > 0) {
       return errors::InvalidArgument("Either configure "
         "server_options.tensorflow_session_parallelism "
         "or (server_options.tensorflow_intra_op_parallelism, "
         "server_options.tensorflow_inter_op_parallelism) separately. "
         "You cannot configure all.");
   } else if (server_options.tensorflow_intra_op_parallelism > 0 ||
-      server_options.tensorflow_inter_op_parallelism > 0){
-          session_bundle_config.mutable_session_config()
-          ->set_intra_op_parallelism_threads(
-              server_options.tensorflow_intra_op_parallelism);
-          session_bundle_config.mutable_session_config()
-          ->set_inter_op_parallelism_threads(
-              server_options.tensorflow_inter_op_parallelism);
+      server_options.tensorflow_inter_op_parallelism > 0) {
+    model_session_config->mutable_session_config()
+        ->set_intra_op_parallelism_threads(
+            server_options.tensorflow_intra_op_parallelism);
+    model_session_config->mutable_session_config()
+        ->set_inter_op_parallelism_threads(
+            server_options.tensorflow_inter_op_parallelism);
   } else {
-      session_bundle_config.mutable_session_config()
-      ->set_intra_op_parallelism_threads(
-          server_options.tensorflow_session_parallelism);
-      session_bundle_config.mutable_session_config()
-      ->set_inter_op_parallelism_threads(
-          server_options.tensorflow_session_parallelism);
+    model_session_config->mutable_session_config()
+        ->set_intra_op_parallelism_threads(
+            server_options.tensorflow_session_parallelism);
+    model_session_config->mutable_session_config()
+        ->set_inter_op_parallelism_threads(
+            server_options.tensorflow_session_parallelism);
   }
 
   const std::vector<string> tags =
@@ -344,10 +345,7 @@ Status CreatePlatformConfigMapV2(const Server::Options& server_options,
 Status Server::BuildAndStart(const Options& server_options) {
   const bool use_saved_model = true;
 
-  bool use_session_group = false;
-  if (server_options.session_num_per_group > 0) {
-    use_session_group = true;
-  }
+  bool use_session_group = server_options.use_session_group;
 
   if (server_options.grpc_port == 0) {
     return errors::InvalidArgument("server_options.grpc_port is not set.");
@@ -368,6 +366,7 @@ Status Server::BuildAndStart(const Options& server_options) {
   if (server_options.model_config_file.empty()) {
     options.model_server_config = BuildSingleModelConfig(
         server_options.model_name, server_options.model_base_path);
+    use_session_group = server_options.session_num_per_group > 1;
   } else {
     TF_RETURN_IF_ERROR(ParseProtoTextFile<ModelServerConfig>(
         server_options.model_config_file, &options.model_server_config));
diff --git a/tensorflow_serving/model_servers/server.h b/tensorflow_serving/model_servers/server.h
@@ -86,6 +86,7 @@ class Server {
 
     // For session group
     bool use_per_session_threads = false;
+    bool use_session_group = false;
     tensorflow::int32 session_num_per_group = 0;
     bool use_multi_stream = false;
 
diff --git a/tensorflow_serving/model_servers/server_core.cc b/tensorflow_serving/model_servers/server_core.cc
@@ -575,6 +575,8 @@ FileSystemStoragePathSourceConfig ServerCore::CreateStoragePathSourceConfig(
         source_config.add_servables();
     servable->set_servable_name(model.name());
     servable->set_base_path(model.base_path());
+    // user set model_id here.
+    servable->set_model_id(model.model_id());
     *servable->mutable_servable_version_policy() = model.model_version_policy();
   }
   return source_config;
diff --git a/tensorflow_serving/servables/tensorflow/bundle_factory_util.cc b/tensorflow_serving/servables/tensorflow/bundle_factory_util.cc
@@ -75,11 +75,27 @@ SessionOptions GetSessionOptions(const SessionBundleConfig& config) {
   return options;
 }
 
-SessionGroupOptions GetSessionOptions(const SessionGroupBundleConfig& config) {
+SessionGroupOptions GetSessionOptions(const SessionGroupBundleConfig& config, int model_id) {
   SessionGroupOptions options;
   options.target = config.session_target();
-  options.config = config.session_config();
-  options.session_num = config.session_num();
+  if (model_id >= config.model_session_config_size()) {
+    LOG(FATAL) << "Multi model config error, required #" << model_id
+               << " model config, but got max config count "
+               << config.model_session_config_size();
+  }
+  options.config = config.model_session_config()[model_id].session_config();
+  options.metadata.session_num = config.model_session_config()[model_id].session_num();
+  if (options.metadata.session_num == 0) {
+    LOG(WARNING) << "User set use_session_group=true, but the #" << model_id
+                 << " model config don't contain session_num field, "
+                 << "please check platform_config_file config file. "
+                 << "Now use default value 1.";
+    options.metadata.session_num = 1;
+  }
+  for (auto& conf : config.model_session_config()) {
+    options.metadata.streams_vec.emplace_back(conf.session_num());
+  }
+  options.metadata.model_id = model_id;
   return options;
 }
 
@@ -169,8 +185,11 @@ Status WrapSessionGroupForBatching(const BatchingParameters& batching_config,
                                    std::unique_ptr<SessionGroup>* session_group) {
   for (int i = 0; i < (*session_group)->GetSessionNum(); ++i) {
     std::unique_ptr<Session>* sess = (*session_group)->GetSessionPtr(i);
-    WrapSessionForBatching(batching_config, batch_scheduler, signatures, sess);
+    Status s = WrapSessionForBatching(batching_config, batch_scheduler, signatures, sess);
+    if (!s.ok()) return s;
   }
+
+  return Status::OK();
 }
 
 Status WrapSessionForBatching(const BatchingParameters& batching_config,
diff --git a/tensorflow_serving/servables/tensorflow/bundle_factory_util.h b/tensorflow_serving/servables/tensorflow/bundle_factory_util.h
@@ -33,7 +33,7 @@ namespace serving {
 // TODO(b/32248363): add SavedModelBundleConfig after we switch Model Server to
 // Saved Model.
 SessionOptions GetSessionOptions(const SessionBundleConfig& config);
-SessionGroupOptions GetSessionOptions(const SessionGroupBundleConfig& config);
+SessionGroupOptions GetSessionOptions(const SessionGroupBundleConfig& config, int model_id);
 
 // Returns RunOptions based on SessionBundleConfig.
 // TODO(b/32248363): add SavedModelBundleConfig after we switch Model Server to
diff --git a/tensorflow_serving/servables/tensorflow/saved_model_bundle_v2_factory.cc b/tensorflow_serving/servables/tensorflow/saved_model_bundle_v2_factory.cc
@@ -88,19 +88,19 @@ Status SavedModelBundleV2Factory::EstimateResourceRequirement(
 }
 
 Status SavedModelBundleV2Factory::CreateSavedModelBundleV2WithMetadata(
-    const Loader::Metadata& metadata, const string& path,
+    const Loader::Metadata& metadata, const string& path, int model_id,
     std::unique_ptr<SavedModelBundleV2>* bundle) {
-  return InternalCreateSavedModelBundleV2(metadata, path, bundle);
+  return InternalCreateSavedModelBundleV2(metadata, path, model_id, bundle);
 }
 
 Status SavedModelBundleV2Factory::CreateSavedModelBundleV2(
-    const string& path, std::unique_ptr<SavedModelBundleV2>* bundle) {
-  return InternalCreateSavedModelBundleV2({}, path, bundle);
+    const string& path, int model_id, std::unique_ptr<SavedModelBundleV2>* bundle) {
+  return InternalCreateSavedModelBundleV2({}, path, model_id, bundle);
 }
 
 Status SavedModelBundleV2Factory::InternalCreateSavedModelBundleV2(
     const absl::optional<Loader::Metadata>& metadata, const string& path,
-    std::unique_ptr<SavedModelBundleV2>* bundle) {
+    int model_id, std::unique_ptr<SavedModelBundleV2>* bundle) {
   bundle->reset(new SavedModelBundleV2);
   std::unordered_set<string> saved_model_tags(
       config_.saved_model_tags().begin(), config_.saved_model_tags().end());
@@ -110,7 +110,7 @@ Status SavedModelBundleV2Factory::InternalCreateSavedModelBundleV2(
     saved_model_tags.insert(kSavedModelTagServe);
   }
   const auto& session_options = [&]() {
-    auto result = GetSessionOptions(config_);
+    auto result = GetSessionOptions(config_, model_id);
     if (metadata.has_value()) {
       auto* session_metadata =
           result.config.mutable_experimental()->mutable_session_metadata();
diff --git a/tensorflow_serving/servables/tensorflow/saved_model_bundle_v2_factory.h b/tensorflow_serving/servables/tensorflow/saved_model_bundle_v2_factory.h
@@ -63,7 +63,7 @@ class SavedModelBundleV2Factory {
   /// @param path      Path to the model.
   /// @param bundle    Newly created SavedModelBundleV2 if the returned Status is
   /// OK.
-  Status CreateSavedModelBundleV2(const string& path,
+  Status CreateSavedModelBundleV2(const string& path, int model_id,
                                   std::unique_ptr<SavedModelBundleV2>* bundle);
 
   /// Instantiates a bundle from a given export or SavedModel path and the given
@@ -75,7 +75,7 @@ class SavedModelBundleV2Factory {
   /// OK.
   Status CreateSavedModelBundleV2WithMetadata(
       const Loader::Metadata& metadata, const string& path,
-      std::unique_ptr<SavedModelBundleV2>* bundle);
+      int model_id, std::unique_ptr<SavedModelBundleV2>* bundle);
 
   /// Estimates the resources a SavedModel bundle will use once loaded, from its
   /// export path.
@@ -96,7 +96,7 @@ class SavedModelBundleV2Factory {
 
   Status InternalCreateSavedModelBundleV2(
       const absl::optional<Loader::Metadata>& metadata, const string& path,
-      std::unique_ptr<SavedModelBundleV2>* bundle);
+      int model_id, std::unique_ptr<SavedModelBundleV2>* bundle);
 
   const SessionGroupBundleConfig config_;
 
diff --git a/tensorflow_serving/servables/tensorflow/saved_model_bundle_v2_source_adapter.cc b/tensorflow_serving/servables/tensorflow/saved_model_bundle_v2_source_adapter.cc
diff --git a/tensorflow_serving/servables/tensorflow/saved_model_bundle_v2_source_adapter.h b/tensorflow_serving/servables/tensorflow/saved_model_bundle_v2_source_adapter.h
diff --git a/tensorflow_serving/servables/tensorflow/session_bundle_config.proto b/tensorflow_serving/servables/tensorflow/session_bundle_config.proto
diff --git a/tensorflow_serving/sources/storage_path/file_system_storage_path_source.cc b/tensorflow_serving/sources/storage_path/file_system_storage_path_source.cc
diff --git a/tensorflow_serving/sources/storage_path/file_system_storage_path_source.proto b/tensorflow_serving/sources/storage_path/file_system_storage_path_source.proto

Original file line number	Diff line number	Diff line change
`@@ -11,8 +11,8 @@ load("//tensorflow_serving:repo.bzl", "tensorflow_http_archive")`
`11`	`11`
`12`	`12`	`tensorflow_http_archive(`
`13`	`13`	`name = "org_tensorflow",`
`14`		`- sha256 = "46ad5154cec11995d5feba1401b6d0d72be457e48a9776bfce04b13c009ac412",`
`15`		`- git_commit = "0fe26688a57eee31bda56a57d8f05e7071c78c9b",`
	`14`	`+ sha256 = "95c2e401a57024a57fcf757498f0e962519e6967381b630d6afc3a4a80c7ee37",`
	`15`	`+ git_commit = "4b8c11fa0c72e1b3483ef8b1960c4790dda0e437",`
`16`	`16`	`)`
`17`	`17`
`18`	`18`	`load("@bazel_tools//tools/build_defs/repo:http.bzl", "http_archive")`
Original file line number	Diff line number	Diff line change
`@@ -65,6 +65,9 @@ message ModelConfig {`
`65`	`65`	`//`
`66`	`66`	`// (This can be changed once a model is in serving.)`
`67`	`67`	`LoggingConfig logging_config = 6;`
	`68`	`+`
	`69`	`+ // model_id in multi-models.`
	`70`	`+ int32 model_id = 9;`
`68`	`71`	`}`
`69`	`72`
`70`	`73`	`// Static list of models to be loaded for serving.`
Original file line number	Diff line number	Diff line change
`@@ -62,7 +62,7 @@ class DelegatingSessionFactory : public SessionFactory {`
`62`	`62`
`63`	`63`	`Status NewSessionGroup(const SessionOptions& options,`
`64`	`64`	`SessionGroup** out_session_group,`
`65`		`- int session_num = 1) {`
	`65`	`+ const SessionGroupMetadata& metadata) {`
`66`	`66`	`return errors::Internal(`
`67`	`67`	`"NewSessionGroup method not implemented in DelegatingSessionFactory.");`
`68`	`68`	`}`
Original file line number	Diff line number	Diff line change
`@@ -0,0 +1,3 @@`
	`1`	`+Usage:`
	`2`	`+`
	`3`	`+CUDA_VISIBLE_DEVICES=0,1 tensorflow_model_server --use_session_group=true --model_config_file=session_group_multi_models_config --platform_config_file=session_group_multi_models_platform_config`