jd-opensource
diff --git a/‎CMakeLists.txt‎
Lines changed: 18 additions & 1 deletion b/‎CMakeLists.txt‎
Lines changed: 18 additions & 1 deletion
diff --git a/‎setup.py‎
Lines changed: 11 additions & 1 deletion b/‎setup.py‎
Lines changed: 11 additions & 1 deletion
diff --git a/‎xllm/core/common/CMakeLists.txt‎
Lines changed: 1 addition & 0 deletions b/‎xllm/core/common/CMakeLists.txt‎
Lines changed: 1 addition & 0 deletions
diff --git a/‎xllm/core/distributed_runtime/CMakeLists.txt‎
Lines changed: 1 addition & 0 deletions b/‎xllm/core/distributed_runtime/CMakeLists.txt‎
Lines changed: 1 addition & 0 deletions
diff --git a/‎xllm/core/distributed_runtime/collective_service.cpp‎
Lines changed: 1 addition & 3 deletions b/‎xllm/core/distributed_runtime/collective_service.cpp‎
Lines changed: 1 addition & 3 deletions
diff --git a/‎xllm/core/distributed_runtime/worker_server.cpp‎
Lines changed: 3 additions & 0 deletions b/‎xllm/core/distributed_runtime/worker_server.cpp‎
Lines changed: 3 additions & 0 deletions
diff --git a/‎xllm/core/framework/CMakeLists.txt‎
Lines changed: 23 additions & 20 deletions b/‎xllm/core/framework/CMakeLists.txt‎
Lines changed: 23 additions & 20 deletions
diff --git a/‎xllm/core/framework/block/CMakeLists.txt‎
Lines changed: 21 additions & 19 deletions b/‎xllm/core/framework/block/CMakeLists.txt‎
Lines changed: 21 additions & 19 deletions
diff --git a/‎xllm/core/framework/dit_model_context.cpp‎
Lines changed: 2 additions & 0 deletions b/‎xllm/core/framework/dit_model_context.cpp‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎xllm/core/framework/dit_model_context.h‎
Lines changed: 4 additions & 0 deletions b/‎xllm/core/framework/dit_model_context.h‎
Lines changed: 4 additions & 0 deletions
@@ -332,7 +332,24 @@ endif()
 
 if(USE_MLU)
   add_definitions(-DUSE_MLU)
-# TODO(mlu): set mlu environment variables
+  set(CMAKE_VERBOSE_MAKEFILE ON)
+  include_directories(
+      $ENV{PYTHON_INCLUDE_PATH}
+      $ENV{PYTORCH_INSTALL_PATH}/include
+      $ENV{PYTORCH_INSTALL_PATH}/include/torch/csrc/api/include
+      $ENV{PYTORCH_MLU_INSTALL_PATH}
+      $ENV{PYTORCH_MLU_INSTALL_PATH}/../
+      $ENV{PYTORCH_MLU_INSTALL_PATH}/csrc
+      $ENV{NEUWARE_HOME}/include
+  )
+
+  link_directories(
+    $ENV{PYTHON_LIB_PATH}
+    $ENV{PYTORCH_INSTALL_PATH}/lib
+    $ENV{PYTORCH_MLU_INSTALL_PATH}/csrc/lib
+    $ENV{PYTORCH_MLU_INSTALL_PATH}
+    $ENV{NEUWARE_HOME}/lib64
+  )
 endif()
 
 # check if USE_CXX11_ABI is set correctly
 
@@ -106,6 +106,14 @@ def get_torch_root_path():
     except ImportError:
         return None
 
+def get_torch_mlu_root_path():
+    try:
+        import torch_mlu
+        import os
+        return os.path.dirname(os.path.abspath(torch_mlu.__file__))
+    except ImportError:
+        return None
+
 
 def set_npu_envs():
     PYTORCH_NPU_INSTALL_PATH = os.getenv("PYTORCH_NPU_INSTALL_PATH")
@@ -196,11 +204,13 @@ def set_npu_envs():
     os.environ["LCCL_DETERMINISTIC"] = "0"
     os.environ["LCCL_PARALLEL"] = "0"
 
-# TODO(mlu): set mlu environment variables
+
 def set_mlu_envs():
     os.environ["PYTHON_INCLUDE_PATH"] = get_python_include_path()
     os.environ["PYTHON_LIB_PATH"] =  get_torch_root_path()
     os.environ["LIBTORCH_ROOT"] = get_torch_root_path()
+    os.environ["PYTORCH_INSTALL_PATH"] = get_torch_root_path()
+    os.environ["PYTORCH_MLU_INSTALL_PATH"] = get_torch_mlu_root_path()
 
 class CMakeExtension(Extension):
     def __init__(self, name: str, path: str, sourcedir: str = "") -> None:
 
@@ -34,6 +34,7 @@ cc_library(
     Boost::serialization
     cpprest
     etcd-cpp-api
+    $<$<BOOL:${USE_MLU}>:torch_mlu>
 )
 
 cc_library(
 
@@ -31,6 +31,7 @@ cc_library(
     proto::xllm_proto
     absl::flat_hash_set
     :parallel_state
+    :collective_service
 )
 
 cc_library(
 
@@ -44,7 +44,6 @@ void CollectiveService::Sync(::google::protobuf::RpcController* controller,
                              const proto::AddressInfo* request,
                              proto::CommUniqueIdList* response,
                              ::google::protobuf::Closure* done) {
-#if defined(USE_NPU)
   brpc::ClosureGuard done_guard(done);
 
   std::string address = request->address();
@@ -53,10 +52,9 @@ void CollectiveService::Sync(::google::protobuf::RpcController* controller,
     std::lock_guard<std::mutex> lock(mutex_);
     addrs_map_[global_rank] = address;
   }
-
+#if defined(USE_NPU)
   to_proto_list(root_infos_, response);
 #endif
-  return;
 }
 
 std::unordered_map<int32_t, std::string> CollectiveService::wait() {
 
@@ -91,6 +91,9 @@ void WorkerServer::create_server(const runtime::Options& options,
 
   CollectiveCommunicator comm(worker_global_rank, world_size, dp_size, ep_size);
   const ParallelArgs* parallel_args = comm.parallel_args();
+#if defined(USE_MLU)
+  comm.create_process_groups_cncl(master_node_addr, device);
+#endif
 
   WorkerType worker_type =
       (options.task_type() == "generate") ? WorkerType::LLM : WorkerType::ELM;
 
@@ -22,7 +22,7 @@ add_subdirectory(xtensor)
 add_subdirectory(dit_cache)
 
 cc_library(
-  NAME 
+  NAME
     parallel_state
   HDRS
     mapping_npu.h
@@ -33,30 +33,33 @@ cc_library(
   DEPS
     :common
     torch
-    hccl
+    $<$<BOOL:${USE_MLU}>:torch_mlu>
+    $<$<BOOL:${USE_NPU}>:hccl>
     glog::glog
 )
 
 
-cc_test(
-  NAME 
-    mapping_npu_test
-  SRCS
-    mapping_npu_test.cpp
-  DEPS
-    parallel_state
-    absl::synchronization
-    absl::time
-    GTest::gtest_main
-    xllm_kernels
-    ascendcl
-    atb
-    c_sec
-    spdlog::spdlog
-)
+if(USE_NPU)
+  cc_test(
+    NAME
+      mapping_npu_test
+    SRCS
+      mapping_npu_test.cpp
+    DEPS
+      parallel_state
+      absl::synchronization
+      absl::time
+      GTest::gtest_main
+      xllm_kernels
+      ascendcl
+      atb
+      c_sec
+      spdlog::spdlog
+  )
+endif()
 
 cc_library(
-  NAME 
+  NAME
     model_loader
   HDRS
     hf_model_loader.h
@@ -78,7 +81,7 @@ cc_library(
 )
 
 cc_library(
-  NAME 
+  NAME
     model_context
   HDRS
     model_context.h
 
@@ -28,24 +28,26 @@ cc_library(
     torch
 )
 
-set(TEST_SRCS
-  block_manager_test.cpp
-)
+if(USE_NPU)
+  set(TEST_SRCS
+    block_manager_test.cpp
+  )
 
-cc_test(
-  NAME
-    block_test
-  SRCS
-    ${TEST_SRCS}
-  DEPS
-    :block
-    :flags
-    :kv_cache
-    :prefix_cache
-    absl::random_random
-    Boost::serialization
-    GTest::gtest_main
-)
+  cc_test(
+    NAME
+      block_test
+    SRCS
+      ${TEST_SRCS}
+    DEPS
+      :block
+      :flags
+      :kv_cache
+      :prefix_cache
+      absl::random_random
+      Boost::serialization
+      GTest::gtest_main
+  )
 
-target_link_libraries(block_test PRIVATE brpc OpenSSL::SSL OpenSSL::Crypto ascendcl Folly::folly)
-add_dependencies(block_test brpc-static)
+  target_link_libraries(block_test PRIVATE brpc OpenSSL::SSL OpenSSL::Crypto ascendcl Folly::folly)
+  add_dependencies(block_test brpc-static)
+endif()
@@ -72,6 +72,7 @@ const QuantArgs& DiTModelContext::get_quant_args(
   }
 }
 
+#if defined(USE_NPU)
 ModelContext DiTModelContext::get_model_context(
     const std::string& component) const {
   return ModelContext(parallel_args_,
@@ -80,5 +81,6 @@ ModelContext DiTModelContext::get_model_context(
                       tensor_options_,
                       context_);
 }
+#endif
 
 }  // namespace xllm
@@ -42,7 +42,9 @@ class DiTModelContext {
 
   const QuantArgs& get_quant_args(const std::string& component) const;
 
+#if defined(USE_NPU)
   ModelContext get_model_context(const std::string& component) const;
+#endif
 
   const ParallelArgs& get_parallel_args() const { return parallel_args_; }
 
@@ -52,7 +54,9 @@ class DiTModelContext {
 
   const std::string& model_type() const { return model_type_; }
 
+#if defined(USE_NPU)
   const atb::Context* get_atb_context() const { return context_; }
+#endif
 
  private:
   std::unordered_map<std::string, ModelArgs> model_args_;
Original file line number	Diff line number	Diff line change
`@@ -34,6 +34,7 @@ cc_library(`
`34`	`34`	`Boost::serialization`
`35`	`35`	`cpprest`
`36`	`36`	`etcd-cpp-api`
	`37`	`+ $<$<BOOL:${USE_MLU}>:torch_mlu>`
`37`	`38`	`)`
`38`	`39`
`39`	`40`	`cc_library(`
Original file line number	Diff line number	Diff line change
`@@ -31,6 +31,7 @@ cc_library(`
`31`	`31`	`proto::xllm_proto`
`32`	`32`	`absl::flat_hash_set`
`33`	`33`	`:parallel_state`
	`34`	`+ :collective_service`
`34`	`35`	`)`
`35`	`36`
`36`	`37`	`cc_library(`
Original file line number	Diff line number	Diff line change
`@@ -72,6 +72,7 @@ const QuantArgs& DiTModelContext::get_quant_args(`
`72`	`72`	`}`
`73`	`73`	`}`
`74`	`74`
	`75`	`+#if defined(USE_NPU)`
`75`	`76`	`ModelContext DiTModelContext::get_model_context(`
`76`	`77`	`const std::string& component) const {`
`77`	`78`	`return ModelContext(parallel_args_,`
`@@ -80,5 +81,6 @@ ModelContext DiTModelContext::get_model_context(`
`80`	`81`	`tensor_options_,`
`81`	`82`	`context_);`
`82`	`83`	`}`
	`84`	`+#endif`
`83`	`85`
`84`	`86`	`} // namespace xllm`