fix

shihaobai · shihaobai · commit 7d18bdcb7a27 · 2025-03-10T21:47:28.000+08:00
diff --git a/lightllm/models/deepseek2/layer_weights/transformer_layer_weight.py b/lightllm/models/deepseek2/layer_weights/transformer_layer_weight.py
@@ -111,14 +111,17 @@ def load_hf_weights(self, weights):
             if self.quant_cfg.quantized_weight:
                 kv_b_proj_ = weight_dequant(
                     kv_b_proj_.cuda(),
-                    weights[f"model.layers.{self.layer_num_}.self_attn.kv_b_proj." + kv_b_quant_method.weight_scale_suffix].cuda(),
+                    weights[
+                        f"model.layers.{self.layer_num_}.self_attn.kv_b_proj." + kv_b_quant_method.weight_scale_suffix
+                    ].cuda(),
                 ).cpu()
             weights[f"model.layers.{self.layer_num_}.self_attn.k_b_proj.weight"] = self._load_kb(kv_b_proj_)
             weights[f"model.layers.{self.layer_num_}.self_attn.v_b_proj.weight"] = self._load_vb(kv_b_proj_)
 
         if (
             self.quant_cfg.quantized_weight
-            and f"model.layers.{self.layer_num_}.self_attn.kv_b_proj." + kv_b_quant_method.weight_scale_suffix in weights
+            and f"model.layers.{self.layer_num_}.self_attn.kv_b_proj." + kv_b_quant_method.weight_scale_suffix
+            in weights
         ):
             kv_b_proj_scale_ = weights[
                 f"model.layers.{self.layer_num_}.self_attn.kv_b_proj." + kv_b_quant_method.weight_scale_suffix
@@ -175,14 +178,14 @@ def _init_qkvo(self):
         self.k_b_proj_ = ROWBMMWeight(
             weight_name=f"model.layers.{self.layer_num_}.self_attn.k_b_proj.weight",
             data_type=self.data_type_,
-            quant_cfg=self.quant_cfg,
+            quant_cfg=None,
             layer_num=self.layer_num_,
             name="k_b_proj",
         )
         self.v_b_proj_ = ROWBMMWeight(
             weight_name=f"model.layers.{self.layer_num_}.self_attn.v_b_proj.weight",
             data_type=self.data_type_,
-            quant_cfg=self.quant_cfg,
+            quant_cfg=None,
             layer_num=self.layer_num_,
             name="v_b_proj",
         )
@@ -247,7 +250,7 @@ def _init_qkvo_dp(self):
         self.k_b_proj_ = ROWBMMWeight(
             weight_name=f"model.layers.{self.layer_num_}.self_attn.k_b_proj.weight",
             data_type=self.data_type_,
-            quant_cfg=self.quant_cfg,
+            quant_cfg=None,
             layer_num=self.layer_num_,
             name="k_b_proj",
             tp_rank=0,
@@ -257,7 +260,7 @@ def _init_qkvo_dp(self):
         self.v_b_proj_ = ROWBMMWeight(
             weight_name=f"model.layers.{self.layer_num_}.self_attn.v_b_proj.weight",
             data_type=self.data_type_,
-            quant_cfg=self.quant_cfg,
+            quant_cfg=None,
             layer_num=self.layer_num_,
             name="v_b_proj",
             tp_rank=0,