remove comment code

wangbluo · wangbluo · commit a8408b4d314c · 2024-05-07T07:08:56.000Z
diff --git a/colossalai/shardformer/modeling/opt.py b/colossalai/shardformer/modeling/opt.py
@@ -989,8 +989,6 @@ def forward(
                 process_group=shard_config.tensor_parallel_process_group,
                 vocab_size=self.lm_head.out_features,
             )
-            # loss_fct = CrossEntropyLoss()
-            # loss = loss_fct(shift_logits.view(-1, self.config.vocab_size), shift_labels.view(-1))
 
         if not return_dict:
             output = (logits,) + outputs[1:]

Original file line number	Diff line number	Diff line change
`@@ -989,8 +989,6 @@ def forward(`
`989`	`989`	`process_group=shard_config.tensor_parallel_process_group,`
`990`	`990`	`vocab_size=self.lm_head.out_features,`
`991`	`991`	`)`
`992`		`- # loss_fct = CrossEntropyLoss()`
`993`		`- # loss = loss_fct(shift_logits.view(-1, self.config.vocab_size), shift_labels.view(-1))`
`994`	`992`
`995`	`993`	`if not return_dict:`
`996`	`994`	`output = (logits,) + outputs[1:]`