[Enhance] Add layers[-1] to norm & lm_head prefetch

nil0x9 · nil0x9 · commit f9dee2150507 · 2026-01-01T00:23:25.000+08:00
diff --git a/xtuner/v1/model/dense/dense.py b/xtuner/v1/model/dense/dense.py
@@ -269,6 +269,7 @@ def fully_shard(
             offload_policy=CPUOffloadPolicy() if self.fsdp_config.cpu_offload else None,
         )
         self.set_modules_to_forward_prefetch([self.embed_tokens, self.layers["0"]])  # type: ignore
+        list(self.layers.values())[-1].set_modules_to_forward_prefetch([self.norm, self.lm_head])  # type: ignore
 
         self._to_empty_meta()
 
diff --git a/xtuner/v1/model/moe/moe.py b/xtuner/v1/model/moe/moe.py
@@ -779,6 +779,7 @@ def fully_shard(
             offload_policy=CPUOffloadPolicy() if self.fsdp_config.cpu_offload else None,
         )
         self.set_modules_to_forward_prefetch([self.embed_tokens, self.layers["0"]])  # type: ignore
+        list(self.layers.values())[-1].set_modules_to_forward_prefetch([self.norm, self.lm_head])  # type: ignore
 
         for _, module in self.named_modules():
             if isinstance(module, nn.Embedding):

Original file line number	Diff line number	Diff line change
`@@ -269,6 +269,7 @@ def fully_shard(`
`269`	`269`	`offload_policy=CPUOffloadPolicy() if self.fsdp_config.cpu_offload else None,`
`270`	`270`	`)`
`271`	`271`	`self.set_modules_to_forward_prefetch([self.embed_tokens, self.layers["0"]]) # type: ignore`
	`272`	`+ list(self.layers.values())[-1].set_modules_to_forward_prefetch([self.norm, self.lm_head]) # type: ignore`
`272`	`273`
`273`	`274`	`self._to_empty_meta()`
`274`	`275`
Original file line number	Diff line number	Diff line change
`@@ -779,6 +779,7 @@ def fully_shard(`
`779`	`779`	`offload_policy=CPUOffloadPolicy() if self.fsdp_config.cpu_offload else None,`
`780`	`780`	`)`
`781`	`781`	`self.set_modules_to_forward_prefetch([self.embed_tokens, self.layers["0"]]) # type: ignore`
	`782`	`+ list(self.layers.values())[-1].set_modules_to_forward_prefetch([self.norm, self.lm_head]) # type: ignore`
`782`	`783`
`783`	`784`	`for _, module in self.named_modules():`
`784`	`785`	`if isinstance(module, nn.Embedding):`