HabanaAI · Mar 4, 2024 · Feb 26, 2024 · Mar 1, 2024 · Mar 1, 2024 · libinta
@@ -692,6 +692,9 @@ def forward(
             htcore.mark_step()
 
         for layer_idx, decoder_layer in enumerate(self.layers):
+            if lazy_mode and torch.distributed.is_initialized() == False:
+                htcore.mark_step()
+
             if output_hidden_states:
                 all_hidden_states += (hidden_states,)