sgl-project · fzyzcjy · May 31, 2026 · May 30, 2026 · gemini-code-assist · May 31, 2026
diff --git a/python/sglang/srt/models/qwen3.py b/python/sglang/srt/models/qwen3.py
@@ -674,8 +674,10 @@ def get_embed_and_head(self):
         return self.model.embed_tokens.weight, self.lm_head.weight
 
     def set_embed_and_head(self, embed, head):
-        del self.model.embed_tokens.weight
-        del self.lm_head.weight
+        if hasattr(self.model.embed_tokens, "weight"):
+            del self.model.embed_tokens.weight
+        if hasattr(self.lm_head, "weight"):
+            del self.lm_head.weight
         self.model.embed_tokens.weight = embed
         self.lm_head.weight = head
-        if hasattr(self.model.embed_tokens, "weight"):
-            del self.model.embed_tokens.weight
-        if hasattr(self.lm_head, "weight"):
-            del self.lm_head.weight
-        self.model.embed_tokens.weight = embed
-        self.lm_head.weight = head
+        if not isinstance(self.model.embed_tokens, PPMissingLayer):
+            if hasattr(self.model.embed_tokens, "weight"):
+                del self.model.embed_tokens.weight
+            self.model.embed_tokens.weight = embed
+        if not isinstance(self.lm_head, PPMissingLayer) and self.lm_head is not self.model.embed_tokens:
+            if hasattr(self.lm_head, "weight"):
+                del self.lm_head.weight
+            self.lm_head.weight = head
-        if hasattr(self.model.embed_tokens, "weight"):
-            del self.model.embed_tokens.weight
-        if hasattr(self.lm_head, "weight"):
-            del self.lm_head.weight
-        self.model.embed_tokens.weight = embed
-        self.lm_head.weight = head
+        if not isinstance(self.model.embed_tokens, PPMissingLayer):
+            if hasattr(self.model.embed_tokens, "weight"):
+                del self.model.embed_tokens.weight
+            self.model.embed_tokens.weight = embed
+        if not isinstance(self.lm_head, PPMissingLayer) and self.lm_head is not self.model.embed_tokens:
+            if hasattr(self.lm_head, "weight"):
+                del self.lm_head.weight
+            self.lm_head.weight = head
         torch.cuda.empty_cache()