PaddlePaddle · guoshengCS · Sep 14, 2022 · Sep 14, 2022 · Sep 14, 2022 · Sep 14, 2022
diff --git a/paddlenlp/transformers/model_utils.py b/paddlenlp/transformers/model_utils.py
@@ -546,6 +546,20 @@ def resize_token_embeddings(self,
         self.base_model.config['vocab_size'] = new_num_tokens
         self.vocab_size = new_num_tokens
 
+        # update init_config
+        def update_init_config_vocab_size_field(sub_dict: dict):
+            if 'vocab_size' in sub_dict:
+                sub_dict['vocab_size'] = new_num_tokens
+                return
+            models = [
+                arg for arg in sub_dict.get('init_args', [])
+                if isinstance(arg, PretrainedModel)
+            ]
+            if models:
+                update_init_config_vocab_size_field(models[0].init_config)
+
+        update_init_config_vocab_size_field(self.init_config)
+
         # TODO([email protected]): add tie_weight.
         # TODO(westfish) Add tie_weight to tie the weights between the input embeddings and the output embeddings if needed.