huggingface · regisss · Jan 22, 2024 · Jan 18, 2024 · Jan 22, 2024
@@ -9,6 +9,7 @@
 
 from optimum.habana import GaudiConfig, GaudiTrainingArguments
 from optimum.habana.trl import GaudiDPOTrainer
+from optimum.habana.utils import set_seed
 
 
 # Define and parse arguments.
@@ -80,6 +81,9 @@ class ScriptArguments:
             "https://github.com/huggingface/transformers/issues/22482#issuecomment-1595790992"
         },
     )
+    seed: Optional[int] = field(
+        default=0, metadata={"help": "Random seed that will be set at the beginning of training."}
+    )
 
 
 def get_stack_exchange_paired(
@@ -129,6 +133,7 @@ def return_prompt_and_responses(samples) -> Dict[str, str]:
 if __name__ == "__main__":
     parser = HfArgumentParser(ScriptArguments)
     script_args = parser.parse_args_into_dataclasses()[0]
+
     # 1. initialize training arguments:
     training_args = GaudiTrainingArguments(
         per_device_train_batch_size=script_args.per_device_train_batch_size,
@@ -151,9 +156,14 @@ def return_prompt_and_responses(samples) -> Dict[str, str]:
         run_name="dpo_llama2",
         use_habana=True,
         use_lazy_mode=True,
-        use_hpu_graphs_for_training=True,
+        use_hpu_graphs_for_training=not script_args.gradient_checkpointing,
         use_hpu_graphs_for_inference=True,
+        seed=script_args.seed,
     )
+
+    # Set seed before initializing model.
+    set_seed(training_args.seed)
+
     # 2. load a pretrained model
     model = AutoModelForCausalLM.from_pretrained(
         script_args.model_name_or_path,