想使用中间的checkpoint看效果，但最终效果和未训练时一样 #208

tzzzzzzzx · 2023-05-01T03:10:23Z

如题，在使用训练完成的adapter_model.bin和adapter_config.json的时候一切正常，但当我把训练过程中checkpoint的adapter_model.bin放到output文件夹，并使用之前已经存在的adapter_config.json时，实际问答过程中模型的表现和没有LoRA的时候完全一样；最关键的是当我撤销上述操作让模型和adapter_config.json用回原来训练完成的版本时，问答过程的表现依然和没有LoRA的时候完全一样。
现在直接用ipynb写代码预测，有一些条目有LoRA的效果，另一些则完全没有效果。这是正常现象吗？

wilson9x1 · 2023-05-02T11:29:21Z

+1 文件md5都不一样了。感觉保存时候哪里出问题了。

yp20000921 · 2023-05-11T05:04:48Z

我也遇到了这样的问题，修改一下代码就好了。
`class ModifiedTrainer(Trainer):
def compute_loss(self, model, inputs, return_outputs=False):
return model(
input_ids=inputs["input_ids"],
labels=inputs["labels"],
).loss

def save_model(self, output_dir=None, _internal_call=False):
    # from transformers.trainer import TRAINING_ARGS_NAME

    os.makedirs(output_dir, exist_ok=True)
    # torch.save(self.args, os.path.join(output_dir, TRAINING_ARGS_NAME))
    # saved_params = {
    #     k: v.to("cpu") for k, v in self.model.named_parameters() if v.requires_grad
    # }
    # torch.save(saved_params, os.path.join(output_dir, "adapter_model.bin"))
    self.model.save_pretrained(output_dir)`

This was referenced Feb 29, 2024

根据infer的代码，lora微调之后的answer和###answer结果一致，没有任何变化 #223

Open

关于保存的adapter_model.bin无实际推理效果的问题 #273

Open

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

想使用中间的checkpoint看效果，但最终效果和未训练时一样 #208

想使用中间的checkpoint看效果，但最终效果和未训练时一样 #208

tzzzzzzzx commented May 1, 2023

wilson9x1 commented May 2, 2023 •

edited

Loading

yp20000921 commented May 11, 2023

想使用中间的checkpoint看效果，但最终效果和未训练时一样 #208

想使用中间的checkpoint看效果，但最终效果和未训练时一样 #208

Comments

tzzzzzzzx commented May 1, 2023

wilson9x1 commented May 2, 2023 • edited Loading

yp20000921 commented May 11, 2023

wilson9x1 commented May 2, 2023 •

edited

Loading