3版本更新后训练model type使用方式发生变化 #3108

EvilCalf · 2025-02-14T03:50:02Z

请问下，现在3.1，我要从qwen2.5-base上全参训sft，用的config是base，这个对最终对训练有影响，stop token的判定也有问题。训练出来最终的配置里eos token有问题

Jintao-Huang · 2025-02-14T04:43:11Z

使用swift infer推理正常嘛

Jintao-Huang · 2025-02-14T04:43:51Z

qwen2.5-base上全参训sft，默认也会使用qwen2.5的template。里面有设置stop_words，只是不对config.json进行修改

EvilCalf · 2025-02-14T06:02:22Z

推理用vllm和sglang都试过，不加stop=["<|im_end|>", "<|endoftext|>"]，无法正常停止，看日志已经预测出了停止token，但依旧在进行预测，但无法看到后续的token

EvilCalf · 2025-02-14T06:02:50Z

这个问题在之前2.x版本没有遇到过，是正常用base 基于instruct的config进行训练的

Provide feedback