微调qwen2.5-32b时，怎么把权重分开部署到各个gpu上？ #5905

lxlx2084 · 2024-11-02T01:14:41Z

lxlx2084
Nov 2, 2024

CUDA_VISIBLE_DEVICES=3,4,5 llamafactory-cli webui，开始微调时会把数据放到3、4、5这三张卡上，相当于在这三张卡上同时加载3个模型，每个gpu使用三分之一的数据。但是单卡的显存肯定不够的。如果是llamafactory-cli webui则直接把服务器上的卡全用了。
我平时都是device_map=‘auto’，权重要分开部署到各个gpu上才够跑起来。
不知道factory在哪里指定？

Answered by hiyouga

Nov 2, 2024

DeepSpeed zero3

View full answer

hiyouga · 2024-11-02T03:17:04Z

hiyouga
Nov 2, 2024
Maintainer

DeepSpeed zero3

0 replies

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

微调qwen2.5-32b时，怎么把权重分开部署到各个gpu上？ #5905

{{title}}

Replies: 1 comment

{{title}}

Select a reply

微调qwen2.5-32b时，怎么把权重分开部署到各个gpu上？ #5905

lxlx2084 Nov 2, 2024

Replies: 1 comment

hiyouga Nov 2, 2024 Maintainer

lxlx2084
Nov 2, 2024

hiyouga
Nov 2, 2024
Maintainer