Skip to content

Train deepseek r1-like reasoning LLM with ease | 轻松训练1个deepseek r1类的推理LLM

Notifications You must be signed in to change notification settings

Zeyi-Lin/easy-r1

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

easy r1

SwanLab训练过程

1. 环境准备

在运行下面的命令之前,请先保证你安装了Python3.10及以上版本,计算机中有Nvidia显卡,并且安装了CUDA和cuDNN。

pip install -r requirements.txt

2. 模型与数据集下载

python download_model.py
python download_data.py

3. 开启训练

在开启训练之前,如果你还没有使用过SwanLab,请先注册一个账号,登录后在设置页面复制你的API Key,然后执行:

swanlab login

将你的API Key粘贴进去,然后按回车完成登录。

ps:如果你对命令行登录不习惯,也可以使用swanlab.login()函数进行登录,指引


然后就可以开始训练了:

python train.py

About

Train deepseek r1-like reasoning LLM with ease | 轻松训练1个deepseek r1类的推理LLM

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages