We read every piece of feedback, and take your input very seriously.
To see all available qualifiers, see our documentation.
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
尊敬的 MiniMind 项目作者, 您好!
首先感谢您开源了这样一个宝藏项目,MiniMind 项目大大降低了大语言模型的实践门槛,项目清晰的代码结构也为源码层面的学习提供了不少帮助!
我在学习 MiniMind 项目的过程中意识到,由于大模型训练的多阶段性,包括我在内的初学者往往会倾向于体验大模型在每个阶段的训练过程(比如简单地在命令行启动脚本,然后 wandb 观察损失),而对准备工作与训练细节疏于考虑。同时,对于想学习项目代码的初学者来说,直接阅读源码难度较高,调试项目代码则可能面对数据量大、文件多码量大、逻辑复杂等问题,而且在 GPU 服务器上调试代码意味着付出的时间成本会转化为实际支出,显得不太友好。
我认为,在项目中添加 Juypter Notebook 运行示例,对项目代码进行分解,更有利于初学者在源码层面展开学习,根据这一想法,我已经完成了部分项目代码的分解,以下是一些具体信息。
通过 Jupyter Notebook 交互式笔记本与尽可能简单的数据集 demo,将训练一个大模型的全流程分解为多个 Notebook,涵盖 tokenizer、model、dataset 等模块的构建与 pretrain、sft、dpo 等训练阶段的过程展示。
通过提供的笔记本,学习者可以深入代码层面展开学习,获取接近上手调试的学习体验;同时,降低 demo 中模型和数据集的大小,且只保留发挥主要功能的代码片段,从而使得 Notebook 可以在个人 PC 运行,降低了运行门槛。
/minimind/notebook
目前已经完成的内容有:
接下来,计划继续基于 Jupyter Notebook 完成以下任务:
/minimind/notebook/2_dataset.ipynb
/minimind/notebook/4_sft.ipynb
The text was updated successfully, but these errors were encountered:
非常感谢你的贡献,期待后面的更新!
Sorry, something went wrong.
感谢作者大大的认可! 已经将当前进度创建 PR #214 进行提交 后续的代码分解我也会尽快跟进 ☺️
进度更新: 目前计划内容基本完成,作为初学者,在学习项目代码的过程中学到了很多知识,再次表示感谢,期待作者大大后续的更新! 以及,由于尚在学习中,完成度想必存在很多不足,有任何问题希望作者大大多多指教(●'◡'●)
No branches or pull requests
尊敬的 MiniMind 项目作者, 您好!
首先感谢您开源了这样一个宝藏项目,MiniMind 项目大大降低了大语言模型的实践门槛,项目清晰的代码结构也为源码层面的学习提供了不少帮助!
我在学习 MiniMind 项目的过程中意识到,由于大模型训练的多阶段性,包括我在内的初学者往往会倾向于体验大模型在每个阶段的训练过程(比如简单地在命令行启动脚本,然后 wandb 观察损失),而对准备工作与训练细节疏于考虑。同时,对于想学习项目代码的初学者来说,直接阅读源码难度较高,调试项目代码则可能面对数据量大、文件多码量大、逻辑复杂等问题,而且在 GPU 服务器上调试代码意味着付出的时间成本会转化为实际支出,显得不太友好。
我认为,在项目中添加 Juypter Notebook 运行示例,对项目代码进行分解,更有利于初学者在源码层面展开学习,根据这一想法,我已经完成了部分项目代码的分解,以下是一些具体信息。
目的
通过 Jupyter Notebook 交互式笔记本与尽可能简单的数据集 demo,将训练一个大模型的全流程分解为多个 Notebook,涵盖 tokenizer、model、dataset 等模块的构建与 pretrain、sft、dpo 等训练阶段的过程展示。
通过提供的笔记本,学习者可以深入代码层面展开学习,获取接近上手调试的学习体验;同时,降低 demo 中模型和数据集的大小,且只保留发挥主要功能的代码片段,从而使得 Notebook 可以在个人 PC 运行,降低了运行门槛。
优势
/minimind/notebook
文件夹中,不破坏 MiniMind 项目整体结构的和谐优雅。当前进度
目前已经完成的内容有:
未来规划
接下来,计划继续基于 Jupyter Notebook 完成以下任务:
效果展示
/minimind/notebook/2_dataset.ipynb
文件部分内容展示/minimind/notebook/4_sft.ipynb
文件部分内容展示The text was updated successfully, but these errors were encountered: