Skip to content

Commit

Permalink
ADD new entry LLM-fine-tuning-summary
Browse files Browse the repository at this point in the history
  • Loading branch information
karminski committed Feb 10, 2025
1 parent 47628b2 commit 1753070
Show file tree
Hide file tree
Showing 3 changed files with 86 additions and 0 deletions.
85 changes: 85 additions & 0 deletions 20250210-LLM-fine-tuning-summary/LLM-fine-tuning-summary.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,85 @@
大模型微调最佳实践指南 (超简洁版)
--------------------------------

by @karminski-牙医

![](assets/images/fine-tuning.webp)

(图片来自 unstructured.io)

## 1. 决策阶段(ROI最高)
**建议**
- 优先使用prompt工程解决简单模式匹配需求 (例如修改文本格式, 大小写转换等)
- 评估是否需要知识更新 → 优先考虑RAG方案
- 确认数据量是否足够(数学推理任务可尝试小一些的数据, 但大量数据带来的优势仍然是显著的)

**不建议**
- 用微调解决简单响应模式问题(大炮打蚊子)
- 试图通过微调注入新知识 (请使用RAG)
- 在数据量<500条时强行微调

## 2. 数据准备(占80%时间投入)
**建议**
- 构建多样化样本(覆盖边缘案例)
- 确保输入输出格式明确统一
- 使用LLM生成增强数据
- 按任务类型结构化数据(指令/对话/开放式)

**不建议**
- 堆砌同质化数据
- 保留未清洗的脏数据
- 忽略数据去重

## 3. 模型选择(中高ROI)
**建议**
- 优先选择1-13B实用模型(如Llama-3.x-8B)
- 严格检查商业使用许可
- 根据任务复杂度选择尺寸

**不建议**
- 盲目使用100B+大模型
- 忽略许可证限制
- 为简单任务过度配置

## 4. 评估体系(常被忽视的高ROI)
**建议**
- 建立量化评估基准
- 对比不同超参数效果
- 定期验证模型退化

**不建议**
- 仅凭主观感受评估
- 忽略baseline对比
- 训练后不做回归测试

## 5. 微调策略(中ROI)
**建议**
- 优先尝试LoRA及其变种(DoRA/AdaLoRA)
- 领域适配时结合剪枝+微调
- 使用SGD+学习率调度器

**不建议**
- 默认使用QLoRA(仅在显存不足时使用)
- 设置过高lora_alpha值(建议从2×rank开始)
- 盲目相信论文报告的训练时间

## 6. 训练优化(技术细节)
**建议**
- 混合精度+量化节省显存
- 梯度累积模拟大批量
- 定期保存检查点

**不建议**
- 在单卡上强推大batch_size
- 忽略模型并行化选项
- 训练中断后从头开始

## 7. 资源分配建议
- 80%时间:数据工程
- 15%时间:评估体系构建
- 5%时间:实际训练配置

## 版本注意
- 保持对LoRA生态的跟踪(每月新变种出现)
- 关注Sophia优化器等新进展
- 定期验证不同量化方案效果
Binary file not shown.
1 change: 1 addition & 0 deletions README.md
Original file line number Diff line number Diff line change
Expand Up @@ -31,6 +31,7 @@ by @karminski-牙医
- [什么是 RAG 技术](20250209-what-is-RAG/what-is-RAG.md) - 什么是 RAG 技术?
- [什么是 Safetensors](20250210-what-is-safetensors/what-is-safetensors.md) - 什么是 Safetensors?
- [什么是 ONNX](20250211-what-is-onnx/what-is-onnx.md) - 什么是 ONNX?
- [大模型微调最佳实践指南](20250210-LLM-fine-tuning-summary/LLM-fine-tuning-summary.md) - 大模型微调最佳实践指南

### 系统相关
- [Windows 任务管理器内存标签说明](20250104-windows-task-manager-memory-tab-description/windows-task-manager-memory-tab-description.md) - 详解 Windows 任务管理器中各个内存指标的含义
Expand Down

0 comments on commit 1753070

Please sign in to comment.