LLM文档 📚教程 LLM推理文档 LLM微调文档 DPO训练文档 界面训练与推理 LLM评测文档 LLM量化文档 VLLM推理加速与部署 LLM实验文档 ORPO最佳实践 SimPO最佳实践 人类偏好对齐训练文档 ⭐️最佳实践系列 自我认知微调最佳实践 Agent训练与通用数据混合最佳实践 Agent部署最佳实践 Qwen1.5全流程最佳实践 NPU推理与微调最佳实践 Grok-1训练和推理最佳实践 🐔参考文档 自定义模型和数据集 微调推理的命令行参数 支持的模型和数据集列表 运行速度与显存的Benchmark HuggingFace生态兼容 🍀Multi-Modal最佳实践系列 查看这里: Multi-Modal最佳实践系列