### 请求类型 其他 ### 模型名称 无 ### 模型来源 无 ### 希望的教程类型 希望能够出一个如何从pdf书籍,PPT等批量转换为markdown格式文本后,如何对大量的文本进行整理为适用于下游高效高质量微调的输入数据集。 ### 模型描述 微调数据集生成的教程 ### 使用场景 任意模型的微调中 ### 技术要求 _No response_ ### 贡献意愿 - [x] 我愿意协助编写相关教程 - [x] 我愿意提供测试和反馈 - [x] 我愿意分享使用经验 ### 联系方式(可选) _No response_ ### 其他信息 _No response_