Skip to content

[微调数据集生成的教程] 请求如何批量从pdf2md文本生成适用于下游模型微调的数据集的教程 #449

@virologist

Description

@virologist

请求类型

其他

模型名称

模型来源

希望的教程类型

希望能够出一个如何从pdf书籍,PPT等批量转换为markdown格式文本后,如何对大量的文本进行整理为适用于下游高效高质量微调的输入数据集。

模型描述

微调数据集生成的教程

使用场景

任意模型的微调中

技术要求

No response

贡献意愿

  • 我愿意协助编写相关教程
  • 我愿意提供测试和反馈
  • 我愿意分享使用经验

联系方式(可选)

No response

其他信息

No response

Metadata

Metadata

Assignees

No one assigned

    Labels

    enhancementNew feature or request

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions