在使用train.py训练模型的时候，读取预训练模型，然后进行初始化，这个好像初始化不了 #4

guangh01 · 2021-07-17T02:51:18Z

在使用train.py训练模型的时候，读取预训练模型，然后进行初始化，这个好像初始化不了；我把项目主训练的作文配置文件config.json、pytorch_model.bin两个文件作为预训练文件读取，然后去训练新的模型，最后去生成新的模型生成文章的时候，内容还是作文内容。不知道我是哪里设置错误了，小白一个。

MaNing1924382115 · 2021-07-20T02:28:00Z

我想问一下，cmp109M那个模型在哪下载呢，去源码哪里没找到

MaNing1924382115 · 2021-07-20T02:30:20Z

而且代码里是没有gpt2模型的代码实现吗？直接调用的库吗?

yangjianxin1 · 2021-07-20T12:35:09Z

我想问一下，cmp109M那个模型在哪下载呢，去源码哪里没找到

模型权重是使用作文数据集自己训练得到的

yangjianxin1 · 2021-07-20T12:36:14Z

而且代码里是没有gpt2模型的代码实现吗？直接调用的库吗?

CPM模型本质上是个中文版的GPT2模型，本文使用huggingface的transformers项目的模型实现

yangjianxin1 · 2021-07-20T12:36:56Z

去训练新的模型，最后去生成

用什么数据训练，训练了多久，loss降到了多少

guangh01 · 2021-07-21T00:56:57Z

去训练新的模型，最后去生成

用什么数据训练，训练了多久，loss降到了多少

产品文章，10多M，训练3轮而已，loss降到了0了

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

在使用train.py训练模型的时候，读取预训练模型，然后进行初始化，这个好像初始化不了 #4

在使用train.py训练模型的时候，读取预训练模型，然后进行初始化，这个好像初始化不了 #4

guangh01 commented Jul 17, 2021

MaNing1924382115 commented Jul 20, 2021

MaNing1924382115 commented Jul 20, 2021

yangjianxin1 commented Jul 20, 2021

yangjianxin1 commented Jul 20, 2021

yangjianxin1 commented Jul 20, 2021

guangh01 commented Jul 21, 2021

在使用train.py训练模型的时候，读取预训练模型，然后进行初始化，这个好像初始化不了 #4

在使用train.py训练模型的时候，读取预训练模型，然后进行初始化，这个好像初始化不了 #4

Comments

guangh01 commented Jul 17, 2021

MaNing1924382115 commented Jul 20, 2021

MaNing1924382115 commented Jul 20, 2021

yangjianxin1 commented Jul 20, 2021

yangjianxin1 commented Jul 20, 2021

yangjianxin1 commented Jul 20, 2021

guangh01 commented Jul 21, 2021