CirBERTa

Apply the Circular to the Pretraining Model

使用通用语料（WuDao 200G) 进行无监督预训练

预训练模型	学习率	batchsize	设备	语料库	时间	优化器
CirBERTa-Chinese-Base	1e-5	256	10张3090+3张A100	200G	2月	AdamW

在多项中文理解任务上，12层CirBERTa-Base模型超过24层MacBERT-Chinese-Large/RoBERTa-Chinese-Large

加载与使用

依托于huggingface-transformers

from transformers import AutoTokenizer,AutoModel

tokenizer = AutoTokenizer.from_pretrained("WENGSYX/CirBERTa-Chinese-Base")
model = AutoModel.from_pretrained("WENGSYX/CirBERTa-Chinese-Base")

引用:

(暂时先引用这个，论文正在撰写...)

@misc{CirBERTa,
  title={CirBERTa: Apply the Circular to the Pretraining Model},
  author={Yixuan Weng},
  howpublished={\url{https://github.com/WENGSYX/CirBERTa}},
  year={2022}
}

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
baseline/Sohu2022		baseline/Sohu2022
img		img
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

CirBERTa

使用通用语料（WuDao 200G) 进行无监督预训练

加载与使用

引用:

About

Releases

Packages

Languages

WENGSYX/CirBERTa

Folders and files

Latest commit

History

Repository files navigation

CirBERTa

使用通用语料（WuDao 200G) 进行无监督预训练

加载与使用

引用:

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages