Chinese Abstract Meaning Representation Parsing Evaluation 2025

第五届中文抽象语义表示解析评测任务

UPDATE!：本届评测已托管至阿里云天池平台，报名及自动提交结果请参考点此跳转。

本届亮点：新增6000+句篇章语料，关注篇章指代消解，考察模型对于篇章共指的解析能力！

往届评测论文现已收录至ACL Anthology：CCL23-Eval，CCL24-Eval

English Version: README_En.md

2025年3月1日：评测任务报名开始。
2025年3月20日：LDC发布训练集以及验证集给参赛队（详见评测语料授权）。
2025年4月10日：本届评测现已上线阿里云天池AI大模型赛，最新赛程安排请参考点此跳转。

~~- [ ] 2025年4月15日：评测任务报名截止。~~

~~- [ ] 2025年5月1日：本站发布测试集给参赛队。~~

~~- [ ] 2025年5月8日：参赛队提交自动标注的数据（提交格式详见2.3 任务说明）。~~

~~- [ ] 2025年5月14日：本站发布测试集黄金标准答案给参赛队。~~

2025年6月1日：参赛队提交中文抽象语义表示评测任务技术报告，用于审稿。
2025年6月15日：参赛队提交技术报告最终版。
2025年7月1日：评测论文录用通知，参赛队Camera-Ready版论文提交ACL/CCL Anthology收录。
2025年8月11日-14日：CCL 2025评测研讨会。

参赛队伍需自行向LDC（Linguistic Data Consortium，语言数据联盟）申请CAMRP 2025评测语料使用权，并签署保密协议：

每支参赛队伍需指派一名联系负责人。
参赛队伍联系负责人需填写LDC评测语料许可协议，扫描后通过E-mail发送给LDC（[email protected]）。
申请通过后，LDC将返回CAMRP v2.0E版本语料（训练集和验证集）给参赛队伍联系负责人，以供参赛队伍使用。该语料数据只可用于本次CAMRP 2025评测任务，不可有其他任何用途。
本次评测语料数据集的版权归LDC所有。

组织者：
- 李斌（南京师范大学）
- 曲维光（南京师范大学）
- 周俊生（南京师范大学）
工作人员（研究生）：
- 许智星（南京师范大学）
- 张艺璇（南京师范大学）
- 徐静（南京师范大学）

1. 任务内容

本次第五届中文抽象语义表示解析评测任务（CAMRP 2025）的重点和创新，在于自动解析中文篇章的共指链，将句子级AMR解析进一步拓展至篇章级AMR解析。

1.1 基于中文AMR的篇章共指语料标注

CAMR作为句子级标注语料，本身提供了包含共指关系在内的语义结构关系。因此，我们在句子级CAMR的标注体系基础之上，构建了篇章共指标注体系，进一步标注了不同句子之间概念同指的关系。CAMR篇章共指标注体系根据先行词和共指词的不同，共设计了9个共指关系类型标签，如表1所示。

表1 9种共指关系类型标签

编号	标签	含义	示例
1	:root	该词为先行词	$[这个善良的女孩]_1$很开心
2	:homo	共指词与先行词相同	$[这个善良的女孩]_1$很开心
3	:add	共指词在先行词基础上添加某些成分	$[这个美丽善良的女孩]_1$很开心
4	:reduce	共指词在先行词基础上减少某些成分	$[这个女孩]_1$很开心
5	:alias	共指词在先行词基础上改换其他表达	$[这个快乐的女孩]_1$很开心
6	:zero	共指词为零形式	$∅_1$很开心
7	:pro	共指词为代词	$[她]_1$很开心
8	:illus	阐述共指，对短语或小句进行阐述	$[张三和李四]_1$很开心，$[两个人]_1$很开心
9	:encap	概述共指，对短语或小句进行概述	$[这个善良的女孩很开心]_1$，$[这一幕]_1$非常感人

其中，“:homo”（同形指代）“:zero”（零指代）出现的频次较高（以500篇语料为样本进行统计），符合汉语的语言学特点。为了更好地形成CAMR篇章共指语义图的统一框架，我们在标注过程中保留了CAMR体系中的语义角色关系标签，将先行词/共指词的句内语义角色关系与共指关系相互连结，如下文2.2数据样例所示。

因此，本届CAMRP评测共包含以下两个子任务：

CAMR解析：给定分词后的句子，输出句子对应的CAMR图结构，要求包含概念对齐与关系对齐信息。
篇章共指解析：给定包含若干分词后的句子的篇章，输出该篇章中的所有共指链，要求包含共指关系、句子编号与共指词。

2. 评测数据

2.1 数据集

中文抽象语义表示语料库（Chinese Abstract Meaning Representation Corpus）于2015年开始，由南京师范大学和美国布兰迪斯大学合作构建。语料库为在LDC（Linguistic Data Consortium）发布的CAMR v2.0，约含2万中文句子，原始语料选自于宾州中文树库（Chinese Tree Bank 8.0，CTB 8.0），分为训练集、验证集和测试集。该语料已在CoNLL 2020和CAMRP 2022-2024进行过评测。本次评测任务将继续沿用该语料库，以比较两年来中文AMR语义解析的进展。

本次评测任务新增了500篇篇章语料，语料源自宾州中文树库语料库中编号chtb0001-chtb0659中的6237句文本，涵盖经济、体育及生活等多种体裁。其中，300篇为验证集，200篇为测试集C，用以考察解析系统在篇章共指上的性能表现。

评测数据集详情具体如表2所示。相比前几届CAMRP评测任务，本次评测首次引入篇章级解析，为后续CAMR自动分析提供了新的方向与思路。

表2 评测数据集详情

数据集	句子数	词例数
训练集（句子级）	16,576	386,234
验证集（句子级）	1,789	41,822
新增验证集（篇章级）	约3,800句	约96,000词
测试集A（句子级）	1,713	39,228
测试集B（句子级）	1,999	36,940
新增测试集C（篇章级）	约2,400句	约64,000词

2.2 数据样例

本次评测共提供三种类型的数据，分别为CAMR文本表示、CAMR多元组表示及篇章共指AMR图。其中，CAMR文本表示与CAMR多元组表示已在CAMRP 2022-2024三届评测任务中有过介绍，详见我们的GitHub主页。

篇章样例：

中国十四个边境开放城市经济建设成就显著新华社北京二月十二日电中国十四个边境对外开放城市一九九五年经济建设取得可喜成果。据统计，这些城市去年完成国内生产总值一百九十多亿元，比开放前的一九九一年增长九成多。国务院于一九九二年先后批准了黑河、凭祥、珲春、伊宁、瑞丽等十四个边境城市为对外开放城市，同时还批准这些城市设立十四个边境经济合作区。三年多来，这些城市社会经济发展迅速，地方经济实力明显增强；经济年平均增长百分之十七，高于全国年平均增长速度。据介绍，这十四个城市的城市建设和合作区开发建设步伐加快。三年来，这些城市累计完成固定资产投资一百二十亿元，昔日边境城市的 “ 楼不高，路不平、灯不明、水不清、通讯不畅 ” 的状况已得到了改变。经济合作区内已开发二十二点六平方公里，引进 “ 三资 ” 企业二百八十七家，实际利用外资八点九亿美元。此外，还有内联企业五千一百家，已投产工业项目一百七十五个。

篇章共指AMR图样例：

p0003_r1_entity :root() s1_:arg0_x6 / 城市（中国十四个边境开放城市） :add() s3_:arg0_x8 / 城市（中国十四个边境对外开放城市） :alias() s4_:arg0_x5 / 城市（这些城市） :alias() s5_:arg1_x20 / 城市（黑河、凭祥、珲春、伊宁、瑞丽等十四个边境城市） :zero() s5_:arg0_x80 / x20 :alias() s5_:arg1_x31 / x20（这些城市） :zero() s5_:arg0_x82 / x20 :alias() s5_:arg1_x25 / 城市（这些城市） :alias() s6_:arg0_x7 / 城市（这些城市） :zero() s6_:arg0_x51 / x7 :alias() s7_:mod_x7 / 城市（这十四个城市） :alias() s8_:arg0_x6 / 城市（这些城市） :zero() s8_:arg0_x65 / x6 :reduce() s8_:poss_x17 / x6（边境城市）

p0003_r2_entity :root() s5_:arg1_x37 / 合作区（14个边境经济合作区） :reduce() s7_:arg1_x12 / 合作区 :zero() s7_:arg1_x36 / x12 :reduce() s9_:range_x2 / 合作区（经济合作区）

p0003_r3_entity :root() s3_:direction_x6 / 外 :homo() s5_:direction_x23 / 外

p0003_r4_event :root() s7_:op1_x10 / 建设-01（这14个城市的城市建设） :encap_of_alias() s8_x48 / causation

p0003_r5_event :root() s7_:op2_x31 / and（合作区开发建设） :encap_of_alias() s9_x25 / and

p0003_r6_entity :root() s4_:arg1_x10 / 总值 :zero() s4_:arg0_x43 / x10 :zero() s4_:dcopy_x44 / x10

上文为篇章样例及对应的篇章共指AMR图示例。其中，该篇章的共指链共有6个，分别为①“城市”②“合作区”③“外”④“建设”⑤“合作区开发建设”⑥“总值”。标注具体信息包含：

“p0003”表示为语料中第3个篇章
“r1”代表该篇章中第1条共指链
“entity”意为该共指链类型为“事件”
“s1”代表篇章中的第1个句子
“:arg0”为该先行词/共指词在句内的语义角色关系
“x6”为先行词/共指词编号
“城市”为先行词/共指词

2.3 任务说明

任务输入：（若干句子组成的篇章）

中国十四个边境开放城市经济建设成就显著。

中国十四个边境对外开放城市一九九五年经济建设取得可喜成果。

据统计，这些城市去年完成国内生产总值一百九十多亿元，...

三年来，这些城市累计完成固定资产投资一百二十亿元，昔日边境城市的 “ 楼不高，路不平、 ...

...

任务输出：（该篇章中存在的共指链，此处以“城市”共指链为例）

p001_r1_entity:

:root() s1_:arg0() x6 / 城市

:add() s2_:arg0() x8 / 城市

:alias() s3_:arg1() x5 / 城市

:reduce() s4_:poss() x17 / 城市

为了更加高效地完成篇章共指解析评测，在本届评测任务中，我们暂不对篇章编号（p001）、共指链编号（r1）、共指链类型（entity）和共指词语义角色关系（:arg0）等对篇章共指解析精度无关的信息进行统计，仅保留共指关系、句子编号和共指词，形成共指三元组：relation(index, coref)，如下表所示。

共指关系	句子编号	共指词
:root	s1	城市（中国十四个边境开放城市）
:add	s2	城市（中国十四个边境对外开放城市）
:alias	s3	城市（这些城市）
:alias	s4	城市（这些城市）
:reduce	s4	城市（边境城市）
...	...	...

评测指标：

Align-smatch（包含篇章共指解析）

自动标注结果提交格式：

每个分项最多提交两个结果，每个结果命名格式如下：

<team>_<modality>_<test>_<run>.txt

参考样例：
- PKU_open_testA_1.txt
- PKU_open_testA_2.txt
- PKU_closed_testB_1.txt
- PKU_closed_testB_2.txt
- PKU_open_testC_1.txt
- PKU_open_testC_2.txt
所有结果需打包在一个文件夹内并压缩后发送至邮箱[email protected]，邮件名称为“CAMRP2025+参赛队名+submitdata”。

3 评价标准与模态

3.1 作为主要标准的Align-smatch评测指标

本次评测沿用Align-smatch（包含篇章共指解析评测）作为主要评测指标。Align-smatch与Smatch两种指标的区别在过去两届评测任务中已有相关介绍，详见CAMRP 2023。

3.2 模态选择

本次评测任务包含开放测试（Open Modality）和封闭测试（Closed Modality）：

若参赛队选择封闭测试，则必须使用指定的训练集、测试集和预训练语言模型，不可自行替换为别的资源。在封闭测试中，主办方提供训练集的依存分析结果，并推荐使用哈工大的HIT_Roberta预训练模型。
若参赛队选择开放测试，预训练语言模型可自由选择（包含ChatGPT等），允许使用外部资源，如专名识别、依存句法分析结果等。开放测试中，参赛队使用的所有资源需要在最终提交的技术报告中给予详细说明。但无论哪种模态，均不可使用人工修正自动解析结果的方式。

表3 两种模态的评测要求

可用资源	封闭测试	开放测试
算法	无限制	无限制
预训练模型	HIT_Roberta	无限制
外部资源	依存句法分析结果	无限制
语料	指定训练集和验证集	无限制
人工修正	禁止	禁止

为了更加完整、精确地解析CAMR，本次评测任务采用Align-smatch评测标准。各参赛队最终生成的CAMR中需包含概念对齐信息和关系对齐信息，最终成绩评分按照Align-smatch评测标准，取测试集A、测试集B和测试集C下的$F_1$值进行综合排名。其中，Smatch评分仅用于和其他语言的AMR解析进行对比，不计入最终排名。

4 撰写技术报告

报告可由中文或英文撰写。
报告统一使用CCL 2025的论文模板。
报告正文一般不超过4页，参考文献页数不限。
报告应至少包含以下四个部分：模型介绍、评测结果、分析与讨论和参考文献。

5 奖项设置

本次评测将设置一、二、三等奖，由中国中文信息学会为本次评测获奖队伍提供荣誉证书。
主办方为获奖队伍提供奖金。

6 参考文献

[1] 孙茂松等. "语言计算的重要国际前沿." 中文信息学报 28.1 (2014): 1-8.

[2] Banarescu, Laura, et al. "Abstract meaning representation for sembanking." Proceedings of the 7th linguistic annotation workshop and interoperability with discourse. 2013.

[3] Li, Bin, et al. "Annotating the little prince with chinese amrs." Proceedings of the 10th linguistic annotation workshop held in conjunction with ACL 2016. 2016.

[4] Li, Bin, et al. "Building a Chinese AMR bank with concept and relation alignments." Linguistic Issues in Language Technology. 2019.

[5] 肖力铭等. "基于概念关系对齐的中文抽象语义表示解析评测方法." 中文信息学报 36.1 (2022): 21-30.

[6] 戴玉玲等. "基于关系对齐的汉语虚词抽象语义表示与分析." 中文信息学报 34.4 (2020): 21-29.

[7] Abzianidze, L., et al. "MRP 2020: The second shared task on cross-framework and cross-lingual meaning representation parsing." Proceedings of the CoNLL 2020 Shared Task: Cross-Framework Meaning Representation Parsing. 2020.

[8] Cai, Shu, and Kevin Knight. "Smatch: an evaluation metric for semantic feature structures." Proceedings of the 51st Annual Meeting of the Association for Computational Linguistics (Volume 2: Short Papers). 2013.

[9] Cui, Yiming, et al. "Pre-training with whole word masking for chinese bert." IEEE/ACM Transactions on Audio, Speech, and Language Processing. 2021.

[10] Xiao, Liming, et al. "Align-smatch: A novel evaluation method for chinese abstract meaning representation parsing based on alignment of concept and relation." Proceedings of the Thirteenth Language Resources and Evaluation Conference. 2022.

[11] Xu, Zhixing, et al. "Overview of CCL23-Eval Task 2: The Third Chinese Abstract Meaning Representation Parsing Evaluation." Proceedings of the 22nd Chinese National Conference on Computational Linguistics (Volume 3: Evaluations). 2023.

[12] Xu, Zhixing, et al. "The Fourth Chinese Abstract Meaning Representation Parsing Evaluation." Proceedings of the 23rd Chinese National Conference on Computational Linguistics (Volume 3: Evaluations). 2024.

[13] 张艺璇等. "从句子图到篇章图——基于抽象语义表示的篇章级共指标注体系研究". 外语学刊 2025(01):19-28.

Name		Name	Last commit message	Last commit date
Latest commit History 290 Commits
CAMRP 2022		CAMRP 2022
CAMRP 2023		CAMRP 2023
CAMRP 2024		CAMRP 2024
docs		docs
img		img
README.md		README.md
README_En.md		README_En.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Chinese Abstract Meaning Representation Parsing Evaluation 2025

第五届中文抽象语义表示解析评测任务

1. 任务内容

1.1 基于中文AMR的篇章共指语料标注

2. 评测数据

2.1 数据集

2.2 数据样例

2.3 任务说明

3 评价标准与模态

3.1 作为主要标准的Align-smatch评测指标

3.2 模态选择

4 撰写技术报告

5 奖项设置

6 参考文献

About

Releases

Packages

Contributors 3

Languages

GoThereGit/Chinese-AMR

Folders and files

Latest commit

History

Repository files navigation

Chinese Abstract Meaning Representation Parsing Evaluation 2025

第五届中文抽象语义表示解析评测任务

1. 任务内容

1.1 基于中文AMR的篇章共指语料标注

2. 评测数据

2.1 数据集

2.2 数据样例

2.3 任务说明

3 评价标准与模态

3.1 作为主要标准的Align-smatch评测指标

3.2 模态选择

4 撰写技术报告

5 奖项设置

6 参考文献

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 3

Languages

Packages