关于语篇结构标注研究
关于语篇结构标注研究 论文关键词:修辞结构理论 篇章结构 标注 论文摘要:语篇结构标注起步较晚,但以修辞结构理论(RST)为指导的篇章修辞结构标注最近取得了令人瞩目的成绩。目前,已经建成
1 10 第页共页 关于语篇结构标注研究 论文关键词:修辞结构理论 篇章结构 标注 论文摘要:语篇结构标注起步较晚,但以修辞结构理论(RST)为指 导的篇章修辞结构标注最近取得了令人瞩目的成绩。目前,已经建成 并公布的篇章结构标注语料库是由美国南加州大学信息科学学院的 一个课题小组完成的,由385篇文章组成,是一个大规模、高质量、高 一致性的带多层语言学标注信息的参照篇章语料库。语料库建设的主 要成就为:确立了如何将语篇切分为基本语篇单位的理论,扩展了修 辞关系集,为RST理论的运用提供了广阔的前景。本文综述该语料库 建设的研究成果。 0.概述 随着计算机技术的普及和发展,语料为机器可读成为语料库建设 的最基本的要求之一。要达到语料机读化这一目的,关键在于语料的 标注。所谓标注,就是对语料库中的原始语料进行加工,把各种表示语 言特征的附码标注在相应的语言成分上,以便计算机的识读。 语料标注的类型主要包括语篇背景信息、词性、词形、句法分析、

