提供者:卢梦依
下载地址:http://t.cn/RJDVxr4
简介
数据集概述
初级文档摘要数据集。该数据集包含澳大利亚联邦法院(FCA)的澳大利亚法律案件。 这些病例是从AustLII下载的([Web Link])。 我们收录了2006,2007,2008和2009年的所有案例。我们将其构建为实验自动汇总和引文分析。 我们收集每个文件的流行语,引用句子,引文标语和引文类。 在文档中可以找到Catchphrases,我们使用的流行语是我们汇总实验的金标准。 在后面引用本案的案例中可以找到引文句子,我们用引文句子进行汇总。 引用流行语是引用本案的两个后期案件的流行语(如果可用),以及本案引用的较旧案例。 文件中指出了引用类别,并指出了本案例引用的治疗类型。
文件
4000个用于自动汇总和引文分析的法律案例的文本语料库。 对于每个文件,我们收集流行语,引文句子,引文标语和引文类。
相关论文
[1] F. Galgani, P. Compton, and A. Hoffmann. Citation based summarisation of legal texts. In PRICAI 2012, volume LNCS 7458, pages 40-52. Springer, Heidelberg, 2012.
[2] F. Galgani, P. Compton, and A. Hoffmann. Combining different summarization techniques for legal text. In Proceedings of the Workshop on Innovative Hybrid Approaches to the Processing of Textual Data, pages 115-123, Avignon, France, April 2012. Association for Computational Linguistics.
[3] F. Galgani, P. Compton, and A. Hoffmann. Knowledge acquisition for categorization of legal case re- ports. In D. Richards and B. Kang, editors, PKAW 2012, volume LNAI 7457, pages 118-132. Springer, Heidelberg, 2012.
[4] F. Galgani, P. Compton, and A. Hoffmann. Towards automatic generation of catchphrases for legal case reports. In the 13th International Conference on Intelligent Text Processing and Computational Linguistics, volume 7182 of Lecture Notes in Computer Science, pages 415-426, New Delhi, India, 2012. Springer Berlin Heidelberg.
[5] F. Galgani and A. Hoffmann. Lexa: Towards automatic legal citation classification. In J. Li, editor, AI 2010: Advances in Artificial Intelligence, volume 6464 of Lecture Notes in Computer Science, pages 445-454. Springer Berlin Heidelberg, 2010.