Uppsala Persian Corpus

提供者:朱述承
访问地址:http://stp.lingfil.uu.se/~mojgan/UPC.html

简介

乌普萨拉波斯语语料库(UPC)(塞拉吉,2015年,第3章,第68-81页)是一个庞大的,免费提供的波斯语语料库。该语料库是Bijankhan语料库(Bijankhan,2004)的修改版本,增加了句子分段和一致的标记,其中包含2,704,028个标记,并注释了31个词性标记。

相关论文

  1. Bijankhan Mahmood. 2004. The Role of the Corpus in Writing a Grammar: An Introduction to a Software . Iranian Journal of Linguistics 19.
  2. Seraji, Mojgan. 2015. Morphosyntactic Corpora and Tools for Persian. Doctoral dissertation, Uppsala University. Studia Linguistica Upsaliensia 16.