CorpusWordParser

提供者:朱述承

简介

CorpusWordParser是一款免费的语料库标注工具,是由“语料库在线“这一网站提供的。CorpusWordParser分为在线版和下载的工具包版。CorpusWordParser的操作界面十分简洁,会使用计算机的普通人员都可以直接上手使用。CorpusWordParser是根据软件自带的标注集或者用户导入的标注集进行标注,可以做到对语句先分词,后标注,其标注效率和准确率都较高。

在线地址

http://www.aihanyu.org/cncorpus/CpsWParser.aspx

工具包下载地址

http://www.aihanyu.org/cncorpus/Resources.aspx

使用方法

A.通过上文给出的官方下载地址下载工具包的压缩文件,下载过后解压缩就可以直接看到CorpusWordParser的应用程序。
B.使用CorpusWordParser之前可能需要对电脑进行相关配置,系统会自动弹出需要配置的内容,按照系统指示一步步配置即可。
C.成功打开CorpusWordParser应用程序后通过“文件“下的”打开文件“选择需要进行分词或者标注的文件。注意该软件只支持打开文本格式(.txt)的文件,其他类型文件需先另存为文本文件格式后再处理。软件可以自动识别、处理文本文件的不同字符编码(GB或Unicode等)。
D.用户还可以在“设置”中根据自身需求勾选其他的附加功能进行配置。
E.配置完成后点击“切分标注”即可看到结果。点击“文件”下的“保存文件”可对已经分词标注完毕的文本结果进行保存。