中文句结构树资料库

提供者:刘唯
链接:http://turing.iis.sinica.edu.tw/treesearch/

简介

中文句结构树资料库检索工具 3.0 版,是由中文词识库小组(CKIP)设计完成,该系统是基于Internet的Web平台,使用者只要透过网际网路浏览器,即可操作本系统。该系统可以帮忙研究者,找到符合相关条件的中文剖析树,而进行研究。并以图文的方式让使用者可以清础地瞭解剖析树的内容。而不用去一个一个的找寻,大大地省去找寻的时间。本系统提供使用者对Sinica Treebank进行检索的动作,以阶层式查询来完成使用者的需求。透过相关查询的结果,使用者可以瞭解到中文句结构树中的词的语意角色与词组语法的标记方式。系统在主层检索中提供关键词查询与句型结构查询功能,对于查询后的结果可再依指定范围进行过滤与统计的动作。其范围包含同词组、同句子、左右距离与同关连关系的匹配词范围;统计包含有句型、词类、词、语意角色统计。

使用说明

进入中文剖析树检索系统后,本系统提供使用者可以「关键词」或「句型」的条件方式搜寻相关的中文剖析树,并对搜寻后的结果可以再次设定条件搜寻。因为,分为第一层搜寻与再过滤(即第N层搜寻)二个部份。

依关键词搜索

有词/词类/角色/特征的项目供使用者填入,使用者可以依需求填入必要的项目。举例来说,如果要查「我们」,就在词的部份填入「我们」即可;如果要查「我们」词类为「Nhaa」的话,在词的部份填入「我们」,并在词类的部份填入「Nhaa」即可;总而言之,它是复合式条件的输入,但看使用者的而求而定。另外,如果使用者对词类不熟,可以「%」代表万用字元。比如说,使用者想查 “Nh” 开头的词类,可以在词类类的栏位键入「Nh%」即可。

依句型搜索

以「句型」为搜寻剖析树结构的方式,其中包含「专业用法」、「标准结构」和「文字输入」,三种方式。以想要查询 “S(experiencer:NP|Head:VL1:爱|goal:NP)” 句型为例专业用法的搜寻表达方式如下,
S < ((/experiencer:NP/) $.. ((/Head:VL1/ < 爱) $.. ((/goal:NP/))))
特别说明:
A < B —> A(B)
A $.. B —> A|B
/A/ < B —> A*(B)
请在输入完毕后,按下 [更新] 按钮,可以检视其它输入方式的内容。
而标准结构的搜寻则是输入:
S(experiencer:NP|Head:VL1:爱|goal:NP)
同样的请在输入完毕后,按下 [更新] 按钮,可以检视其它输入方式的内容。
假设你都不知道要输入什麽的结构,可以输入文字,进行线上剖析,会显示其剖析结果,再加以修改。
输入:我爱你  按下 [剖析] 按钮
输出:S(experiencer:NP(Head:Nhaa:我)|Head:VL1:爱|goal:NP(Head:Nhaa:你))

再处理

再处理的部份,主要再缩小范围,找到更符合条件的树或查看其统计频率讯息。系统提供使用者对查询后的结果进行统计与过滤的动作。
首要任务就是先设定好处理的范围,系统提供五种范围设定:全句、同关键词词组、关键词左右范围、搭配词,接下来是依使用者的需求而定,如果要进行过滤的动作(也就是对经由第一层查询后的结果,再进行过滤分析的动作)系统提供:搭配词过滤、句型过滤。另外的统计部份,系统提供以下的统计:句型、角色/词类/词、角色、词类、词,并且可以设定频率下限,内定值为2。

过滤

若过滤的对像是「搭配词」,记得在搭配词上打勾。搜寻对象为「词类」、「语义角色」、「特徵」可点选各自右方的 ,即可得到剖析树所有的词类和语义角色,以便查询,至于各词类及论旨角色的特性和分类原则,可参考「词库小组技术报告93-05中文词类分析」,里面有详细分析和说明。或自行依不同类别,作不同的输入。
若过滤的对象是「句型」,其条件的输入方式同第一层的句型输入方式。只是,如果使用者是再「句型」查询后进入再处理的动作,操作方式都是一样的。

统计

在统计的部份,接着前一次查询「我们」的结果,假设想查询「我们」有哪些词类,可以在范围里设定,起与迄可以是正负值。并点选统计左侧的选项,再点选词类的项,在按执行按钮之后,就会出现统计的结果。

相关论文

1.Susan J. Blalock,Carri Casteel,Mary T. Roth,Stefanie Ferreri,Karen B. Demby,Viswanathan Shankar. Impact of enhanced pharmacologic care on the prevention of falls: A randomized controlled trial[J]. American Journal of Geriatric Pharmacotherapy,2010,8(5).