情感挖掘的酒店评论语料库

提供者:杜成玉
下载地址:https://download.csdn.net/download/lssc4205/9903298

概述

数据来源:https://blog.csdn.net/noter16/article/details/75340354

谭松波收集整理了一个较大规模的酒店评论语料。语料规模为10000篇。语料从携程网上自动采集,并经过整理而成。为了方便起见,语料被整理成4个子集:
1.ChnSentiCorp-Htl-ba-2000: 平衡语料,正负类各1000篇。
2.ChnSentiCorp-Htl-ba-4000: 平衡语料,正负类各2000篇。
3.ChnSentiCorp-Htl-ba-6000: 平衡语料,正负类各3000篇。
4.ChnSentiCorp-Htl-unba-10000: 非平衡语料,正类为7000篇。

相关论文

[1]王骏科. 多粒度中文情感分析系统的研究与实现[D].电子科技大学,2017.
[2]陈柯宇. 酒店领域文本情感分类研究[D].重庆大学,2017.
[3]孔伟俊. 细粒度情感分析技术在评论挖掘系统中的应用[D].江苏科技大学,2017.
[4]魏华,李华飙.基于短语模式的情感分析[J].科研信息化技术与应用,2015,6(06):12-17.
[5]贾会玲,吴晟,李英娜,李萌萌,杨玺,李川.基于PLSA模型的观点句聚类算法研究[J].价值工程,2015,34(31):167-169.
[6]刘邵博. 社会网络新媒体的信息获取与情感分类关键技术研究及实现[D].河北科技大学,2013.