yelp数据集

提供者:杜成玉
下载地址:https://www.yelp.com/dataset/download

概述

数据来源:http://www.gooseeker.com/doc/thread-4667-1-1.html

Yelp Dataset Challenge是Yelp官方公布的挑战赛,只要你的研究项目用到这个数据集,并且研究文章得到Yelp的青睐,就有机会获取5000美元以上的奖金。Yelp是美国著名商户点评网站,创立于2004年,囊括各地餐馆、购物中心、酒店、旅游等领域的商户,用户可以在Yelp网站中给商户打分,提交评论,交流购物体验等。在Yelp 中搜索一个餐厅或者旅馆,能看到它的简要介绍以及网友的点论,点评者还会给出多少星级的评价,通常点评者都是亲身体验过该商户服务的消费者,评论大多形象细致。数据集包括470万条用户评价,15多万条商户信息,20万张图片,12个大都市。此外,还涵盖110万用户的100万条tips,超过120万条商家属性(如营业时间、是否有停车场、是否可预订和环境等信息),随着时间推移在每家商户签到的总用户数。

数据集特征

数据来源:http://blog.sina.com.cn/s/blog_4db72f1501010zs0.html

文件类型:nodes.csv和edges.csv
数据类型:企业、评论、用户、签入和提示

相关论文

1.Bin Guo,Shasha Zhou. Understanding the impact of prior reviews on subsequent reviews: The role of rating volume, variance and reviewer characteristics[J]. Electronic Commerce Research and Applications,2016,20.
2.Camilla Vásquez. Right now versus back then : Recency and remoteness as discursive resources in online reviews[J]. Discourse, Context & Media,2015,9.
3.毛莺池,穆超,包威,李晓芳.空间众包中多类型任务的分配与调度方法[J].计算机应用,2018,38(01):6-12.
4.孙庆英,王中卿,朱巧明,周国栋.基于整数线性规划的商家属性抽取研究[J].中文信息学报,2017,31(06):190-195+204.
`