Skip to content

Nicoloer/Six-Nuts-data

Repository files navigation

(一)项目工程介绍
项目名称:
基于python的爬虫数据采集及可视化分析,以《我不是药神》为例

项目功能:

1.主要工作:《我不是药神》影评爬取以及分析

2.获取数据:

(1)处理的数据:《我不是药神》影评、评论时间、推荐指数

(2)数据获取:从豆瓣网上爬取

(3)选择数据原因:《我不是药神》是一部反映现实并得到社会广泛响应的影片,大量影评数据的获取可以反映大众对这部电影的客观评价,以及这部电影中反映的社会现象与真实社会现象的契合度;评论时间则反映出大众观看这部电影的时间分布,可以看出这部电影究竟是一时火热,还是持续广受欢迎;推荐指数,点赞人数则是对爬取的影评的真实性认可性进一步优化,推荐指数越高,点赞人数越多的评论则更能够被大众认同。此外,选取豆瓣网的影评还有一个原因,与其他网站相比,豆瓣网的知名度更高,受众范围更广,影评质量更高,人们更喜欢在豆瓣网上发表自己的言论,有好评有差评,更具客观性。

3.数据分析处理,可视化

(1)制作词云显示影评中的高频词

(2)制作关于评论时间、推荐指数的圆饼图、散点图

(3)基于词云、圆饼图、散点图进行分析 

所采用的语言:

python

项目版本:

1.0

(二)项目的基本结构

1.数据采集

2.词云

3.可视化分析


(三)需要配置的环境
matplotlib
jieba
wordcloud
numpy
PTL

(四)作者
杜皓轩,昝鹏艺,张玺,张扬,梁珂,顾凡

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 4

  •  
  •  
  •  
  •  

Languages