-
Notifications
You must be signed in to change notification settings - Fork 0
License
Nicoloer/Six-Nuts-data
This commit does not belong to any branch on this repository, and may belong to a fork outside of the repository.
Folders and files
Name | Name | Last commit message | Last commit date | |
---|---|---|---|---|
Repository files navigation
(一)项目工程介绍 项目名称: 基于python的爬虫数据采集及可视化分析,以《我不是药神》为例 项目功能: 1.主要工作:《我不是药神》影评爬取以及分析 2.获取数据: (1)处理的数据:《我不是药神》影评、评论时间、推荐指数 (2)数据获取:从豆瓣网上爬取 (3)选择数据原因:《我不是药神》是一部反映现实并得到社会广泛响应的影片,大量影评数据的获取可以反映大众对这部电影的客观评价,以及这部电影中反映的社会现象与真实社会现象的契合度;评论时间则反映出大众观看这部电影的时间分布,可以看出这部电影究竟是一时火热,还是持续广受欢迎;推荐指数,点赞人数则是对爬取的影评的真实性认可性进一步优化,推荐指数越高,点赞人数越多的评论则更能够被大众认同。此外,选取豆瓣网的影评还有一个原因,与其他网站相比,豆瓣网的知名度更高,受众范围更广,影评质量更高,人们更喜欢在豆瓣网上发表自己的言论,有好评有差评,更具客观性。 3.数据分析处理,可视化 (1)制作词云显示影评中的高频词 (2)制作关于评论时间、推荐指数的圆饼图、散点图 (3)基于词云、圆饼图、散点图进行分析 所采用的语言: python 项目版本: 1.0 (二)项目的基本结构 1.数据采集 2.词云 3.可视化分析 (三)需要配置的环境 matplotlib jieba wordcloud numpy PTL (四)作者 杜皓轩,昝鹏艺,张玺,张扬,梁珂,顾凡
About
No description, website, or topics provided.
Resources
License
Stars
Watchers
Forks
Releases
No releases published
Packages 0
No packages published