MovieRecommend

一个电影推荐系统——实现用户登录、评分、推荐，采用协同过滤算法。:cherry_blossom:

作者序

我完成该项目的时间线可以参考README末尾的笔记，请注意笔记中所记载的内容和最后的实际成果有所出入，只做为本人完成的过程记录。
本项目为2018年所做，和当前主流技术有所出入，大家可以利用深度学习算法来改进推荐结果。

下面贴出我收藏的部分资料链接，希望对大家有帮助。
Window 下 MySQL 5.6.15 下载安装及使用
 Python3 MySQL 数据库连接
 协同过滤算法
 django

系统流程

用户注册、登录系统，对看过的电影进行评分，点击提交评分按钮，再点击查看推荐按钮即可看见推荐的电影列表。项目主页以及推荐结果如下：

如何使用

1.首先将项目克隆到本地，用Pycharm打开movierecommend文件夹，并install项目依赖
2.将用到的csv文件导入mysql数据表中，详见数据库建表，配置好数据库；注意数据库相关代码（settings.py、views.py）可能都要进行修改以符合实际情况；（本项目端口号为3307,用户为root,密码为admin,database为MovieData);
3.命令行执行:

python manage.py makemigrations
python manage.py migrate
python manage.py runserver

点击http://127.0.0.1:8000/ 即可查看注册登录以及评分页面。
注意登录后点击电影海报下面的星星对该电影评分，之后还要点击左上角的“提交评分”按钮才能将该评分数据存入mysql中，否则代码会报错。

项目依赖
1.Python3.6+django1.11 (python3.5亦可)
2.MySQL5.6
3.Jquery+CSS3+Html5

数据库建表处理
1.在MySQL中创建一个database，取好名字，比如MovieData；
2.在该数据库中创建moviegenre3和users_resulttable两张表,建表命令行如下：

CREATE TABLE moviegenre3(imdbId INT NOT NULL PRIMARY KEY,title varchar(300),poster varchar(600));

CREATE TABLE users_resulttable(userId INT NOT NULL,imdbId INT,rating DECIMAL(3,1));

3.通过命令行或者navicat等工具将项目data文件夹下的两张csv表分别导入上面创建好的两张table中。由于moviegenre3.csv中的超链接较复杂，建议使用navicat工具导入；users_resulttable表可以使用下面命令行导入：

load data infile "E:/MovieRecommend/data/users_resulttable.csv" into table users_resulttable fields terminated by ',' lines terminated by '\n' (userId,imdbId,rating);

注意，此表没有主键，增加主键操作为:

alter table users_resulttable add column id int auto_increment PRIMARY KEY;

问题

1.由于在views.py的查询推荐结果的代码中直接将查询sql写死为select * from users_resulttable WHERE userId = 1001，可能会报keyerror:1001的错误。如果报错请检查users_resulttable表的末尾是否存入了userId=1001的用户评分记录，如果没有，很可能是用户没有点击提交评分按钮将数据插入数据表造成的。如果要进行第二个用户的注册和登录推荐，要将sql改为userId=1002或者先将user表中所存用户信息删除。
2.如果通过命令行将csv导入数据库表报错‘The MySQL server is running with the --secure-file-priv option so it cannot execute this statement’，则是mysql版本问题，建议使用5.6版本。如果使用5.7版本出现此问题，修改mysql文件夹下的my.ini文件，增加secure_file_priv=语句，并且在service服务里面重启mysql即可。
3.执行迁移时出现问题建议删除迁移文件重新迁移。

笔记
2018年2月18日
寒假过的好快啊，前一阵子准备用flask，但是后面进一步了解之后决定用django+mysql+python完成这个推荐系统，现在就在懵懵懂懂的学django

2018/4/5
UserCF是给用户推荐和他有共同兴趣爱好的用户喜欢的电影，ItemCF是给用户推荐那些和他之前喜欢的电影类似的电影。
目前已经实现UserCF部分算法，模拟了用户-电影矩阵数据，对已有用户里的某一位用户进行电影推荐。之后的工作就是要从csv中获取数据。
看了《推荐系统实践》这本书，后期可能用基于标签，但是基于标签算法涉及更多，每部电影都需要多个标签，不能用movielens数据集。

2018/4/7
今天尝试用了pycharm，之前一直用的sublime，但是文件管理的比较混乱。用pycharm的时候遇到坑了，我系统按安装的是django1.11, 但是pycharm里面安装的是最新版本2.0，导致项目文件自带的代码有错误。后来又卸了重新安装，统一成了1.11.0版本。
接下来是mysql，项目迁移如下：

python manage.py makemigrations

这只是生成了迁移文件，还要执行迁移文件

python manage.py migrate

2018/4/8
进行一下流程梳理：
1.先启动mysql:net start mysql;mysql -u root -p;
2. create database [数据库名字];
3.pycharm直接创建一个django项目，然后进入这个项目下
4.在settings.py 中,数据库代码为：

   DATABASES = {
 'default': {
     'ENGINE': 'django.db.backends.mysql',
     'NAME': '[数据库名字]',
     'PASSWORD': '[自己设置一个密码]',
     'HOST': '127.0.0.1',
     'USER': 'root',
     'PORT': '',   
 }
}

5.在_init_.py中： import pymysql; pymysql.install_as_MySQLdb()
6.models.py:加入模型类，属性等。
7.生成迁移文件：python manage.py makemigrations;执行迁移：python manage.py migrate;
8.在mysql>中：use [数据库名]; show tables;
在项目文件下，python manage.py runserver 浏览器中输入127.0.0.1:8000
9.在templates下写html文件，然后和views.py视图文件、urls.py文件进行匹配

2018/4/10
今天搭建了django的虚拟开发环境，安装了virtualenv，一定要保证整个项目都在虚拟环境中运行。 django1.11.1
关于html文件调用js、css等文件：首先在建的app目录下建一个static文件，分支如下
├─migrations
│ └─__pycache__
├─static
│ ├─css
│ ├─img
│ └─js
└─__pycache__
注意migrations和static文件同级。html文件开头要加上 {% load staticfiles %}，引入css的语句为：
python <link rel="stylesheet" href="{% static 'css/Test.css' %}">
如果纯粹像写前端那样调用css、js是不能成功的。
输入'http://127.0.0.1:8000/users/login/'，返回用户登录界面
点击登录后进入推荐系统首页（目前的首页只有一个电影分类页面，之后应增加分页，以及实现用户对电影评分，数据库记录用户对电影的评分）

2018/4/12
今天找到了另一个csv文件，里面含有电影海报的链接，这样可以直接用Js动态获取链接然后加载图片；
还有由于有很多个csv文件，每个文件包含的内容都不一样，所以要将各个文件合并。准备直接用mysql的多表查询。花了很久才成功把csv导入进mysql表中的ratings.

2018/4/13
注意result表里面要存电影的名字，而名字里面很多不确定的特殊符号，比如有逗号，冒号等。所以不能加enclosed by '"'这句，否则csv导进mysql表时会中断。

4/14
今天做的很少，主要都去看深度学习视频了，为以后的研究生项目扫盲。
主要还是csv和Mysql的问题，不知道要怎么去遍历里面的数据。之前是自己模拟的几个用户对电影进行评分，用的是列表类型，我就想能不能读取csv然后转为列表再操作。

4/20
由于之前创建表时，不小心将rating设为了int型，所以今天重新建了一张表改为DECIMAL，名为resultTable。而且增加了主键:id。
‘alter table resultTable add column id int auto_increment PRIMARY KEY;’是给表增加一列并设为自增主键。
现在前端页面已经可以获取图片的imdbId号和评分，接下来就是获取当前用户的名字，给他分一个从669开始的userId号。然后插入imdbId号和rating，调用算法进行分析。

4/25
今天实现了可以从前端页面获取评分的电影的rating和imdbId号并存入users_resulttable中，还要解决的是给登录用户自动分配一个userId号，与他的评分相对应。
之后要实现算法从数据库中获取数据得出推荐结果。现在没有存title，后面得出推荐结果了就通过查询imdbId号得到海报和title。
还实现了index.html显示用户登录信息。
重新根据model生产数据表要将所有的迁移文件都删除才能生成成功。

4/26
实现了给每个用户分配一个id，其实是在原有的user.id基础上加1000.
然后将算法导入pycharm，并且实现了可以将mysql数据表导出为csv文件。
现在的Mysql表是user_resulttable，同csv文件，csv文件导出到static下。明天的任务是通过按钮将其连贯起来。

4/27
poster2从moviegenre7.txt导入。
对users_resulttable的处理：

alter table users_resulttable drop column id;    
load data local infile "e:/Moviedatabase/rrtotaltable.csv" into table users_resulttable fields terminated by ',' lines terminated by '\n' (userId,imdbId,rating);    
alter table users_resulttable add column id int auto_increment PRIMARY KEY;

费劲周折终于实现了从数据库里获取海报链接并且显示在html上。
但是，还没有实现从recommend函数得到的imdbId中查询到poster再显示。可能要将imdbId存到数组里再循环查询。
而且还有个问题，就是现在页面一刷新数据库里就会出现重复的值。

4/28
有个最大的问题，现在imdbId和poster对应的表不完整，很多推荐出来的ImdbId号找不到电影海报。
必须要解决这个问题，而且最好增加title。现已解决select查询语句遍历recommend函数输出的数组。

4/29
到今天为止，毕设基本已经完成。且增加了用户注销按钮。
但有几点不足：
1.推荐页面的排版样式未设计 2.运行速度有点慢 3.只用了一种推荐算法 4.每次刷新都在重新生成推荐列表，应该去除这种效果，刷新不应该变动。

4/30
提高了一点运行速度。

5/2
今天写完了ItemCF,但其实性能比UserCF差。因为电影数据集的电影数量比用户多太多。

5/7
今天登入数据库出现了问题，一直登不进去。后面重新建了数据库，重设置了密码。
数据库端口号由3306改为3307，要删除迁移文件重新执行迁移。
CREATE TABLE moviegenre3(imdbId INT NOT NULL PRIMARY KEY,title varchar(300),poster varchar(600));
然后通过navicat将moviegenre3.csv自动导入。

Name		Name	Last commit message	Last commit date
Latest commit History 65 Commits
data		data
img		img
movierecommend		movierecommend
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

MovieRecommend

作者序

系统流程

如何使用

问题

About

Releases

Packages

Languages

JaniceWuo/MovieRecommend

Folders and files

Latest commit

History

Repository files navigation

MovieRecommend

作者序

系统流程

如何使用

问题

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages