博主介绍:✌全网粉丝10W+,前互联网大厂软件研发、集结硕博英豪成立工作室。专注于计算机相关专业项目实战6年之久,选择我们就是选择放心、选择安心毕业✌
> 🍅想要获取完整文章或者源码,或者代做,拉到文章底部即可与我联系了。🍅点击查看作者主页,了解更多项目!
🍅感兴趣的可以先收藏起来,点赞、关注不迷路,大家在毕设选题,项目以及论文编写等相关问题都可以给我留言咨询,希望帮助同学们顺利毕业 。🍅
1、毕业设计:2026年计算机专业毕业设计选题汇总(建议收藏)✅
2、大数据毕业设计:2026年选题大全 深度学习 python语言 JAVA语言 hadoop和spark(建议收藏)✅
🍅感兴趣的可以先收藏起来,点赞、关注不迷路,大家在毕设选题,项目以及论文编写等相关问题都可以给我留言咨询,希望帮助同学们顺利毕业 。🍅
1、项目介绍
- 技术栈:Python语言、Django框架(2.2.1)、Django 、MySQL数据库(用户提及SQLite为实际使用,此处统一标注)、协同过滤推荐算法(基于用户+基于物品)、requests爬虫技术、豆瓣电影数据源(3000条电影数据);前端:Bootstrap3、JavaScript、jQuery
- 研究背景:豆瓣电影平台聚集3000+部电影数据(含标题、评分、导演、标签等),但用户面临“信息过载”与“推荐不精准”痛点——传统浏览需手动筛选标签/评分,无法基于个人偏好推送内容;同时人工采集豆瓣数据效率低,缺乏系统的“数据管理+个性化推荐”工具,导致用户找片时间成本高,亟需一体化系统解决。
- 研究意义:技术层面,通过requests爬虫实现豆瓣数据自动化采集,Django+DRF构建稳定后端,协同过滤算法(准确率约75%)提升推荐精度,形成“采集-存储-推荐-管理”技术闭环;用户层面,为电影爱好者提供个性化推荐,减少筛选时间;行业层面,为“影视数据应用”提供可复用方案,推动从“被动浏览”转向“主动推荐”,具备实际应用价值。
2、项目界面
- 电影信息详情页面
- 系统首页,电影信息排序
- 我的收藏电影
- 后台数据管理
- 电影信息管理
- 数据采集页面
3、项目说明
本项目是基于Python+Django框架开发的豆瓣电影个性化推荐系统,整合Bootstrap3、requests爬虫与协同过滤算法,以“四层分层模型设计”(前端页面+后端架构+算法实现+数据库)为核心,实现“豆瓣数据采集-电影管理-个性化推荐-后台运维”完整流程,推荐准确率约75%,旨在解决电影信息筛选难、推荐不精准的问题。前端页面层基于Bootstrap3+JavaScript+jQuery构建响应式界面,支持电影展示、排序、搜索等交互,适配不同设备;后端架构层以Django 2.2.1为核心,结合Django REST Framework开发API接口,采用MVC架构划分数据、交互与逻辑模块,负责用户认证、数据处理及算法调度;算法实现层为协同过滤推荐算法(基于用户+基于物品),通过用户标签/评分行为计算相似度,结合“冷启动”解决方案(新用户先推8分以上高评分电影)生成推荐;数据库层用SQLite存储3000条豆瓣电影数据(含id、title、评分等字段)及用户账号、收藏/评分记录,保障数据结构化。核心流程为requests爬虫采集豆瓣电影数据,经清洗后存入SQLite,Django+DRF提供接口支撑前端展示与用户操作,协同过滤算法根据用户行为生成推荐,后台完成数据管理与爬虫任务运维。功能上,数据采集模块支持断点续爬与数据清洗,确保数据完整性;前端用户交互模块含电影浏览筛选(多维度排序、标签分类、关键词搜索)与个性化操作(注册登录、电影评分/收藏);推荐模块在用户登录后自动推送10-15部未浏览/未收藏影片;后台管理模块可对电影数据增删改查、批量导入导出,同时监控系统核心指标(电影总数、活跃用户数等)、查看爬虫运行日志并调度更新任务。
4、核心代码
# -*-coding:utf-8-*-importos os.environ["DJANGO_SETTINGS_MODULE"]="movie.settings"importdjango django.setup()frommovie.modelsimport*frommathimportsqrt,powimportoperatorfromdjango.db.modelsimportSubquery,Q,Count# from django.shortcuts import render,render_to_responseclassUserCf:# 获得初始化数据def__init__(self,all_user):self.all_user=all_user# 通过用户名获得列表,仅调试使用defgetItems(self,username1,username2):returnself.all_user[username1],self.all_user[username2]# 计算两个用户的皮尔逊相关系数defpearson(self,user1,user2):# 数据格式为:物品id,浏览sum_xy=0.0# user1,user2 每项打分的的累加n=0# 公共浏览次数sum_x=0.0# user1 的打分总和sum_y=0.0# user2 的打分总和sumX2=0.0# user1每项打分平方的累加sumY2=0.0# user2每项打分平方的累加formovie1,score1inuser1.items():ifmovie1inuser2.keys():# 计算公共的浏览次数n+=1sum_xy+=score1*user2[movie1]sum_x+=score1 sum_y+=user2[movie1]sumX2+=pow(score1,2)sumY2+=pow(user2[movie1],2)ifn==0:# print("p氏距离为0")return0molecule=sum_xy-(sum_x*sum_y)/n# 分子denominator=sqrt((sumX2-pow(sum_x,2)/n)*(sumY2-pow(sum_y,2)/n))# 分母ifdenominator==0:return0r=molecule/denominatorreturnr# 计算与当前用户的距离,获得最临近的用户defnearest_user(self,current_user,n=1):distances={}# 用户,相似度# 遍历整个数据集foruser,rate_setinself.all_user.items():# 非当前的用户ifuser!=current_user:distance=self.pearson(self.all_user[current_user],self.all_user[user])# 计算两个用户的相似度distances[user]=distance closest_distance=sorted(distances.items(),key=operator.itemgetter(1),reverse=True)# 最相似的N个用户print("closest user:",closest_distance[:n])returnclosest_distance[:n]# 给用户推荐电影defrecommend(self,username,n=3):recommend={}nearest_user=self.nearest_user(username,n)foruser,scoreindict(nearest_user).items():# 最相近的n个用户formovies,scoresinself.all_user[user].items():# 推荐的用户的电影列表ifmoviesnotinself.all_user[username].keys():# 当前username没有看过ifmoviesnotinrecommend.keys():# 添加到推荐列表中recommend[movies]=scores*score# 对推荐的结果按照电影# 浏览次数排序returnsorted(recommend.items(),key=operator.itemgetter(1),reverse=True)# 基于用户的推荐defrecommend_by_user_id(user_id):user_prefer=UserTagPrefer.objects.filter(user_id=user_id).order_by('-score').values_list('tag_id',flat=True)current_user=User.objects.get(id=user_id)# 如果当前用户没有打分 则看是否选择过标签,选过的话,就从标签中找# 没有的话,就按照浏览度推荐15个ifcurrent_user.rate_set.count()==0:iflen(user_prefer)!=0:movie_list=Movie.objects.filter(tags__in=user_prefer)[:15]else:movie_list=Movie.objects.order_by("-num")[:15]returnmovie_list# 选取评分最多的10个用户users_rate=Rate.objects.values('user').annotate(mark_num=Count('user')).order_by('-mark_num')user_ids=[user_rate['user']foruser_rateinusers_rate]user_ids.append(user_id)users=User.objects.filter(id__in=user_ids)#users 为评分最多的10个用户all_user={}foruserinusers:rates=user.rate_set.all()#查出10名用户的数据rate={}# 用户有给电影打分 在rate和all_user中进行设置ifrates:foriinrates:rate.setdefault(str(i.movie.id),i.mark)#填充电影数据all_user.setdefault(user.username,rate)else:# 用户没有为电影打过分,设为0all_user.setdefault(user.username,{})user_cf=UserCf(all_user=all_user)recommend_list=[each[0]foreachinuser_cf.recommend(current_user.username,15)]movie_list=list(Movie.objects.filter(id__in=recommend_list).order_by("-num")[:15])other_length=15-len(movie_list)ifother_length>0:fix_list=Movie.objects.filter(~Q(rate__user_id=user_id)).order_by('-collect')forfixinfix_list:iffixnotinmovie_list:movie_list.append(fix)iflen(movie_list)>=15:breakreturnmovie_list# 计算相似度defsimilarity(movie1_id,movie2_id):movie1_set=Rate.objects.filter(movie_id=movie1_id)# movie1的打分用户数movie1_sum=movie1_set.count()# movie_2的打分用户数movie2_sum=Rate.objects.filter(movie_id=movie2_id).count()# 两者的交集common=Rate.objects.filter(user_id__in=Subquery(movie1_set.values('user_id')),movie=movie2_id).values('user_id').count()# 没有人给当前电影打分ifmovie1_sum==0ormovie2_sum==0:return0similar_value=common/sqrt(movie1_sum*movie2_sum)#余弦计算相似度returnsimilar_value#基于物品defrecommend_by_item_id(user_id,k=15):# 前三的tag,用户评分前三的电影user_prefer=UserTagPrefer.objects.filter(user_id=user_id).order_by('-score').values_list('tag_id',flat=True)user_prefer=list(user_prefer)[:3]current_user=User.objects.get(id=user_id)# 如果当前用户没有打分 则看是否选择过标签,选过的话,就从标签中找# 没有的话,就按照浏览度推荐15个ifcurrent_user.rate_set.count()==0:iflen(user_prefer)!=0:movie_list=Movie.objects.filter(tags__in=user_prefer)[:15]else:movie_list=Movie.objects.order_by("-num")[:15]print('from here')returnmovie_list# most_tags = Tags.objects.annotate(tags_sum=Count('name')).order_by('-tags_sum').filter(movie__rate__user_id=user_id).order_by('-tags_sum')# 选用户最喜欢的标签中的电影,用户没看过的30部,对这30部电影,计算距离最近un_watched=Movie.objects.filter(~Q(rate__user_id=user_id),tags__in=user_prefer).order_by('?')[:30]# 看过的电影watched=Rate.objects.filter(user_id=user_id).values_list('movie_id','mark')distances=[]names=[]# 在未看过的电影中找到forun_watched_movieinun_watched:forwatched_movieinwatched:ifun_watched_movienotinnames:names.append(un_watched_movie)distances.append((similarity(un_watched_movie.id,watched_movie[0])*watched_movie[1],un_watched_movie))#加入相似的电影distances.sort(key=lambdax:x[0],reverse=True)print('this is distances',distances[:15])recommend_list=[]formark,movieindistances:iflen(recommend_list)>=k:breakifmovienotinrecommend_list:recommend_list.append(movie)# print('this is recommend list', recommend_list)# 如果得不到有效数量的推荐 按照未看过的电影中的热度进行填充print('recommend list',recommend_list)returnrecommend_listif__name__=='__main__':similarity(2003,2008)recommend_by_item_id(1)5、源码获取方式
🍅由于篇幅限制,获取完整文章或源码、代做项目的,查看【用户名】、【专栏名称】就可以找到我啦🍅
感兴趣的可以先收藏起来,点赞、关注不迷路,下方查看👇🏻获取联系方式👇🏻