1. 豆瓣电影数据分析
这篇报告是我转行数据分析后的第一篇报告,当时学完了Python,SQL,BI以为再做几个项目就能找工作了,事实上……分析思维、业务,这两者远比工具重要的多。一个多月后回过头来看,这篇报告虽然写得有模有样,但和数据分析报告还是有挺大差别的,主要原因在于:a.只是针对豆瓣电影数据分析太过宽泛了,具体关键指标到底是哪些呢?;b.没有一个确切有效的分析模型/框架,会有种东一块西一块的拼接感。
即便有着这些缺点,我还是想把它挂上来,主要是因为:1.当做Pandas与爬虫(Selenium+Request)练手,总得留下些证明;2.以豆瓣电影进行分析确实很难找到一条业务逻辑线支撑,总体上还是描述统计为主;3.比起网上能搜到的其他豆瓣电影数据分析,它更为详细,可视化效果也不错;
本篇报告旨在针对豆瓣电影1990-2020的电影数据进行分析,首先通过编写Python网络爬虫爬取了51375条电影数据,采集对象包括:电影名称、年份、导演、演员、类型、出品国家、语言、时长、评分、评论数、不同评价占比、网址。经过去重、清洗,最后得到29033条有效电影数据。根据电影评分、时长、地区、类型进行分析,描述了评分与时长、类型的关系,并统计了各个地区电影数量与评分。之后,针对演员、导演对数据进行聚合,给出产量与评分最高的名单。在分析过程中,还发现电影数量今年逐步增加,但评分下降,主要原因是中国地区今年低质量影视作品的增加。
另外,本篇报告还爬取了电影票房网( http://58921.com/ )1995-2020年度国内上映的影片票房,共采集4071条数据,其中3484条有效。进一步,本文分析了国内院线电影票房年度变化趋势,票房与评分、评价人数、时长、地区的关系,票房与电影类型的关联,并给出了票房最高的导演、演员与电影排名。
清洗、去重后,可以看到29033条数据长度、评分、评论数具有以下特点:
结合图1(a)(b)看,可以看到电影数据时长主要集中在90-120分钟之间,向两极呈现阶梯状递减,将数据按照短(60-90分钟),中(90-120分钟),长(120-150分钟),特长(>150分钟)划分,各部分占比为21.06%, 64.15%, 11.95%, 2.85%。
结合图2(a)看,可以看到我们采集到的电影数据评分主要集中在6.0-8.0之间,向两极呈现阶梯状递减,在此按照评分划分区间:2.0-4.0为口碑极差,4.0-6.0为口碑较差,6.0-7.0为口碑尚可,7.0-8.0为口碑较好,8.0-10.0为口碑极佳。
这5种电影数据的占比分别为:5.78%, 23.09%, 30.56%, 29.22%, 11.34%
再将评分数据细化到每年进行观察,可以发现,30年内电影数量与年度电影均分呈反相关,年度均分整体呈现下降趋势,2016年电影均分最低,电影数量最多。
进一步做出每个年份下不同评级等级的电影数据占比,可以发现,近年来,评分在[2.0,6.0)的电影数据占比有着明显提升,评分在[6.0,7.0)的数据占比不变,评分在[7.0,10.0)的数据占比减少,可能原因有:
对照图5,可以发现,评分与时长、评论人数的分布大致呈现漏斗状,高分电影位于漏斗上部,低分电影位于漏斗下部。这意味着,如果一部电影的评论人数很多(特别是超过30w人观影),时长较长(大于120min),那么它大概率是一部好电影。
根据各个国家的电影数量作图,可以得到图6,列出电影数量前十的国家可得表格2,发现美国在电影数量上占第一,达到8490部,中国其次,达6222部。此外,法国,英国,日本的电影数量也超过1000,其余各国电影数量相对较少。这可以说明美国电影有着较大的流量输入,在中国产生了较大的影响。
进一步分析各国电影的质量,依据评分绘制评分箱线图可得图7,在电影数量排名前20的国家中:
接着我们可以探索,哪个国家的电影对豆瓣评分随年份下降的贡献最大,考虑到电影数量对应着评分的权重。根据上述各国的电影评分表现,我们可以猜测电影数量较多的国家可能对年度均分的下降有较大影响。于是,我们再计算出这些国家的年度电影均分,并与整体均分进行比较分析。
再作出中国大陆,中国台湾,中国香港的均分箱线图图9(a),可以看到,大陆电影均分低于港台电影,且存在大量低分电影拉低了箱体的位置。
分析相关性可得,大陆、香港、台湾电影年度均分与全部评分关联度分别为R=0.979,0.919,0.822,说明滤去台湾和香港电影,大陆电影年度均分的变化趋势与全部评分变化更接近。图9(b)可以进一步反映这一点。
可以看到,大部分类型集中在X×Y=[10000,30000]×[6.00,7.50]的区间范围内,剧情、喜剧、爱情、犯罪、动作类电影数量上较多,说明这些题材的电影是近三十年比较热门的题材,其中剧情类电影占比最多,音乐、传记类电影平均得分更高,但在数量上较少,动作、惊悚类电影评论人数虽多,但评价普遍偏低。
除此之外,还有两块区域值得关注:
根据类型对电影数据进行聚合,整理得到各类型电影评分的时间序列,计算它们与整体均分时间序列的相关性,可得表格4与图11,可以看到剧情,喜剧,悬疑这三种类型片与总分趋势变化相关性最强,同时剧情、喜剧类电影在电影数量上也最多,因此可以认为这两类电影对于下跌趋势影响最大,但其余类别电影的相关性也达到了0.9以上,说明几种热门的电影得分的变化趋势与总体均分趋势一致。
前面已经得知,中美两国电影占比最高,且对于均分时间序列的影响最大。在此,进一步对两国电影进行类型分析,选取几种主要的类型(数量上较多,且相关性较高)进行分析,分别是剧情,喜剧,爱情,惊悚,动作,悬疑类电影,绘制近年来几类电影的数量变化柱状图与评分箱线图可得图12,13,14,15。
对导演与演员进行聚合,得到数据中共有15011名导演,46223名演员。按照作品数量在(0,2], (2,5], (5,10], (10,20], (20,999]进行分组统计导演数量,可以发现,15009名导演中有79.08%只拍过1-2部作品,46220名演员中有75.93%只主演过1-2部作品。忽略那些客串、跑龙套的演员,数据总体符合二八定律,即20%的人占据了行业内的大量资源。
在此,可以通过电影得分、每部电影评论人数以及电影数目寻找优秀的电影导演与演员。这三项指标分别衡量了导演/演员的创作水平,人气以及产能。考虑到电影数据集中可能有少量影视剧/剧场版动画,且影视剧/剧场版动画受众少于电影,但得分普遍要高于电影,这里根据先根据每部电影评论数量、作品数量来筛选导演/演员,再根据电影得分进行排名,并取前30名进行作图,可得图17,18。
结合电影票房网( http://58921.com/ )采集到的3353条票房数据,与豆瓣数据按照电影名称进行匹配,可以得到1995-2020年在中国大陆上映的电影信息,分别分析中国内地电影的数量、票房变化趋势,票房与评分、评价人数、时长、地区以及类型的关系,此外还给出了不同导演与演员的票房表现以及影片票房排名。
如图19所示,国内票房数据与上映的电影数量逐年递增,2020年记录的只是上半年的数据,且由于受疫情影响,票房与数量骤减。这说明在不发生重大事件的情况下,国内电影市场规模正在不断扩大。
对电影数据根据类型进行聚合,绘制散点图21,可以发现:
提取导演/演员姓名,对导演/演员字段进行聚合,计算每个导演/演员的票房总和,上映电影均分、以及执导/参与电影数目进行计算,作出票房总和前30名的导演/演员,可得图22,23,图中导演/演员标号反映了票房排名,具体每位导演/演员的上映影片数量、均分、每部电影评价人数、平均时长与总票房在表5、表6中给出。
最后根据电影票房进行排名,得到票房排名前20的电影如表格7所示,可以看到绝大部分上榜电影都是中国电影,索引序号为3、10、12、14、18、19为美国电影,这也反映了除国产电影之外,好莱坞大片占据较大的市场。
本篇报告采集了1990-2020年间豆瓣电影29033组有效数据,从豆瓣电影的评分、时长、地区、类型、演员、导演以及票房等信息进行分析评价,主要有以下结论:
2. 最好的影院排名
最好行此橡的影院有万达影院、大地影院、横店影城、中影国际影城、金逸电影等。
1、万达影院
万达电影可以说几乎覆盖了全国各大城市的电影院线品牌,由王健林的万达集团于2005年推出,至今品牌旗下业务几乎覆盖了完整扒扒了电影产业链,并且还有着IMAX专业放映设备和观影厅。
3. 中国电影产业现状及发展历史
中国电影现状,产业呈现出良好的发展势头。一方面,中式大片在产量和社会效果两方面都越来越好,重新赢得国内观众的信任;另一方面,它在海外市场的拓展也出现持续上升趋势,对于推广我国文化价值体系及其软实力起到积极作用。
中式大片的国际影响力不断增强,受到外国观众的欢迎,国际市场有了新的开拓,商业价值也趋于提高。但我们应当看到,中国电影在国际贸易中处于逆差状态,影片的海外竞争力仍然偏弱,与中国贸易大国和文化大国的地位很不相称。为此我们简要归纳了近年来中式大片的成功经验:从创作上看,中式大片已经摸索出一条主旋律片、艺术片和商业片三型互渗的电影美学道路,特别是在主旋律应当具有观赏性和艺术性方面取得了共识。从在观众中的社会效果看,中式大片已初步形成在通俗故事中蕴藉民族主流或核心价值理念的美学传统。
发展史
中国电影从无声、单机、黑白影片到高科技、大投入、环绕立体声巨幕电影,乃至全球最有影响力的电影节,以武术及以尚武崇德的侠义思想为主题的电影占据了中国电影的重要地位。从而使电影成为中国文化产业的中流砥柱。
1905年,中国第一部电影《定军山》 在北京丰泰照相馆诞生,着名京剧老生谭鑫培在镜头前表演了自己最拿手的几个片断。片子随后被拿到前门大观楼熙攘的人群中放映,万人空巷,就此宣告中国电影的诞生。
第一个阶段是中国电影的大产业时期,在这个时期里,中国电影经历的是井喷现象,中国电影的行业当时都是被三大巨头所把握的,他们一个开创了长篇正剧的历史,一个成为了文艺片的源头,最后一个是中国志怪电影鼻祖,这些东西到现在还在影响着中国的电影制作,当外国资本看到中国的电影市场,就几乎全部的涌了进来。中国电影当时都与外国的电影各都占据了半壁江山。
第二个电影阶段是新中国成立之后涌现出大批的电影制作人,也都制作出一大批优秀电影,在1950年的时期,新中国从苏联引入了一部电影《列宁在十月》可是中国人不懂俄语啊,于是,电影配音员就这样出现了,于是一部带着一股子东北味的普通话的电影出现了,从此,配音员在中国电影成为中国电影不可或缺的重要组成部分。从此,中国电影就进入了历史发展的快车道了。
中华人民共和国成立以后,中国电影事业获得全面的发展,建立了10多个国有电影制片厂,建起了大型电影机械厂、电影洗印厂、电影胶片厂,成立了高等电影专业学府-北京电影学院和中国电影发行放映公司为龙头的电影发行网。到90年代,全国放映单位(影院、放映队等)已超过10万个。故事片年产量最高达140部,每年观众在200亿左右人次,60年代以来,为了繁荣电影事业,先后举办百花奖和金鸡奖的评选活动,还在长春、上海等地举报了国际电影节,有不少优秀影片在权威性国际电影节上获奖!
而中国电影的潜力也以及展示出来,2017年,全国的总票房已经高达557亿,平均每天新增加5家电影院。从2012年至2017年全年上映场次从1311万场增加到7510万场;2012年至2017年全国银幕数量从9286个增加到41179个;2012年至2017年全国观影人次从3.5亿增加到13.7亿。而至今到2018年10月08日,全国总票房已经达到509.09亿,才半年多过去,已经快抵得上2017年全年的总票房。几乎每年都在100亿的稳定增长。从数据上来看,中国电影未来的发展潜力还是无限的,比如《战狼2》《红海行动》《我不是药神》《唐人街探案2》这些电影都具有很好的口碑,而且也让世界看到了现在中国电影的高速发展。随着国家的提倡和大众的参与让中国电影有了更高层次的发展,同时也让出品公司和大众参与者赚的盆满钵盈。
4. 2017上映电影数量
2017年是电影产业的丰收之年,全年上映电影数量达到了超过800部,其中不乏优秀的作品。据统计,国内电影数量约为530部,进口电影数量约为280部。在进口电影中,美国电影占据了大含岩握多数份额。而在谈庆国内电影中,除了传统的喜剧、爱情、动作等类型外,也涌现出了一些具有新意的题材和风格,例如《战狼2》、《芳华》等。此外,2017年也是中国影视产业与海外市场交流合作的重要一年,不少国内电影也在国际上枣衫获得了认可和好评。可以说,2017年是一年充满活力和创新的电影年份。
5. 2017年中国电影票房达到559亿元了吗
据报道,来自国家新闻出版广电总局电影局的数据显示,2017年全国电影总票房达559.11亿元,较上年同期增长13.45%,城市院线观影人次为16.2亿,比上年13.72亿增长18.08%,电影产业发展态势良好。
随着“电影走出去”呈现出新的亮点和特征,已与20个国家签署了电影合拍协议,金砖国家电影节等活动顺利举办,为推动中外人文交流积累了重要经验。
6. 2017年中国电影票房达到了多少亿
新闻出版广电总局电影局12月31日晚发布的数据显示,2017年全国电影总票房为559.11亿元,同比增长13.45%;国产电影票房301.04亿元,占票房总额的53.84%;票房过亿元影片92部,其中国产电影51部;城市院线观影人次16.2亿,同比增长18.08%。
电影局负责人称,2017年,电影产业促进法顺利实施,“放管服”改革为市场带来更多活力;我国作为世界第二大电影市场的地位更加巩固,成为全球电影市场增长的主引擎;“电影市场规范年”活动深入开展,为产业健康发展提供了坚实保障;“电影走出去”呈现出新的亮点和特征,我国已与20个国家签署了电影合拍协议,金砖国家电影节等活动顺利举办,为推动中外人文交流积累了重要经验。
7. 中国大数据影片有哪些
静水深流,空山鸣响。2017年的农村电影放映在平稳的大背景下,整个体系在向平衡、多元、差异、活跃的方向提质增效,进入了一个以供给侧结构性改革为导向的“精耕细作”时期。农村电影市场在2017年度展现出的新需求、新变化,不仅对电影放映工作提出了更高的要求,也为探索农村电影放映新机制、提高发行方活力和收益提供了新思路。在国家大力推行乡村振兴战略的背景下,农村电影市场必然将像其他乡村产业一样,迎来一个充满新潜力、新价值与新可能的黄金机遇期。
发行主体集中化趋缓,平衡化向前
2017年度,发行方表现出“大局稳定、整体接近、小众崛起”的特点。
从总体格局看,无论是发行影片数、被订购影片数、被订购总场次还是被订购总金额方面,都处于“几家独大”的状态,头部发行方占据了八成左右的比重。
从发展趋势看,各发行方在被订购场次和被订购金额上的差距又有所减小,分布更加集中,头部在各方面所占的比例相比往年有所下降,整体在向更加平衡的方向发展。
对于那些发行影片、被订购影片较少的“小发行方”来说,市场也提供了机会。不同发行方的单片平均收益、单片平均场次都表现出扩大趋势,今年单片平均收益、单片平均场次较高的发行方大都是被订购影片数不高的“非头部发行方”,说明在大的“二八格局”下,其他发行方并没有完全被马太效应束缚,依靠优质的影片也有机会获得较好的订购场次和版权收益,弥补在发行影片数量上的不足。
推荐影片
2017年度,主题放映活动共推荐了225部影片,内容丰富多样,包括剧情、动作、戏剧、爱情、犯罪、战争、古装等类型。
主题放映活动推出了许多思想精深、艺术精湛、制作精良的影片,在各类热门影片中,被推荐影片占2017年度订购量TOP50影片的30%(15部),占故事片TOP200影片情况的23.5%(47部)。
推荐效果
主题活动所推荐影片受到市场的高度认可,平均订购场次、平均订购金额远超过所有影片的平均水平。
被推荐影片数量上仅占所有被订购影片总数的6.04%,全年被订购了2152228场,占订购总场次的21.64%,总订购金额24043949元,占总订购金额的25.46%。
年度总结稳中有变,进入提质增效新阶段
经历了前几年的高速增长,农村电影放映事业在2017年进入了一个“增速放缓、调整加快”的阶段,从发行到订购的各个层面都表现出了“稳中有变”的特点。
2017年度,农村电影订购总场次首次突破1000万场,增幅高达12.99%。但也要看到,若将较为特殊的公益广告的场次不纳入统计,本年度订购总场次、订购总金额几乎与去年持平,分别还有0.11%、0.7%的下降,订购情况的“稳”正反映在这里。不同以往的是,2017年版权有补贴的农村版权影片和版权非补贴的农村版权影片的差距进一步扩大,版权非补贴影片的场次占比达到了64.99%、金额占比达到了73.37%,达到了历年之最,反映出了公益因素和市场因素更加深入地结合。
2017年的影片供给十分丰富,可订购的和被订购的影片数同比分别增长了11.55%和6.67%,但也要看到,影片订购率保持稳定,影片的平均订购场次和平均订购金额与往年也基本一致。在“稳”的背后,新片、大片的表现都要优于往年,占总数10.58%的新片,贡献了52.59%的订购场次和48.44%的订购金额,大片的平均订购场次和订购金额更是所有影片平均水平的160.72%和232.41%。这一稳一变之间,反映出了农村群众的观影偏好进一步与城市接轨,对影片质量提出了更高要求。
2017年,省份、院线、放映队等放映终端的数量、分布等都没有出现明显的变化,但省份之间的差异却在一定程度上有所凸显。各省份的订购场次差距减小的情况下,订购金额的差距却进一步拉大,订片均价上也存在较大的差距,故事片平均订价最高的省份是最低省份的2.5倍,反映出了各省份在订购影片的种类、价 格上存在偏好甚至态度的不同。而放映队平均活跃度的差异,也能在一定程度上反映出各省份农村电影放映工作的落实情况、固定化程度等。
对于发行方来说,2017年度的格局仍维持着“几家独大”。在发行影片数、被订购场次、被订购金额和版权收益等方面,前五名的发行方基本占据了80%左右的份额,“二八效应”明显。但从趋势上说,众多非头部发行方的份额加速提升,发行方之间订购情况的差距有所减小,而发行方单片平均收益的差距却大幅提高,2017年度出现的《战狼2》《勇士》等优秀影片,让发行影片数较少的“小发行方”也能获得较高版权收益,显示出农村电影市场里“大鱼不通吃”的机遇和潜力。
值得一提的是,无论是平稳巩固,还是调整变化,农村电影放映工作仍然保证了将社会效益和文化惠民放在首位。2017年发行的4部公益广告总订购量达1304781场,占年度总场次的11.60%,在广大农民群众中有效宣传了新时代、新思想、新政策。民族语译制工作有条不紊地扎实推进,新发行的32部译制影片100%被订购,充分体现了“为映而译”。作为引导、调控农村电影放映的有效手段,主题放映活动同样效果显着,200多部积极向上、质量精良的影片在平台的推荐下,获得了占总数21.64%的订购场次和25.46%的订购金额,得到了人民群众的广泛认可,对弘扬主旋律、传播正能量、提升农村电影放映质量起到了积极作用。
8. 截止2016年年中国有多少家电影院
根据已公布数据,目前大约在5000家左右。
电影局发布数据:2014年,中国新增影院1015家,日均增长近3家;新增银幕5397块,日均增长15块,目前全国银幕总数已达2.36万块。可以类比的是,2013年中国新增影院数量约900座,新增银幕5077块。
两次数据公布,都并没有提及中国电影院的总数目,但可以参照去年各大拟上市院线公司所采用的数字——2013年,中国可统计票房影院总数达到3849家。