Python 来分析,堪比“唐探系列”!B站9.5分好评如潮!

百家 作者:AI100 2022-03-02 19:25:55

作者 | 菜鸟哥

来源 | 菜鸟学Python


Hello 小伙伴们,最近一部非常不错的悬疑+侦探+喜剧 电影,登上B站热榜!菜鸟哥看完之后,大呼过瘾,简直就是一本非常棒的"剧本杀"!演员都是实力派,演技超级好,剧情设计太有节奏感了!尤其是片尾的大反转,亮点很多。
短短几天的时间,播放量接近2000万,更是收获了9.5分的评价。接下来,我们一起来看看,扬名立万究竟是一部怎样的电影吧。
故事发生在民国时期,月黑风高之夜,一群失意电影人不约而同地受到上海滩大亨陆子野的邀请,来到一栋神秘大别墅,参加电影剧本讨论会。试图将一桩轰动上海的重大命案改编成电影。而随着讨论的逐渐深入,他们发现这栋别墅就是案发现场,齐头扎进了一个巨大的迷局,暗处的黑势力也在虎视眈眈,而凶手就在他们中间。

豆瓣影评

该部电影主打的是悬疑+喜剧的题材,围绕一群电影人展开故事主线。题材内容富有张力。为充分了解大家对于影片的评价,我们从B站弹幕和B站影评两个角度来抓取数据。


B站弹幕
对于弹幕的数据抓取,程序如下图所示:
上述的程序内容非常的简单,利用requests库来提取网页数据后,利用BeautifulSoup来解析网页数据后,获取到弹幕的内容、颜色以及字体等内容,最后将数据保存到本地。
程序中最为关键的点是cid数值的获取。如下图所示:

在网页当中,点击“F12”,打开开发者模式后,在网络下,通过搜索cid的关键词,来找到cid的数值。

接下来我们首先来分析一下弹幕数据。

对于观影者来说,弹幕的发送时间往往跟用户的观影时间呈现强相关性。

如上视频所示,弹幕的数量有两个高峰时间段,分别是晚上八点到凌晨以及下午的一点到六点。

假期期间,大家有着充分的观影时间,无论是白天或者是晚上,都可以随时随地观看电影发送弹幕。

而在大家的弹幕词云,如下图所示。

在弹幕当中,大家发送最多的弹幕当然是“新年快乐”,并且包含了“前方高能”等常见的弹幕用语。弹幕更多的是观影用户的随手发送的信息,不能很好体现对于电影本身的评价。

因此接下来我们来进一步的来抓取B站的影评数据:

上图是抓取B站影评的全部程序,程序的主入口是run函数。

58-72行函数,利用requests库来请求数据后,解析返回的json数据,并提取data数据,然后利用get_detial_data函数来获取详细的数据内容。

对于获取的影评数据,我们先看一下大家的评分数据。

从大家的评分数据可以看出,接近87%的影评给出了满分10分的评价。超过九成的用户给出了8分以上的评分。足以见得用户对于该部影片的喜爱和支持。

在用户的影评当中。对该部影片给予了高度的评价,“好看”、“不错”等褒义词成为了高频关键词。错过电影院观看的小伙伴们,非常值得花6块钱在B站看一下这部电影。

以上便是今天同大家对于《扬名立万》这部影片的分享,有喜欢的小伙伴可以前往B站观看;尤其是最后的结局,一些细节很有意思。最后男主角李家辉为啥没有去截住“夜莺”,以及最后越南两船相撞,主角团一行人有没有到死掉,照相馆无人取的照片等等。

资讯

Meta开发AI语音助手,助力元宇宙

技术

Pandas重复数据处理大全

技术

5个短小精悍的Python趣味脚本

资讯

M2芯片终于要来了?全线换新


分享

点收藏

点点赞

点在看

关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接