2022-7-27 18:41 /
分享一下我的选修课《时间序列分析》的期末报告,二次元浓度这块是拿下了(bgm24)

本文哔哩哔哩专栏链接:
https://www.bilibili.com/read/cv17280183




摘要:随着视频平台哔哩哔哩的快速崛起,动画成为了更多年轻人消遣娱乐的方式。研究动画评分的时间序列有助于理解观众的习惯,向他们推荐有潜力的动画。本文基于 “bangumi番组计划”的869条动画评分序列,利用描述性分析的方法,得出评分序列的两条规律。随后聚焦于动画《紫罗兰永恒花园》的评分序列,指出其曾被严重低估。最后,利用ARIMA(1,1,0)模型,得出动画的短期评价会对用户的打分造成影响,并对《紫罗兰永恒花园》的未来评分做出预测。


关键词:动画评分 紫罗兰永恒花园 描述性分析 ARIMA模型


一、研究背景


动画是一种综合艺术,它是集合了绘画、摄影、音乐、文学等众多门类于一身的表现形式。近年来,随着二次元文化走向普罗大众,动画作为该文化最出圈的表现形式,受到越来越多年轻人的青睐。


动画已成为电影院线中不可忽视的一股势力。在中国,《哪吒之魔童降世》斩获50亿票房,位列内地影史第四。在日本,《鬼灭之刃 无限列车篇》击败同为动画的《千与千寻》,成为票房冠军。不只在院线,动画在流媒体平台上的成绩也傲视群雄。在著名动画平台哔哩哔哩上,最新的TV动画《间谍过家家》仅用22天播放量即破亿,刷新了经常被改写的日本动画播放量过亿纪录。在全球知名的视频平台Netflix上,有半数的会员观看过动画。





动画爱好者的数量不断增加,传统的视频播放平台已不足以满足他们交流的需要,动画评分网站应运而生。在评分网站中,比较具有代表性的是中国的“bangumi番组计划”和欧美的“MyAnimeList”。动画评分网站可以对观众选择动画提供参考,相比于传统的剧集评分网站例如豆瓣、IMDB,动画评分网站更能体现动画观看群体的特质。学术圈中已有针对动画评分网站的研究,在管理学顶级期刊《Marketing Science》上,Mina Ameri等人就研究了欧美动画评分网站“MyAnimeList”上动画口碑和社区网络对动画观看决策的影响。研究动画评分可以捕捉到观众品味的变化,为观众推荐未曾寻觅到的宝藏动画。在本案例中,我将针对动画评分时间序列进行研究,横轴为时间,纵轴为动画评分。由于每一部动画都有它自身的特点,很难提出一个通用的时间序列模型。因此,我会将大多数笔墨集中在一部动画上——《紫罗兰永恒花园》。


《紫罗兰永恒花园》是一部于2018年1月开播,由京都动画制作的电视动画。该动画讲述了原为战争兵器的女主角,为了领悟上司的遗言“我爱你”的含义,成为了代笔写信的「自动手记人偶」,追寻人生意义的故事。其导演为石立太一,剧本统筹是吉田玲子。2016年,该片的商业广告(CM)一经开播,迅速引起了全球动画迷的关注。因为该片的商业广告和预告片的制作特别精良,不少UP主在它还未开播时就进行了过度吹捧。动画平台哔哩哔哩更是十分看重该片,将该动画作为会员专属动画的急先锋。然而,从动画销量的结果来看,该动画的第一年并不算成功,截止2018年12月31日,该动画的销量为7331,排名四个季度日本电视动画的第12位。其治愈但“寡淡如水”的剧情为部分人所诟病。不过,随着时间的推移,该动画的口碑有所逆转,后文的分析与预测会详尽说明这一有趣的变化。





介绍研究背景之后,本文后续有数据介绍、数据分析、总结与讨论三部分。数据介绍板块将展示所用数据;数据分析部分首先观察大量的时间序列,寻找动画评分变化的一般趋势。而后以动画《紫罗兰永恒花园》为例,建立ARIMA模型预测它的未来评分走向。根据ARIMA模型的结果,管中窥豹地谈谈动画观众的评分习惯;总结与讨论部分会提及动画《紫罗兰永恒花园》评分变化的可能原因。


二、数据介绍


本文的数据收集自国内最大的动画评分网站“bangumi番组计划”。数据集中共有869部电视动画以及它们在各个时刻得到的评分。这些动画的开播时间介于2015年和2019年,完结日期在2021年1月1日之前,为了统一起见,只考虑2022年6月1日之前的评分记录。


作为本文的重点观察对象,《紫罗兰永恒花园》是一部开播于2018年1月10日,完结于2018年4月4日的日本电视动画,每周更新一集,共13集。





三、数据分析


(一)描述性分析


首先,将《紫罗兰永恒花园》的评分记录转化为时间序列。时间序列的转化原则如下:计算到2018年1月17日(开播后一周)为止的平均得分,计算到2018年1月24日为止的平均得分,…,计算到2022年5月25日为止的平均得分。因为绝大多数的TV动画是每周更新一次的,这里时间间隔设定为一周。《紫罗兰永恒花园》动画评分时间序列折线图如下。





图中使用一条紫罗兰色的竖线将时间序列一分为二,该竖线所对应的时间为2018年7月4日,此时动画已经完结了一个季度。可以发现2018年7月之前和2018年7月之后动画评分的趋势完全不同。这是因为大部分动画观众有“追番”的习惯,即更新一集观看一集。在完结三个月之前,动画的评分会随着观感的变化大幅度震荡;而动画完结一个季度之后,“追番党”的回合结束,接下来是完结后观看动画的“补番党”的回合。二者显然是异质的,不能混为一谈。在观察了许多动画评分序列后,我发现以上结论对于绝大多数动画是成立的,总结如下:


① 在动画完结一个季度之前,动画评分的可信程度并不高。


② 动画完结一个季度之前和动画完结一个季度之后是不同质的序列,不能轻易混合建模。


进一步观察《紫罗兰永恒花园》的动画时间序列,可以发现该动画如今的评分和动画完结一个季度时有较大差距,达到了0.363分。不要小看这0.363分,它可以使动画的评分排名上升约1000名(参与排名的动画有约7000部)。可以说,经过了几年的沉淀,目前《紫罗兰永恒花园》的评分已经显著高于刚完结时。那么,这种现象是不是普遍存在的呢?我计算了869部动画完结后的评分变化量,以直方图展示如下。





通过简单的计算,可得动画完结后评分变化量的样本均值为-0.027分,样本标准差为0.135。0.363分已经很接近样本均值+三倍样本标准差,因此可以认定《紫罗兰永恒花园》的评分曾经被严重低估。


(二)模型建构


为了预测《紫罗兰永恒花园》的未来评分走势,考虑对2018年7月4日(完结一个季度之后)到2022年5月25日的评分序列建立ARIMA模型。


首先对该评分序列进行ADF检验。ADF检验的p值为0.8287 > 0.05,因此认为原序列不平稳。这是显然的,因为2018年7月4日之后该动画的评分有线性增长的趋势。


对评分序列做一阶差分,而后进行ADF检验。此时的p值为2e-21 < 0.05,因此认为一阶差分序列平稳。对一阶差分序列做延迟6阶、延迟12阶的LB白噪声检验,p值分别为0.0028和0.0157,均小于0.05,这说明该序列值得研究。接下来绘制差分序列的ACF图和PACF图,用于定阶。





观察到自相关系数和偏自相关系数拖尾,综合后考虑对原始序列拟合ARIMA(0,1,0)、ARIMA(0,1,1)、ARIMA(1,1,1)和ARIMA(1,1,0)模型,模型的选择指标为AIC和BIC,这两个指标都是越小越好。





根据各预设模型的AIC和BIC值,选择AIC和BIC均最小的ARIMA(1,1,0)。ARIMA(1,1,0)模型的拟合结果如下表。





根据各参数的p值,得出该模型通过了参数的显著性检验,各参数显著。接下来对模型做显著性检验,绘画残差Q-Q图。





从Q-Q图中可以看出模型的残差近似服从正态分布。在此基础上对残差做延迟6阶、延迟12阶的LB白噪声检验,p值分别为0.749和0.583,均大于0.05,因此认为残差是白噪声,模型的显著性检验通过。

(三)模型解释与应用

据ARIMA(1,1,0)的模型结果,若动画在过去一周的上涨得分较多,则动画在本周的上涨得分更可能较多。这是因为在动画评分网站上,用户可以看到该动画最近的评价,动画的近期评价可能会对用户的打分造成影响。





利用所建立的ARIMA(1,1,0)模型预测《紫罗兰永恒花园》的评分走势,可以看出模型对于《紫罗兰永恒花园》的未来十分看好。到2023年6月时,该动画有望达到7.4分。





四、总结与讨论


对于动画评分序列总体,本文得出了:在动画完结一个季度之前,动画评分的可信程度并不高;动画完结一个季度之前和动画完结一个季度之后是不同质的序列,不能轻易混合建模。


对于《紫罗兰永恒花园》单条动画评分序列,本文得出了:该动画的评分曾经被严重低估;可以使用ARIMA(1,1,0)模型预测该动画的未来评分;动画的近期评价可能会对用户的打分造成影响;该动画是一部很有潜力的宝藏动画,到2023年6月,该动画有望达到7.4分。


《紫罗兰永恒花园》风评回升的原因可能有很多:“补番党”对动画的期待值没有“追番党”那么大,京都动画纵火事件带来的同情分,观众对治愈系、大众化动画的喜爱程度提升,该动画剧场版上映带来的效应等。但我觉得,最重要的是这部动画本身的质量,该动画的作画质量令人震撼,第10集把经典的剧情发挥到了极致。如今,该动画的销量已经达到了28330,位列2018年日本电视动画的第一位。是金子总会放光,这部“来自未来的动画”,最终会得到它应得的评价。




参考与引用

动画(一种综合艺术) - 百度百科

二次元(ACGN亚文化圈专门用语) - 百度百科

电视动画 - 萌娘百科 万物皆可萌的百科全书

哔哩哔哩番剧的微博_微博

Netflix动画制作人:全世界会员有半数以上看过动画

《间谍过家家》海报

bangumi 番组计划

MyAnimeList.net - Anime and Manga Database and Community

四月新番全球评分中期排行(2022)

Ameri M ,  Honka E ,  xie Y . Word of Mouth, Observed Adoptions, and Anime-Watching Decisions: The Role of the Personal vs. the Community Network[J]. Marketing Science, 2019, 38(4):567-583.

【TV动画】Violet Evergarden 紫罗兰永恒花园CM

2018年日本TV动画销量排行榜

紫罗兰永恒花园 的剧照

ヴァイオレット・エヴァーガーデン

7·18日本京都动画纵火案 - 百度百科

21世纪TV动画销量TOP200 

【瓶说动漫】赞美京紫——你是来自未来的动画 
Tags: 动画
#1 - 2022-7-27 19:01
合格的粳米,是真爱无误了(bgm38)
#2 - 2022-7-27 23:50
(H(x)=-∑p(x)log[p(x)])
一如既往的硬核(bgm38)
#3 - 2022-7-28 00:03
京紫还是得找一个空余时间一口气看完有感觉
#4 - 2022-7-28 10:03
(翼持たぬ鳥の歌よ)
梦回大三
#5 - 2022-7-28 16:26
紫罗兰粉狂喜
#6 - 2022-7-28 23:13
太秀了,不明觉厉
#7 - 2022-7-31 22:55
(Proletarier aller Länder,vereinigt euch!)
太   过  硬  核
#8 - 2022-8-31 10:52
(Dream a dream)
请问如果想获得一部动漫的大众审美评分,完结后多久的评分是可以参考的呢
#8-1 - 2022-8-31 14:15
飞飏之龙
一般情况下完结一个季度后的评分就可以参考了,只是不能排除评分变化的可能性。
如果要获得更加大众的评分,建议不要光看bangumi,也要参考豆瓣/MAL/B站之类的平台
#9 - 2022-9-6 23:03
(El Psy Kongroo)
支持,我觉得京紫以现季度动画评分为参考得分在7.7及以上是合理的
#10 - 2022-9-10 12:11
高数学的好呀 没记错这些函数模型都应该是高二下学期的知识了
#11 - 2022-9-17 16:02
真是硬核
#12 - 2022-12-6 11:52
厉害,历史是个圆
#13 - 2022-12-14 19:44
梦回计量经济学论文,一个只会因子分析的渣渣
#14 - 2022-12-15 22:56
好厉害
#15 - 2023-4-20 20:24
报!2023年4月,7.4分
#16 - 2023-5-11 14:43
文学类的东西能像你这样分析吗
#16-1 - 2023-11-9 19:20
胡安·鲁尔福
不是圣经?不是圣经?不是圣经?不是圣经?