2021-12-20 12:20 /
1    导读

高评分的动画具有哪些特质?一千个人的眼中就有一千个哈姆雷特。有的人偏爱正能量的风格,认为兼具励志、治愈、成长的《国王排名》无人能敌;有的人看重番剧的阵容,觉得拥有荒木哲郎、虚渊玄、泽野弘之和霸权社的《泡泡》不可能翻车。



那么,究竟哪些因素可以真正地影响动画评分呢?本文综合3230部新作动画的数据,利用逐步回归分析的方法,寻找到131个显著变量。这些变量涵盖原作、导演、编剧、风格、音乐等多个方面。本文会把重点落在这些因素的科普上(`・ω・´)



2    数据来源

本文所用的数据来自动画评分网站bangumi。从该网站可以获取动画的评分、导演、编剧、标签等属性,其中标签中含有更丰富的信息例如改编来源、风格等。



由于bangumi上收录的国产、欧美动画较少,为了避免幸存者偏差的现象,我们只考虑日本动画。

3    模型建立

动漫高手们往往通过阅读原作,查导演、编剧成分的方式预测动画评分。顺着这个思路,可以建立预测动画评分的基础模型:



其中,导演评分和导演过往作品的评分有关,编剧评分和编剧过往作品的评分有关。

从数据中,可以算出动画评分和原作评分、导演评分、编剧评分均呈正相关

接下来,利用逐步回归的方式,将标签中的更多因素引入模型,直到没有显著的变量为止。



模型最终的形式为:



4    结果展示

①    风格

有十种热门风格对动画评分有显著的影响,它们分别是:



从结果中可以看出,治愈+日常+萌系的组合非常强势。该风格组可以使动画评价提高0.26 + 0.23 +  0.15 = 0.64分,是妥妥的上分密码。这是因为此类型的动画比较平稳,不容易出现剧情雷点,观众愿意给这种动画较高的分数。



反观后宫、乙女向等类型的动画,由于质量不稳定且不适合所有人,得到的评价较低。而奇幻、战斗、校园、恋爱等其他热门风格被判定为对评分没有显著的影响。

②    导演

一位灵性导演的加入,可以盘活全局,化腐朽为神奇。本模型认为有28位导演对动画评分有显著的影响,部分结果如下:



在上表展示的八名导演中,对动画评分有正向影响的六位可以说是大名鼎鼎。

宫崎骏指导的《千与千寻》一路过关斩将,获奥斯卡最佳动画长片;押井守导演的《攻壳机动队》意蕴深远,影响了《黑客帝国》等一大批科幻电影;新房昭之的《魔法少女小圆》是21世纪10年代最具代表性的原创动画作品,贡献了无数名场面。



今石洋之创作的《天元突破》堪称燃系巅峰,突破天际的钻头仍在等待后来者的挑战;今敏的《千年女优》将分镜发挥到了极致,场景的无缝切换令人回味无穷;渡边信一郎的《星际牛仔》浪漫而富有想象力,至今仍是bangumi中评分第一的动画。



③    编剧

剧情在一定程度上决定了番剧的上限。动画的制作人员中若有强力编剧加入,必然大有裨益。相反,如果一部动画由水平较次的编剧接手,就有点尴尬了。本文所用的模型寻找出了11位对评分有显著影响的编剧,部分结果如下:



模型对编剧的评价令人意外,著名编剧麻枝准被给了一个很低的系数,甚至已经和小太刀右京相同,这意味着麻枝准的动画编剧能力可能远低于外界对其的评价。

事实上,由麻枝准担当系列构成的动画并不尽如人意,从《CLANNAD》中获得的免喷权已经消耗殆尽。2020年麻枝准指导的《成神之日》刷新了他的下限,近乎反向登顶动画榜单。



不过,我个人还是很相信麻枝准老师的能力。希望他在保持身体健康的同时,能够创作出更多直击人心的曲子,至于动画编剧...还是少当为妙。

④    其他结果

这里主要介绍此前没有涉及到的领域的结果,例如改编来源、投资方等。



模型发现,童年滤镜对于动画评分的加成非常之大,高达0.41分。但是,无论是童年经典还是过往的热门作品,想在如今复现(文艺复兴),难度非常之大。

漫画改编的动画比较稳定,具有更高的基础分。而游戏改动画(不包括GAL改)多少会带有一点圈钱性质,基础分较低。

型月(Type-Moon)IP改编的作品,发挥优秀(不是全部),值得称赞。网飞出品的新作动画,难以评价,雷点较多。



在冷门风格、制作公司和其他制作人员方面,本文所用模型也获得了一些结果。但囿于篇幅限制(懒),我会在之后的专栏中作出介绍。

5    模型预测

经验证,该模型对未来的动画评分具有一定的预测能力。AI模型认为2022年1月开播的新作动画中,最具潜力的五部是:明日酱的水手服、Slow Loop、地球外少年少女、佐佐木与宫野和食锈末世录。



6    总结

本文以一种独特的大数据角度,来寻找动画评分的显著影响因素。这既有益于动画萌新们快速入门、寻找高水平动画,也给了动画婆罗门一种全新的视角。

数据不是万能的,尽信数据不如无数据。个人喜欢的动画 ≠ 热门动画 ≠ 评分高的动画,这篇文章不是严谨的学术论文,本质还是图一乐。本文可能会有些许错误,还请各位多多斧正233



附录

本部分将会展示一些不适合放在正文中的细节。

1    导读

新作动画:没有前作的动画,一般为一部动画的第一季。本文不考虑续作动画的原因是,新作动画和续作动画是不同质的。如果我们想预测续作动画,直接依靠前作评分,就可以取得较好的效果。

2    数据来源

对于相同意思的标签,进行人工合并。动画的标签数量繁多,我们只考虑出现次数>=5的标签。

数据集中所有动画的平均分:6.69,标准差:0.81。

3    模型建立

①    原作评分的计算方法:

如果原作是书籍,则计算方法为(原作书籍的评分-所有书籍的平均分)/ 所有书籍评分的标准差。

如果原作是游戏,则计算方法为(原作游戏的评分-所有游戏的平均分)/ 所有游戏评分的标准差。

如果没有原作,原作评分取0。

程序会自动过滤掉评分人数过少的原作。

②    导演评分的计算方法:

(导演以往作品的平均分-所有动画的平均分) / 所有动画评分的标准差。

如果导演没有以往作品,导演评分取0。

程序会自动过滤掉评分人数过少的动画。

③    编剧评分的计算方法:

(编剧以往作品的平均分-所有动画的平均分) / 所有动画评分的标准差。

如果编剧没有以往作品,编剧评分取0。

程序会自动过滤掉评分人数过少的动画。

④    逐步线性回归采用的方法:

偏F检验(显著性水平α=0.05)

4    结果展示

①    模型拟合效果:

在整个数据集上,模型的R方为0.5521,调整后的R方为0.5331。

②    变量显著性表示:

***    P值<0.001

**     P值>=0.001且P值<0.01

*       P值>=0.01且P值<0.05

5    模型预测

模型预测效果测试:

按照时间切分数据集。用对应时间以前的动画训练模型,然后预测对应时间的动画(测试集),效果如下。

①    2021年1月动画:

R方:0.124(2021年1月份有异常值)

Spearman系数:0.638

②    2021年4月动画:

R方:0.575

Spearman系数:0.730

③    2021年7月动画:

R方:0.442


全部变量的结果(每行第一个数字是系数)



本文B站专栏链接:https://www.bilibili.com/read/cv14481422
Tags: 动画
#1 - 2021-12-20 14:58
什么机器学习
#2 - 2021-12-20 17:36
(会いたい、知りたい)
文艺复兴 -0.88(bgm38)
#3 - 2021-12-21 08:10
(精彩不亮丽,起落是无常)
高分的基本都了解差不都了,反而想看看那些低分的都有啥传世名作
#4 - 2021-12-21 14:47
能不能预测下明年的大烂片都有啥
#4-1 - 2021-12-21 15:00
水澜
哦看到楼主的另一篇文章了
#5 - 2021-12-24 08:46
说句题外话,感觉明年泡泡可能会翻车。
#5-1 - 2022-3-10 11:38
kaleidoscope
泡泡目前评价确实不尽人意
#6 - 2022-3-10 11:40
(勇士经常是孤独的。勇士必须连续作战,保持胜利的战果,因 ...)
建议考虑一下或许有部分出圈作品产生的模型过拟合,好吧说的就是你成神之日
#7 - 2022-6-25 00:55
(ACG猫舌,喜欢补已经凉了的企划,不喜欢趁热。)
佐藤雄三上限很高的……(bgm38)
田中仁就尼玛近年国内讨论环境中最闷声发大财的人,好多不是他的功劳都被扣到他头上,应该多分些他的分到他合作的监督上。(