评分与排名讨论会 » 讨论
动画评分在统计学上真的有意义吗？

#1 - 2021-12-23 00:25

CrazyScientist

一般来说我们通过使用统计这个手段来获得某个值，是要求每个样本具有相同的含义，这样经过统计平均得出的数字才有明确的意义。

但是动画评分不一样，每个人在打分时对这个分数的理解是不一样的，有人觉得星越多代表作品越好，也不排除有人觉得星越少越好，有人按心情给分，也有人按照自己定的某个标准给，也有人随手打的一个分数。即使对这个分数的理解相同，打分标准也是不相同的。例如可以把作品分解为作画、演出、分镜、剧情等分别给分再做加权平均，但是每个人的加权值也是不一样的。

那么把这些意义不明的样本平均后得到的数字到底代表了什么？通过这个数字的大小比较获得的排序有代表了什么？

#2 - 2021-12-23 00:33

飛龍 🇺🇸🇯🇵🇹🇼🇺🇦 (让我们远离冰冷的房间，亲自推动历史的进程。 ...)

这就跟社交网络把人们的自由表达统一简化为了【点赞】【关注】【投币】这些傻逼按钮一样。
其实分数背后每个人都有自己不同的意见观点和解释，所以我向来主张不要过于关注分数高低，它只是一种参考，更何况它的参考价值越来越不能反映作品的优劣，只能反映观众的好恶。因此我更倾向于鼓励各位去写影评，去对抗社交网络对人们自由意志的统一规范。读和写这个过程可以更好地整理思绪，重新审视自己和他人的观点。而不是跟神经病一样在那刷分。

#2-1 - 2021-12-23 01:15

punk🐷🐻

＋1

#2-2 - 2021-12-23 02:04

三尖酸努努

有理

#2-3 - 2021-12-23 02:14

クロネコさん

#2-4 - 2021-12-23 09:08

谎雨

有道理，赞同

#2-5 - 2021-12-23 10:47

超级葵花鹦鹉

确实是的

#2-6 - 2021-12-23 12:47

瓶子大家族

#2-7 - 2021-12-23 17:58

ЕΜΛR

#2-8 - 2021-12-23 18:34

Uaoko

#2-9 - 2021-12-30 03:28

zod

令人怀念的互联网古老风气

#2-10 - 2021-12-30 12:47

‭

删除了回复

#2-11 - 2022-2-2 12:56

🐧

#3 - 2021-12-23 00:53

红炉点雪 (此账号已停用)

没有，多加点志同道合的好友看评语才是正路

#4 - 2021-12-23 01:03

蜜汁微笑

加速到点赞率异化，点赞率点击率反过来决定一切

#5 - 2021-12-23 01:21

Cedar (｡´-д-)

至少你可以根据评分知道不同动画在每个人心目中的大致顺位，而打分足够多就可以默认他们的规则能相互制约，做个归一化统一一下分值就能找到意义。

#6 - 2021-12-23 02:17

クロネコさん

不存在刷分、平衡党的情况下，评分还是有意义的，能表示一个群体对某部动画的推荐程度，对于不了解此圈子的人而言，通过评分可以快速了解该群体的审美、癖好，加速融入该群体的速度。

#7 - 2021-12-23 02:52

气相 (就算对话双方很正常，也可能遇到nc小鬼和nc审核 ... ...)

分数对于作品本身没有多少实际意义，因为大多数观众并不具备专业知识，主要还是反映观众的取向，但因为作品某些点其实是和某群观众达成共识和共情、延伸的部分，所以观众取向其实也是作品质量的参考之一。（比如某些片虽然看不懂，但是觉得很牛逼；亦或是风评很懒，但某些特点却很吸引人。）分析用户的取向数据，商业走向的选择

而在观众角度，因为有节奏大师和刷分的存在，所以一般来说分低的不一定差，分高的肯定不错，随着高质新作的出现会有一定变化。
当然也不排除某些不按套路出牌的怀疑主义打击高分区。
总而言之，观众看番玩游戏的出发点是为了欣赏游乐，寻找兴趣。而不是评论家，因为那意味着需要钻研更多的专业知识和制作经验为底蕴。

#8 - 2021-12-23 05:56

第四人称

按你第一段的定义几乎所有用做比较的平均值都没有意义，简单举个例子：

新番完结后，bangumi计算了一下各番的平均分，并进行了排名。
期末考试后，年级组计算了一下各班数学成绩平均分，并进行了排名。

每个人在打分时对这个分数的理解是不一样的……有人按心情给分，也有人按照自己定的某个标准给，也有人随手打的一个分数。
每个学生对待分数的理解是不一样的，有人认为60分万岁，有人89分挨巴掌。所以有人对考试很认真，也有人对考试非常散漫，甚至考场上睡大觉。

即使对这个分数的理解相同，打分标准也是不相同的。
即使学生对待分数的理解相同，最终分数也会受很多因素的影响，比如任课老师讲课的侧重点和考试的重点重合度高不高，任课老师布置作业量的大小甚至阅卷老师对字体潦草的接受程度……

如果认为bangumi的评分是某种意义不明的数字，那这个班级排名也是意义不明的排名。

事实上所有主要根据平均来进行统计的数字深究起来被平均的个体或多或少都会存在差异，君不见我和科比合砍83分，原神龙约共送332抽，我和马云一起平均收入。平均并不可靠，不然也不需要发明那么多假设检验的统计学工具了。而单独的数字解释起来都很费劲，更遑论排名。不说平均，哪怕把一个人拎出来让他说敢不敢保证自己任何一个给7.5分的作品一定比任何一个给7分的作品好，恐怕敢保证的都没多少。

那么为什么通常语境里我们会对bangumi评分的莫名其妙感到不解，但却不会对班级平均分感到不解，这也是有原因的：因为我们对bangumi评分有一种期待的投射，会有人认为它一定代表了什么，相反，班级平均分，关我鸟事，我上没上90最重要，谁管我们班平均分89还是91啊。

说会话题，bgm评分意味着什么，bgm评分作为每个用户评分的平均，他就意味且仅意味着“bgm用户打分的平均”，你可以尝试从里面分析出社区的属性或者作品的优劣，但说到底他就只是一个打分的平均数，或者说“bgm社区整体的打分”。

至于刷分党和平衡党，其实也是有意义的。就说平衡党吧，如果我们把打分当成单次博弈，平衡党作为二次博弈确实是会让打分结果出现偏差的，但是，打分从来不是单次博弈，当一个用户看到一个作品bgm评分很高或者现在话题度很高然后去看作品，哪怕不从平衡党的角度来看，他也已经受到其他打分者的影响了。所以平衡党和非平衡党事实上看差别不大。

刷分党也是同理。再说一次，平均分就在那里，不来不去，你作为社区的一份子你选择了刷分，那么事实上这个社区就是有人刷分的社区，评分原原本本不偏不倚的体现了这件事情。你看B站神作分界线是9.9，这也是一个能反映社区风貌的评分不是吗？

总结一下，评分就在那里，不来不去，不偏不倚，他永远能也永远只能代表他自己：平均分。

#8-1 - 2021-12-23 12:30

Michen

#8-2 - 2021-12-25 09:43

CrazyScientist

不是的，考试给分是有制定确定的标准的，尤其是大型考试，这样就可以确保大多数老师是按照这个标准给分，部分老师对标准的理解不同或者看错等因素导致的结果偏差可看作随机误差，只要这个随机误差足够小对结果的影响就不大。但是动画评分是没有一个官方标准的，因此结果甚至没有误差可言，这就导致任何在这个基础上进行的进一步统计处理和分析都是没有站得住脚的理论依据

#8-3 - 2021-12-25 10:27

第四人称

CrazyScientist 说: 不是的，考试给分是有制定确定的标准的，尤其是大型考试，这样就可以确保大多数老师是按照这个标准给分，部分老师对标准的理解不同或者看错等因素导致的结果偏差可看作随机误差，只要这个随机误差足够小对结果的影响...

再仔细看看我前面类比bgm评分标准时考试的那项是什么？

说白了，你面对bgm的评分的期待是这个评分能告诉你片子好不好看，然后你说标准不同没有意义；但是同样的期待，你放到数学考试上，他是能告诉你数学学得怎么样还是考试状态怎么样？也许有人根本没认真做，也许有人觉得小考无所谓80%的时间在想附加题……你看，不一样，没有意义。你的考试评分标准只是停留在考试这一层面的标准，而学生到成绩这个黑箱的过程依旧和bgm用户到打分的黑箱过程完全一致。考试这个类比确实逻辑比较绕，再尝试解释一下：你觉得bgm我的9分和你的9分不一样，但其实我们说疼痛1-9级时我的3级也和你的3级不一样，数学考试我的90和你的90也不一样，我的是挑战自我放空了别的题只钻研附加题的90，他是100%正确率三遍检查会的都对的90，他是漫不经心只做一遍提前交卷考完放假的90……所以说，按你这个定义，任何平均都没有意义，那么是不是……言尽于此了，不明白可以再看一遍

#8-4 - 2021-12-25 11:31

CrazyScientist

第四吟游说: 再仔细看看我前面类比bgm评分标准时考试的那项是什么？

说白了，你面对bgm的评分的期待是这个评分能告诉你片子好不好看，然后你说标准不同没有意义；但是同样的期待，你放到数学考试上，他是能告诉你数学学...

学生的对考试分数的理解并不重要，事实上评分评的是这份试卷答案的水平，而这份试卷答案的水平到底能不能反应学生的水平就是另一个问题了。

#8-5 - 2021-12-26 01:36

第四人称

CrazyScientist 说: 学生的对考试分数的理解并不重要，事实上评分评的是这份试卷答案的水平，而这份试卷答案的水平到底能不能反应学生的水平就是另一个问题了。

所以不能反映学生水平的一堆答案的水平的平均按你主楼的讲法有啥意义呢？如果你觉得考试评分反应的是【该试卷的答案】和【标准答案】的匹配程度，只是标准答案是固定的，那我可以告诉你bgm打分反应的是【个人审美框架】和【指定作品】的匹配程度，后者也是固定的，前者也是从个人出发的。依旧是可以高度类比的，事实上动画评分和其他任何评分性质都是完全一样的，只是程度上有差别，你换一万种角度也都是可以类比上的

#9 - 2021-12-23 09:16

T酱 (T酱终末旅行)

你对统计学的理解和我很不一样啊，统计学致力于从数据中理解并发现其蕴含的信息，因为说到底它是个帮助我们理解世界的工具，帮我们把我们不擅长的冰冷的数据处理翻译成人话，而评判某种数据有无“意义”不是统计学的工作，是人类的工作，正如你用它做为否定可能你不喜欢的东西的理由，我觉得对统计学不是好事。

你说的问题确实存在，但为解决你的问题，我觉得你也要思考几个问题：你是否预设了想获得的结果的意义，那到底是什么？为了达到你想要的结果的意义，改进统计方法和数据采集方法是否可行？

你头像是人类小姐吗？

#10 - 2021-12-23 09:31

rock1995 (人生五十年如梦亦如幻有生斯有死壮士何所憾 ... ...)

每个人的身体状况不一样，同样的血压有些人能头痛到动不了，有些人还能上蹿下跳的，那统计医学还有意义吗？

#11 - 2021-12-23 10:42

夢回环℃ (『一言以蔽之，就是「爱」！』)

你说什么不行，非要说统计学，那当然有。

#11-1 - 2021-12-25 09:47

烈之斩

#12 - 2021-12-23 12:09

absurd (休息一下，吃點炸雞漢堡吧)

參考，參考，第一名和第四千名的區別，傻子也能看出來了吧 (bgm38)

#13 - 2021-12-23 12:33

uks (往事如烟随风飘远)

怎么会没有呢。
高分反映多数观众的审美偏好，即所谓流行趋势；低分可以用来扫雷，节约补番时间。

#14 - 2021-12-23 12:41

潮汐听雨 (少年听雨歌楼上，红烛昏罗帐。)

这种问题不需要去想本质，评分高低跟作品优劣有相关性吗？如果有，那他不就有意义吗？起码绝大多数人是会承认有相关性的。
就像你会问PMI指数是从哪找的一群傻逼，这么主观判断凭什么反映未来趋势吗？

#15 - 2021-12-23 17:51

夷蹴而就 (当你长大，会成为绝望者、失败者与被诅咒者的拯救者吗？ ...)

高考作文分数有意义吗（

#16 - 2021-12-23 18:01

秘则为花 (必须保卫战争)

一般来说我们通过使用统计这个手段来获得某个值，是要求每个样本具有相同的含义，这样经过统计平均得出的数字才有明确的意义。

没有的事，李克特量表从1分到5分，所有人的理解都是一样的吗，我的1分的疼痛和你的1分的疼痛是一样的吗，我的1分的疼痛就一定不如你的2分的疼痛疼？那医学心理学统计有意义吗？

大家在讨论动画的特殊性之前，还是先要了解一下统计方法的普适性 (bgm39)

#17 - 2021-12-24 09:17

narcissus

只是统计学意义不严格而已，比如排名无效，分数之间不能高低对比啊，但是怎么会没有统计学意义呢。

我好几年看番都是翻阅的当季bgm评分，看看有没有自己漏掉的番剧，感觉是很有效果的。基本上一个番剧大概是什么档次根据类型简介我看了分数就有可预期的结果了。

#18 - 2021-12-25 10:14

yuusiki (挽尊)

不如问：统计学对个人判断有意义吗

#19 - 2021-12-26 01:41

黑猫 (感情枯竭中)

动画评分在统计学上真的有意义吗？

#20 - 2021-12-30 12:17

彼方盛夏 (有裤袜就)

我只能说没有意义，

#21 - 2021-12-30 12:58

Satanial (越看越二，越二越看)

mal上高达铁血第二季评分8.23，是GTO
以外的系列最高 (bgm24)

所以意义就在于判别真正的nt了

#21-1 - 2021-12-30 13:00

invisible

惊了，冈妈大胜利

/ 返回评分与排名讨论会小组

评分与排名讨论会 » 讨论动画评分在统计学上真的有意义吗？

评分与排名讨论会 » 讨论
动画评分在统计学上真的有意义吗？