#1 - 2021-12-23 00:25
CrazyScientist
一般来说我们通过使用统计这个手段来获得某个值,是要求每个样本具有相同的含义,这样经过统计平均得出的数字才有明确的意义。
但是动画评分不一样,每个人在打分时对这个分数的理解是不一样的,有人觉得星越多代表作品越好,也不排除有人觉得星越少越好,有人按心情给分,也有人按照自己定的某个标准给,也有人随手打的一个分数。即使对这个分数的理解相同,打分标准也是不相同的。例如可以把作品分解为作画、演出、分镜、剧情等分别给分再做加权平均,但是每个人的加权值也是不一样的。
那么把这些意义不明的样本平均后得到的数字到底代表了什么?通过这个数字的大小比较获得的排序有代表了什么?
但是动画评分不一样,每个人在打分时对这个分数的理解是不一样的,有人觉得星越多代表作品越好,也不排除有人觉得星越少越好,有人按心情给分,也有人按照自己定的某个标准给,也有人随手打的一个分数。即使对这个分数的理解相同,打分标准也是不相同的。例如可以把作品分解为作画、演出、分镜、剧情等分别给分再做加权平均,但是每个人的加权值也是不一样的。
那么把这些意义不明的样本平均后得到的数字到底代表了什么?通过这个数字的大小比较获得的排序有代表了什么?
说白了,你面对bgm的评分的期待是这个评分能告诉你片子好不好看,然后你说标准不同没有意义;但是同样的期待,你放到数学考试上,他是能告诉你数学学得怎么样还是考试状态怎么样?也许有人根本没认真做,也许有人觉得小考无所谓80%的时间在想附加题……你看,不一样,没有意义。你的考试评分标准只是停留在考试这一层面的标准,而学生到成绩这个黑箱的过程依旧和bgm用户到打分的黑箱过程完全一致。考试这个类比确实逻辑比较绕,再尝试解释一下:你觉得bgm我的9分和你的9分不一样,但其实我们说疼痛1-9级时我的3级也和你的3级不一样,数学考试我的90和你的90也不一样,我的是挑战自我放空了别的题只钻研附加题的90,他是100%正确率三遍检查会的都对的90,他是漫不经心只做一遍提前交卷考完放假的90……所以说,按你这个定义,任何平均都没有意义,那么是不是……言尽于此了,不明白可以再看一遍