2020-4-17 12:21 /
用bangumi这个网站也有段时间了,每隔一段时间就能看到因为“评分”盖起来的大楼。评分警察,评分警察警察层出不穷。最近整理了一下思路,详细探讨一下bgm及类似网站的一些“评分”。
首先这里引入一个概念“绝对客观评分”,顾名思义,指的就是抛开一切主观因素(如情怀加成,年代加成,主观上的喜好加减,这里指真正“绝对”客观的素质分数)。
我们知道,在统计学中,data数量越少,越容易受到极端数值的影响,而data数量越多,就越容易接近真实水平。对于data数量少的条目,其评分的参考性往往会被认为较低。尤其反应在bangumi的黄油条目里,一些冷门的只有个位数或者数十个data的黄油评分可能会较高。原因一是data数少受极值影响,二来嘛,既然都是冷门作了,那本来知名度就不行,来玩这类作品的不是厨子,至少也是对这类作品有一个事先的了解在里面,容易打出较高/较低(达不到预期)的分数,“客观”的评分部分要大打折扣。反过来,按理来说,一个条目的评分人数越多,其真实水平就应该越接近“绝对客观评分”。然而事实是这样的吗?我想未必。因为在这类评分网站上往往还有另一个群体——厨团。
举个例子,枕社的《美好的每一天》(素晴日),这部作品本体在bgm的评分是8.9分,排名游戏类第7,data数为2582(截止2020.4.17),然而这部作品在18年发行的HD版本,评分却为9.3分,游戏区排名第二,data数为386(目前已被锁定)。可是这部游戏的HD版本只升级了画质,追加了大概1-2个小时的游戏内容和补充了部分语音,这些差距能造成0.4分的差距吗?我想不应该。那这个差距是怎么造成的?厨团。对于厨团来说,喜欢的游戏自然要打10分,这个没什么问题。但是问题出在,对于这类游戏,并没有足够多的路人来冲淡“厨团”的极端数值。或者说,去专门给HD打分的,厨团比例肯定会偏高。例如动画类作品,给第二季打分的大概率是看过第一季的,不看第一季却去看第二季的人只能说相当少。那么第二季的评分准确度是否就有待商榷呢?厨团带来的影响是极端数值的偏差。一个作品的评分分布应该是接近于某个分布曲线(如正态分布,偏态分布),其平均分数在data数量足够多的情况下应该接近于先前提到的“绝对客观分数”。但是在厨团群体加入后,这个分布曲线必然会受到高分影响。能平衡厨团的只有另一个群体——黑粉,那些给作品刷低分的人。但是在bgm,无脑给作品打10分的人没有问题,但是无脑刷1分的却会被所有人唾弃。这样一来,一部作品的分数高低是否就取决于作品厨团数量的多少呢?举个例子,bangdream第二季开播的时候曾经一度冲到8分,现在逐渐回落(动画下面现在依然有相关讨论帖)。但是另一个问题是,如果纵容刷1分的人,那就会造成厨团大战,变成厨黑两边互相比人数,那样甚至会失去了评分本身的意义。
不过话说回来,“评分”到底有什么意义呢,是给作品排一个高低?还是给路人一个作品水平的大致参考?还是在欣赏完作品以后留一个自己的印记?我想每个人都有自己的看法吧。至于这个评分社区到底该怎么发展,我想也应该是由社区里所有用户的想法所决定的。
Tags: 动画 游戏
#1 - 2020-4-17 12:24
(家に帰るまでが遠足です)
若是要定义绝对客观,那就不得不列出客观因素的集合。
然而列出集合这一行为本身就已经是主观了。
#1-1 - 2020-4-17 12:33
南魔法翁头
绝对客观当然不存在,这里指的仅仅是一个概念,或者说“真实分数”,取决于一个评分网站所有用户认为的“客观评分”的集合所产生的分数。
#2 - 2020-4-17 12:36
赞同lz开头的观点。我本人只给素晴日打了7分,因为我看不懂哲学部分,感觉后三章的妹控展开也着实无聊。但是我并不会去给hd打分,因为我没玩过。
至于想从评分获得什么。首先是寻找更高质量的作品,其次是寻找同好吧,再者就是发泄个人情绪。在bgm可以很舒服的“暴言”,而不用担心被厨子轮。
#3 - 2020-4-17 13:33
#4 - 2020-4-17 14:29
(备忘)
以前挺喜欢评的,有点留下印记的意思,给自己看过的番排个名,不过后期二刷三刷乃至五刷,每次观感都有可能变化,索性就不评分了,自己打自己脸没意思
#5 - 2020-4-17 15:03
评分并不决定一部作品的质量,换个词好一点吧,不用纠结主观客观,“推荐度”
#5-1 - 2020-4-17 17:31
南魔法翁头
“推荐度”这个词是不错的,我很喜欢。
#6 - 2020-4-17 15:24
(愿意给我5分钟的编辑时间吗?)
就我所知,刷10分和刷1分在bangumi算是一样被讨厌的吧,而且刷10分和刷1分的人其实很多情况会是同一种人(当然也有纯爱好者/hater活儿只做了一半)。
#6-1 - 2020-4-17 17:33
南魔法翁头
怎么说呢,人们对于低分和高分的容忍度是不一样的。比如一个作品均分8分,这个时候你给1分,很容易就会引来各种口伐笔诛,但是你给10分并声称“我很喜欢这部作品所以给了10分”往往不会产生什么问题。至于开小号刷分的不管刷多少分都应该是被讨厌的对象。
#6-2 - 2020-4-17 18:19
小T
南魔法翁头 说: 怎么说呢,人们对于低分和高分的容忍度是不一样的。比如一个作品均分8分,这个时候你给1分,很容易就会引来各种口伐笔诛,但是你给10分并声称“我很喜欢这部作品所以给了10分”往往不会产生什么问题。至于开小...
那你要这样说,刷一分的效率比刷十分高,相应代价更高所以得到更多的反感也行吧b38 这要是个均分6分的作品刷上下限分更接近一样安全也一样危险233
#6-3 - 2020-4-17 18:32
南魔法翁头
小T 说: 那你要这样说,刷一分的效率比刷十分高,相应代价更高所以得到更多的反感也行吧b38 这要是个均分6分的作品刷上下限分更接近一样安全也一样危险233
这样就回到了我上面文章说的问题,如果纵容厨黑群体大战,结果就会变成厨黑比人数,那边人数多分数就会往那边偏,这样就偏离了评分本身的意义,变成类似萌战一样的东西了。
#6-4 - 2020-4-17 18:55
小T
南魔法翁头 说: 这样就回到了我上面文章说的问题,如果纵容厨黑群体大战,结果就会变成厨黑比人数,那边人数多分数就会往那边偏,这样就偏离了评分本身的意义,变成类似萌战一样的东西了。
这站没那么多人想把自己的号这样玩吧......感觉你多虑了。至于一击脱离的那种为了增加影响力常常就被ban掉了

一个用户偶一为之的参与那影响力更可以被评分数cover住了,rank榜也都有个最小评分量。
#7 - 2020-4-17 16:19
有腦黑的大多是扭曲的廚,廚和黑是可以相互轉換的
#8 - 2020-4-17 17:25
(もどかしい世界の上で 君と一緒に...)
其实1分的data数在所有data中的比重也可以拿来参考。如果一个黄油分数比较高但同时1分的比重也很高(一般认为1%就很高了),那路人对这种作品应该小心。因为这种作品要么带有强烈的作者个人风格,要么优点缺点都十分突出,要么存在喂屎,这些都是很容易劝退路人的。举个例子,素晴日、樱之诗这两部的1分率都在1%高一点,而这两部中确实存在大量会引起路人反感的元素,muv更是达到了1.2%。而像秽翼、eden、水仙这样分数高而1分率极低的作品更加适合大多数人。
#8-1 - 2020-4-17 17:32
南魔法翁头
确实有不少参考价值,但是我之前说到的“厨团刷票”这种现象对1分很可能会产生影响,不过具体我就不太清楚了。
#8-2 - 2020-4-17 17:50
飞鸟
南魔法翁头 说: 确实有不少参考价值,但是我之前说到的“厨团刷票”这种现象对1分很可能会产生影响,不过具体我就不太清楚了。
其实能够引起“厨黑大战”的作品基本上都是些“邪道”作品,多少存在电波属性。在bgm10分制的评分机制下,作品凭借本身素质拿到1分是不太可能的。打1分的应该都是由于某些作品厨们吹的太过,然后自己慕名接触了之后不对电波被劝退的。由于这一落差感和紧接着而来的对无脑厨的厌恶,1分就出来了。当然也不排除有一小部分自己喜欢就打10分,不喜欢就打1分的人存在。
#9 - 2020-4-17 19:16
(当你长大,会成为绝望者、失败者与被诅咒者的拯救者吗? ...)
我倒是觉得bangumi的评分标准本来就会容易极端1或10。
推荐度这个东西完全是主观的,有人喜欢食雪,还会到处叫卖,这种行为好像也没有什么不对;有些人吃着山珍海味也挑三拣四,吃到一半就扔下水道加以大骂,好像也没有什么不对。
如果真的要让评分反映作品,怎么着也得细分出多项,例如作品的情节,音乐,演出,作画,声优,创新度,价值取向等等;而且其中有些是得分制,有些得用是否制——但即便如此想要有成熟而较为全面的评分体系也是非常非常困难的,同时也缺乏所谓的自由度与尊重性。
bangumi有几个比较著名的gal评主都有自己的综合给分体系,在单一评主文章之间横向比较能很快区分出作品的综合水准;但即便如此在各个评主之间横向比较就完全失去意义,因为标准和加权都各有不同。
本身体系都缺乏科学性和统计学效率的打分就算认真了也只是给自己找罪受,问题就是能不能看到这一点而已。
如果有好事者调查统计一下评分警察的受教育程度和年龄,或许就能揭露出评分出警的本质了。
另外,强烈建议管理组增加手动置顶挂城墙功能。
#10 - 2020-4-18 07:35
(Let's all love lain.)
说千道万也改变不了对没看过的作品打1分的举动是脑瘫。
至于冷门加成,续作加成这些因为统计人群不均匀造成的误差我想懂得都懂,脑内修正一下就行了。
#10-1 - 2020-4-18 07:36
AkiriMua
那种做出“因为你给我了喜欢的作品低分,我就要把你打高分的作品全部给一分”的幼稚园行为的人,我刚创号不到一个月就碰上两个。
#11 - 2020-4-21 22:32
(。)
评分存在就是为了评判一部作品的优劣(不予反驳)
很多人有评分的权利但是没有评分的能力,
绝大多数的普通受众的艺术鉴赏水平和平衡个方面因素对作品本身造成影响大小的能力都是毋庸置疑的  完  全  不  达  标
所以大部分的非官方的大众评分网站往往都是五分制,
(我本人更倾向相信于有能力的官方网站的评分而不是大众评分网站的评分)
大部分的人还是水平有限的(无论是能力还是素质)
以至于太过自自负,而导致评分这项权利的滥用,
我只能说这是非常不负责的,
但是我什么也改变不了。