#1 - 2020-7-26 04:06
nickname
论证如下:
若一个评分体系足够好,那么使用该评分系统来追番的人,会对大部分看完的番剧给出8分及以上的评价(数字由你定),换言之,大多数情况下,根据该评分系统而补番,不会失望。若网站主体用户全部根据该评分系统来选择作品,那么必然导致整个网站作品的评分上涨。而这个系统的推荐精度越高,作品间的分数就越小。当差距足够小,以至神作满天飞,系统无法依照评分来区分作品的优劣,自然也无法排名,体系崩溃。所以,如果真的有一个完美的评分系统,它要么属于少数用户,要么崩塌。
更新:
因为不想陷入过多技术性的细节,原论证为草稿。下面完善逻辑,顺带解释很多未加澄清的名词:
注1:第一句话是“好的评分系统”在该证明中的定义。进一步可以这样定义:对网站中任一用户,若其阅读基于该评分体系的作品排行榜,并挑选高于x分的作品进行观看或阅读,之后,另该用户给出作品评分,若有y%的概率,给出高于z的分数,那么,我们称这个评分系统为“好的评分系统”。这里x,y,z可以依照你的想法任取,不是论证重点。
注2:可以构造一个衡量评分体系多好的函数,这个函数f(y,z)只要正相关于yz即可,随意构造,非论证重点。
注3:关于“推荐精度”,其实只是用来衡量一个推荐系统有多好而编造的词。可以理解为注2中的f(y,z)函数。要义是,值越高,用户踩坑触雷越少,失望越少。
注4:“完美的评分系统”在原文中意思是用户根据该评分享用作品,享用后100%对所有作品给出10分。
注5【重点】:证明中对全用户做理想化假设,忽略所有心理社会因素(如跟风),从而论证心理社会因素厨黑大战,评分警察的必要性。
#2 - 2020-7-26 10:36
(已淡出bgm38)
(1)一个评分体系足够好,便能够有效区分优劣作品,但你不能认为大部分人都只看高分作,这是不符合现实的,实际上看得越多,各分段的作品的涉猎也会越均匀。如果你指的“忠实的评分信徒”是只根据评分系统给出的高分作补番的,那么他们并不是理想的评分用户,也不是“忠实的评分信徒”,“忠实的评分信徒”不仅应该看高分作印证自己的期望,也应该从低分作补充印证自己的判断。

(2)事实上,大部分人并不是根据评分来选择作品,而是从自己的喜好出发,或者看作品的热度来选择作品,所以“主体用户全部根据该评分系统来选择作品”的假设是不成立的

(3)评分系统的评分分布取决于初期状态、分制和评分群体,初期状态失衡就会诱导后面的人评分畸形,分制会影响评分的均值,评分群体的习惯会影响评分的区分度,虽然我们很难定义一个完美的评分系统是什么样的,但一个属于少数用户的评分系统肯定不是完美的。
#2-1 - 2020-7-26 16:40
nickname
(1)(2)我认为大部分人不只看高分作的原因之一是因为他们不相信当前的评分体系,而遵循自己的一套体系。而遵循自己体系的原因有很多因素,可以是羊群效应,光环效应等社会心理因素,这个三楼也有提到,但为何“自己的体系优于网站评分体系”这个偏好能够得以维系,个人认为是学习行为。这里是问题的关键。也就是说,比起根据评分补番,根据自己的准绳,带来的"快乐"更多。用户尝试了各种评价标准后,发现信自己最好。那么也就是说,基于该评分体系的推荐不够好。为什么该评分体系不够好,因为一旦足够好,就会崩塌,这正是我正文中所要论证的。
(3)对于这种社会心理因素建模,感觉会比较繁琐,所以我刻意回避了。原文要说的一个意思是,全员理性+完美系统不可共存。
#3 - 2020-7-26 10:54
(开摆)
表面上感觉挺对但lz大概假定了每位观众都是绝对的理性人(bgm38)事实上感觉大部分观众还是靠名气和口碑来追番的(bgm38)而且别忘了还有没放完的片,万一开头惊艳骗进来杀后期喂屎怎么办?总之可能高分段区分会小,但三六九等还是能分出来的(bgm38)
#4 - 2020-7-26 12:05
(生气了吗? 才,才没有呢!)
为啥大部分看完就会8分以上 看完了也会打67分呀
#4-1 - 2020-7-26 15:10
nickname
原文的意思用户基于该评分系统的推荐补番大概率不会失望。看完确实可能打67分,但大概率会打8分以上。系统会将最可能让大多数用户满意的作品置于榜首
#5 - 2020-7-26 12:12
(一双舞燕,万点飞花,满地斜阳。)
若一个评分体系足够好
未定义好;
那么使用该评分系统来追番的人,会对大部分看完的番剧给出8分及以上的评价(数字由你定),换言之,大多数情况下,根据该评分系统而补番,不会失望。
参见2l的(1)(2),我没有什么要特别补充的;
若网站主体用户全部根据该评分系统来选择作品,那么必然导致整个网站作品的评分上涨。
逻辑错误,假设存在笃信某个评分系统的x,那么x的认识也只是诸如“评分8.5的作品比评分8的作品更会令自己满意”,并不能推出x会给作品大于等于原有的评分。进一步说,甚至都无法对x本体的评分基准做出判断。
而这个系统的推荐精度越高,作品间的分数就越小。
???今日迷惑
精度越高不就是衡量的尺度越细吗?如7.2和7.5变成了7.22和7.51,这是怎么变成“越小”的?
而且这句和上句也有着逻辑断层,我脑补了下,lz想说的可能是这样的:
“因为分数会一直呈上涨趋势,而评分又有着上界,所以在迈向10分的过程中,涨幅会越来越小,结果就是越来越多的9.9+,评分差距自然越来越小。”
拿b站当现例吗?
当差距足够小,以至神作满天飞,系统无法依照评分来区分作品的优劣,自然也无法排名,体系崩溃。
因为前一句论证已全是错,这大概也没有继续纠正的必要了。补充一点吧,不是要把集合变成一个全序集,才是一个“完美的评分体系”。
泰坦尼克号和楚门的世界哪个更好?
美国往事和美丽心灵呢?
在很多尺度下,彼此并没有分出高下的必要。知道这几个电影都nb得不行,去看就对了。
故一个不能穷尽排名的体系,未必不是一个“好”的体系。
#5-1 - 2020-7-26 14:00
Cedar
你说得对 不是只有全序集合才完美
#5-2 - 2020-7-26 15:04
nickname
已更新,欢迎讨论
#6 - 2020-7-26 12:39
看不懂。。
#7 - 2020-7-26 13:15
理论上是这样,但是“使用该评分系统来追番”这个前提无法实现
#8 - 2020-7-26 15:15
(Anime is a gag, and so are its dilettantes.)
确实是这么回事。精度越高,兼容性就越少,当精度达到极限,实际上就是兼容性几乎全无。这种情况下,等价于评分体系完全就是单个人的评分准则,能从评分中获得的新的信息量为0,体系对于个人来说不在具有任何的参考价值,也就是所谓的体系崩坏了。
#9 - 2020-7-26 16:13
压缩映射?(bgm38)
#9-1 - 2020-7-26 16:25
nickname
并不是(bgm38)赶紧翻了下泛函笔记
原文跳过了很多细节,因为证明gap补不上,没有涉及很多数学。
#9-2 - 2020-12-22 11:06
dhzy
nickname 说: 并不是赶紧翻了下泛函笔记
原文跳过了很多细节,因为证明gap补不上,没有涉及很多数学。
根据该评分系统而补番,不会失望
那从期望到现实的评分映射就是一个压缩映射了
#10 - 2020-12-22 11:13
(BGMのTrinitas<=>婊冈妈<=>补冈妈<=>拜冈妈 三位一体 ...)
根据冈妈补番的路过 评分都是浮云
#11 - 2020-12-22 15:56
(Traduttore traditore)
精度越高分数差距越小是什么……
不是更具有区分性才对吗
#12 - 2020-12-23 00:15
(休息一下,吃點炸雞漢堡吧)
忠實的評分體系的目的是相對真實地反應這個社區的審美水平和傾向,和啥崩潰沒啥關係,重點是「真實可靠」。

然後其他假設也充滿槽點,我就不說了。