番組WIKI計画 » 讨论
能不能实现一个所有用户统一分布的评分系统？

#1 - 2022-9-11 10:21

心之刃 (？？！)

具体来说，把每个用户的所有已评分条目进行排序，再重新赋分。比如某用户一共给了5个动画评分，分别是2、3、5、7、10，那么先将分数转换成排名（标准化到[0,1]区间）：2->0.1、3->0.3、5->0.5、7->0.7、10->0.9，再将排名转换成新的分数：2->0.1->f(0.1)、3->0.3->f(0.3)、5->0.5->f(0.5)、7->0.7->f(0.7)、10->0.9->f(0.9)，其中f是一个[0,1]->[0,10]的函数（最简单的，f(x)=x*10），然后再计算每个条目的平均分。

将分数转换成排名时会遇到多个条目分数相同的问题。一个朴素的解决办法是取该分数排名的平均值。比如某用户给了10个动画评分，5个1分、5个10分，那么排名就是5个0.25，5个0.75。

这种评分系统目测可以一定程度上解决不同用户评分分布不一致的问题（有的倾向打高分，有的倾向打低分），使最终的条目分更可信，不知道技术上能不能实现？

更新：
貌似我的思路跟这个回答是一致的。我对投票理论不熟，最高赞答案推荐的Schulze method貌似需要用户对所有条目给出一个排名，可能大概不适合bgm的排名系统。

#2 - 2022-9-11 11:08

ForsakenRei (A.T.Field)

技术上可以实现，但是没有必要实现，因为这里不是LCL之海 (bgm38)

#3 - 2022-9-11 11:10

Cfox

顺便提升了小号刷分成本，看看

#4 - 2022-9-11 11:28

伪 (他人即地狱)

可以是可以，但最后的效果是不是真的可以解决不同用户评分分布不一致的问题有待商榷，比如某个用户过去打的分偏低但最近打的分偏高，比如有两个用户一个打分偏高一个打分偏低综合下来就会显示差不多的分数 (bgm38)

#4-1 - 2022-9-11 12:12

心之刃

比如有两个用户一个打分偏高一个打分偏低综合下来就会显示差不多的分数

如果用户的打分倾向和条目相关性不高，那么确实问题不大，怕的是用户的打分倾向和条目有一定的相关性，比如条目A的用户打分倾向偏高，条目B的用户打分倾向偏低，那么条目B相对条目A在评分上就有劣势了。

#4-2 - 2022-9-11 12:15

伪

心之刃说: 如果用户的打分倾向和条目相关性不高，那么确实问题不大，怕的是用户的打分倾向和条目有一定的相关性，比如条目A的用户打分倾向偏高，条目B的用户打分倾向偏低，那么条目B相对条目A在评分上就有劣势了。

你想要达成的目的过于困难了，根本不是靠一个函数就能解决的。
其实相对的解决方式就是只看自己关注的用户的评分，这个是已经实现的了。

#4-3 - 2022-9-11 12:23

心之刃

伪说: 你想要达成的目的过于困难了，根本不是靠一个函数就能解决的。
其实相对的解决方式就是只看自己关注的用户的评分，这个是已经实现的了。

我觉得这个方案就基本解决了这个问题啊，有啥漏洞吗？

#4-4 - 2022-9-11 15:59

伪

心之刃说: 我觉得这个方案就基本解决了这个问题啊，有啥漏洞吗？

我这层提到的"某个用户过去打的分偏低但最近打的分偏高"，用这个方案就属于没啥卵用的情况。你的函数的核心关键在于用户本身一直维持一个某一种偏高或者偏低的情况，这样在加权求平均之后才能算作是个相对客观的评分。

#4-5 - 2022-9-11 17:03

心之刃

伪说: 我这层提到的"某个用户过去打的分偏低但最近打的分偏高"，用这个方案就属于没啥卵用的情况。你的函数的核心关键在于用户本身一直维持一个某一种偏高或者偏低的情况，这样在加权求平均之后才能算作是个相对客观的评...

这个方案只在于解决“不同用户评分分布不一致”这个问题，不是为了一次性解决“评分不够客观”这个大问题（后者也几乎不可能解决吧）。

#4-6 - 2022-9-11 17:39

伪

心之刃说: 这个方案只在于解决“不同用户评分分布不一致”这个问题，不是为了一次性解决“评分不够客观”这个大问题（后者也几乎不可能解决吧）。

可以自己尝试下写一个bgm的插件(

#5 - 2022-9-11 12:10

徒手开根号二 (nobody cares.)

凭什么假定 “所有用户评分分布应该统一”

#5-1 - 2022-9-11 16:45

padorax

#5-2 - 2022-9-11 17:06

心之刃

不是假定，是以此为目标进行改进。分布不统一可能对一些条目不公平（见我楼上举的例子），至少我觉得统一分布没有坏处。

#6 - 2022-9-11 12:11

楓の海

不如控制刷分实在

#6-1 - 2022-9-11 12:19

心之刃

控制刷分和这个系统不矛盾的，我全都要.jpg

#7 - 2022-9-11 15:20

OH_toothache (小圣杯邀请码: whyjxz14#576501)

可以。
如果我要做我会考虑用这样的方法。比完全不处理好
不过其实还有其他算法也可以达到这个目的
[来自Bangumi for android] 获取

#8 - 2022-9-11 15:50

标签贰零零壹 (失去的永不复返世守恒而今倍还.)

可是……这个小组是管wiki的，不是管站务的啊 (bgm38)

#9 - 2022-9-11 16:09

allegray

https://bgm.tv/group/qpz
可以来这个小组

#9-1 - 2022-9-11 17:07

心之刃

帖子能迁移吗？重发一个不太好吧

#9-2 - 2022-9-11 17:14

allegray

心之刃说: 帖子能迁移吗？重发一个不太好吧

不能。其实应该也不用重发吧，我发这个只是想给你推荐个小组 (bgm38)

可以看看，还有下次可以发评分这个小组

#10 - 2022-9-11 18:40

atoz (我？)

每个人收藏（看过）的番剧不是1-10分番剧均值取样的，就算有打分标准离谱的也会随着时间数学期望回归。
重点应该放在整治刷分，推荐EM算法或神经网络 (bgm24)

计算特征。

#10-1 - 2022-9-11 18:56

心之刃

确实，这点是我疏忽了，只收藏好条目的只收藏差条目的混合起来就会出问题

#11 - 2022-9-11 18:52

Genius🌟小乖💯 (Enjoy your (real) life!)

你好！不知你是否想说cumulative distribution function?

#12 - 2022-9-11 19:30

灰风

是这样的，bgm有相当一部分人，“我的六分就是绝世神作”，这种旁人不太好理解的打分方法 (bgm38)

。

#13 - 2022-9-11 19:37

笙歌看水 (一双舞燕，万点飞花，满地斜阳。)

lz是不是数学吧15级了，5年前你回过我问题 (bgm105)

。
我觉得问题在于标准化吧，几乎没有用户打分是均值分布的，理想的整合模型比较难选（应该是个偏态分布），选出来之后直接对同分做均值化处理效果可能会不太好，但同分除此之外应该没有特别合适的办法了。
至于条目收藏的差异我倒是觉得不是问题，因为对用户没有偏见的话，肯定假设其收藏是“正常的”。

#13-1 - 2022-9-11 20:16

心之刃

其实本质上只是把用户的喜好排序提取出来，用户本身打分是什么分布并没有影响，最终的分布由f决定。

#13-2 - 2022-9-11 20:28

笙歌看水

心之刃说: 其实本质上只是把用户的喜好排序提取出来，用户本身打分是什么分布并没有影响，最终的分布由f决定。

一个意思，我是按照f=x*10说的。
如果是通过构造一个统一的f来表征的话，我觉得这个f很难构造，毕竟分差往往比rank更有参考性。

#13-3 - 2022-9-11 20:53

笙歌看水

笙歌看水说: 一个意思，我是按照f=x*10说的。
如果是通过构造一个统一的f来表征的话，我觉得这个f很难构造，毕竟分差往往比rank更有参考性。

感觉讲的不够清楚。
我没理解错的话，你的意思是用一个理想分布去重构所有用户的分布，再作平均统计（或者先统计再重构），那就绕不开“这个理想分布是什么”这一问题。
如果只是通过用户排序来做一个排序系统的话，那分布是什么就无关紧要了，不过那会损失过多的信息。

#14 - 2022-9-13 00:14

Terminal_0 (我开启了属于我的幻境，那个蝴蝶翩跹的世界，只有我的世界)

这样也不一定能更准确地概述用户总体评价。比如一个人只看/听/玩口碑好实力硬的作品并且客观给高分，那么赋分后他评分里的微小偏差对条目平均分的扰动也会很大。可能你认为的主要问题是不同种类作品的受众面不同导致给分不均一。这点按tag排序就可以了（虽然看了下bangumi的tag放权给用户了，没什么参考性）。但说到底不论用什么统计方法来判断一部作品的艺术价值都是极不负责任的做法，任何评分平台的Rank还没有一篇推荐语来得实用。自己看完评分记录一下是不错，迷信rank我无法理解。

#14-1 - 2022-9-13 04:53

Sinestra

统计学是对这问题有持续的研究的，我不太懂但听过一个报告是用贝叶斯方法给出每个base ranker的“质量水平”再得到综合的rank。我觉得数据终归是有意义的（至少能反映一些观众的看法），主要看怎么提取信息吧；至于评判艺术价值，就见仁见智了

#15 - 2022-9-13 00:49

MinalinskY☆ (努力成为真正的河豚：剧毒又带刺，充满敌意...)

这个机制会进一步加深热门作和小众作评分行为的差异。比方说，对口碑和人气皆较高的作品应该是不利的

#16 - 2022-9-13 01:54

酒神的狂欢祭 (生者悲苦，死者平安)

最近才学的L2R消除bias的各种方法，不知道有没有人用这种思路做评分排名的

#17 - 2022-9-13 03:48

宿星雨

我的建议是楼主可以细化下算法然后利用bgm的api和数据尝试去建立其一个排行榜看看实际的效果，不然纯粹对于理论的讨论是很难得出具体切实的结果的。
这其实是对我的那个长贴提出的问题的一种很好的解决方法，我很期待具体的效果。

#17-1 - 2022-9-14 19:14

心之刃

我不会编程啊（b38

#18 - 2022-9-13 11:46

永夜寒星 (信仰是为了虚幻之人)

动画之外呢？

#19 - 2022-9-13 21:47

夏日勘探者 (家に帰るまでが遠足です)

那就是说为了让打的高分被计算必须把低分作也放到时间线里去？那每天打开首页在看过里见到一堆恶心作品的精神伤害评分人来赔吗？

#20 - 2022-9-14 01:07

一年又一年

想过类似的玩法，可惜没有统计学背景知识不知科学性和有效性如何。

#21 - 2022-9-14 20:03

清清清 (请尽情向我发☆射好友申请!)

但是哥们你举的例子错了啊 (bgm38)

应该是2->0 3->0.25 5->0.5 7->0.75 10->10
另外感觉作品冷热程度对分数也有影响吧？
热门作品会被更多的少标记量用户标记评分，也更容易获得较极端的分数？我不懂统计学

/ 返回番組WIKI計画小组

番組WIKI計画 » 讨论能不能实现一个所有用户统一分布的评分系统？

番組WIKI計画 » 讨论
能不能实现一个所有用户统一分布的评分系统？