2022-9-1 23:36 /
起因:关于bgm评分机制以及近期リコリス・リコイル大规模评分争议的探讨(长文预警) @宿星雨
这里只是数据的展示,没有分析和结论。

我获得了截止2022-8-31晚上,莉可莉丝、辉夜三、终物语和蜂蜜与四叶草四部作品的评分以及给分用户的标记数量。评分莉可莉丝之统计了“在看”用户的评分,有一部分隐藏评分用户的数据获取不到。后三部的评分是统计了‘看过“用户。用户标记数量来源是用户公开的“看过”条目数量,通过sai老板开源的api获取的。


莉可莉丝和辉夜三算是最近一段时间条目条论霸榜的两部作品,另外两部是现在评分接近的两部冷一点的动画私货
下面是数据的可视化展示
四部作品的用户分布:

上图的数据表格


四部作品不同标记数量用户的分数统计

上图的折线图版本

其实能看出来,标记数量越多的用户,均分明显是降低的,四部都一样。


删掉能确定用户id的原始数据
蜂蜜与四叶草
辉夜三
莉可莉丝
终物语
#1 - 2022-9-1 23:52
其实你如果去调所有动画的分数,基本都是这样,新注册用户整体会比老注册用户打分高。就我有印象的近几年里,老动画大多有0.1-0.2的涨幅。当然,新动画肯定会吃到一些红利,但是随着时间推移分数会越发趋近于客观值。

这个时间大概在一年左右——比如赛马娘2,同样是大热+高口碑动画,一年后看趋势基本就稳定在8.47左右,除非有大量刷低分的小号涌入,否则应该是掉不出去了。
#1-1 - 2023-1-7 19:19
渡桥泰水
评分本来就是用户对于动画的主观反应,总体评分说白了也就是一个群体对于动画的整体主观反应,“客观值”这种东西是不存在的。
#2 - 2022-9-2 00:47
让我评价的话就是名侦探柯南,比如赤井秀一和安室透。区别就是一个卖给白河豚一个卖给腐女。其实带入柯南和腹部或者柯南和怪盗基德也一样。柯南剧场版虽然评分不咋地卖得也挺好
#3 - 2022-9-2 01:03
(今天的我也是加把劲骑士!!!)
一部初期有着大量“一击脱离”评分的热门动画,随着时间推移也会有很多阅番量较高的观众进行标记,分数会趋于稳定,某种意义上这是bangumi的一种自我调节机制,也可以说是新老用户之间的一种妥协,这网站十年都是这么过来的。
#4 - 2022-9-2 08:23
如果能過濾 開播前一個月注冊的
單獨列出多次改過分的活躍用戶
就更好了
#4-1 - 2022-9-2 10:37
腾文鱼
改分列不出来,除非高强度频繁爬bgm(bgm38)
注册时间是能获得的
#4-2 - 2022-9-2 14:00
1ra
单独列出那不就成挂人了么(bgm38)
#4-3 - 2022-9-2 16:35
離 見 の 見
腾文鱼 说: 改分列不出来,除非高强度频繁爬bgm
注册时间是能获得的
記錄下集開播前的上次分數變化, 不過可以預估數據量一過濾可能就沒多少了, 不足以參考

如果增加每集評分, 這樣保證參與性, 後面沒評分就當作棄番
但這樣無法排除掉幽靈了, 而且因無統一評分標準徒增疲勞感
---
還是回歸評分"無用"論
評分只做人氣相關參考, 人氣是可以拿錢買的, 看情況由個人自我決定是否參考 (人氣往往只對官方很重要, 只有東方Project 那種等級的作品才連官方都不怎麽注重維護人氣, 可能因爲非商業化, 評分才變得單純
質量和喜好還是靠口碑在小圈子傳播, 這樣也能避免性癖差異大的爭論

反饋系統中最有用的還是問卷/標簽
bgm 也是有標簽的, 如果利用起來參考/推薦就慢慢推特化了, SNS中尋找志同道合的朋友建立小圈子
---
個人把 bgm 當作 wiki 和看吐槽的地方多一點
UGC 中腦部和補完設定也是 wiki 中很寶貴的資源 (類似常見的電影解讀
---
商業氣味太濃厚的作品, 一般缺少解讀都在爭論評分, 看來要慢慢適應了 (資本建立動漫飯圈產業
#5 - 2022-9-2 23:35
(我长大了要发明7G)
有没有可能如果只看100部动画可以全挑好片子,看1000部动画必然有大量烂片(只部分解释总体的下降趋势
#5-1 - 2022-9-3 04:46
腾文鱼
那个折线图的总分其实是针对特定一部作品的,而不是用户的均分
#5-2 - 2022-9-3 14:55
Jerry@Bangumi
腾文鱼 说: 那个折线图的总分其实是针对特定一部作品的,而不是用户的均分
那这么解释,只看100部的人挑的都是“对自己来说”的好片子,看1000部的人则有随便看的?
(抱歉看错了图
#5-3 - 2023-1-2 21:41
黑色的白兔子
不如说能让人看完的片子都不会太差,而对于轻度用户来说,能专门跑过来打分的都是还不错的片子……
#5-4 - 2024-1-26 14:25
ZJLalala
Jerry@Bangumi 说: 那这么解释,只看100部的人挑的都是“对自己来说”的好片子,看1000部的人则有随便看的?
(抱歉看错了图
好像有道理
#6 - 2022-9-3 08:05
感谢楼主分享,今天才看到,我把数据和原文链接放到那篇文章里了。
这篇文章的数据还是比较可靠的支持了我的部分论证过程的,关于标记量和分数的平均值也是符合经验和猜想的
#7 - 2022-9-3 13:36
建议不要带着预设的立场来解读。有些人立刻得出了“新观众无鉴赏能力喜欢胡乱打高分”的结论。那按道理标记了200部以上的用户应该都是所谓的“有鉴赏能力”、“打分值得参考”的观众了。然而把这部分人再细分的话,依然存在标记数量的越多对同一部作品评价越低的情况,即使是老番也一样
如果不能单纯的用鉴赏能力解释的话,有没有可能这就是普遍现象,即我看过的作品越多,新的作品越难给我带来惊艳的感觉
#7-1 - 2022-9-7 15:38
not easy
鉴赏能力和所谓的阅片量肯定和新老用户啊没啥区别,差别可能更多在于对于bgm类似这种打分排行榜综合评价体系的认可和理解
#7-2 - 2023-1-2 21:43
黑色的白兔子
对于我这种新用户来说,能想起来回来打个分的作品都是近期看过的印象深刻的作品,看个三集就扔的根本想不起来,也不会过来打分,自然打了分的作品分数都会偏高……
#8 - 2022-9-6 09:36
(修行中。以上)
准确的说,这个叫众口难调的视觉化效果w
#9 - 2022-10-24 00:32
(I like to be alone.)
说实话我觉得评分争议这种事情最好解决了,提高评分门槛就解决了。
并不是说用户不能评分,而是统计分数时筛选掉:评分数量低,评分曲线非正态分布,活跃时长短(排除注册刷分后僵尸)的用户,就好了。既没有排挤新用户,又保证了评分的相对客观。
说实话有自己一套评分规则的人是不会受网络大众影响而评分的,更不会当评分警察。说到底还是一帮争强好胜的年轻人。我也不会因为大家打分高而手下留情,评分争议什么的根本无所谓。
#9-1 - 2023-5-28 18:56
确实