2024-3-25 22:48 /
如果你是和我一样在入宅时因为信奉排行榜的权威并从上至下补番的所谓“老用户”,当看到芙莉莲登入榜单27、亦或是看到满屏失语症般的 “伟大,无需多言” 的时候,你或许会像我一样五味杂陈,无法理解被自己奉为圭臬的经典怎么就被这么一部符号堆叠、商业气息浓郁的番剧轻易超越。
毕竟人类总想寻找一个理由让自己与现实和解,我开始尝试思考产生这一现象的原因。直接对成千上万的评分记录分析是耗时耗力的,而只观察人数均分标准差这些统计量又难以窥见细节,我们首先得选取一个合适的分析粒度。不管你是新用户还是老用户、不管你承不承认“更多的阅番量会带来更鲁棒与保守的评分风格”,我们至少可以达成一个这样的共识:
基于该思路,我们引入这样的分析框架:总评分等同于不同阅番量用户对作品打分的加权平均,权重理所应当地取决于对应分组里用户的数量。正好评分透视给了我们轻松获取这一信息的渠道。
我选取了被芙莉莲(芙)超过的,并且评分人数接近一万的“经典tv作品”作为比较对象绘制下图。横坐标是不同阅览量的观众分组,纵坐标是该分组用户对作品的打分平均值。
可以轻易看出,在 评分分布 里,芙相比这些被它超越的作品都没有显著的优势:
• 对于阅番量10-~100+的用户来说,芙算不上领先
• 对于200+阅番量的用户来说,芙是绝对的落后
于是困惑自然而然产生:这样的劣势下芙又是如何超越一众经典跃上#27的呢?(利益相关:shaft铁粉、汤浅切黑粉)
上图所展现的 人数分布 给这种“看似处处输但是最后赢麻了”的局面提供了一目了然的解释:
• 芙莉莲的评分贡献里将近 40% 来源于“10-”的用户,而对于给分更为苛刻的“200+~1000+”用户,他们的贡献不足 30%:整体刻画了一个正突入大气层的 钱学森弹道。
• 作为对比,其他作品的典型数据里,前者只占 10%、而后者往往超过 50%,曲线一如笔者电脑桌面上孤零零的 富士山。
看到这里,因为标题而点进来的用户们应该有所释怀:经典在大家的心目中依旧经典,芙莉莲的“篡位”更多是一种 热度的兑现;当然,芙莉莲也并不是唯一一部享受了热度红利的作品:
让我们再把镜头转向这两年升榜迅速但争议颇多的作品上来,做一个横向比较:
不论你喜不喜欢芙这部作品,芙依旧是近年新出作品中最为能打的一位;计程车展现出了更为厚重的气质;与之相比,mygo就显得有些力不从心(没看过,利益无关,别捶我)。
在评分人数的分布上,除开奇巧计程车,绝大多数作品也都展现了和芙类似的评分人数分布。
一个更为有趣的发现在于:从芙莉莲、mygo,孤独摇滚一路到赛马娘,伴随着作品发布时间越早,“10-”用户的评分贡献逐步下降,曲线重心一步一步向坐标系右边滑移。
这里有两种可能的解释:
• 随着二次元文化在国内的泛化普及与班固米知名度的上升,今年新涌入用户比往年来的更加浩荡
• 每年新涌入的用户数量并没变,只是原先的“10-”用户随着收藏数量的增加,逐步迁移到别的分组
具体究竟是新生代评分用户的海啸式增长、还是仅仅只是某种用户演替在时间上的切面,还需要更长时间跨度上的采样,我们的分析也到此为止。
最后回归标题,那些和我一样,因为看到自己所信奉喜欢的作品被芙莉莲超越而感到破防的班固米用户,你需要认清这些现实:
• 作品热度在班固米评分规则的民主设计下已经在事实上成为排名的重要组成部分
• 芙莉莲以其精良的制作以及营造的全肯定的观看体验,确实获得了全区间用户的喜爱
• 造成芙排名#27的主力群体,既不是和你在条目帖子里对线的其他网友,也不是你那些给芙莉莲打高分的好友,而是 沉默的另一半。
如果你依旧难以释怀,最后的这些是我的建议:
• 请尝试参考VIB排名与科学排名,并启用相关组件:显示科排,显示VIB
• 请给予班固米社区里的短评与长评更多关注,他们比评分来得更有价值也更有力量
• 不留任何矜持地给你认为德不配位的作品打1分
repost from [locked] https://bgm.tv/subject/topic/29081
毕竟人类总想寻找一个理由让自己与现实和解,我开始尝试思考产生这一现象的原因。直接对成千上万的评分记录分析是耗时耗力的,而只观察人数均分标准差这些统计量又难以窥见细节,我们首先得选取一个合适的分析粒度。不管你是新用户还是老用户、不管你承不承认“更多的阅番量会带来更鲁棒与保守的评分风格”,我们至少可以达成一个这样的共识:
按照 阅番量 来对全体评分用户分组,每个分组内用户的评分风格是大致相近的、或者说分组内部符合一个比较稳定的分布。
基于该思路,我们引入这样的分析框架:总评分等同于不同阅番量用户对作品打分的加权平均,权重理所应当地取决于对应分组里用户的数量。正好评分透视给了我们轻松获取这一信息的渠道。
我选取了被芙莉莲(芙)超过的,并且评分人数接近一万的“经典tv作品”作为比较对象绘制下图。横坐标是不同阅览量的观众分组,纵坐标是该分组用户对作品的打分平均值。
图1:评分分布 - 经典作品
可以轻易看出,在 评分分布 里,芙相比这些被它超越的作品都没有显著的优势:
• 对于阅番量10-~100+的用户来说,芙算不上领先
• 对于200+阅番量的用户来说,芙是绝对的落后
于是困惑自然而然产生:这样的劣势下芙又是如何超越一众经典跃上#27的呢?(利益相关:shaft铁粉、汤浅切黑粉)
图2:人数分布 - 经典作品
上图所展现的 人数分布 给这种“看似处处输但是最后赢麻了”的局面提供了一目了然的解释:
• 芙莉莲的评分贡献里将近 40% 来源于“10-”的用户,而对于给分更为苛刻的“200+~1000+”用户,他们的贡献不足 30%:整体刻画了一个正突入大气层的 钱学森弹道。
• 作为对比,其他作品的典型数据里,前者只占 10%、而后者往往超过 50%,曲线一如笔者电脑桌面上孤零零的 富士山。
看到这里,因为标题而点进来的用户们应该有所释怀:经典在大家的心目中依旧经典,芙莉莲的“篡位”更多是一种 热度的兑现;当然,芙莉莲也并不是唯一一部享受了热度红利的作品:
图3:人数分布 - 本季度
让我们再把镜头转向这两年升榜迅速但争议颇多的作品上来,做一个横向比较:
图4:评分分布 - 近年热门
不论你喜不喜欢芙这部作品,芙依旧是近年新出作品中最为能打的一位;计程车展现出了更为厚重的气质;与之相比,mygo就显得有些力不从心(没看过,利益无关,别捶我)。
图5:人数分布 - 近年热门
在评分人数的分布上,除开奇巧计程车,绝大多数作品也都展现了和芙类似的评分人数分布。
一个更为有趣的发现在于:从芙莉莲、mygo,孤独摇滚一路到赛马娘,伴随着作品发布时间越早,“10-”用户的评分贡献逐步下降,曲线重心一步一步向坐标系右边滑移。
这里有两种可能的解释:
• 随着二次元文化在国内的泛化普及与班固米知名度的上升,今年新涌入用户比往年来的更加浩荡
引用 秘则为花#19:我的观点是,bgm评分的变化和阿b作为即时制看番网站的溃败有很大关系。冻鳗的热度榜肯定是存在的,泛二群体看番后也有即时交流体验的需求,在阿b还能按时放送新番的时候,这些需求其实都被阿b满足了。但随着阿b实行先审后播,跟随霓虹时间追番的泛二就需要另一个讨论场所,传统的贴吧、s1、nga因为是论坛发帖形式,对泛二比较有门槛,而bgm的单集评论区+打分,更符合阿b新人们的使用习惯。既然总要有一个阿b,那为什么不能是bgm呢
这其实是我一直的观点,在阿b三年前刚实行先审后播时就聊过https://www.zhihu.com/pin/1410350757937418241。我一直强调,共同体是一个时间性的团体,它意味着我们同时观看、同时体验、即时交流。正是在这种“同时性”上,我们才相互配合有了共同的“步调”,才有了“一致性”。因此,共同体文化往往有很强的“代际性”。阿b作为即时制看番网站的溃败影响深远,bgm成为加冕成为新的阿b就是结果之一。事实上,各种x批确实都是在21年之后大规模出现在bgm,展现出一幅万物竞发、勃勃生机之态
还有一个侧面证据,就是近几年国创冻鳗很火,但国创观众却没有像各种x批一样如天灾尸潮般涌入bgm,我觉得背后的原因就是国创在阿b的即时观看制并没有崩溃
具体究竟是新生代评分用户的海啸式增长、还是仅仅只是某种用户演替在时间上的切面,还需要更长时间跨度上的采样,我们的分析也到此为止。
最后回归标题,那些和我一样,因为看到自己所信奉喜欢的作品被芙莉莲超越而感到破防的班固米用户,你需要认清这些现实:
• 作品热度在班固米评分规则的民主设计下已经在事实上成为排名的重要组成部分
• 芙莉莲以其精良的制作以及营造的全肯定的观看体验,确实获得了全区间用户的喜爱
• 造成芙排名#27的主力群体,既不是和你在条目帖子里对线的其他网友,也不是你那些给芙莉莲打高分的好友,而是 沉默的另一半。
如果你依旧难以释怀,最后的这些是我的建议:
• 请尝试参考VIB排名与科学排名,并启用相关组件:显示科排,显示VIB
• 请给予班固米社区里的短评与长评更多关注,他们比评分来得更有价值也更有力量
• 不留任何矜持地给你认为德不配位的作品打1分
repost from [locked] https://bgm.tv/subject/topic/29081
说实在的,既然舆论上不占上风,你有技术基底,就给bgm开发一个烂番茄组件,人手一个柿子,讨厌哪个片子就扔出去,喜欢哪个片子就自己吃,不能反悔,一个月统计一次挨柿子砸的次数,这样一来人人都没有心理负担了。
虽然销量有时候也不靠谱,比如某IS,以及催生出来的名作之壁称号,还有国内的名作之壁小组
但奇诺和魔旅比摸鱼莲好看,这倒是事实,至少前几集的铺设上让人难忘。
例如咱就觉得制作费用有时浪费在了奇怪的地方,修塔尔克穿外套,费伦坐下时捋裙子,维尔贝鲁向前走了几步蹲下看抓到的陨铁鸟… 肯定有更值得投入作画张数的地方,例如第一场考试维尔贝鲁与尤贝尔(前者的后撤步明显滑步了)、费伦与艾露的战斗(光炮轰炸艾露的效果还可以再丰富一点)。如果这么做了是为了观众能在这种地方觉得作品很棒,总感觉重点有点不对。资源分配都还可以更合理。
而宣发非常卖力,也只是本片的内容表现和同时期出产的动画有所不同,宣发方只是想利用这种反差感来打一张出奇制胜的牌?
豆瓣也是5星评价,不过评分也还行,不像b站那样
bangumi是10分制,以后分数会随着时间膨胀,不过速度比较慢,就是看的少的新用户越来越多,新番评分膨胀比较严重,老番涨的速度较慢
-
即便同一个分组内用户评分口味大相径庭、就算是beta分布而不是正态分布,也并不会影响这个说明。你可以用不同分组标准做出总评分均值E=W^T·X的不同分解,而这其中 按照评分者阅番量的分组 在图表上看是充满着解释性的一个。
一个比较自在的观影态度是“无所谓”,你有你的白月光,我有我的心头好,大家互不相扰,在对方没有伤害到自己的社交需求与精神需求的前提下互相尊重对方的喜好,当然,自己也要提高修养,不要化身为到处煽风点火的恶棍,惟恐天下不乱,不要因为对方给你的白月光打低分就信息骚扰对方,也不要变成碰点火星就爆炸的火药桶。
不要总是打着扩大同好数量、开发潜在市场等等数不清的旗号去干涉他人的私人空间,这也很重要,虽说你不干涉就无法起到宣传作用,但现在的宣传手段往往都是过度干涉,烦不胜烦,提倡这项准则也是没办法的事,有没有人遵守是另一码事
典型的像甲铁城:有着江原康之,川野达朗等厉害原画师造就的优秀作画加上不错的音乐,就算有篇幅较短导致展开不够等问题,怎么说也该有7分了,却因为某些大up等贬低都跟风打低分,导致现在只剩5.9了
而芙莉莲这种是比较平稳,也没有特别精彩的地方,理应在8.0左右,网络各种一片吹嘘加观感不错就都打高分了
现在人很容易被网络风潮带着走,两极分化也加剧了
1.起手强调自己是“纯路人”,然后直接给对方扣个“党同伐异”,“冻鳗-神教”的帽子,这种话术不知道的还以为是在给某个鸽鸽洗白。
2.这里确实没有,可能是重发的时候删了吧。
3.字面意义难道不就是指”200+-1000+“用户给出的平均分要远低于"10-”用户?如果这也需要详细定义,那你先把你说的“冻鳗一神教”给定义一下吧,我觉得这个名词更加意义不明。
3.5 “几十年的老军迷”没听过钱学森弹道?我这种不算军迷的都听过。再说“钱学森弹道”用在这里难道不是为了形容曲线的形状?我寻思这也不涉及什么专业知识啊。
4.只看这句话本身确实应该是个显然的结论,但"10-"用户的具体占比多少并不显然。比如图里展示的芙莉莲的“10-”评价已经达到约40%。所以这篇日志里的数据仍不失其意义。不过话又说回来,我看芙莉莲的时候也觉得里面有些道理就是显而易见的,有些套路也是属于典中典的,我看了前面都能猜到后面会发生什么,奈何大伙就是吃这一套呢。
5.6.虽然我个人也不认可给“德不配位”的作品打1分,但是正如你自己说的,那又关你什么事呢?就算有人组队给你喜欢的作品刷1分,也不影响你自己的评价,不是吗?
-
所以 图1里的一条曲线 点乘 图2里同颜色曲线 等于 班固米显示的该条目均分
2:芙莉莲评分随阅番量增加下降速度尤其快
3:芙莉莲评分占比中10-阅番量用户占40%
4:阅番量多的用户更有鉴赏力(你所攻击的观点)
由1、3可得出,芙莉莲评分虚高;
由2、4可得出,芙莉莲在鉴赏力更强的用户眼里更差
你说是守旧婆罗门的错,无非是在质疑4,但芙莉莲评分虚高只需要1、3就可以得证
-
也可以试着按照日本动画史的路径来补番。
我想看用户组(站龄1、3、5、7、10年)的标准差和200+到1k+用户组的标准差