#1 - 2022-8-30 14:45
宿星雨 (A little knowledge is a dangerous thing)
提醒:长篇文章,建议使用电脑或者iPad浏览,由于排版复杂,请注意观察引导符和序号。另外,请务必仔细阅读全文后再发表你关于本文相关观点的意见
重要声明:本文主要观点均为理论分析和假说,论证过程都是建立在相应假说和观察上的,量化数据全部放在了文末  带有方括号的内容参考对应也在文末。
本帖欢迎理性讨论和反驳以及针对事实性错误提出质疑。 另外,本人关于不同评分者群体上的性质上的定义不基于人格和道德上的看法,仅仅是一种为了理解评分系统机制和解释当下现象所作的群体区分模型,用来更好的解释这个问题。

引言:
关于分数的争议在Bangumi并不是一个新问题,多集中在“评分与排名讨论会”的bangumi小组里,这种讨论多是对整体评分的规则或者是所部动漫的探讨,并不针对具体作品的评分高低,也不会发展到争吵和攻击的程度。但是近年来,出现了越来越多针对具体作品的评分质疑和争议,在本部作品リコリス・リコイル达到了一个巅峰。由此,关于对这样一种现象的探究性文章开始构思并写为本文。

正文:

一、关于动漫的评分争议愈演愈烈之总体分析。(绪论)
排除掉明显的「钓鱼」行为,就争议各方立场而言,可以大致分为两类:认为新番评分普遍偏高的「保守派」以及相对而言的「自由派」,而这些争议多发生在新作品上而言,其原因可以归结于是由于Bangumi大量新用户涌入带来对新作品评分的“相对影响”。
即,这是一种评分体系客观性与价值认同趋于割裂、崩坏的现象。
这是“新用户”的涌入导致Bangumi原有的“评分相对比较共识”和“参考性”受到了破坏 。

二、具体的关于新用户涌入导致评分相对性和参考性遭到破坏的解释与论证

关于排行榜价值的阐述:
排行榜的意义在于对各种不同的作品进行比较,借以指导人们选择更优质的作品,从而体现出这样一种参考性。

1.关于新用户显著增加的说明:最近3年,大部分动漫的评分data有了超过两倍的增长[7][1]、我们可以认为新增的用户数也至少为这个数量级  再结合百度指数相关数据[2]  可以明确的说,Bangumi的“新用户”处于一个快速增长的状态且对评分数据特别是热门和较新的作品产生了显著的影响。


2.为解释评分争议现象而建立的群体划分与重要概念

核心定义:(类B站)新用户      下文简称“新用户”
顾名思义,与B站受到认可的主流评分体系相似的用户  
定性划分:不具有或者不明确评分相对性的意识,无法根据对比的大致原则确实一部动漫的“相对实力”
主要外在性质与表现:data数量较少  评分集中在高知名度的动漫与当季制作优良的动漫   data平均分偏高  评分分布集中在高分段  

对“类B站”名词的解释:B站,指哔哩哔哩视频弹幕网,中文互联网上的主要的视频平台和文化社区。由于近年在其站内动漫相关综合话题内涌现大量关于Bangumi的介绍,起到了主要的引流作用,故以此用作为新用户的典型画像分析。 [3]

与“新用户”相对的则是本文所指的“老用户”,方便起见您可以简单理解为对一个追求理性和相对客观的评分系统的“坏用户”和“好用户”。

以上我们就完成了对研究对象简单的群体划分,但需要注意的是关于两类用户群体的定性定义并不是一个完全清晰的划分,中间必定有少量模糊地带,但由于观点上强烈的对立性,我们可以忽略掉这个中间部分 并且认为他们的表现也是介于两个群体之间的 既不会对数据产生实际影响。


3.“新用户”增加带来的data增加对应主要条目以及影响的分析

概述:新用户的增长带来的data主要体现在一些热门且制作良好的作品或者当下热度高的新动漫, 其总体影响在于,以上两类作品分数获取了基于新用户增长的“不当”相对优势,而前者的影响尤为明显

具体论述:
⑴. 关于这个不当相对优势影响对象的定性说明
被影响的作品主要是热门的、制作相对良好的作品。  关于他们评分作品的具体倾向,如下:
①当下热门且看上去制作至少不能算缺点的新作品    相对而言应季度的泡面番以及每季都有的低质量动漫几乎不会受到影响 因为它本身观看 人群就决定了其几乎不会受到“新用户”的性质所影响的  而制作中规中矩和剧情受众少的作品受到的影响也相应较少 ( 这种意义上,相当于单方面加强了受众和热度对分数的正面效果)
②一直有人气并且被视为经典的老作品   相对同“水平”但由于题材受众和不符合传播学相关特性的经典老作品 获得了这种新用户的相对高分加成
     
举例、最近的这类新作品如:来自深渊 二期 、リコリス・リコイル、spy family 、明日酱、更衣人偶、夏日重现  、辉想告3  、 或多或少受到了这类加成的影响   有些本身全方面质量过硬的作品受到的影响是更少的,因为新老用户本身评价相对接近:(都是较高的评价),所以这些并不会反应到具体的分数争议上,但是总的来说,还是相比{那些同等质量但是没有这部分新用户好评}的作品来说,得到了一个相对优势。 而有名无实的作品则得到了更多“好处”  (以上提到的仅仅是本人有所了解的一些作品,这类作品比想象中的应该要多,本文并不针对其中某个特定作品)

⑵关于这种相对优势的数据对象的说明以及相关事实和这种优势在统计上的澄清
澄清之一:   新老用户之间的区别不只是注册时间和阅番量  
请参阅上文的定性说明。
就性质的表现而言,这一种对动画的综合了解程度、鉴赏能力和横纵向对比能力的差别。
但是 从统计角度对分数的影响而言  我们可以认为注册时间和标记量上意义的老用户在整体上更代表了“老用户”这个群体,新用户同理。
这种粗略的基于性质的群体判定会带来一定误差,不过我们可以忽略这种误差对结论带来的影响。
①对有关人主观感情和看法的定性判断的误差无法消除的  通过bangumi提供的现有数据维度,我们只能通过这两个数据既{注册时间和阅番量} 对这两个群体进行定性的划分
②就误差的实际情况而言,基于以上两个数据维度的判断带来与实际基于人内心性质的情况带来的误判是双向的,这种误差在一定程度上会被其他误差所“中和”
③就实际统计结果显示出的群体差异显著区别而言,这种误差可以被忽略

澄清之二,群体差别对评分带来的影响不在于个体的主观性而在于群体的统计趋势我们讨论的是针对评分的整体影响,所以只需比较其中的群体整体“受主观影响程度”、“欣赏能力”、而前提是:有基础的共识
其中各种极端的情况总体综合必然回归其本身群体的“理性水平”,从而得到一个可以说明群体本身性质的合理分数。

⑶关于群体性的具体区别以及相对优势的具体成因的论述  

关于“欣赏能力”和“对比能力”的群体性区别论述
猜想1:在同等情况下,观看动漫数量更多的观众整体上更有能力去横向和同类比较一部动漫的实力和地位。
猜想2:评分对比必然有一个参考基准。
猜想3:在同等情况下,在一个排行榜既有的前提下,接触排行榜更久以及对其的利用度更高的用户相比而言更能确定这个参考基准。

(待补充)

⑷关于以上论证的主要反对观点的反驳:评分主观论的反驳
观点:两个群体都是基于自我主观进行评分   所以排行榜不具有任何客观性   
反驳:   
① 不同的作品在剧情完整度、剧情合理度、剧情深度、人物设定、人物塑造、音乐、美术、动态效果上都有着客观上的差异,并且由于动漫是一类内部极为相近的表达形式,所以我们可以对不同动漫进行一定程度的比较

②群体中每一个个体按照一定的个人主观进行评分  但群体总体基于一定共识做出的判断既具有统计上的必然性和参考意义
如上统计意义的论述  每个个体的主观偏差对总体不会带来统计上的影响,各种个人喜好带来偏差相互抵消得到的就是一个有参考性的数据

③两个群体间有统计上的显著差异   这种统计上的误差无法简单用个体的主观喜好不同进行解释  因为个体的主观偏好在人群总应该是相对均匀的

⑸实例分析:没有关于比较性共识和评分参照基准的“排行榜”分析

例1:B站  [4][5][6]
例2:豆瓣   
例3:myanimationlist(mal)  

(待补充)


⑹一些杂论、假设和其他观点和事实的澄清
如果“新用户”在不能明确以上关于排行榜相对性的情况下凭借“个人观感”进行评分,那么bangumi的全年代动漫排行将很丧失其比较价值,或向mal方向发展。
设想,如果不认同根据一些普通而一般化的方法去对一部作品进行评分,那么排行榜的存在(对这部分用户)将失去意义  
重申  排行榜就是作品间的比较 同类型的对比和同分数段的对比对维持一个排行榜的参考性是必要的

关于“评分标准” 的澄清:合理的data指的不是按照某一个特定的“评价标准  而是确实的基于一定相互比较基准对作品的评分 如上述,个人的主观不可避免,但是极端的主观相互抵消,剩下的就是确实具有参考的比较价值(每个data都像一个混沌的数据,必然受用户个人主观影响,但是排行榜也必须有一定共识才具有比较意义,这样,数据将趋于一个基于这个群体理性平均值的结果,但是“新用户”与“老用户”的群体间“收束”结果显然是有差异的
这也是引起相关争议的原因。


3. 结论以及总结:

从统计角度 的  ”新用户”客观上的增加  导致前文所述的一类动漫得到了统计上相对其他作品的“不当”优势  从而影响到了排行榜的整体比较性  降低了排行榜的参考性  引发了相关与具体评分有关的争议


4.个人愿景
虽然以上这种又“新用户”涌入带来影响目前看来还并不是那么严重  但是长久以往 必然导致评分的进一步分化和排名相对意义的丧失  不利于社区的长远发展
可能的解决方法是:只有在确认用户已经明确评分系统的意义和参考性以及比较性后才允许用户评分或者将分数记录统计   鼓励用户在横向和同类比较的基础上给出自己的评分。  


三.相关量化数据

数据一:对本文认为受到新用户评分加成的动漫的bangumi用户注册时间与评分之间关系的数据,原文点此,原作者:隔壁的王某某
统计时间为2022年8月30日

莉可丽丝(平均分7.6952)

辉夜大小姐想让我告白-超级浪漫-(平均分8.4774)

赛马娘 Pretty Derby 第二季(平均分8.4814)

CLANNAD ~AFTER STORY~(平均分9.0802)


解读与说明:关于这种新用户的加成带来的优势  其中具有热度的新番得到优势最大(如莉可莉丝),热度大的老番得到也优势,但是因为data总数更多,受到影响更小,如clas,其2021–2022总data占全data18%,而赛马娘占42%  ,而其他热度更低的冷门动漫,可以认为其新用户评分占比更低,不受影响。
可以得到两个群体间评分回归趋势有明显差异,以上均为本文认为的收益作品,新老用户评分回归值差距都有0.3分以上  

数据二:一组关于不同标记数量用户的评分统计数据,原文点此原作者:腾文鱼

统计了莉可莉丝、辉夜三、终物语和蜂蜜与四叶草四部作品的评分以及给分用户的标记数量。评分莉可莉丝之统计了“在看”用户的评分,有一部分隐藏评分用户的数据获取不到。后三部的评分是统计了‘看过“用户。用户标记数量来源是用户公开的“看过”条目数量,通过sai老板开源的api获取的。
下面是数据的可视化展示
四部作品的用户分布:

上图原始数据
四部作品不同标记数量用户的分数统计
上图的折线图版本

解读与说明:可以看出“新用户”评分显著更高,“新用户”数量不可忽略,得到更多“新用户”评分的动漫获得了不正当的“相对优势”。

关于最后一个表格的排版,具体颜色忘记标记,感兴趣的可以问问原作者

四.

由于本文由写作之初后进行了大量的修改与精简,删除了大量我认为个人主观性强、繁琐冗长、以及不必要、重复的论述    如果你想浏览本文的历史版本  请访问  网页时光机上本文的存档https://web.archive.org/web/20220000000000*/https://bgm.tv/subject/topic/22669  (请使用科学上网技术进行访问)

本文自写作以来在站内引发了广泛而深入的讨论,其中一部分讨论的内容包含了对本文的补充说明以及某方面更深刻的解释。
现列举如下 希望可以帮助你更好理解本文的观点或解决一些常见的疑惑。

#2   关于“交给时间解决”看法的讨论
#8   关于“bgm社区的标记属性”与“分类别评分”的讨论
#14   关于“真正的客观”的讨论
#19   关于“评分的意义”与“个性化推荐”算法的讨论
#22  关于某些极端用户言行生动的展示
#44  关于实施“鉴赏家”评价体系与大众评价双体系的看法
#45  关于参考“好友评分”的看法
#50  关于这种新用户不当加成对制作水平分配的理解
#55&#118  关于个人主观看法更能在一定情况下作品素质以及关于用户样本的影响  关于用户评分动机以及因果性的看法
#60  关于极端的门槛限制下实施“鉴赏家”以进行“瑞典式民主”评分的看法
#73  关于分tag评分的看法与其他排行榜的说明与介绍
#77  关于哲学上价值判断上的可行性与更高范畴排行榜指导性的讨论
#93  关于样本归一化这一解决方法的讨论
#95  关于本文论证方式、数据相关性、术语准确性的质疑
#98  关于本文核心观点的梳理与论证逻辑、论证手段的说明
#101  关于某些极端用户言行的生动展示2以及关于“显然的汉语内容”的语法讨论   
#103  关于某些极端用户言行的生动展示3
#108  一个关于体现主动性的评分权重设想方案
#113  关于解决方案的分析以及一种对用户评分心理的解释

在浏览评论区时,强烈建议您启用:长楼层折叠插件 !!!或者配合小组爬楼辅助器一起使用!!!

五.更新日志以及参考

量化数据更新记录:
数据一:更新时间8/31 17:55  其中clas更新时间:9/3 8:26
数据二:更新时间9/3  8:19

其他排版与内容更新日志(不完全记录)
1.第一次编辑,初版     8/30
2.第二次编辑,删除冗余与增加解释,将重要观点加粗体现   8/30 23:49
3.重要更新,排版大规模修改以及语言重新组织和精简      9/6 03:44
4.排版更新与语言精简   9/12 18:31
5.删除个人关于分数估计的部分,润色部分段落  9/21 9:11
6.添加关于用户数量增加的相关数据  9/24  8:37
7.重要更新:删除所有主观性强的论述  调整修辞  根据逻辑关系调整文段位置  精简段落  排版大规模修改  标题修改   参考内容位置调整置于文末最后  9/24  11:00
8. 关于文章的历史版本、以及评论区指引 的部分的增加  9/24   12:12
9.新增参考、增加爬楼辅助插件推荐  9/24  19:45

参考
1.https://netaba.re/
2.百度指数相关数据  
3:根据不完全统计 哔哩哔哩视频弹幕网中的视频中直接提及到Bangumi和其相关评分的视频播放总量超过50m次  实际展示次数可能达到0.1b  其中 标题中直接含有bangumi相关的视频约2m次 数据可视化类视频中采用了Bangumi作为数据源并明确在视频和简介中说明的约30m次 单一动漫评价中专门提及到Bangumi的约20m次
动漫与其他视频评论区与弹幕中提及到Bangumi有关内容的由于计算困难不列入其内  数据取自2019年之后发布的视频 (观看量随时间增加,按照B站推送机制可以认为相关视频总展示度在逐年增加)
4.B站动漫评分统计以及按比例分布表
来源:https://bgm.tv/group/topic/347061
5.https://bgm.tv/group/topic/343962   #11   补充说明
6.B站动漫评分帕累托图  来源:未知 同第四条 数据基本吻合
7.补充参考:https://windrises.net/bgmtools/review/chart
#2 - 2022-8-30 14:58
有没有考虑新用户会成长?老用户也是熬出来的嘛。一是阅番量增大、鉴赏能力提高,二是分数段不够用导致自己重新调整评分。人多了是好事&交给时间吧

最后部分,如果能把“个人观点”转化成数据分析就好了,大伙儿的评分都摆在这儿了,真要能算出个“剔除新用户评分”也是极好的

另外这番还没完结呢,冲动打高低分、习惯完结前评分的都有,这还是等完结了再讨论更有价值一些
#2-1 - 2022-8-30 15:03
宿星雨
建议看看我说的新老用户的区别以及对全体用户的建议  其实新老并不是重点 关键是是有比较性的评分(即科学的评分,相对的)

具体在最后几段:虽然这个过程影响目前看来还并不是那么严重  但是我相信  长久以往 必然导致bgm评分的进一步意见分裂和排名相对意义的丧失  不利于社区的长远发展 解决方法就是:让每个用户学习并了解评分系统的意义和参考性和比较性的来源  并鼓励用户在横向和同类比较的基础上给出自己的评分。  
#2-2 - 2022-8-30 15:14
Acylation
宿星雨 说: 我完全写清楚了这个问题吧  建议好好看看我说的新老用户的区别以及对全体用户的建议  其实新老并不是重点 关键是是有比较性的评分(即科学的评分,相对的)

具体在...
能理解,其实和你说的“需要引导用户学习评分系统来提高评分的参考性”是一致的。只不过我觉得吧,在站里混一段时间应该就可以自然学会了,没必要专门强调一个“学”的过程

所谓交给时间也就是说,等待新用户建立起评分标准之后,这些时下热门作品也会逐渐回归到应有的位置。毕竟能找到这儿来多少还是有点认真的
#2-3 - 2022-8-30 15:16
冰水混合体
Acylation 说: 能理解,其实和你说的“需要引导用户学习评分系统来提高评分的参考性”是一致的。只不过我觉得吧,在站里混一段时间应该就可以自然学会了,没必要专门强调一个“学”的过程

所谓交给时间也就是说,等待新用户建立...
在这一点上我也认同“交给时间”这个解决方式。
#2-4 - 2022-8-30 15:16
宿星雨
Acylation 说: 能理解,其实和你说的“需要引导用户学习评分系统来提高评分的参考性”是一致的。只不过我觉得吧,在站里混一段时间应该就可以自然学会了,没必要专门强调一个“学”的过程

所谓交给时间也就是说,等待新用户建立...
这就说不定了 看这部的可怕的10分比以及点开这些人的主页 就会发现基本符合我上面提到的“新用户”特点 注册未满半年,评价量低于30,大多数8分以上好评。
#2-5 - 2022-8-30 15:21
冰水混合体
宿星雨 说: 这就说不定了 看这部的可怕的10分比以及点开这些人的主页 就会发现基本符合我上面提到的“新用户”特点 注册未满半年,评价量低于30,大多数8分以上好评。
符合就符合呗,我刚入bgm时还点一堆9分10分呢(bgm38)有啥大不了的
#2-6 - 2022-8-30 15:23
Acylation
宿星雨 说: 这就说不定了 看这部的可怕的10分比以及点开这些人的主页 就会发现基本符合我上面提到的“新用户”特点 注册未满半年,评价量低于30,大多数8分以上好评。
这倒是未必。刷分的确实有,但也可以代入一下正常新用户视角看看这个问题

最近刚拉了个同学进站,平时看番也不算少,但刚开始补标的时候还是集中给到了7、8、9分,区分度不高。一部分因素是,补标的番都是自己印象深刻的,倾向于给好评,另一部分是标记的作品还不算太多、区分度尚且够用

回想看看的话,我自己的评分也迭代好几轮了,有的时候为了给个分还得专门二刷一遍,要不就直接不评分,比刚入站那会儿确实变了许多

另外就是,一部作品刚看完的“观感”和一段时间后的回味确实不一样,我回顾评分列表的时候,也正是由于这个原因,调低了不少作品的评分,差评也比以前更敢打了

基于这些经验,我对热点作品的评分回归还是有信心的,毕竟本站大环境在这嘛。简单写点,供lz参考
#2-7 - 2022-8-30 15:41
宿星雨
Acylation 说: 这倒是未必。刷分的确实有,但也可以代入一下正常新用户视角看看这个问题

最近刚拉了个同学进站,平时看番也不算少,但刚开始补标的时候还是集中给到了7、8、9分,区分度不高。一部分因素是,补标的番都是自己...
这是一部分良性用户 但是可能更多的不是这样  参考热门番剧的评论下用户  
其实统计上说 这种可以慢慢成为“老用户”的更少也是显然可以考虑到的
#2-8 - 2022-8-30 15:42
宿星雨
冰水混合体 说: 符合就符合呗,我刚入bgm时还点一堆9分10分呢有啥大不了的
这种想法不仅仅是个人 如果是“新用户”中的大多数就不行了 而且现在新用户越来越多 况且不是所有人都会成为老用户而去修正评价的 这就是我提出的意义
#2-9 - 2022-8-30 15:44
冰水混合体
宿星雨 说: 这是一部分良性用户 但是可能更多的不是这样  参考热门番剧的评论下用户  
其实统计上说 这种可以慢慢成为“老用户”的更少也是显然可以考虑到的
觉得不良性的多了,可以私信网站管理员让她给入站增加标准,你冲咱网友叨叨有啥用啊(bgm38)
#2-10 - 2022-8-30 15:45
Acylation
宿星雨 说: 这是一部分良性用户 但是可能更多的不是这样  参考热门番剧的评论下用户  
其实统计上说 这种可以慢慢成为“老用户”的更少也是显然可以考虑到的
定量这个实在是超出能力范围了(bgm38)不过哪个排名靠前的番没有一群狂热爱好者呢www

也就是说,lz希望扣减掉这部分“热门”带来的评分加成对吗?不过一击脱离的话是有在清的来着。不一击脱离的那些,可不就变成稳定用户了吗?(bgm35)
#2-11 - 2022-8-30 15:49
宿星雨
Acylation 说: 定量这个实在是超出能力范围了不过哪个排名靠前的番没有一群狂热爱好者呢www

也就是说,lz希望扣减掉这部分“热门”带来的评分加成对吗?不过一击脱离的话是有在清的来着
定量用户而言很难做到,但是明显的是bgm的知名度上升 新三年用户增量几乎以前所有还要多 (从data数统计可以看出) 这就导致了我提出的这种问题是一种不可忽视的对原有体系的影响 而且不是单纯多样性的影响 这只是自欺欺人 大部分新用户都是很难留存的 这些少数data对特点的作品在rank里的地位就会产生我说的影响  不只是新的这类作品 老的一些火爆好口碑也肯定有影响 相对其他无人问津的动漫来说。
#2-12 - 2022-8-30 15:50
Acylation
宿星雨 说: 这种想法不仅仅是个人 如果是“新用户”中的大多数就不行了 而且现在新用户越来越多 况且不是所有人都会成为老用户而去修正评价的 这就是我提出的意义
在用户需要有评分标准这一点上,咱几位的观点其实是一致的

分歧似乎来源于对现状的不同看法,楼主基于热门番评分虚高这一点,对新用户入站狂热评分有所担忧,从而希望这些用户能够建立起一套自己的评分标准,提高自己评分的参考价值

我和@冰水混合体 看法比较相似,就是这一部分狂热打分会随着时间正常回归,所以不需要特地干预新用户,他们会慢慢形成一套自己的评分标准,以上
#2-13 - 2022-8-30 15:50
冰水混合体
宿星雨 说: 定量用户而言很难做到,但是明显的是bgm的知名度上升 新三年用户增量几乎以前所有还要多 (从data数统计可以看出) 这就导致了我提出的这种问题是一种不可忽视的对原有体系的影响 而且不是单纯多样性的影...
一击脱离的管理员有清,这一点就不用加戏了。
#2-14 - 2022-8-30 15:51
冰水混合体
Acylation 说: 在用户需要有评分标准这一点上,咱几位的观点其实是一致的

分歧似乎来源于对现状的不同看法,楼主基于热门番评分虚高这一点,对新用户入站狂热评分有所担忧,从而希望这些用户能够建立起一套自己的评分标准,提高...
确实是这样。只要做好清理一击脱离,我觉得随着时间流逝最终是会归于“合理”的。
#2-15 - 2022-8-30 15:53
冰水混合体
Acylation 说: 在用户需要有评分标准这一点上,咱几位的观点其实是一致的

分歧似乎来源于对现状的不同看法,楼主基于热门番评分虚高这一点,对新用户入站狂热评分有所担忧,从而希望这些用户能够建立起一套自己的评分标准,提高...
我记得之前巨人3part2进前十的时候也是一场大战,现在已经快掉出第一页了。另外不知道楼主知不知道“某科学的动画排名”(bgm38)
#2-16 - 2022-8-30 15:58
Acylation
宿星雨 说: 定量用户而言很难做到,但是明显的是bgm的知名度上升 新三年用户增量几乎以前所有还要多 (从data数统计可以看出) 这就导致了我提出的这种问题是一种不可忽视的对原有体系的影响 而且不是单纯多样性的影...
还有就是,b站化这个,貌似短期内也不必担心,感觉像国王排名、鬼灭这些叔叔力推的番,班友挺不待见的,反倒是lycoris,恰恰一开始b站应该没有官方宣发。

倒不如说是lycoris路人缘好,不细看的话容易得到观感很好的结论这样?总之现在评分人数才不到在看的一半,完结后再看嘛,万一又是个契丹呢对吧?(bgm38)
#2-17 - 2022-8-30 17:54
宿星雨
冰水混合体 说: 我记得之前巨人3part2进前十的时候也是一场大战,现在已经快掉出第一页了。另外不知道楼主知不知道“某科学的动画排名”
经常混迹在评分讨论会小组的怎么会不知道…… 虽然但是 仅仅是算法我觉得也很难做到这种效果 而且也不怎么直观
#2-18 - 2022-8-30 17:57
宿星雨
Acylation 说: 还有就是,b站化这个,貌似短期内也不必担心,感觉像国王排名、鬼灭这些叔叔力推的番,班友挺不待见的,反倒是lycoris,恰恰一开始b站应该没有官方宣发。

倒不如说是lycoris路人缘好,不细看的话...
你说路人缘好,这个我是不太认同的,这个动漫的传播很大程度是因为一些“恶俗”的gif动图梗,引发了广泛的传播,导致了很多“圈外人”也一起来凑热闹,这不就是流量运作么。如果这种工业化生产这种作品,我相信没人可以接受吧,特别是真正喜欢动漫的人。 至于这种传播力有多大:以至于我在cpp这种讨论群都经常能见到那个踢屁股的gif表情包。这种间接带动的流量就不用我多说了吧
#2-19 - 2022-8-30 18:03
冰水混合体
宿星雨 说: 经常混迹在评分讨论会小组的怎么会不知道…… 虽然但是 仅仅是算法我觉得也很难做到这种效果 而且也不怎么直观
我认为反而那个算法代表的方向才是解决楼主认为的这个问题的唯一路径(bgm38)(如果需要解决的话),现在的暴力平均算法本身就难以抵御大规模极端评分。
#2-20 - 2022-8-30 18:10
冰水混合体
宿星雨 说: 你说路人缘好,这个我是不太认同的,这个动漫的传播很大程度是因为一些“恶俗”的gif动图梗,引发了广泛的传播,导致了很多“圈外人”也一起来凑热闹,这不就是流量运作么。如果这种工业化生产这种作品,我相信没...
刚看了眼,按照那个算法,莉可丽丝排名1350,辉夜3排214,这样感觉楼主会更满意一些。
#2-21 - 2022-8-30 18:21
宿星雨
冰水混合体 说: 刚看了眼,按照那个算法,莉可丽丝排名1350,辉夜3排214,这样感觉楼主会更满意一些。
确实我的个人预期也是如此,但是毕竟还是非官方的而已。

其实跟vndb的top250算法异曲同工  

这种新作品没有接受时间检验,置信度肯定相对较低
#2-22 - 2022-8-30 22:10
Acylation
宿星雨 说: 你说路人缘好,这个我是不太认同的,这个动漫的传播很大程度是因为一些“恶俗”的gif动图梗,引发了广泛的传播,导致了很多“圈外人”也一起来凑热闹,这不就是流量运作么。如果这种工业化生产这种作品,我相信没...
这点上我也是保留态度,大致和#9-11一致。虽然这个观点在讨论版见到好多次了,但我认为社群传播和官方宣发还是有些区别的。低质量二创是该diss,但如果用“流量运作”来解释,多少有阴谋论之嫌。仅靠创作者,真的能准确预判“爆点”、控制传播吗?

一定程度上也能理解楼主的想法,一是对番的具体内容,用户们各有所爱,不喜欢很正常;另外是看不惯小鬼跳。但如果上升到对制作组本身的批评的话,还需要更加谨慎才能服众。

毕竟是在lycoris的条目下面,有人赞有人踩很正常,希望下面的火药味少一些,有意义的交流多一些。感谢楼主的耐心回复和您维护的良好讨论氛围
#2-23 - 2022-8-31 21:24
The Laughing Whimsicott
不同意新用户会通过学习朝着老用户靠拢的观点.(以下借用楼主的新老定义)

你说的转变在新用户远比活跃的老用户少的情况下确实会发生, 因为实际上每个论坛都是一个茧房, 这个茧房体现在用户文化以及习惯上的有不成文的规矩, 而不仅仅是信息上的闭塞. 少量的新用户无法产生足够的推力来影响拥有数量优势的老一辈的文化.

但bgm现在是大量的新用户涌入进来, 从楼主给的几张图来看, 活跃的新用户和活跃的老用户数量比率大概在1比1左右, 甚至是我也算是一个新用户. 不再具有数量优势的老的文化必然受到新的价值观新的文化的冲击, 这也在近几部大红大紫的产品上能看得出来, 这是新老价值观冲突的一角.

而论坛的风气和用户文化也不会一成不变, 具体可以参照16年前后的知乎, 活跃在知乎16年前的一些知识分子现在不是销号就是不再发言, 而知乎也涌出一大群只会抖机灵和发脾气的角色. 如果bgm再不做点什么的话, 我觉得最终就会向bilibili靠拢, 和知乎一样变味.

时间确实会带来一些什么, 但不可能全部按照你希望的方向去发展. 因为历史潮流从来不是"希望"怎样就怎样的.
#2-24 - 2022-9-3 01:53
QSCFTHMKO
Palladiawa 说: 不同意新用户会通过学习朝着老用户靠拢的观点.(以下借用楼主的新老定义)

你说的转变在新用户远比活跃的老用户少的情况下确实会发生, 因为实际上每个论坛都是一个茧房, 这个茧房体现在用户文化以及习惯上的...
知乎的例子有些不一样,那边应该是站方有意引导的,bgm到底之后会如何确实不清楚,但至少目前情况下不至于变质那么快(bgm38)
#2-25 - 2022-9-3 16:44
The Laughing Whimsicott
QSCFTHMKO 说: 知乎的例子有些不一样,那边应该是站方有意引导的,bgm到底之后会如何确实不清楚,但至少目前情况下不至于变质那么快
知乎没有故意引导, 知乎在那些年采取的行动就是增流, 和其它平台抢流量. 从客观结果上来说, 知乎流量的增大和bgm流量增大是没有差别的.
#2-26 - 2022-9-3 16:56
QSCFTHMKO
Palladiawa 说: 知乎没有故意引导, 知乎在那些年采取的行动就是增流, 和其它平台抢流量. 从客观结果上来说, 知乎流量的增大和bgm流量增大是没有差别的.
增流引来一堆牛鬼蛇神我认为就是故意引导,不过流量增大人员混杂倒也是事实,无论是主动增流还是被动增流
#2-27 - 2022-9-7 22:39
史上第二帅的人
Acylation 说: 还有就是,b站化这个,貌似短期内也不必担心,感觉像国王排名、鬼灭这些叔叔力推的番,班友挺不待见的,反倒是lycoris,恰恰一开始b站应该没有官方宣发。

倒不如说是lycoris路人缘好,不细看的话...
叔叔没有推,但是某几个动漫区up主带来的热度相当高了(
#3 - 2022-8-30 15:15
(生而为人,我很高兴)
咱来一点一点捋

(叠buff:我认为莉可莉丝是一部优点与缺点都相当明显的作品,免得楼主又像在隔壁楼层那样直接把我打成因为立场情绪就来喷他)

先来想想,最为公平的评分系统是什么呢?难道是标准统一?层主个人觉得非也,应该是“对每一部作品进行评分”。即使每一个人的标准不同,只要每个人对所有动画都根据自己的标准打了一个分,那么这样在统计学上就是完完全全合理的。
当然,现实不可能是这个样子,人不可能看所有动画,自然这个评分会有“问题”,这一点可能的确是公认的。楼主将其问题归结于“阅历低的新用户涌入”,表面上看是有理的,层主自己以前也是这个看法。
让我看法转变的是什么呢?
咱就不谈用户权利的问题,因为楼主最后希望的是“进行教育规训”这个方向,这一点比起之前动辄喊打喊杀的人无疑要强上不少。
新用户多不假,楼主的意思我也理解,“bgm精英”在某种程度上的评分更‘客观’这一个论点,大体上也不假。
然而最终导向的是什么问题?为什么啊。为什么别人要用你的规训来打分?bgm不是内网不是秘密论坛不是国家文艺作品评分委员会,为什么最终你要去修正那个排行榜让它成为“更贴近所谓‘真理’的存在”。动画作为一个艺术题材,为什么就要条条框框这么多?有人喜欢剧情,有人喜欢人设,有人是作豚是声豚,百花齐放才好嘛。如果你认为有一个网站应该承担起客观准则的作用,希望你可以去帮助设立一个更加严肃的地方,而非在这个网友吹牛对线的平台。
此外,阅番量50-的观众又不是死了,只要他/她还在看动画,迟早能长成你我的样子,咱也不是生下来就看了50+的动画的吧?所以与其关心他们,不如关心事实上对于你所在意的“排行榜”影响最大的一击脱离。虽然就我而言,网站的使用仅仅是自由市场罢了,我去我想去的地方,觉得不好就不去,我不是网站的所有者也不是维护者。
#3-1 - 2022-8-30 15:21
宿星雨
我说的统计合理性可能你没看太清楚,是在既有的基础上对全年代的动漫比较的一个基准,百合豚、声豚自然是可以在这个基础上得到统计上的加成 这是全体用户中的部分加成偏好 是可以接受的 但是现在问题不是这些 而是大量新用户对可比性完全忽略的情况下的评分 比如 还有很多作画很棒的百合作 7.3分左右 没错点兔这种的 这种就是我提倡的同类比较和同分数段比较  这样才有全年代排行榜的意义
#3-2 - 2022-8-30 15:24
冰水混合体
宿星雨 说: 我说的统计合理性可能你没看太清楚,是在既有的基础上对全年代的动漫比较的一个基准,百合豚、声豚自然是可以在这个基础上得到统计上的加成 这是全体用户中的部分加成偏好 是可以接受的 但是现在问题不是这些 而...
人只能看所有的动画中的沧海一粟,同类动画同分数段这种比较缺乏可操作性。此外,喜欢作品是一个先验的东西,人不是先想到理由再喜欢的,而是喜欢才开始想理由的。
#3-3 - 2022-8-30 15:26
宿星雨
回复2 最终导向 我的目的仅仅有一个更加有可比性的排行榜 去引导或者提供一个看番的方向。 如果不认同这种排名的制度而按照热度什么的 完全可以不来使用的bgm 参考bgm宗旨  比如b站排行榜更适合这种用户  那么问题来了  bgm不就是个对作品进行排名的地方么  如果人人都新用户这种虚假百花齐放那还有什么可比性 很显然这种加成是针对我说的特定新作品的 至少程度更高  况且这根本不是什么可比性  我主要指出的是“新老用户”带来的统计差异 这种个人偏好可以认为在两者里分布是平均的 至少一开始是 然后的改变就是又阅番量或者说对动漫行业的了解而发生的改变 这种主观因素我已经提到很多次了 就是说他是综合的 人们当然可以依靠主观评价 但是前提是对基础共识的认可 这个基础共识就是bgm全年代排行的意义。
#3-4 - 2022-8-30 15:28
宿星雨
冰水混合体 说: 人只能看所有的动画中的沧海一粟,同类动画同分数段这种比较缺乏可操作性。此外,喜欢作品是一个先验的东西,人不是先想到理由再喜欢的,而是喜欢才开始想理由的。
所以说 这种主观喜爱论也是回归人群平均值的 但是新老用户的基础共识不同导致的问题并不是单纯的喜好问题  你见过多少新用户喜欢90或者00年代的宇宙背景的动漫?专门打高分? 如果是针对特点如我所说的新作品,那么这不就是客观上的一种排行榜系统失衡 失去了全年代排行榜的价值
#3-5 - 2022-8-30 15:28
冰水混合体
宿星雨 说: 回复2 最终导向 我的目的仅仅有一个更加有可比性的排行榜 去引导或者提供一个看番的方向。 如果不认同这种排名的制度而按照热度什么的 完全可以不来使用的bgm 参考bgm宗旨  比如...
我还是想问为什么。“我的目的仅仅有一个更加有可比性的排行榜 去引导或者提供一个看番的方向。”为什么呢?正如我提到的,bgm不是国家文艺评分委员会
#3-6 - 2022-8-30 15:30
宿星雨
至于自由选择 我当然没强制你按照这种方法去评价了 它的好处和坏处当然是你们自己评估 不过我认为如果人人如此自由 b站用户全部来这里评分 那么意义就没有了。
#3-7 - 2022-8-30 15:31
宿星雨
冰水混合体 说: 我还是想问为什么。“我的目的仅仅有一个更加有可比性的排行榜 去引导或者提供一个看番的方向。”为什么呢?正如我提到的,bgm不是国家文艺评分委员会
都说了是个人观点 没人强迫你 如果你认为排行榜怎么样都好 这当然是你的自由 我仅仅是抛砖引玉而已
#3-8 - 2022-8-30 15:31
冰水混合体
宿星雨 说: 至于自由选择 我当然没强制你按照这种方法去评价了 它的好处和坏处当然是你们自己评估 不过我认为如果人人如此自由 b站用户全部来这里评分 那么意义就没有了。
回到这句话吧:“先来想想,最为公平的评分系统是什么呢?难道是标准统一?层主个人觉得非也,应该是“对每一部作品进行评分”。即使每一个人的标准不同,只要每个人对所有动画都根据自己的标准打了一个分,那么这样在统计学上就是完完全全合理的。”
#3-9 - 2022-8-30 15:32
冰水混合体
宿星雨 说: 都说了是个人观点 没人强迫你 如果你认为排行榜怎么样都好 这当然是你的自由 我仅仅是抛砖引玉而已
我这不也是个人观点没强迫你嘛,着急啥啊(bgm38)
#3-10 - 2022-8-30 15:33
宿星雨
冰水混合体 说: 我还是想问为什么。“我的目的仅仅有一个更加有可比性的排行榜 去引导或者提供一个看番的方向。”为什么呢?正如我提到的,bgm不是国家文艺评分委员会
关键是 你似乎仅仅是认为我强迫了别人的自由(但是我没有强迫 仅仅是意见) 而没有看到我的意见的任何建设性优点  这不就是预设立场么 所以你很难发出赞同的评论 即使你认为有些说的有道理 但是我还是要找到反驳的地方
#3-11 - 2022-8-30 15:35
宿星雨
冰水混合体 说: 回到这句话吧:“先来想想,最为公平的评分系统是什么呢?难道是标准统一?层主个人觉得非也,应该是“对每一部作品进行评分”。即使每一个人的标准不同,只要每个人对所有动画都根据自己的标准打了一个分,那么这样...
不是公平不公平 而是比较性 希望你能看懂我认为排行榜的作用 当然,如果是这种立场上的分歧也没必要争论了 毕竟b站算平均分 一人一票最公平
#3-12 - 2022-8-30 15:41
冰水混合体
宿星雨 说: 关键是 你似乎仅仅是认为我强迫了别人的自由(但是我没有强迫 仅仅是意见) 而没有看到我的意见的任何建设性优点  这不就是预设立场么 所以你很难发出赞同的评论 即使你认为有些说的有道...
我只是认为你的意见在这个层面上是不合理的。reasonable,但不feasible。bgm和b站的区别仅仅是使用者不同罢了,他没有义务(网站管理员也没有表现出这个意思过)成为你口中那个“有作用的排行榜”。MAL和anikore这些玩意的排行榜在bgmer看来几乎毫无价值,人网站照样好好的。
#3-13 - 2022-8-30 15:43
宿星雨
冰水混合体 说: 我只是认为你的意见在这个层面上是不合理的。reasonable,但不actionable。bgm和b站的区别仅仅是使用者不同罢了,他没有义务(网站管理员也没有表现出这个意思过)成为你口中那个“有作用的...
如果这样我们有什么必要辩论?仅仅是观点不同,我也不想去说服谁,如果变成mal就不用了不就是了。
#3-14 - 2022-8-30 15:45
冰水混合体
内容已被用户删除
#4 - 2022-8-30 15:15
(V1046-R MAHORO)
并不是一个老问题 x
并不是一个新问题 o
#4-1 - 2022-8-30 15:17
宿星雨
感谢指出 已修改
#5 - 2022-8-30 15:22
(垃圾桶已经满了。)
写的挺好的,虽然后面的估分不是重点,但我还是忍不住想说“手还是太软了!”
#5-1 - 2022-8-30 15:50
宿星雨
没办法 又不是去引战  我是不想找来很多那种情绪性的言论 毕竟这更多是对评分系统的讨论,我个人对某部番的看法其实并不重要
#5-2 - 2022-9-7 22:48
史上第二帅的人
所以制作一般应该打5分...?还是说我阅历太少烂番看得不够多(
啧,而且为啥你一部10分都没有
#5-3 - 2022-9-7 23:00
老悠
史上第二帅的人 说: 所以制作一般应该打5分...?还是说我阅历太少烂番看得不够多(
啧,而且为啥你一部10分都没有
不是有个虫师嘛,虽然现在重看可能不能十分了
#6 - 2022-8-30 15:26
(希望治安官大教育家屠魔勇者阴阳师拱火孤儿消停点 ... ...)
我的观感是リコリス・リコイル≈明日酱≥更衣人偶≥夏日重现>spy family 。
其实一开始夏日重现观感还是要高不少的,因为美少女jk杀人魔太戳我了,结果发现后面卖的美少女变金毛,就感觉有点失望,虽然后面又回到影jk了,但不是杀人魔了,又有点小失望。(bgm38)(bgm38)
我感觉我好像在某个时刻看立本动画就主要是围绕美少女上了,其他也不是说不重要了,而是加分减分项,减分是因为有时候做不好美少女以外的内容反而影响观感,结果现在审美水平还在原地踏步,我是不是没救了……
#6-1 - 2022-8-30 15:31
老悠
辉夜大小姐3呢
#6-2 - 2022-8-30 15:33
冰水混合体
美少女是立本动画最突出的部分之一,不可不品尝(bgm38)
#6-3 - 2022-8-30 16:07
小笠原ユリ
老悠 说: 辉夜大小姐3呢
哦错,忘记了,辉夜3也≈リコリス・リコイル≈明日酱
#7 - 2022-8-30 16:25
(与幸福的邂逅相对的,也会因邂逅而失去一些今后的事物。 ...)
这种事情不应该去茶话会说吗?(bgm38)
#8 - 2022-8-30 16:37
虽然这个过程影响目前看来还并不是那么严重  但是我相信  长久以往 必然导致bgm评分的进一步意见分裂和排名相对意义的丧失  不利于社区的长远发展 解决方法就是:让每个用户学习并了解评分系统的意义和参考性和比较性的来源  并鼓励用户在横向和同类比较的基础上给出自己的评分。  
想法很好,但是无法落实。就像你文中提到的,连一些老用户的评分都是脱离bgm现有评分机制自成一派的,评分甚至还不如很多新用户客观些。人的观念是不可能轻易被扭转的。

如果你了解过bgm的历史,就会明白,这不是一个「为评分而生的社区」,创始人其实更想把它做成中国的anidb。没有网站的评分排名是严谨合理的,bgm也只是矮个子里拔将军,好在情绪化打分的用户较少而已。

插句题外话,其实要真让我来设计评分系统,我第一个删除的就是bgm这全年代全类型动画的排行榜。年代差异较大、类型差别较大的动画放一起比可不就是关公战秦琼吗?所以你看我给的分数,基本都是按它所在的那个类型片里的地位给的。
#8-1 - 2022-8-30 16:47
宿星雨
稍微看了下你的评分  感觉你这样按类型给分更是不可行的 就说辉想告3吧 你把它分到恋爱喜剧类给它打no1我没意见 但是事实上不应该分到恋爱大类下么 那么这样的评分就一样没参考价值了  因为分类的纬度太多了  就算分个几十大类出来 一部可以算多类 等等  那不就是所谓全年代中的“按标签搜索”了么 ? 评分纬度不还是只能靠分数。。
#8-2 - 2022-8-30 17:04
蒅南
宿星雨 说: 稍微看了下你的评分  感觉你这样按类型给分更是不可行的 就说辉想告3吧 你把它分到恋爱喜剧类给它打no1我没意见 但是事实上不应该分到恋爱大类下么 那么这样的评分就一样没参考价值了...
首先Love comedy不是某个个体擅自定义的,它本来就是日本动画里自成体系的类型片,已经有二十年以上的历史了。

其次你的程序员思维太重了些,所谓动画的类型或评分不是让你量化到具体某个数值的,因为人类的情感本身就无法量化。所以我只会对动画做大致的分类,类型相近则互相参考比较,类型差别较大我则会用不同的评价标准。

另外,即便放恋爱动画,辉告我也会依然会选择给10。校园迷糊大王、旋风管家和月刊少女也很好,可惜不是生在这个时代。
#8-3 - 2022-8-30 17:26
宿星雨
蒅南 说: 首先Love comedy不是某个个体擅自定义的,它本来就是日本动画里自成体系的类型片,已经有二十年以上的历史了。

其次你的程序员思维太重了些,所谓动画的类型或评分不是让你量化到具体某个数值的,因为...
或许这是一个不错的想法,和豆瓣的分类榜单制度差不多。 但是对bgm而言还是很难实现的,另外 就恋爱动画而言 我只能说你列举的几个例子可能并不算得上那么经典 参考的样本太少  实际上这类的好作品应该数不胜数クロスゲーム、狼与香辛料 歌牌情缘 86―エイティシックス― 第2クール  等等 如果掺杂了其他元素的恋爱作则更多  就辉想告来看,不如说喜剧元素多于恋爱,设定太浓了,说白了就是刻意感,单纯恋爱角度看是很难打动人的。单纯青春喜剧的作品可以比的也很多 比如幸运星这种   就算是恋爱喜剧这一个小类也未必可以比高木同学更出色  综合这些作品的评分和辉想告3的评分和总体水平看  我认为后者还是有一定水分的  至于会不会回归理性值就让我们拭目以待吧
#8-4 - 2022-8-30 17:33
蒅南
宿星雨 说: 或许这是一个不错的想法,和豆瓣的分类榜单制度差不多。 但是对bgm而言还是很难实现的,另外 就恋爱动画而言 我只能说你列举的几个例子可能并不算得上那么经典 参考的样本太少  实际上...
单从恋爱角度看不如某些作品,这个我倒是认同,因为喜剧要素过多的缘故,恋爱要素显得过分戏剧化,甚至恋爱一定程度也是为喜剧而服务了。但我一般不会把喜剧和恋爱割裂开来看就是了。
#8-5 - 2022-8-30 17:38
宿星雨
蒅南 说: 单从恋爱角度看不如某些作品,这个我倒是认同,因为喜剧要素过多的缘故,恋爱要素显得过分戏剧化,甚至恋爱一定程度也是为喜剧而服务了。但我一般不会把喜剧和恋爱割裂开来看就是了。
我觉得  你这样看  学生会生役共 可能和辉想告差不多了。也许你会喜欢
#9 - 2022-8-30 16:51
极致的双标,这一头在这批判给这部番打高分的观众,另一头又打着平衡党的名义给这部番打一分。对所有番剧全凭理性打分,试问你能做到吗?人是理性和感性交融的生物,对喜欢的偏爱,对讨厌的反感是人之常情。观感适宜并对这部番钟爱有加肯定会偏向于给高分,无感甚至厌恶就会偏向于打低分。(所以如果你凭的是厌恶直接打一分的话我完全不会指责你)。
还有结合你在上一个帖子的发言(恶俗剧情增加传播),我并不认为你能对这部番作出理性评价。我想问下,你给这部番下恶俗这一定义的理由是什么?卖肉了吗?传播了什么不好的风气吗?是哪一处场景触发了你阅了几百部里番的肌肉记忆?
#9-1 - 2022-8-30 17:03
宿星雨
你根本没看完文章就在这里乱怼人,首先 这部从来不是我论述的重点,我早声明了不针对任何一部具体作品 而是一个现象 再说关于主观性的问题明明写了几百字论述 装瞎子自娱自乐你高兴就好   另外 我在别处对本作品的评论  只是一个个人偏好 在这篇论述中不起任何作用 我当然承认它是一个具有主观性的判断 至于你怎么理解是你自己的事情  你要为这部作品正名而忽略我提到的现象 从这种角度进行批驳 恕我不进一步解释
#9-2 - 2022-8-30 17:03
宿星雨
“我批判给这部番高分的观众”
请问从何看出?
#9-3 - 2022-8-30 17:05
宿星雨
另外,再澄清一个问题 关于我对本作品的1分平衡,虽然声明分数正常后恢复7分,但我现在也认为这是一个不太好的决定,所以在几个小时前已经取消了评分,现在是未评状态
如果你对我个人评分体系有其他质疑 欢迎提出
#9-4 - 2022-8-30 17:19
千束
宿星雨 说: 另外,再澄清一个问题 关于我对本作品的1分平衡,我现在也认为这是一个不太好的决定,所以在几个小时前已经取消了评分,现在是未评状态
如果你对我个人评分体系有其他质疑 欢迎提出
首先,我并没有多要为这部番正名,也不在乎评分高低,回复要点是之一是指责你口口声声强调理性自己却是平衡党的所作所为。
其次:(另外,有另外一部分观众认为,我就是认为ly的xxx,xxx很棒,很优秀,所以给高分。 那么我想说,你为什么来看排行榜呢?)这句话不是你在上一个帖子说的吗?有没有带有批判性质?
最后也是最重要的的,请你回答我你给这部番下恶俗这一定义的理由是什么?
#9-5 - 2022-8-30 17:28
宿星雨
千束 说: 首先,我并没有多要为这部番正名,也不在乎评分高低,回复要点是之一是指责你口口声声强调理性自己却是平衡党的所作所为。
其次:(另外,有另外一部分观众认为,我就是认为ly的xxx,xxx很棒,很优秀,所以...
说了是个人观点  我并不想解释 这不是本文重点  你非要胡搅蛮缠我也没办法  
我都承认了这是个人主观看法  又没逼你接受 你在意我在其他地方的发言来这里怼做什么呢
#9-6 - 2022-8-30 17:30
宿星雨
千束 说: 首先,我并没有多要为这部番正名,也不在乎评分高低,回复要点是之一是指责你口口声声强调理性自己却是平衡党的所作所为。
其次:(另外,有另外一部分观众认为,我就是认为ly的xxx,xxx很棒,很优秀,所以...
我也没说我是平衡党,我从来不平衡分数,这一次是唯一一次并且我已经自发改正了,我自己的评分也只会按照自己的标准去评价。至于这部 我并没有任何偏见 我并不讨厌不如说是喜欢百合作品 但是剧情的垃圾和烂俗不能因为百合而得到任何帮助 如果你不认同我对这部番的评价你可以在心里骂我 但是我和不想解释了 心累
#9-7 - 2022-8-30 17:32
宿星雨
千束 说: 首先,我并没有多要为这部番正名,也不在乎评分高低,回复要点是之一是指责你口口声声强调理性自己却是平衡党的所作所为。
其次:(另外,有另外一部分观众认为,我就是认为ly的xxx,xxx很棒,很优秀,所以...
另外 那个例子中ly只是一个代词,可以替换任何本文提到的名字,你激动个什么呢?至于对ly的看法,我一直承认是不看好,也没必要像任何人解释
#9-8 - 2022-8-30 18:05
千束
宿星雨 说: 另外 那个例子中ly只是一个代词,可以替换任何本文提到的名字,你激动个什么呢?至于对ly的看法,我一直承认是不看好,也没必要像任何人解释
在这个帖子里面我是根据你自身作出平衡打分这一行为,质疑你的评分体系是否足够具有说服力。当然,你改了我也没有要继续质疑你这个点以及你的评分体系。
然后再根据你之前帖子的发言,顺便在这里想要求证你这部番下恶俗这一定义的理由是什么,如果你觉得这里不适合质问你,那我也可以到那下面在重新问一遍。
你觉得垃圾,俗和不看好这部番我没有意见。但剧情烂和俗≠恶俗,请你不要偷换概念来回答,你认为靠恶俗剧情增加传播那意思就是这部番带来了不好的风气,是负面影响。如果你觉得回答不上来全凭主观并认为我胡搅蛮缠的话那我无话可说。
#9-9 - 2022-8-30 18:13
宿星雨
千束 说: 在这个帖子里面我是根据你自身作出平衡打分这一行为,质疑你的评分体系是否足够具有说服力。当然,你改了我也没有要继续质疑你这个点以及你的评分体系。
然后再根据你之前帖子的发言,顺便在这里想要求证你这部番下...
好吧,可能我说的严重了些,确实达不到恶俗 但是确实“不太好”和“某些剧情太刻意”,这样说你满意了吧……我不知道为什么你这么在意我对这部作品的批评,毕竟我对这作品也没仇啊,上面那些例子我不是一样举么,即使我认为ly我会打7分,也不能算低,认为辉相告3我打8分,但其分数还是有水分 并不代表我本身多讨厌它  再次重申 我和ly没仇 也不觉得它非常烂 只是一般而已 达不到7.7 我质疑的只是这个  至于比它烂的也是多得数不过来  我会这么评价的原因多半还是我受不了这种商业化的宣传  这种类似炒作的剧情  这种踢屁股的表情包流传这种广 以至于我躲都很难躲的一种抱怨 所以我讨厌它 但不代表我对这部作品本身评价会非常低 那也就是 一般 但名不副实 而且宣传很讨厌  和spy family这种过度宣传的我一样讨厌 但是绝对不是对作品本身的偏见
#9-10 - 2022-8-30 18:14
宿星雨
千束 说: 在这个帖子里面我是根据你自身作出平衡打分这一行为,质疑你的评分体系是否足够具有说服力。当然,你改了我也没有要继续质疑你这个点以及你的评分体系。
然后再根据你之前帖子的发言,顺便在这里想要求证你这部番下...
而且再次重申,这不是重点,我把相关评论删了也无所谓,毕竟我和l没仇,也不想计较这些,更不想卷入这种粉黑的争端中 仅仅是一部中规中矩的作品而已。
#9-11 - 2022-8-30 18:40
千束
宿星雨 说: 好吧,可能我说的严重了些,确实达不到恶俗 但是确实“不太好”和“某些剧情太刻意”,这样说你满意了吧……我不知道为什么你这么在意我对这部作品的批评,毕竟我对这作品也没仇啊,上面那些例子我不是一样举么,即...
适当的批评我当然不会太在意,但是恶俗这一批评对于这部番来说显然是不适当的吧?发言是会被众人看到且具备一定影响力的,我不希望它被打上这么一个标签希望你也可以理解。你打的出你认为适当的分数我也肯定是尊重你的。
至于宣传,我想说的是了解过会发现其实官方对于这部番的作出的宣传其实挺烂的,说是草台班子也不为过。更多的是二创的人太多了吧,老实说有的时候我自己也会被烦到,因为质量普遍比较低和引来太多人跟风了。
谢谢你能认真回我并肯承认某些错误,我也有某些过激的发言,不好意思。
#9-12 - 2022-9-12 09:24
君との思い出に
就双标打分而言我也反感。但是你对“因为厌恶而直接一分”的纵然,我也实在不敢苟同。我认为情感是一个人评价番剧的一部分,但是并不是全部。只因为个人情感而完全不考虑其他方面就直接极端评分(1分/10分),过于狭隘和……此时的评分表现出的完完全全就是个人喜好,而不是番剧本身好坏的的评价。不是因为它优秀我喜欢它,而是因为我“喜欢它而喜欢它”。
#9-13 - 2022-9-12 16:50
千束
君との思い出に 说: 就双标打分而言我也反感。但是你对“因为厌恶而直接一分”的纵然,我也实在不敢苟同。我认为情感是一个人评价番剧的一部分,但是并不是全部。只因为个人情感而完全不考虑其他方面就直接极端评分(1分/10分),过...
怎么说呢,对于纯凭厌恶而忽略番剧其他因素打一分这种行为我是不赞同的。与其说是纵然这种行为,其实更多的是无可奈何吧。毕竟左右他人的主观想法本来不容易,而在互联网更是难如登天了,所以相对于要我去指责这种行为的话,我还是偏向于妥协吧。当然尽量约束好自己也是必要的,对于厌恶的作品,我选择的是不打分,而喜好的话确实会成为打高分的因素之一(扪心自问我也做不到纯理性的)。
#10 - 2022-8-30 16:58
我就不叠楼中楼了,楼上Acylation和冰水的观点我基本认同。动画的分数随时间流逝会越来越接近它的「客观值」,因为审美是有时代性的。台长说对了一句话,现在的阿宅是不吃痞子那套自闭抑郁流风格的,这类动画肉眼可见的变得不受欢迎。好在eva是已经盖棺定论了,放在现在大概率没法像当年一样成功。
#10-1 - 2022-8-30 18:23
宿星雨
不过bgmer不是还挺喜欢的么,漂流少年这种,不过我不太喜欢。
#11 - 2022-8-30 17:05
(今天的我也是加把劲骑士!!!)
某种意义上,MAL就是bgm的最终形态。大家各打各的分,圈子彻底割裂开来,个体的意见在庞大的票仓中不会造成任何分数波动,排行榜对于用户来讲已经失去了参考价值。但说实话,bangumi距离这种大网站还有很长的一段路要走(bgm38)
#11-1 - 2022-8-30 17:09
宿星雨
就像豆瓣的任何榜单尤其是图书榜单、具体评分已经几乎没有任何意义、不同类型几乎没有可比性   对我而言就是一个印象:豆瓣标记的人觉得好/不好  

说白了就是这系统坏了  根本不是去看分数的  只有点格子的功能。。

那就药丸了  不是大部分用户药丸 而是我这种人药丸
#11-2 - 2022-8-30 17:16
冰水混合体
宿星雨 说: 就像豆瓣的任何榜单尤其是图书榜单、具体评分已经几乎没有任何意义、不同类型几乎没有可比性   对我而言就是一个印象:豆瓣标记的人觉得好/不好  

说白了就是这系...
不同类型的可比性本来就极弱。就如同你很难说天元突破、混沌武士、四叠半、小圆这四部作品的比较(他们在bgm排名相当接近)。而分类又是一个主观的东西,就像你和上面有个班友的“恋爱”与“恋爱喜剧”之辩。(bgm38)
#11-3 - 2022-8-30 17:22
冰水混合体
宿星雨 说: 就像豆瓣的任何榜单尤其是图书榜单、具体评分已经几乎没有任何意义、不同类型几乎没有可比性   对我而言就是一个印象:豆瓣标记的人觉得好/不好  

说白了就是这系...
排行榜首页的星际牛仔、攻壳机动队、EVA、银英、机动条子、石头门似乎都是科幻作品,你是打算将他们看成一类去比较,还是细分成“恋爱”与“恋爱喜剧”之类的关系(bgm38)
#11-4 - 2022-8-30 17:34
宿星雨
冰水混合体 说: 排行榜首页的星际牛仔、攻壳机动队、EVA、银英、机动条子、石头门似乎都是科幻作品,你是打算将他们看成一类去比较,还是细分成“恋爱”与“恋爱喜剧”之类的关系
难道要每一部每一部比较么,你没发现我的看法其实是比较宏观的,这种分差0.1 rank差距不大的比较在我认为的排行榜意义上你可以认为价值不大,建议还是好好理解我的观点再来回复
#11-5 - 2022-8-30 17:37
宿星雨
冰水混合体 说: 排行榜首页的星际牛仔、攻壳机动队、EVA、银英、机动条子、石头门似乎都是科幻作品,你是打算将他们看成一类去比较,还是细分成“恋爱”与“恋爱喜剧”之类的关系
其实与那个班友争论我现在也觉得不太必要   因为按找类别喜欢去指导观看本身也是我的一个评价论点  这样本身我其实我觉得我也算支持的  还是为了目的服务吧  不是让你真正全年代每一部都分的明明白白  但是参考性不能丢了。  ly这种就有点离谱了(个人观点)
#11-6 - 2022-8-31 23:12
Faumeplder
我一直把同一地区网络下任何平台的评分看作是热度和舆论高度绑定的产物,就论国内大平台集体对大热门作品的不屑看出,就算bgm人多后也不会像mal一样大热门新作冲顶,但续作冲顶基本是评分网站共性,这个没办法(bgm38)
#12 - 2022-8-30 17:46
关于蒜的分争议、评分警察基本上面都讨论的差不多了,随着新用户增长速度增加,往后所有作品分都会变高,我记得刚进bgm14年那会儿RANK1还是EVA,分数也就刚好9.0,现在RANK1的cb已经9.15了,不知道算法能不能抑制分数膨胀了,但我们这些用户的只能等时间去改变每一个新人的评分习惯了,我只想提一嘴bgm评分机制。
目前来看,现在总番数已经6k+,十分制个人感觉真心不够用,个人认为可以注册年限到一定时间的老用户可以用百分制或者至少半分加以区分,今年间谍过家家和辉告3打分都打的特别心烦,近几年比上不足,比下有余的番太多了,蒜不出意外完结打分又非常纠结(bgm38)(bgm38)(bgm38)
#12-1 - 2022-8-30 17:48
宿星雨
是的 我认为批评空间的百分制其实更科学
#12-2 - 2022-8-30 17:48
宿星雨
7 8 9这几个档位里经常是出于比较纠结的状态。
#12-3 - 2022-8-30 18:06
冰水混合体
对于区间不够的问题,最后我的解决方式是:把以往1-6分的作品都缩到1-4分去,然后上面就增多了区分度(博诸君一笑)(bgm38)
#12-4 - 2022-8-30 18:22
蒅南
宿星雨 说: 7 8 9这几个档位里经常是出于比较纠结的状态。
7 8 9 比较纠结+1

事实上你班很多评分问题和这个档也有一定关系。比如蒜,很多人看得舒心就给了个8,但真要说力荐嘛我觉得也不至于。
#12-5 - 2022-8-30 18:46
宿星雨
蒅南 说: 7 8 9 比较纠结+1

事实上你班很多评分问题和这个档也有一定关系。比如蒜,很多人看得舒心就给了个8,但真要说力荐嘛我觉得也不至于。
对,很多人是觉得7分有点低,所以给了8,但是8其实又一点高了, 如果有7.5这种选项就不会有这个问题了,或者说,7.5和8.5的重要性我觉得还是很大的
#12-6 - 2022-9-3 02:00
QSCFTHMKO
宿星雨 说: 7 8 9这几个档位里经常是出于比较纠结的状态。
我怎么不太一样,是678纠结(bgm38)
(9分都挂上神作级了,我觉得跟10分一样得谨慎
#12-7 - 2022-9-3 02:05
宿星雨
QSCFTHMKO 说: 我怎么不太一样,是678纠结
(9分都挂上神作级了,我觉得跟10分一样得谨慎
可能是因为我经常从top1000里挑作品看吧,所以打分相对也偏高。
#12-8 - 2022-9-4 13:14
湛蓝De豌豆
冰水混合体 说: 对于区间不够的问题,最后我的解决方式是:把以往1-6分的作品都缩到1-4分去,然后上面就增多了区分度(博诸君一笑)
好办法,忙活了半天,终于把所有番压缩到3分及格线了(bgm38)
#12-9 - 2022-9-6 07:00
🌕LoneFireBlossom
不要把6分作为及格线,把5分作为及格线的话,6-10分的区分度就好很多了。
本来bangumi的评分标准里,“不过不失”就是5分。
#12-10 - 2022-9-8 11:41
鱼さん
其实看下此时间段现时间段至少可以知道总榜目前的分数膨胀还没到11年的程度(bgm38)
#13 - 2022-8-30 18:06
(必须保卫战争)
都在讲社群倾向,但问题是2022年以前bgm也没有一以贯之的社群倾向,实际上莉可丽丝开播前,bgm已经打过无数场评分战争了。所谓的“老东西”本身也是一大团混沌物质。bgm的评分在2022年以前是混沌状态,2022年以后依旧是混沌状态,过去不比现在更好,现在也不比过去更好。如果要说有什么不同,那可能就是莉可丽丝是如今“年轻人的第一部评分争议作品”。如果真如你所说,年轻人高估了莉可丽丝,那你可能也高估了莉可丽丝评分争议的影响
#13-1 - 2022-8-30 18:18
宿星雨
这点我也是非常赞同的,目前这种趋势的影响确实不多,不过我担忧的是这样的程度会加剧(已经在了,相比以前,肉眼可见争吵的多而且分歧大),ly的商业化成功如果还附带了好名声,岂不是再鼓励行业向这个方向发展,简单的经济学原理之人对刺激会做出反应。
#13-2 - 2022-8-30 18:48
秘则为花
宿星雨 说: 这点我也是非常赞同的,目前这种趋势的影响确实不多,不过我担忧的是这样的程度会加剧(已经在了,相比以前,肉眼可见争吵的多而且分歧大),ly的商业化成功如果还附带了好名声,岂不是再鼓励行业向这个方向发展,...
谈不上,像cl在站内吵架已经吵了快十年,莉可丽丝能吵上十年吗?实际上,bgm评分一直在变化中,并不存在一个the golden age。并且,放眼站外也一样,cl吵了十年是因为bgm也才十几年,在站外只会更久

之所以会有过去评分更稳定的印象,其实是受困于“婆罗门”神话。大家相信过去存在一个内部具有高度共识、垄断动画评分话语权的婆罗门小群体,垄断意味着稳定。所以,喜欢目前状态的人会拼命攻击婆罗门,讨厌者则希望回到the golden age。但实际上呢?动画婆罗门就像统治着世界的蜥蜴人群体一样,真要找的话反而哪里都找不到
#14 - 2022-8-30 18:32
首先尊重楼主愿意理性讨论的态度。反驳如下:

第一,你主张新用户的评分破坏了bgm排行榜的意义和参考性,然而除了理论以外,拿出的证据却只是不同意某些热门新番的评分这种主观意见,很难站得住脚

第二,你试图否定所谓的“完全主观”、“极端主观”的评分,同时也主张评分会受一定主观影响,其实是矛盾的。主观就是主观,客观就是客观,并没有相对主观一说
#14-1 - 2022-8-30 18:44
宿星雨
1.我主张是依照这样一个观察到的事实,即新用户的增长以及其评分的一个大趋势,虽然没有定量的分析,但是通过一些定性统计(比如,一个一个点开看看给ly打十分九分用户的成分,做一个简略的统计)(又比如,关于新用户增加量、bgm名气扩大的相关统计数据)虽然不那么精确,但是可以在性质上基本说明我提到的这一个现象的,还是说你对这点完全否认呢?(你是否部分承认这种现象,而且根据对10分和9分用户的统计,可以说这对评分是显著的)(依据:大部分番剧并不会得到这部分“新用户“的相对高评分)

2.这部分我论述应该比较清晰,所以不是你这样用两个概念可以简单否定的,比如,你是否赞同我所指的新用户以及他们的评分喜好带来的主观收束平均值和我所指“老用户”的收束平均值有显著差异,并且,你是否承认这部分用户和老用户相比,在“欣赏能力”比老用户要显著低 由此造成的评分上的一些争议。


ps 希望有大佬可以帮我爬一下我提到的那些番的10以及9分分用户的注册时间、阅番量、平均分、中位分以及方差,(后者也许用netaba可以轻松解决  )  然后形成一个表格  再爬下相应分数的其他经典作品的10分以及9分用户的相关数据,作为比较。
#14-2 - 2022-8-30 18:59
宿星雨
一个比较直观的看法就是,到ly的评分统计目前标了在看和看过的按评分排序,发现高分的居然有很大一部分是连头像都是默认的用户,这些用户评价基本都是20部以下,完全符合我的描述,任何一页几乎都是这样,辉想告3也差不多,而其他老经典作品这种情况几乎没有,或者要好的多。就算是无头像,点开看注册时间和标记数也和ly和辉想告不是一个级别的。这就是一个显著的统计差异。
#14-3 - 2022-8-30 20:21
TheAnimePlanet
宿星雨 说: 一个比较直观的看法就是,到ly的评分统计目前标了在看和看过的按评分排序,发现高分的居然有很大一部分是连头像都是默认的用户,这些用户评价基本都是20部以下,完全符合我的描述,任何一页几乎都是这样,辉想告...
统一回答
我承认你说的现象存在。但是热门番除了引来刷高分的也会有刷低分的(ly的1分是2分的6倍多),算是平衡了一点,甚至我觉得一些已经盖棺定论的经典老番的刷分情况会更严重。而且一部番能火起来必然是质量受大部分观众认可的(特别是ly这种无官方宣发的),这种质量反映在新用户的高分是可以接受的。
而相对的,老宅也会有厚古薄今的偏见存在。假设存在A和B两部质量相当的番,而你先看的A,再看B的时候就没那么惊艳、印象没那么深了。因此给B打的分会比A低。有新宅给B打高分反而也算一种平衡。
因此,把差异归咎于所谓的“鉴赏能力”是不妥的。
#14-4 - 2022-8-30 20:43
宿星雨
TheAnimePlanet 说: 统一回答
我承认你说的现象存在。但是热门番除了引来刷高分的也会有刷低分的(ly的1分是2分的6倍多),算是平衡了一点,甚至我觉得一些已经盖棺定论的经典老番的刷分情况会更严重。而且一部番能火起来必然是质...
针对你说的特别经典的涨分的情况其实我第一段要点里是提到了的,这点也是有目共睹,但是总的来说,我说它对评分机制的破坏不是说只针对新番的增加,在于这个评分带来的分值是不均衡分布的,这才是要点,而经典的番受到的影响因为基数大和本身两者收束差距小,基本可以忽略不计。 至于厚古薄今,首先不论这种说法有没有到底,但我觉得这样带来的偏差是相对合理和可以接受的,毕竟你拍得晚,和前人高度重合带来的观感下降不是正常的么,就是模仿作当然不如原作的意思了。 但是新作有了更加好的技术手段,这点完全是压倒性的优势不如说,毕竟以前连计算机辅助制图都没有。 况且实际情况是,隔太久不看,再经典的番的细节你也记不清楚,当时的感受也很难复刻,只有极少数对个人而言特别重要的才可以做到一点,试想你自己会不会有这种感觉就可以了。就像我现在去回顾我看得入宅番感到的是惊艳而不是想:哦,这种我见多了。
#14-5 - 2022-8-30 20:44
宿星雨
TheAnimePlanet 说: 统一回答
我承认你说的现象存在。但是热门番除了引来刷高分的也会有刷低分的(ly的1分是2分的6倍多),算是平衡了一点,甚至我觉得一些已经盖棺定论的经典老番的刷分情况会更严重。而且一部番能火起来必然是质...
至于低分的平衡,这点是有一定说服力,但是很难和10分9分数量对抗,前者至少是后者10倍,而且bgm对5分以后的处理并不是按平均分处理,尤其是data多的情况下,毕竟谁都知道1分只是情绪分,并不是真正参与评价的权重。
#14-6 - 2022-8-30 22:03
TheAnimePlanet
宿星雨 说: 至于低分的平衡,这点是有一定说服力,但是很难和10分9分数量对抗,前者至少是后者10倍,而且bgm对5分以后的处理并不是按平均分处理,尤其是data多的情况下,毕竟谁都知道1分只是情绪分,并不是真正参...
我说的质量相当是理论上的综合评价,并不是模仿跟风。简单来说,当一个老用户看过许多很震撼的番,以后的番就必须在震撼度上完全超越前面的才可能得到同样的评价。同样新用户被新的番震撼到打高分很正常,再看老的觉得不如新的也能理解。这种矛盾是无法解决的。
#14-7 - 2022-8-30 22:14
TheAnimePlanet
宿星雨 说: 针对你说的特别经典的涨分的情况其实我第一段要点里是提到了的,这点也是有目共睹,但是总的来说,我说它对评分机制的破坏不是说只针对新番的增加,在于这个评分带来的分值是不均衡分布的,这才是要点,而经典的番受...
当然还有新老观众的口味等等老生常谈的问题就不多说了,我的意思是两边的喜好都要尊重。只考虑老观众的评价对新宅同样没啥参考价值
#14-8 - 2022-8-30 23:33
Acylation
TheAnimePlanet 说: 当然还有新老观众的口味等等老生常谈的问题就不多说了,我的意思是两边的喜好都要尊重。只考虑老观众的评价对新宅同样没啥参考价值
从这个角度考虑挺不错的,收获很多,感谢
#14-9 - 2022-8-31 22:21
宿星雨
TheAnimePlanet 说: 当然还有新老观众的口味等等老生常谈的问题就不多说了,我的意思是两边的喜好都要尊重。只考虑老观众的评价对新宅同样没啥参考价值
emmm,都说了不是评分口味的问题,这种关于主观喜好差异在人群里应该是平均的,至少表现对于一部作品是,问题是新老用户体现出的评分差异不是基于喜好,而是基于我文中提到的理由,即“没有参照物”。
新用户本身观看面少,对它不了解的作品没有任何认识,更别谈喜好了。应该说是大众热度还差不多。

这个问题还是回到了个人主观性这个部分,我原文解释应该比较清楚了已经。关于两类用户在评分权重的差别在于对评分机制的理解和比较性的基础上。

即使按照你说的,那么不就变成了b站式的评分了么,这是没人希望看到的
#14-10 - 2022-8-31 22:22
宿星雨
TheAnimePlanet 说: 当然还有新老观众的口味等等老生常谈的问题就不多说了,我的意思是两边的喜好都要尊重。只考虑老观众的评价对新宅同样没啥参考价值
归根结底,你还是不理解文中所指的新老用户差异。
#14-11 - 2022-8-31 22:22
宿星雨
Acylation 说: 从这个角度考虑挺不错的,收获很多,感谢
从这个角度考虑,就是mal的现状。
#14-12 - 2022-8-31 23:25
TheAnimePlanet
宿星雨 说: emmm,都说了不是评分口味的问题,这种关于主观喜好差异在人群里应该是平均的,至少表现对于一部作品是,问题是新老用户体现出的评分差异不是基于喜好,而是基于我文中提到的理由,即“没有参照物”。
新用户本...
不不不,我当然理解。你主张造成评分差异的根本原因(下称A)是一些新用户的“非理性评分”(即缺少跟其他番剧对比的过程)。我的主张并非A不存在,而是A对评分的影响比你想象中小,而且可以接受。我另外也主张造成评分差异还有除了A以外的原因,即口味问题(下称B)和新老番剧的对比问题(下称C)。只是你似乎不同意B和C的存在。
#14-13 - 2022-8-31 23:41
宿星雨
TheAnimePlanet 说: 不不不,我当然理解。你主张造成评分差异的根本原因(下称A)是一些新用户的“非理性评分”(即缺少跟其他番剧对比的过程)。我的主张并非A不存在,而是A对评分的影响比你想象中小,而且可以接受。我另外也主张造...
b的问题其实就是a的问题
B 就口味差异  比如对百合剧情内在偏好,在人群总体可以认为是平均分布的  与用户的新旧关系不大   如果是这样的话那种口味问题差异带来的巨大统计差异的实质我想请你解释一下  另外这种分数的加成只针对我文中提到这些作品  就这部而言,如果认为是口味偏好,但是相同“口味”的其他番剧一样并没有得到这部分新用户的评分,也就是这种加成是有针对性的,再者,其实也和口味相关性很弱。 再进一步,你所谓的口味 不就是大众喜欢看什么代表了口味?跟播放量正相关的意思么,这种“不成熟”的口味并不能代表真正的口味,新用户的“独特口味”归根结底还是“不了解”其他种类而带来的无法定位比较的一种“个人认知局限”   
C你说新老番剧的对比问题指的是?,这里得到优势和没有优势的并不是其本身的水平完全决定的,而是很大程度由热度决定的
#14-14 - 2022-8-31 23:48
宿星雨
TheAnimePlanet 说: 不不不,我当然理解。你主张造成评分差异的根本原因(下称A)是一些新用户的“非理性评分”(即缺少跟其他番剧对比的过程)。我的主张并非A不存在,而是A对评分的影响比你想象中小,而且可以接受。我另外也主张造...
进一步解释,口味是一种个人偏好,而“新用户”在仅接触了“你所指的口味”后作出的评分,根本就不是一种个人偏好,没有对比,哪来的偏好?  
口味是对某种动漫类型的更喜欢,而我指出的并不单单针对一种偏好,是所有“新用户”的共同特征,难道你的意思是:这种偏好,即是对我所指的受益动漫全体的一种偏好? 受益动漫并不具有共同的属性特征 所以你这样解释是不具有相关性的。
#15 - 2022-8-30 19:03
(快乐荒废每一天)
尊老崇古是惯性,喜新厌旧是本能。不同的爱好彼此碰撞和融合,一切只能交给时间。(bgm24)

感觉明年、明年的明年、明年的明年的明年,反正总会有一年。直接来个连载rank10完结rank1的旷世神作,讨论版要炸开。
实际上就算是足够优秀和完美的作品,不经过时间的考验都抢不下rank1。


讨论版占满了,你们做得好啊(bgm38)
#16 - 2022-8-30 19:07
(哪个好看看哪个,没别的)
评分我感觉应该是看过了怎么打分都行吧
#17 - 2022-8-30 19:30
我还真就是因为bgm评分更客观才来注册这的。不然我来一个评分网站做啥?另外我还真特别想看“bgm精英”的评分榜,哪里有看?
说白了,评分网站不就是让大家来参考避雷选优的么。
全都乱打分,这站还有什么存在价值?
另外我觉得阅历多少只是楼主用来表达“是否相对客观”这个问题的一个观察和佐证,没有直接画等号。
#18 - 2022-8-30 20:04
評分是其次
你們寫點好的討論/觀後感吧
不要批評不得, 也誇不得
---
花錢捧過的作品本來爭議就很大, 基本沒人正經討論看番了
宣發覆蓋了基數不小的人群, 難免不會出現極端的評價, 然後宣發開始製造觀衆之間的對立保持熱度
對宣發來説下一個動畫的質量無所謂, 只要能輕易製造熱度, 以後還會繼續污染各種社區
#19 - 2022-8-30 20:35
首先想问一个问题:评分的意义是什么?是从绝对意义上衡量作品的“好坏”吗?先不谈这个“绝对好坏”的定义问题,至少我自己不觉得我能承受得起如此大任。在我看来,评分的意义在于让一个没有接触过这部作品的人能够对自己喜欢这部作品的程度有一个大致预期,说到底还是一个统计意义上的参考作用。
既然评分只是一个可供参考的统计数据,那么我们就应该考虑如何提高这个数据的可信程度。就我自己而言,我不希望把我自己接触过作品的分数普遍拉高或者拉低,所以我会尽量做一个线性变换,把我自己的个人评分平均值拉到和已有平均值大概一致。
就整体而言,我希望能有更符合我自己主观喜好的评分算法,比如尽量少的极端评分(包括情绪化、与作品无关评分、平衡党和个人打分平均分与样本的偏离),比如好友打分,甚至是不是可以根据在我自己已有的其它打分的基础上,由系统自动选出一些和我的偏好相近的人,通过他们在某部作品上的打分分布给出更具参考价值的数据?这些都是比起追求“客观标准”更有价值的方法。
所以,我不太想防止所谓“评分分裂”,毕竟我也不太相信,当对这个领域足够了解时,个体的主观偏好会逐渐收敛到同一方向。我希望做的是如何在分裂的评分分布中找到更加可供自己参考的数据。
#19-1 - 2022-8-30 20:48
宿星雨
本身已经指出很明白,是不同作品的相对排序,但是意义在于区间而不是具体顺序。
第一段就是文中提过的思想,是没问题的
你所说的评分分裂其实一种可能也可以被观测的现象,你可以重新看看文章的最后一段提供的定量分析方法。
还是希望有大佬可以帮忙爬一下准确的。

实际上除了bgm、批评空间这种收录范围比较专一、人群相似度比较高的网站,其他网站如豆瓣、vndb、mal都已经完全进入这种状态了。
#19-2 - 2022-8-30 21:05
不知如何取名
宿星雨 说: 本身已经指出很明白,是不同作品的相对排序,但是意义在于区间而不是具体顺序。
第一段就是文中提过的思想,是没问题的
你所说的评分分裂其实一种可能也可以被观测的现象,你可以重新看看文章的最后一段提供的定量...
我也清楚评分分裂的现状,但是我觉得这应该是评价网站壮大后审美多元化的必然结果。之所以对于一部分人来说,bgm评分的参考意义没有之前大,就是因为参与评分的人喜好不一定再与他的喜好高度重合。所以我觉得评分分裂是不可能也没有必要完全解决的。我的希望是在评分分裂的必然现实下,如何搜集到更加符合个体喜好的数据。
比如对于萌新来说,符合老宅口味的高分作品他们也不一定喜欢,反而是同为萌新(或者更进一步)的评价可以帮助他们更好的铺平入坑之路。我想要的就是这样的精准化评价体系。
#19-3 - 2022-8-30 21:20
宿星雨
不知如何取名 说: 我也清楚评分分裂的现状,但是我觉得这应该是评价网站壮大后审美多元化的必然结果。之所以对于一部分人来说,bgm评分的参考意义没有之前大,就是因为参与评分的人喜好不一定再与他的喜好高度重合。所以我觉得评分...
萌新的口味这种东西真的有么 那这里参考肯定不如b站热门参考性大 大概就是这种意思。
要么按作品本身评分,某某人群的口味这种东西,不就是玄学
#19-4 - 2022-8-30 21:36
不知如何取名
宿星雨 说: 萌新的口味这种东西真的有么 那这里参考肯定不如b站热门参考性大 大概就是这种意思。
要么按作品本身评分,某某人群的口味这种东西,不就是玄学
所以说“按作品本身评分”是需要评分标准的设定的,那么这个“设定权”归谁呢?如果归你的话我大概不会同意,归我的话你也是一样的,如果说归大众普遍评价的话那也挺玄学的……况且大众评价的参考性往往也不强,因为混有太多和自己不一致的喜好了。
至于萌新口味这种东西,我只能说我了解过一些婆罗门在萌新时代是可以看网管看得很开心的。况且我也只是就不同人的喜好偏差举个例子而已。
#19-5 - 2022-8-30 23:14
宿星雨
不知如何取名 说: 所以说“按作品本身评分”是需要评分标准的设定的,那么这个“设定权”归谁呢?如果归你的话我大概不会同意,归我的话你也是一样的,如果说归大众普遍评价的话那也挺玄学的……况且大众评价的参考性往往也不强,因为...
这个当然是靠用户自己的认识去评价,这样总体可以说就是理性的了,当然是在理解排行榜意义和相对性的前提下,所有经过理解的用户的data都是有效的,我想我文章应该解释的很清楚,建议看完整些。我的论点冲突点不在于标准,而是在于“不理解”相对性和排行榜意义的“新用户”
#19-6 - 2022-8-31 00:06
Acylation
这个的话,找到兴趣一致的班友,加好友看友评应该能解决一些
#19-7 - 2022-8-31 00:09
宿星雨
Acylation 说: 这个的话,找到兴趣一致的班友,加好友看友评应该能解决一些
这就不科学了……这个本身是一个没有操作性的办法。  况且友评也没有一个完整的排行榜 而且样本少行不通
#19-8 - 2022-8-31 00:12
Acylation
宿星雨 说: 这就不科学了……这个本身是一个没有操作性的办法。  况且友评也没有一个完整的排行榜 而且样本少行不通
那就直接推荐算法“猜您喜欢”(bgm38)
认真,能不能把用户分类了然后做每类用户自己的排名?
#19-9 - 2022-8-31 00:13
宿星雨
Acylation 说: 那就直接推荐算法“猜您喜欢”
认真,能不能把用户分类了然后做每类用户自己的排名?
唔……脱离了本文讨论范畴,并且操作性很差。
#19-10 - 2022-8-31 00:16
Acylation
宿星雨 说: 唔……脱离了本文讨论范畴,并且操作性很差。
好的吧╮(╯▽╰)╭
#19-11 - 2022-8-31 10:07
不知如何取名
宿星雨 说: 唔……脱离了本文讨论范畴,并且操作性很差。
其实还是有可行性的,毕竟bgm现在的评分样本并不那么多,动画分区大概不会超过1亿条,游戏区也就千万左右,这个量级的样本处理起来还是挺容易的。至于算法问题,根据与自己兴趣相近的人拟合新评分的方法肯定没必要一开始就实现最优,凭经验随便设几个参数之后再根据体验优化就可以,结果大概也比原始评分更有参考性
#19-12 - 2022-8-31 10:21
不知如何取名
宿星雨 说: 这个当然是靠用户自己的认识去评价,这样总体可以说就是理性的了,当然是在理解排行榜意义和相对性的前提下,所有经过理解的用户的data都是有效的,我想我文章应该解释的很清楚,建议看完整些。我的论点冲突点不...
我觉得可能是我们对于“有效”的理解不太一样,在我看来除了上面举例子说到的情绪化(比如情怀加成之类),与作品无关(比如制作组和人气、从众心理)因素,刷分,平衡党和均分与固有均分的偏离之外基本都是可接受的,比如阅番量和喜好的不同,比如对剧情/主题/人物/作画/配音/bgm/等维度的不同追求,甚至是作品中只有一点戳到自己导致给出好评,由这些因素引起的个人偏差,哪怕与已有样本偏差很大,对于总体来说也是值得参考的。当然对特定的人来说可能会使参考度下降,所以我在前面提到了希望能有更加精准化的评分系统
#19-13 - 2022-8-31 10:46
宿星雨
不知如何取名 说: 我觉得可能是我们对于“有效”的理解不太一样,在我看来除了上面举例子说到的情绪化(比如情怀加成之类),与作品无关(比如制作组和人气、从众心理)因素,刷分,平衡党和均分与固有均分的偏离之外基本都是可接受的...
这种完全根据用户调整的评分…… 我不知道能称它为什么    但是这肯定是没法实行的
#19-14 - 2022-9-24 18:53
宿星雨
https://bgm.tv/group/topic/345856
参考好友打分的想法这个可能有用
#20 - 2022-8-30 20:45
(0-0)
整理了自己想的几个点。
1.存有刷分小号,sai老板会定期清分,“新用户”说不准有多少是刷分的号,但以sai老板的理念,新号评分限制估计不会搞,所以对于清分的事情,选择相信sai老板就好。
2.喵哥在#13说的就很好,评分战争从有评分的时候就有了,以前bgm的评分也不比现在好到哪里去。
3.或者说,正是重视bgm评分的人多了,所以才会有评分之争,才会有刷分之举, 才会有出警之言。
4.评分是自由的,个人认为不该否定任意一部作品给某一个人带来的震撼,不应该否定这一个人因此对该作品给予的好评。每个人都有为自己喜欢的作品做出好评的权利,这些「理由」是很自然的。而如果评分变成了存有普世标准的「答案」,那个体的评分还具有意义吗?这样就不需要用户来评分了吧。
5.辉夜个人看来还是值得前五十守门员这个位置的,至于彼岸回转(莉可莉丝),还没完结前不急着下结论,评分也尚未稳定,不如等它「沉淀」一下?
姑且也提一下,契约之吻刚开播的时候才6.8,现在已经开始回升了,莉可莉丝现在相比开局也回跌了,至少现在bgm的动画评分生态还是合理的,它会一定程度上地自我调整,最终,至少在这些热门作品上会逐渐调和,这些作品也会得到自己的合适位置。所以更需要的是如何维护,促进好这一生态,而不需要过多的人为干预。
关于如何维护,楼上也有说,新人也在成长,而且对于bgm,新血液的流入十分重要,老用户也最终逐渐退圈,「小众狂欢的永恒乐园」是不可能也不必要的,所以等新人成长,等老人安心退圈,不就是「合理」的更替吗?社区少点键证钓鱼,少点出警对线,多些真诚交流的讨论,至少在我看来,已经足够了。毕竟该没落的时候总会没落,在此之前,它(bangumi)能达成它创立之初的理念已经很好的「终末」了。
#20-1 - 2022-8-30 20:54
宿星雨
正是因为有了这些应激反应,才使得得评分回归理性和正常成为可能,也是我所希望的,如果人人都不过问分数,没有关于这些的争议,就像各种大众的评分网站、豆瓣、mal一样,才会变得越来越圈地自萌。 希望我的文章起到了一定的帮助,那也不枉我花数个小时去构思和回复评论了。(bgm24)
#20-2 - 2022-8-30 21:10
aquarium
宿星雨 说: 正是因为有了这些应激反应,才使得得评分回归理性和正常成为可能,也是我所希望的,如果人人都不过问分数,没有关于这些的争议,就像各种大众的评分网站、豆瓣、mal一样,才会变得越来越圈地自萌。 希望我的文章...
你应该相信bangumi嘛,bangumi之所以是bangumi,并不是因为bangumi这个网站,而是它的用户群体让它成为了bangumi,喜欢这里氛围的人自然会留着点格子,不喜欢的也呆不长久,毕竟在网络上缺的从来不是社区,谁都可以来,谁都可以走。所以还是可以认为能长期留在这里的,就已经能融入bangumi的评分体系了。那种很极端的人在这里留不久的…社区的大家又不是不能分辨那些人。而且它还有小众这一层保护膜,一般而言还是够靠谱的。
#20-3 - 2022-8-30 21:31
宿星雨
aquarium 说: 你应该相信bangumi嘛,bangumi之所以是bangumi,并不是因为bangumi这个网站,而是它的用户群体让它成为了bangumi,喜欢这里氛围的人自然会留着点格子,不喜欢的也呆不长久,毕竟...
你这么一说我就安心多了(bgm24)
#21 - 2022-8-30 20:49
(你们脑子里是只有糖刀雷屎吗)
关于评分行为的解说很完备了,不过还是有三点不吐不快。
不过我担忧的是这样的程度会加剧(已经在了,相比以前,肉眼可见争吵的多而且分歧大),ly的商业化成功如果还附带了好名声,岂不是再鼓励行业向这个方向发展,简单的经济学原理之人对刺激会做出反应。
第一点,想必没有商业公司会受bgm评分刺激而做出反应。能刺激行业的是点击量,销量,转播权,周边。
第二点,你所担心的事情:其一,已经发生了,参考ly碟片销量预测;其二,过去也一直在发生,日本动画业界本就是得社区者得天下,病毒式传播永远有用,过去的名作靠这种手段成功的也大有人在,只是那时传播的发生场合可能不是社交媒体或短视频。
第三点,我疑惑你为什么坚持认为踢屁股是一个很恶俗的演出,我觉得这是直观展现她们二人性格与关系性的一个颇巧妙的设计。(bgm39)
#21-1 - 2022-8-30 20:58
宿星雨
第一点和第二点,口碑虽然不是短期的决定性因素,但是长期来说它不亚于传播的重要性。
第三点,可能是因为单纯这个东西传播力太强,防不胜防,看到太多以至生理性不适。
#21-2 - 2022-8-30 21:24
k酱
宿星雨 说: 第一点和第二点,口碑虽然不是短期的决定性因素,但是长期来说它不亚于传播的重要性。
第三点,可能是因为单纯这个东西传播力太强,防不胜防,看到太多以至生理性不适。
你三点才是你的重点吧
#22 - 2022-8-30 21:11
蒜不需要bgm的证明它的含金量
而一部分人需要bgm来证明自己的含金量
#22-1 - 2022-8-30 21:18
k酱
bgm顶天也就是个评分网站,评分有高有低很正常,你不喜欢蒜,觉得蒜这么一般般能火成这样心里难以接受,觉得不值得这个分数,然后为此开始各种辩证分析,然而评分的事也不是你一个人能控制的了的,这是bgm用户打分的综合结果。
#22-2 - 2022-8-30 21:26
k酱
k酱 说: bgm顶天也就是个评分网站,评分有高有低很正常,你不喜欢蒜,觉得蒜这么一般般能火成这样心里难以接受,觉得不值得这个分数,然后为此开始各种辩证分析,然而评分的事也不是你一个人能控制的了的,这是bgm用户...
我就放狠话,再过几年bgm的评分机制就和豆瓣评分一样,你越较真就越显得你搞笑
#22-3 - 2022-8-30 21:28
宿星雨
k酱 说: bgm顶天也就是个评分网站,评分有高有低很正常,你不喜欢蒜,觉得蒜这么一般般能火成这样心里难以接受,觉得不值得这个分数,然后为此开始各种辩证分析,然而评分的事也不是你一个人能控制的了的,这是bgm用户...
对,毕竟你的眼睛里永远只有蒜,但是我连蒜这个代称怎么来的都懒得了解也不愿了解,只能说你开心就好。
#22-4 - 2022-8-30 21:32
k酱
宿星雨 说: 对,毕竟你的眼睛里永远只有蒜,但是我连蒜这个代称怎么来的都懒得了解也不愿了解,只能说你开心就好。
你写这么多分析不就是质疑蒜吗?配不上7.7,觉得蒜的7.7分拉低了bgm作为国内动漫第一评分网站的b格吗?得了吧,bgm的精神股东
#22-5 - 2022-8-30 21:33
宿星雨
k酱 说: 你写这么多分析不就是质疑蒜吗?配不上7.7,觉得蒜的7.7分拉低了bgm作为国内动漫第一评分网站的b格吗?得了吧,bgm的精神股东
你开心就好,随便怎么想
#22-6 - 2022-8-30 21:37
k酱
宿星雨 说: 你开心就好,随便怎么想
谁不知道打分就是很主观的东西?那我问你如果你喜欢蒜你还会这么长篇大论写这么多东西来分析什么所谓评分机制,本质上就是因为你不喜欢这番
#22-7 - 2022-8-30 21:39
k酱
宿星雨 说: 你开心就好,随便怎么想
同时还是bgm的精神股东
#22-8 - 2022-8-30 21:49
k酱
宿星雨 说: 对,毕竟你的眼睛里永远只有蒜,但是我连蒜这个代称怎么来的都懒得了解也不愿了解,只能说你开心就好。
我还喜欢《渣愿》呢,翻了评分还觉得bgm分低了,仔细想想但也没觉得什么大不了得,那我也没有向您这样长篇大论的分析什么评分机制。评分什么有这么重要吗?我管你评分网站上打几分,老子我自己喜欢看才重要。lz你还是太闲了,找点事情做做吧
#22-9 - 2022-8-30 22:07
k酱
宿星雨 说: 你开心就好,随便怎么想
“达不到7.7 我质疑的只是这个”
“ 这种踢屁股的表情包流传这种广 以至于我躲都很难躲的一种抱怨 所以我讨厌它 但不代表我对这部作品本身评价会非常低 那也就是 一般 但名不副实 而且宣传很讨厌  和spy family这种过度宣传的我一样讨厌”
这些可都是你说的哦,我可没觉得你喜欢蒜
#22-10 - 2022-8-30 22:12
星空17
bgm评分豆瓣b站化不就是不在乎评分的人导致的吗?bgm更热门的动画都免不了评分争议。如果以后热门动画不像这次是你喜欢的你还能像这次这么说吗?当然你说太针对蒜那可能是有的,毕竟蒜也是它的优点所在的。
#22-11 - 2022-8-30 22:21
Acylation
k酱 说: “达不到7.7 我质疑的只是这个”
“ 这种踢屁股的表情包流传这种广 以至于我躲都很难躲的一种抱怨 所以我讨厌它 但不代表我对这部作品本身评价会非常低 那也就是 一般 但名不副实 而且宣传很讨厌&nb...
嘛消消气,喜欢或者不喜欢一部番都是很正常的,楼主明确说了自己不喜欢的理由,归为主观因素而并不是在阴谋论解释蒜的大热,这其实是比较客观的讨论态度了,可以再看看第九层的交流。

基于这样的态度,讨论当红热番是否存在分数虚高现象以及如何解决、维护评分生态才是楼主关心的,这一点与是否喜欢蒜并没有直接联系。虽然确实,会不会太认真了点?

我挺赞同评分就只当参考参考的,评分高低的确不会影响我对一部番剧的喜欢与否。冒昧回复,见谅
#22-12 - 2022-8-30 22:34
k酱
Acylation 说: 嘛消消气,喜欢或者不喜欢一部番都是很正常的,楼主明确说了自己不喜欢的理由,归为主观因素而并不是在阴谋论解释蒜的大热,这其实是比较客观的讨论态度了,可以再看看第九层的交流。

基于这样的态度,讨论当红热...
是否存在分数虚高现象以及如何解决、维护评分生态,这种都是不是靠时间来表现吗?是靠它这种bgm的精神股东就能决定的吗?
#22-13 - 2022-8-30 22:38
k酱
星空17 说: bgm评分豆瓣b站化不就是不在乎评分的人导致的吗?bgm更热门的动画都免不了评分争议。如果以后热门动画不像这次是你喜欢的你还能像这次这么说吗?当然你说太针对蒜那可能是有的,毕竟蒜也是它的优点所在的。
那你也不能拦着这些人不评分啊,都是bgm的用户还有什么高贵之分吗?真当自己是精神股东了。
#22-14 - 2022-8-30 22:38
宿星雨
k酱 说: 是否存在分数虚高现象以及如何解决、维护评分生态,这种都是不是靠时间来表现吗?是靠它这种bgm的精神股东就能决定的吗?
难道我发表意见就不是让时间解决?我说过我要自己解决?谁强迫你了?
人人都做木头人,世界会更美好?
不正是有愿意去思考去影响去改变,问题才会解决?
随便扣帽子显得你rz而不是我
别回复了已经屏蔽了 眼不见心不烦
#22-15 - 2022-8-30 22:39
宿星雨
k酱 说: 是否存在分数虚高现象以及如何解决、维护评分生态,这种都是不是靠时间来表现吗?是靠它这种bgm的精神股东就能决定的吗?
谁拦着你了,中文都看不懂建议回炉重造。
#22-16 - 2022-8-30 22:41
k酱
宿星雨 说: 谁拦着你了,中文都看不懂建议回炉重造。
你越在乎什么评分争议不争议,配不配7.7,就越显得你幼稚。
#22-17 - 2022-8-30 22:50
k酱
星空17 说: bgm评分豆瓣b站化不就是不在乎评分的人导致的吗?bgm更热门的动画都免不了评分争议。如果以后热门动画不像这次是你喜欢的你还能像这次这么说吗?当然你说太针对蒜那可能是有的,毕竟蒜也是它的优点所在的。
我难道看番不是按照自己的口味的标准,难道是要靠什么评分?执着于评分网站的权威,把评分当做圣经的人,不是更搞笑么?
#22-18 - 2022-8-30 23:00
k酱
宿星雨 说: 谁拦着你了,中文都看不懂建议回炉重造。
除非bgm倒闭,按照国内这环境,国内评分网站的宿命都是豆瓣爱优腾评分,光靠你在这里发个帖子没什么卵用,只是可笑挣扎罢了。你真想改变,还不如直接去bgm上班
#22-19 - 2022-8-30 23:09
星空17
k酱 说: 是否存在分数虚高现象以及如何解决、维护评分生态,这种都是不是靠时间来表现吗?是靠它这种bgm的精神股东就能决定的吗?
完全按照个人喜好,那lz因为不喜欢蒜发帖不是也行吗?(bgm38)另外为啥讨论评分现象评分生态就是bgm精神股东了,bgm甚至还有讨论评分的小组呢。
#22-20 - 2022-8-30 23:15
k酱
星空17 说: bgm评分豆瓣b站化不就是不在乎评分的人导致的吗?bgm更热门的动画都免不了评分争议。如果以后热门动画不像这次是你喜欢的你还能像这次这么说吗?当然你说太针对蒜那可能是有的,毕竟蒜也是它的优点所在的。
光靠评分网站的评分来参考避雷选优的人,本质上是对自己艺术鉴赏能力的不够自信。
#22-21 - 2022-8-30 23:24
k酱
星空17 说: 完全按照个人喜好,那lz因为不喜欢蒜发帖不是也行吗?另外为啥讨论评分现象评分生态就是bgm精神股东了,bgm甚至还有讨论评分的小组呢。
行啊,他发帖质疑7.7,我可以回复质疑他啊,我又没有禁言他。不是精神股东会这么维护bgm作为国内第一动漫评分网站的权威吗,谁会这么闲纠结一个小众网站(嗯,二次元的确是大众)的评分机制?小组不是更是精神股东了吗?这你们帮精神股东不去bgm总部干活真是太可惜了。的确,蒜在你们这群精神股东、动漫高手眼里是烂,是不行,是不配7.7
#22-22 - 2022-8-30 23:30
Acylation
k酱 说: 是否存在分数虚高现象以及如何解决、维护评分生态,这种都是不是靠时间来表现吗?是靠它这种bgm的精神股东就能决定的吗?
这一点在1、2楼已经充分交换过意见了,是这样没错。大家有不同意见很正常,还是先耐心沟通交流为好

说实在的蒜讨论版那些钓鱼贴才该猛冲,这贴还行的其实
#22-23 - 2022-8-30 23:36
k酱
Acylation 说: 这一点在1、2楼已经充分交换过意见了,是这样没错。大家有不同意见很正常,还是先耐心沟通交流为好

说实在的蒜讨论版那些钓鱼贴才该猛冲,这贴还行的其实
你都说是钓鱼帖了,发帖的人都心怀鬼胎,我何必浪费时间给他们增加热度?bgm精神股东聚会是挺行的
#22-24 - 2022-8-31 13:59
时间溯行双鱼GUYS
内容已被用户删除
#22-25 - 2022-8-31 21:50
星空17
k酱 说: 行啊,他发帖质疑7.7,我可以回复质疑他啊,我又没有禁言他。不是精神股东会这么维护bgm作为国内第一动漫评分网站的权威吗,谁会这么闲纠结一个小众网站(嗯,二次元的确是大众)的评分机制?小组不是更是精神股东了吗?这你们帮精神股东不去bgm总部干活真是太可惜了。的确,蒜在你们这群精神股东、动漫高手眼里是烂,是不行,是不配7.7
为啥讨论评分机制就是精神股东了?别的网站照样会有讨论评分的人。我是不是可以恶意揣测你是百合厨所以才不满lz讨论莉可莉丝评分的,lz要是换个例子怕不是就不会这么说了吧。
#23 - 2022-8-30 21:23
(信仰是为了虚幻之人)
10年后还会这么觉得吗?
#23-1 - 2022-8-30 21:29
宿星雨
和时间没有关系,请注意我段落中关于新老用户的区分并不是时间的区分。
而究竟这种问题会怎么样,就谁也说不清了。
#23-2 - 2022-8-30 21:39
永夜寒星
宿星雨 说: 和时间没有关系,请注意我段落中关于新老用户的区分并不是时间的区分。
而究竟这种问题会怎么样,就谁也说不清了。
鉴赏水平有顶点吗?二次元有尽头吗?评分在变化吗?争论有终结吗?人群在移动吗?环境在变迁吗?在意的东西在改变吗?答案确实不唯一。青山依旧在,几度夕阳红。古今多少事,都付笑谈中
#24 - 2022-8-30 22:17
(不同事物应该适用不同评分标准 ... ... ... ... ... . ...)
仅针对新老用户评分问题,我觉得这大概要改评分算法和排名机制才能一定程度解决,像豆瓣不就有类似的算法。但这问题是没法完全解决的。
#24-1 - 2022-8-30 22:27
宿星雨
豆瓣的算法再好也没用 比如图书类   各种不同类型的书的评分完全不能相互比较,因为评分的用户群体可以说完全不一样   电影同理,因为类型实在跨度太大了,这种全年代排名只能说真的就是笑一笑算了。 用印象分:好/不好 理解豆瓣评分比较有用。
#25 - 2022-8-30 22:22
(Shaft & P.A.works 粉)
观点认可
个人觉得,阅片量设限这个东西,利大于弊,得设置
不过大家也有了另一种解决,就是彼此都只和拥有一定阅片量/观赏速度的用户交流
这样直接过滤掉很多的弱、浅、短

我设置的话会是——100部以下免谈、打分分布不是近似正态分布的免谈
#25-1 - 2022-8-30 22:30
宿星雨
一定的积累对于评分而言还是必要的,可以先让新用户评评不计入真实值,然后慢慢用算法解决这种问题,不过技术上还是几乎不可能的就是了。。
#26 - 2022-8-30 22:33
(Wir müssen wissen, wir werden wissen.)
樓上似乎也有提到了,bgm 不是一個純粹的廣場。點格子和排行榜到底哪個更重要是有分歧的。由此不如說 bgm 的排行榜本身就有反映近期觀眾趨勢的作用,除開清理明顯惡意刷分外,更多限制可能不一定能起到正面效果。

至於「專業性」的排行榜,相信閲片量上去的各位一定早就在心裡有個準了。(bgm39)而有些連評分高低的「相對參考價值」都不明白的人,bgm 本來也沒給他們有什麼大幫助吧。
#26-1 - 2022-8-30 22:42
宿星雨
是的,wiki和点格子也是重要一个组成部分,不过还是很大程度依赖于排名这个搜索入口的。另外bgm的wiki实质介绍信息总觉得是不是有点少,简洁确实也简洁。
#26-2 - 2022-8-31 02:44
Brethland
宿星雨 说: 是的,wiki和点格子也是重要一个组成部分,不过还是很大程度依赖于排名这个搜索入口的。另外bgm的wiki实质介绍信息总觉得是不是有点少,简洁确实也简洁。
主要還是搜索做得差,wiki 可以改善的感覺是關聯性展示,除了列表呈現還可以做 Graph。內容豐富度就不是設計問題了,而且有些比如現實人物本來就沒多少信息(bgm38)
其實這些設計問題去 Github 提 issue 好了(x
#27 - 2022-8-30 22:40
虽然我玩bgm不多,但是我也很容易注意到一点,那就是bgm本质上是作为一个大众的用户评分网站而存在的。我不想讨论你提及的改进方法正确与否,但我想这大概率是收效甚微的。用户评分不应有同意标准,不然为什么不直接去看媒体评分而来看bgm这种大众的用户评分?依我所见媒体评分完美符合你的要求。

对于新用户涌入导致评分上升的论点我也无法苟同。所谓的平衡党给番剧刷一星的也比比皆是,那么你如何量化两者对于番剧所谓客观分数的影响呢?如果给石蒜打十分是过激,那平衡党刷一星不是跟过激得多(一个人抵两三个刷高分的)。

因此在此我提出一个暴论,就像亚当斯密看不见的手一样,每个人的主观评分最终很大程度上可以代表番剧应得的分数(当然前提是评分人数足够多)。
#27-1 - 2022-8-30 22:48
宿星雨
不是,你说电影有视与听这种顶级权威基于电影专业手法的去评价我也就认了,不过问题来了,动漫哪有这种媒体评分? 就算有,这肯定也算不上不是用户评分的一个替代方案,至于原因……我实在不想解释,十分显然。
关于平衡的影响,我在上面几楼有讨论,你可以再看看。
看到你的第三点,你甚至完全没看到我的中心论点……连读完了原文没都怀疑
我简单回答下吧,你这个第三点本质上我是认同的,但是问题是,“新用户”的特殊性很大程度是由于对基本共识的缺乏引起的,不能放入一起加以讨论。
#27-2 - 2022-8-31 00:10
1ra
+1,第一和第三点非常认同
#28 - 2022-8-30 23:42
(灵光乍现。)
其实我早就想说了,不过后来我想了想,bgm本来就不是个专门用来评分的网站,对评分的要求本来就没有设置任何限定,所以任何人按照自己的标准,或者标准没有的就纯靠喜好进行评分,这样评出来的分本来就一定程度上偏离了作品本身质量的鉴定,更多的还是反应一段时间内的群体爱好趋势罢了,更不要说还有刷分党的存在,要说客观性缺失的话从头到尾古往今来一直都是缺失的。所以追求客观和真实当然是可以的,但是在bgm这里追求就有点痴人说梦了,bgm只是用于acg爱好者来记录自己看的东西的地方,不设限的点格子和自己选择给自己想给的分才是bgm本来的样子,bgm的排行榜也不过是对此进行统计罢了。所谓的含金量其实是观众自己对比了几个网站后选出来的,但bgm并不是为此而生。
楼主的想法很好,但是发在这里肯定是要挨一些人骂的,因为很多人本来就是评着玩儿的还能从中获取满足感,不想动脑子思考的,bgm的个人评分本就是自觉遵守,乱评也没人管你,评的价值高低也没人管你,直观地来说就是“礼仪”而不是“法律”,你在这里进行法律条框式的约束就必然会被遭到乐子人的追击。
另外这个帖子其实更适合发在评分与排名讨论小组里面而不是这里。
#28-1 - 2022-8-31 00:02
宿星雨
唔,你这么佛系理解当然也行,不过我认为评分可能是bgm的核心价值,维持这种价值其实也是很重要的
至于发在小组里…唔,其实一开始我是想的,但是小组话题的展示度太低,不利于传播,所以权衡利弊选择了这里。
#28-2 - 2022-8-31 10:33
小琉璃吃粽子
我觉得评分还是没那么随意的。。至少你很喜欢一个东西,如果是b站那种满意程度调查的话就给“5”就行了,但bgm的9和10是代表着神作和超神作,不过不是就是5了,怎么都不至于为了自己的喜好完全忽略客观因素无脑打个4以下和9以上吧。。
#28-3 - 2022-8-31 14:13
小豆hzj
小琉璃吃粽子 说: 我觉得评分还是没那么随意的。。至少你很喜欢一个东西,如果是b站那种满意程度调查的话就给“5”就行了,但bgm的9和10是代表着神作和超神作,不过不是就是5了,怎么都不至于为了自己的喜好完全忽略客观因素无脑打个4以下和9以上吧。。
你能这么想说明你是个正常人,但是bangumi可没有筛选正常人的机制,魔怔人还是有不少的,现在的系统限制相对自由所以其实一定程度上是在放任他们为所欲为。
#29 - 2022-8-30 23:47
这个问题有意思,等我程序爬完数据比对一下收藏数不同的用户评分差异,虽然收藏数目并不能等同了解程度,很多人不补标的
不到100行的python写了俩小时,还是单线程贼慢
#29-1 - 2022-8-30 23:58
宿星雨
其实你可以看出,或多或少都有一个“评分水平”在里面,有些人的标的少真的是因为懒得标,有些人是因为真的只看过这些了! (或许从标记作品类型等可以比较清晰的看出来)

但是,我这个帖子主要还是集中在“新用户”的评分偏好上,包括针对某部具体分数是否偏高,以及个人总体评分是否都会好评以及评价的番是不是不是近期热门就是老牌经典。
#29-2 - 2022-8-31 02:48
Brethland
這個好耶,期待樓主的數據
#29-3 - 2022-8-31 21:33
宿星雨
Brethland 说: 這個好耶,期待樓主的數據
有人已经爬了数据了,放在文章上面了,你可以看看,其他数据还在统计。
#29-4 - 2022-8-31 23:34
腾文鱼
宿星雨 说: 有人已经爬了数据了,放在文章上面了,你可以看看,其他数据还在统计。
我昨晚爬了辉夜三,蒜,终物语和蜂蜜与四叶草(排名接近)的收藏人数以及每个人点格子的总数然后摸鱼一天
我自己不太擅长分析,有需要的话可以发出来
#29-5 - 2022-8-31 23:43
宿星雨
腾文鱼 说: 我昨晚爬了辉夜三,蒜,终物语和蜂蜜与四叶草(排名接近)的收藏人数以及每个人点格子的总数然后摸鱼一天
我自己不太擅长分析,有需要的话可以发出来
你可以简单处理下做成表然后发图片出来,或者把数据放网盘私信给我吧,我帮你处理下。
#29-6 - 2022-9-1 23:42
腾文鱼
宿星雨 说: 你可以简单处理下做成表然后发图片出来,或者把数据放网盘私信给我吧,我帮你处理下。
图片和原始数据
https://bangumi.tv/blog/312654
#29-7 - 2022-9-3 08:38
宿星雨
腾文鱼 说: 图片和原始数据
https://bangumi.tv/blog/312654
刚刚看到,已经把原文链接和内容加进去了,不过现在感觉楼太高已经没什么人愿意认真看了emmmm。
#30 - 2022-8-30 23:55
(一个普通的acg爱好者)
先mark一下,楼主讲的绝大部分都让我非常认可
说一下我自己的看法,我认为动画评分的在于,个体用评分反映自身对作品的评价,而统计出来的评分则能够用数据反映作品的口碑,并能在一定程度上反映作品质量,以此能提供参考、便于对不同作品之间优劣的比较与分析。
评分终究是对于用户评分的统计,它的系统构成由用户整体上的评分习惯所决定。
一个个别的用户,他的评分,他的评价习惯,总的来说是由两个方向构成,一个是初级的直观的主观感受而获得的“喜爱”,一个是高级的经过理性分析的“优劣”。这两种都能反映作品质量,但是有效的程度不同。前者并不需要对作品的清晰认知,只需要模糊的感受,它参杂着过多的瞬时的主观性。而后者则要求清晰认知作品,对作品给予分析,它要求剔除多余的主观性。绝大部分人在评分是不可能完全剔除喜好的影响,事实上上也没必要,我认为只要“理性分析”在评分时起了重要的影响,这个评分就有了足够的价值,不过拥有以“理性分析”为主导的个别评分越多,这个作品的评分自然越有价值。
“理性分析”需要用户有一个评价标准,这个评价标准现在不需要统一也不可能统一,个别的评价标椎之间有着各种差别与矛盾,但是在一定数量的评价累积后,评价的个别性会被消解,而愈发体现出整体的共通性,从而得到一个有足够价值的评分。
两个方向的评分习惯的矛盾,产生了站在两大方向上的用户对评分结果的质疑。

不过,除了由评价根据不同外,部分新用户(或非用户)对于bangumi不同评分所指代的作品评价高低的错误认知(一个极端例子如认为Bangumi的10分和B站5星一样不值钱,bangumi评分9.2和B站一样)而产生的一系列争议,都是没意义的,并且一律错在有这样错误认知的人上。
#31 - 2022-8-31 00:16
(尝试减肥中)
我的评分和评价大多是自己回顾和给别人观前心理预期用。不如说推荐力荐这种词就该这么用吧
只能安慰你放松,谁没看过“年轻人的第一部XXX”,时间长了自然会趋于合理。纠结评分不如多花点钱给自己喜欢的动画。在BGM不管打一星还是十星制作组都不会少挣多挣1毛钱。
顺便不乐意你这文章的,照样甩个9分10分拍屁股走人,说他们还嫌你事儿逼。
#32 - 2022-8-31 00:47
楼主对蒜的分数影响预估有点准啊,刚看了下科学排名截止8.14号蒜排1350位,而bgm的1350位正好就差不多是7.3分(bgm38)
#32-1 - 2022-8-31 01:15
宿星雨
你也看了这么多番,具体一部作品有什么水平和在经过横向对比后在bgm的评分大概还是看得出的吧。
#32-2 - 2022-8-31 01:44
银毛熊
宿星雨 说: 你也看了这么多番,具体一部作品有什么水平和在经过横向对比后在bgm的评分大概还是看得出的吧。
看了下你给蒜标的吐槽箱,我想说的是bgm的rank和分数本身并不会有所谓亚当斯密说的那手那么神奇,因为每个条目的评分“评委”不同这种水分根本就无法通过自我调节消解掉。如果蒜哪天bgm分数掉到7.3到7.4这样,真实水平(科排)恐怕得掉到两千去了,水分还是在。具体原因我之前在辉夜3类似条目讨论区说过,我非常自信同时看过【日常】和【辉夜3】的人里均分会是前者高所以前者科排必比后者强,但后者的bgm分数也不会自我调节到总有一天降到【日常】以下,那些又认为【辉夜3】分数虚高又认为往后它会降下来的“贷款掉分”永远还贷日(除非有场外比如赤坂乱搞大新闻这些非动画本身元素介入)
#32-3 - 2022-8-31 07:54
宿星雨
银毛熊 说: 看了下你给蒜标的吐槽箱,我想说的是bgm本身的rank和分数本身并不会有所谓亚当斯密说的那手那么神奇,因为每个条目的评分“评委”不同这种水分根本就无法通过自我调节消解掉。如果蒜哪天bgm分数掉到7.3...
是的,这本身是由于不那么具有合理判断用户即“新用户”的介入导致的评分相对性失效的情况,所以除了直接使用算法过滤,bgm的评分自我调节很难消除这个影响。这也是我写这篇文章的意义

(至于说我吐槽箱的,并不是我认为一定会降到7.3-7.4,不过大量用户进入平衡后分数肯定还是会降一些的)
#33 - 2022-8-31 01:21
在评分10分时有个“请谨慎操作”的提示,但并不知道会有什么影响。如果是要基于“相对专业的评分网站“这一概念进行建设的话,其实可以考虑设置类似”季度/年度新番只允许给一个10分计入评分统计“这种操作的。
一般而言旧番/gal评分波动不会太大,但近年来确实有上涨趋势

(虽然但是,bgm我一开始也是听说国内相对靠谱的评分来找旧番补的,(bgm93)

把bgm视作论坛互撕也好,填格子游戏也好,婆罗门评分网站也好都没问题,但刷分、警察和反警察确实挺影响心情的。评分问题可以考虑提取特征进行算法分析,给出筛选前和筛选后评分。
#34 - 2022-8-31 02:48
太把自己当回事
#35 - 2022-8-31 03:27
(罪名:毒害年青人的心灵)
评分网站改变不了社会思潮,如果二次元的饭圈化是注定的,评分的极端化是注定的,修改权重就没意义。如果我是站长,我会选择欺骗公众,给假指标。同时淡化评分,突出评论区。
#35-1 - 2022-8-31 07:57
宿星雨
二次元的xx化和我们这种小众社区关系没那么大,评分极端化当然不是注定的,我也不认为修改权重是本质方法
我提出的针对这种“新用户”影响的本质方法是入站前关于评分体系的一个“强制”科普,具体参考文中内容。
#35-2 - 2022-8-31 23:47
Faumeplder
宿星雨 说: 二次元的xx化和我们这种小众社区关系没那么大,评分极端化当然不是注定的,我也不认为修改权重是本质方法
我提出的针对这种“新用户”影响的本质方法是入站前关于评分体系的一个“强制”科普,具体参考文中内容。
事实上的打分主力大部分根本不看讨论版,文章里的分析也已经被很多人得出过了
当代大众评分作为一个与热度和舆论高度相关的指标,评分分析作品好坏已经和热度分析作品好坏差距不大了,后又因为评分的可操控性,就是会造成两部作品粉丝互刷的极端情况(IMDB的教父,黑暗骑士,MAL的巨人,钢炼,还有早到00年代的ANN上CL,浪客剑心互刷,更甚至是去年的牛仔攻壳互换Rank 1时也有小规模的对刷),而最近又出现了MAL那样因为钢炼粉太倡狂导致所有作品粉丝给辉夜3刷高分冲顶的混乱现象。
龙说的“欺骗公众,给假指标。同时淡化评分,突出评论区”这种做法确实有网站这么干了
俄语区的Shirione就是前些年把分数和排名换成了MAL的,但用户的评论与单个评分保留,用户也并没有严重流失,反倒是俄语区另一个更注重的评分的world-art一直在人数流失,记录式网站的评分对用户吸引力/讨论的影响真没这么大
#35-3 - 2022-8-31 23:52
宿星雨
Faumeplder 说: 事实上的打分主力大部分根本不看讨论版,文章里的分析也已经被很多人得出过了
当代大众评分作为一个与热度和舆论高度相关的指标,评分分析作品好坏已经和热度分析作品好坏差距不大了,后又因为评分的可操控性,就是...
bgm也不是人越多越好  喜欢这套既有传统的留下来不就好了  既然按流量评分的地方多的是 为什么这部分人还来看bgm,不是多此一举么。
事实上bgm的核心吸引力和特点就是目前还相对客观有比较性的排行榜机制

虽然不是bgm社区的强制要求,但是我认为大部分用户在这里的很大原因还是这一点
#36 - 2022-8-31 03:33
说到底现在动漫圈就跟饭圈没啥区别 可能重合度也挺高的 没人在意哥哥的作品质量 哥哥长得帅就行了 蒜的剧情也没那么重要 看百合贴贴就完了

我估计你认为的打分应该是以剧情为主 综合考虑各方面给出的评分 但是对现在很多人来说 剧情其实没那么重要 时代变了 打分的规则也变了 没啥意外的

另外你说的让评分合理化的理想基本无法实现只会越来越偏 我认为暂时比较实际的做法是 应该先看标签再看评分 同一大类标签下的才有相互比较的意义 如果标签像百合之类 饭圈众多的标签  横向对比的时候心理预期降个一分就行了
#37 - 2022-8-31 05:19
(この勝利を、近所のおばさんに捧げる! ... ... ... ... ...)
“bgm是个评分网站”

一整楼扫下来最让我惊讶的是这个观点被好几个人当作理所当然

当年入BGM的时候主要吸引的要素是点格子、wiki、日志/评论交流(评价性质的文章少、多是同好发掘作品细节这一类的),十几年了也没发现分有什么用

有机会可以统计一下,多少活跃用户真的在意评分
#37-1 - 2022-8-31 07:46
宿星雨
就算不仅仅有这个功能,也是bgm的一个核心价值和竞争力。
#37-2 - 2022-8-31 07:56
Kane
宿星雨 说: 就算不仅仅有这个功能,也是bgm的一个核心价值和竞争力。
可能吧,我也能理解在乎的人想要认真讨论一下这个问题的心情

只是现在热门讨论全是评分、评分、评分,不管是出警还是meta-level的讨论。以前看热门讨论看的是对各种作品内容的吐槽,有的时候片子自己不看也能看别人讨论看个热闹。现在这个模块完全失去这方面价值了,我直接折叠了

顺便
很少打出低分,不喜欢的作品很少去评价,喜欢的则打9-10分
哦这说的就是我了(bgm37)
#37-3 - 2022-8-31 07:59
宿星雨
Kane 说: 可能吧,我也能理解在乎的人想要认真讨论一下这个问题的心情

只是现在热门讨论全是评分、评分、评分,不管是出警还是meta-level的讨论。以前看热门讨论看的是对各种作品内容的吐槽,有的时候片子自己不...
emmm,实际上真正在意分数人的只是一小部分,其他人只是粉黑大战或者凑热闹之类的    这其实是一种极端化的情况吧   我也不怎么喜欢。
#38 - 2022-8-31 10:49
我也觉得bgm的趋势就是这样的(之前四月在战吧讨论这个热度高了好像还被删了),基本上属于是没有办法阻挡的趋势,比如很多新番刚出时甚至能够出现评分10大于评分9的现象(过于不合理了),虽然没完结的评分也说明不了全部问题,不过也反应了确实存在部分完全只凭喜好打分的人吧。
然后我觉得bgm评分好一点的地方就是每个评分下都说出了标准,比如9、10为神作和超神作,5就为不过不失了,所以评价一部动漫就不能完全的只凭自己的“观感”来打分了,比如我不是很喜欢动漫的间谍过家家(漫画到挺喜欢的),但是打分的时候怎么都无法说服自己把他打到7以下(制作确实好),比如我很喜欢路人女主,毕竟有入宅时期的滤镜加成,但是也确实没办法给他的第一部很高的评价。
总的来说就是我还是认为评分应该是需要有意义的,个人喜好能够影响评分,但是最多只能有个1分左右的加成,至于极端高分和极端低分我认为更是需要深思熟虑的,既然你在这个体系下评这种分,那还是应该多少背负些心理负担而不是完全图一乐吧(bgm38)
#39 - 2022-8-31 11:51
(似水流年的虚无)
这果然不是高中生,研究生读几年了(bgm39)
#40 - 2022-8-31 12:03
(・ω< )⭐️★☆)
楼主观点基本认同(bgm07),给蒜的估分也和我一致。个人看来:辉夜S3,包括本季的来自深渊S2哪怕算上续作的buff,分数也似乎有一些膨胀(来自深渊在完结时估计会掉0.2-0.3,但辉夜已经稳在那里了)

想说的百分制被楼上说了(bgm38)

瞎吐槽一下:
bangumi的用户越来越多,将来的增长速度大有可能会比现在还快。〇子君和〇式现在直播杂谈的时候也会用bangumi,虽然也说过“大家不要跑到ban上去乱打分(bgm112)”这样的话,但也会不可避免的拉入很多新人用户,(当然其中真乱打分的肯定只有一小部分,要是能理性打分、只给最喜欢的一两部打分或者干脆不打分这样的用户还是很欢迎入住的(bgm67))没有批评的意思,总不能形成一种小up可以用但大up不行的局面吧(笑。
大up的“引流”,最终只是对用户数量成长的的一个加速,真要到mal那种地步的话,想必也会有不少人去一下个“bangumi”的。(bgm112)
#40-1 - 2022-8-31 12:50
银毛熊
来自深渊2完结后分数不会掉那么多,保底8.5。辉夜3同期才8.3分后面在分数相关贴子下就一大堆说别急完结会掉,结果完结反向掉分到8.5(bgm38)
#40-2 - 2022-8-31 22:24
宿星雨
银毛熊 说: 来自深渊2完结后分数不会掉那么多,保底8.5。辉夜3同期才8.3分后面在分数相关贴子下就一大堆说别急完结会掉,结果完结反向掉分到8.5
新增data还是多来自“新用户”,老用户不会急着去看。
#41 - 2022-8-31 12:50
(やりたいこととやるべきことが一致する時、世界の声が ...)
实际上作者批判的对象评分普遍现象是不低于6,但这是每个人都会经历过的路程。样本数上来之后,高活跃度用户自然就会意识到自己所给出的评分的不合理之处。当然,当事人是否能意识的到后进行调整又是另一件事。激情评分自然是存在于每个网站之中的,如果一直持续老片就是好,就可以给高分的情况那也并非健康。十年前的bgm新番甚至评论和回复都不到现在的1/3,人少就一定能评价的合理吗。
最终评分反应的情况是现在和过去综合起来这部片子大家的喜好度。
#42 - 2022-8-31 13:02
(やりたいこととやるべきことが一致する時、世界の声が ...)
说说我对完结后评分“下降”的看法吧。就现在的新媒体时代这是不可能的,甚至说小幅上升会成为热门作品的普遍现象。SNS在新时代的影响不可估量,更多的用户在大数据的帮助下,在其无意间接触到某作品后来到这里评价自己喜欢的作品时,真的会给这部完结的作品差评吗。更不用提漫评up主的舆论攻势引导。

追着看片的人也许还有7天的时间去思考每一期之间故事的不合理,作画的纰漏。可是补片的人可以把这部片当成剧场版一样去体验,可以跳过oped,也可以快进倍速自我调节观看体验,其中一些小细节很快就会被忽略,最后当他们一口气看完这部热门的当季好作品时,留给他们的也许只有看完的激情和想要抒发情感的冲动,怒点9分10分然后走人。你可以说他们是文中定义的类b站用户,但是他们不会在意。因为看片他们就是满足业余生活。多看动画,快乐生活,不要在意评分,还是多看看好友平均评分
#42-1 - 2022-8-31 13:44
宿星雨
所以说,入站门槛要提高,b站都还有那个什么考试呢。
比如建立一个题库,随机抽取20题,限时要求答对60%以上之类的

但是问题来了,很多人bgm排行榜不是唯一目的,很多人单纯点格子

那么可以限制,只有通过了答题才可以评分之类的,点格子都可以。
#42-2 - 2022-8-31 13:55
罗拐
宿星雨 说: 所以说,入站门槛要提高,b站都还有那个什么考试呢。
比如建立一个题库,随机抽取20题,限时要求答对60%以上之类的

但是问题来了,很多人bgm排行榜不是唯一目的,很多人单纯点格子

那么可以限制,只...
我也是单纯当个动画豆瓣在用,顺带认识同好一起聊天,劝题主放宽心。小建议,建议题主自己做视频吹动画尽量多的为自己喜欢的作品做一点贡献,万一真的有人愿意因为你的视频来bgm下面评分也算是为你心中的评分事业做些贡献了。
#42-3 - 2022-9-24 18:54
#42-4 - 2022-9-24 23:55
罗拐
宿星雨 说: 参考好友兴趣这个可能有用
https://bgm.tv/group/topic/345856
https://anime.bakery.moe/
感谢
#43 - 2022-8-31 14:31
(一倍速死忠)
支持。忍不住口嗨一下:不知道,让评分数不足50的用户评分无效会怎样
#43-1 - 2022-9-1 11:13
奶鸽
那可能评分榜前49的作品要收获很多1星...
#44 - 2022-8-31 14:41
(こんな夜に意味があるなら 僕らは地を這う ... ...)
楼主的观点莫名让我想到了烂番茄,虽然我没实际用过。

是不是可以筛选出一批有「资质」的用户,弄个鉴赏家认证,然后像烂番茄那样证两套评分,鉴赏家评分和一般用户评分。

要注意的是,很多人看烂番茄都光看新鲜度了,但是新鲜度只代表正面评价率,而另外还有一项是平均分Average Rating才是真正的评分,正面评价多不代表分就高。比如烂番茄上《你名》的新鲜度是98%,略高于《千与千寻》的97%,但前者的平均分是8.2,低于后者的8.6。
虽然这套评分系统有争议(但是没有无争议的系统),但是个人认为很方便。对于只想做个参考决定这部片看还是不看的人,看好评率就可以了;对于想要深入的人,还有更具体的rating。

只是突然想到的而已。
我个人只是把班固米的评分当烂番茄新鲜度看的。
#45 - 2022-8-31 14:58
(下民易虐,上天難欺)
不是有好友评分吗,你要觉得大众意见不合你口味可以关注一些你喜欢的人。
老用户的评价系统也不见得就一定比新用户高明。10年前排行榜前二是银魂' 和银魂。
#45-1 - 2022-8-31 16:11
宿星雨
治标不治本,样本少的任何评分都是统计学上的不可靠。
#45-2 - 2022-8-31 16:12
che
宿星雨 说: 治标不治本,样本少的任何评分都是统计学上的不可靠。
多加好友(bgm38),加到几百个怎么也有统计学意义了
#45-3 - 2022-8-31 16:23
宿星雨
宿星雨 说: 治标不治本,样本少的任何评分都是统计学上的不可靠。
1.我本身好友也加到了几百个
2.无论自己加的好友数量多少这本身没有统计学上的意义,因为对老用户的筛选也包含了个人偏好
#45-4 - 2022-8-31 18:06
che
宿星雨 说: 1.我本身好友也加到了几百个
2.无论自己加的好友数量多少这本身没有统计学上的意义,因为对老用户的筛选也包含了个人偏好
本来就不存在绝对客观的评分,你多加好友能帮你筛出具有统计学意义且能够拟合你口味的评分数据库。
#45-5 - 2022-8-31 23:23
Faumeplder
宿星雨 说: 1.我本身好友也加到了几百个
2.无论自己加的好友数量多少这本身没有统计学上的意义,因为对老用户的筛选也包含了个人偏好
在Bangumi待着认真评分本来就是筛选过了,你在#51-1也说“用户喜好高度相似更有意义”
量加好友与观察其好友评分也是对“高度相似”的再筛选,尽管确实偏向于个人喜好与样本量较少的缺点,但加自己所认可的用户,打分完全是个人眼中的正态分布,没有新人的“无脑高分”,也没有刻意放大自己权重与区分度将均分降低的严格用户,且平均标记量大,更是去除了极端评分
从这里看,统计上的意义并不比整体评分差
#45-6 - 2022-8-31 23:25
宿星雨
Faumeplder 说: 在Bangumi待着认真评分本来就是筛选过了,你在#51-1也说“用户喜好高度相似更有意义”
量加好友与观察其好友评分也是对“高度相似”的再筛选,尽管确实偏向于个人喜好与样本量较少的缺点,但加自己所认...
1.这样的评分内部无法比较,你还是只能和全体评分对比
2.一般的作品可能平均下来还好,冷门作品表现一样极端
3.说到底就是,样本数太少,你这样说的至少加几千人才可能实现
#45-7 - 2022-8-31 23:27
宿星雨
Faumeplder 说: 在Bangumi待着认真评分本来就是筛选过了,你在#51-1也说“用户喜好高度相似更有意义”
量加好友与观察其好友评分也是对“高度相似”的再筛选,尽管确实偏向于个人喜好与样本量较少的缺点,但加自己所认...
就我个人而言,冷门番剧的好友评分有时候会与bgm全体值偏差1分以上,这就是统计上显著的误差。(包含了选择偏好)
#45-8 - 2022-8-31 23:54
Faumeplder
宿星雨 说: 就我个人而言,冷门番剧的好友评分有时候会与bgm全体值偏差1分以上,这就是统计上显著的误差。(包含了选择偏好)
这个偏差1分以上你可能还要看全体值的分布吧,如果你说的是雄狮少年等总体标准差极大的条目,反而是好友评分更有价值

就我个人而言,我还会具体观察为何会出现偏差1分以上的情况,比如评论者对片子本身的描述等等
#45-9 - 2022-9-1 00:02
宿星雨
Faumeplder 说: 这个偏差1分以上你可能还要看全体值的分布吧,如果你说的是雄狮少年等总体标准差极大的条目,反而是好友评分更有价值

就我个人而言,我还会具体观察为何会出现偏差1分以上的情况,比如评论者对片子本身的描述等...
观察后发现就是喜好偏差了……
打开一部00年前后关于太空为背景的在我友评普遍偏低很多
#45-10 - 2022-9-24 18:54
宿星雨
参考好友打分这个推荐系统可能有用
https://bgm.tv/group/topic/345856
#46 - 2022-8-31 15:10
内容已被用户删除
#46-1 - 2022-8-31 16:21
宿星雨
1.保存现有排名、使用webarchiver、评分统计plus等方法都是退而求其次的办法。毕竟我的目的也不是为了(自己单纯)筛选动漫,实话说,bgm的排行榜已经被我翻来翻去,rank前2000都看过至少10遍以上了。
2.评分插件里的统计趋势无法无法确定影响是否由我文中提到的这种“新用户”带来,对本文来说似乎没多大帮助
3.主要还是为了完善这样一个体系,毕竟未来一年一年的动漫收录肯定是不断上升的。
4.改变规则就很困难了毕竟… 这篇网站主要还是提出一个观察到的现象,抛砖引玉,所谓的对社区的一个自己的想法
#47 - 2022-8-31 16:09
想法很好,但真的難以落實
干脆搞個要看完整部作品才能評分的限制好了
#47-1 - 2022-8-31 16:25
宿星雨
是的,等全部放送完再评分可以很大程度减少由“新用户”评分带来的“锚定效应”,可以在初始评分得到一个更加合理的分数,一定程度上可以降低这个问题带来的分数加成。
#47-2 - 2022-9-1 00:44
mob
宿星雨 说: 是的,等全部放送完再评分可以很大程度减少由“新用户”评分带来的“锚定效应”,可以在初始评分得到一个更加合理的分数,一定程度上可以降低这个问题带来的分数加成。
我觉的可以和mal一样 等番完结之后 去掉那些看了一两集就打分的人 3集定律嘛 只有看了三集 评的分才有效
#47-3 - 2022-9-1 07:56
s1psw
mob 说: 我觉的可以和mal一样 等番完结之后 去掉那些看了一两集就打分的人 3集定律嘛 只有看了三集 评的分才有效
指点格子?,那有些人是标记党怎么办?指标记看过,无法直接点格子,这样也不好吧
#47-4 - 2022-9-1 12:29
mob
s1psw 说: 指点格子?,那有些人是标记党怎么办?指标记看过,无法直接点格子,这样也不好吧
对 所以只删掉那些标记到1,2集的
#47-5 - 2022-9-17 19:28
SPUZH
这样反而更提纯了,因为抛弃的人甚至无法打分
#48 - 2022-8-31 16:43
(我是萌新二次元)
内容已被用户删除
#49 - 2022-8-31 18:00
如果看重评分,那么不同定位的评分本就应该是不同类型。但实际情况是每个人看到的数据都是一样的,而这个分值是根据各自的标准+评价+对分值系统的理解综合得出的,随着用户群体、社会背景的变化,年代差异自然会在分值上体现出来。

(如果bgm只给10个星不带文字描述,我估计会给很多7-8星的,但是加上“还行”、“推荐”这样的描述后,很多原本给6-8的就只能给到5-7了)

个人更希望不默认显示综合评分,非要显示的什么的话,显示热度、评论数或者精确到十位的排名就行。如果还嫌不够,就把个人的评分按 内容、制作、观感、推荐程度、综合评价 拆开,自己想打哪个分打哪个,想看哪个同理。

我很清楚这只是纸上谈,太理想了之类的就不用提醒了,而且bgm没能力也没必要做这些繁琐的工作。总之顺其自然就好,当然,如果能顺便保留每周历史评分就更好了。
#50 - 2022-8-31 20:17
(结构性番荒)
就是说,新用户打分相对偏高导致新热门作品得分偏高。
但我认为,整体上,新作品必然地在制作上比老作品好,特别是画质。但老用户的评分往往不能反映出这种进步,而你说的这个现象恰好能提供修正。尽管新用户可能并不是因为制作上的进步而给新作品打出相对更高的分,但得到的结果,我认为是好的,不需要去干预。
#50-1 - 2022-8-31 20:22
宿星雨
有意思的观点,不过我并不认为制作带来的加成仅限于新用户,而且这种更高分的合理性并不仅仅基于画质,也就是说两者的相关性还是很低的,这种加成不能以对应关系反映在画质上,而且制作水平也是有边际效用递减的,不仅于年代也与投入相关
#50-2 - 2022-8-31 20:39
悲观的看客
宿星雨 说: 有意思的观点,不过我并不认为制作带来的加成仅限于新用户,而且这种更高分的合理性并不仅仅基于画质,也就是说两者的相关性还是很低的,这种加成不能以对应关系反映在画质上,而且制作水平也是有边际效用递减的,不...
我明白了,问题是这种修正无法恰当地分配到所有新番里,越热门的新番评分会越虚高,远远超出制作进步应得的加分。反之冷门新番受到的影响太小,评分反映不出制作进步。
#50-3 - 2022-8-31 20:42
宿星雨
悲观的看客 说: 我明白了,问题是这种修正无法恰当地分配到所有新番里,越热门的新番评分会越虚高,远远超出制作进步应得的加分。反之冷门新番受到的影响太小,评分反映不出制作进步。
是的、说白了这种优势并不是基于画质的、所以它也反映不出真实的画质进步。
#51 - 2022-8-31 20:45
实际上不只是bgm有这种现象, imdb上同样也出现了类似的情况, 一些老电影如教父在年龄段上的方差很小, 反而是复仇者联盟这样的电影在年龄上打分的差距比较大. 这是互联网通俗化低龄化出现的普遍的现象.
#51-1 - 2022-8-31 21:08
宿星雨
除了bgm、批评空间、vndb这种相似度较高的排行榜系统,imdb、豆瓣、mal这种收录范围内受众都极度分裂的平台的评分是不可能有参考性的,就我自己而言这种平台你不能看具体分数和排名,只能当个二极管看看一部作品口碑是好还是不好,不希望bgm也变成这样
#52 - 2022-8-31 21:03
(我来这世界只是为了好好看看它)
这里在是一个网站之前首先是无数个单机版的记录软件,可以按自己满意的方式标记看过的作品才是很多人用这个网站的理由,社区指导原则里可没有一个字和打分有关,没有人有义务按那个描述去打分,多看几个主页也不难发现很多人都有自己的标准。
当然从结果上来说参考评分肯定也是很多用户都会做的,但就算你是为评分参考性而来的,也不应该要求别人去为了这种参考性而服务。所以一般来说,像某科学排行一样利用bgm的数据按自己觉得合适的标准再做一个别的排名不就是两全其美的办法了吗?想要自己的意志得到表达总要付出点努力而不能指望就靠发发帖子吧。但看你的回复好像又不满意,那还能咋办,那大概只能再建个新网站了吧,反正你看英文有那么多网站呢,中文也不止bgm一个。反正指望bgm肯定是不现实的,这网站又不盈利,加功能谁给开工资呢?
#52-1 - 2022-9-1 08:41
薇塔
+1
#52-2 - 2022-9-1 12:23
#52-3 - 2022-9-3 03:27
#52-4 - 2022-9-6 07:57
#52-5 - 2022-9-8 00:27
#53 - 2022-9-1 00:01
(想象力是 ACGN 最宝贵的财富。)
不评论文章本身。
如果bgm用户是一个acg观众的完全随机抽样的话现在这个“变化”还有观察价值,但只是“bgm用户”群体发生改变的话观察评分变化也只能得出关于“bgm用户”群体改变的结论……
#54 - 2022-9-1 01:44
(象牙门的梦,午夜前的景。)
直接老用户拉个新群,搞个Private的社区内部交流(bgm40)

毕竟「年轻人的第一部番剧」都不同,有代沟是难免的,交流不了的就踢出去!为了蓝色清净的世界!
#55 - 2022-9-1 04:24
爬这楼这么多评论就是自讨没趣
还是老调重弹的东西


其实如果你自己看数据表会发现每个注册年的用户平均评分,并不存在什么线性回归,是上下波动的,「新老用户」其实是个有点牵强划分,为什么21年前就算老用户呢?这只是没什么道理随便拍脑袋的。

每个个体的打分来说,是不可能反应作品真实质量的,因为每个人的欣赏面和阅历都很有限,无法感知不同类型/赛道作品的优劣之处。

注意我在说连优劣都无法感知,这是比喜好更基础的东西。所以如果你观察每个人的评分,他总会有与客观认知或者说统计平均分出入较大的评判的。

如果认同我上面这个结论,那就不难解释所谓的评分争议:

正是因为每个个体的单独评判都会偏差,所以我们才看统计结果,所以统计结果才是更接近客观的。同时,争议的大小与两个因素相关,一是意见方向背离度,二是持意见的人数。意见背离度参考统计评分标准差,大部分番都很合理,リコリス也很合理,所以它并没有反映什么特别的现象;而从持意见的人数来说リコリス显然有着相当数量的争端参与者——但这也就是全部了。

——仅仅是它火所以参与人多所以看着好像争议大而已,纯粹是个单变量相关,并没有什么好挖掘分析的。至于为什么火,那是另外一码事。


说「新用户进入会破坏评分系统的客观性」我只能说,「样本更少更能反映规律从统计上讲就是不科学的」。

但统计数字反映的是什么不一定如直觉所见。

我一直确信分数与推荐度的相关度比作品本身素质更大,这是由前文所述的「每个个体都有的缺陷」决定的。意识到分数并不是作品素质的客观反应  也  不可能存在一个良好的由统计反映的作品素质的评判系统,能减少90% 发此类帖子的动机。
#55-1 - 2022-9-1 06:33
宿星雨
你根本没理解本文定义新老用户的区别,并不是纯粹时间长短的区别,所以在一定注册时间以上,可以留存都为“老用户”,不存在线性回归的关系。量化计算上仅仅是一个粗略的统计,即看出最近用户(有很大可能是新用户的这批人)相比其他的的一个直观上的统计。即,2018和2017和2016评分的数据均值可能并不是按回归趋势递减的,因为这部分人基本都是本文定义的老用户,在“自己的主观判断”后评分,这些人是同一个组别,不能割裂的比较,因为他们在本文的用户分组没有任何本质区别

建议连原文观点理解清楚再来反驳,关于中间主观性的反驳在文中已经解释多遍

另外,我认为的这种“不平衡”的倾向来源是基于文中的新老用户区别,文章已经解释很清楚了,关于你最后几段的观点
正是因为每个个体的单独评判都会偏差,所以我们才看统计结果,所以统计结果才是更接近客观的
这种事情也解释太多遍了,别得不说,你看看mal和b站评分就可以了,真的更客观了吗?

有理由认为,你并没有理解本文指出的新老用户核心区别和真正的矛盾点:对比较性的理解和实际对比的能力以及其群体特点,并且选择性忽视本文的论证过程。

说实话,我感觉我们谈论的根本不是一个东西,如果仅仅是一个认知上的分歧,我也不打算再过多解释,如果层主可以针对原文核心矛盾点更加有说服力的意见,愿意进一步探讨。
#55-2 - 2022-9-1 16:33
Arctic
什么搞笑的不可知论
#55-3 - 2022-9-1 20:37
シャナ俺の嫁
宿星雨 说: 你根本没理解本文定义新老用户的区别,并不是纯粹时间长短的区别,所以在一定注册时间以上,可以留存都为“老用户”,不存在线性回归的关系。量化计算上仅仅是一个粗略的统计,即看出最近用户(有很大可能是新用户的...
我回复中最重要的观点有俩,一是「新用户影响客观度」是不对的,二是「统计评分与推荐度的相关度比作品素质更大」。

第一点,由于发展中的社群用户量基本是指数增长的(马太效应),所以新的「冲突」规模一定都会比以往大。因此「新用户怎么好像质量更差了」的结论很可能在每个新观察点下都成立——看起来矛盾偏颇更多只是因为基数已经更大了。但这个观察并不能得出「新用户质量更差」或「有危害」。而且统计数字也没有反应什么规律,我想如果真要能拿出数据验证或反驳你的结论,应该统计每个年度的新用户评分他当季新番的评价行为vs他所在年存量老用户对同一新番的评价行为 (然后就可以比较是否是最近的用户比较傻逼还是以往的「新用户」都傻逼但后来治好了) 。 不过总的来说虽然不能证明出与你相反的观点,但起码你的观点站不住脚是可以指出的。

第二点,评分与推荐度的相关度比作品素质更大。这种属于都有道理的认知分歧也没什么好展开辩论的,但从这个观点出发即使是B站9分起底的评分我也不认为损害了客观性——因为B站的评分本来也不是第三方独立评分,而更接近于第一方推荐度。b站购买的所有番剧版权都可以视为「自我推荐」行为,推荐架上的东西都在9分附近徘徊不如说完全合理。

另外如果此前没有良定义的话我想先补充这一点:
所谓的「客观」定义为「接近事物的本来样貌」,并非「公正」
#55-4 - 2022-9-1 20:50
宿星雨
シャナ俺の嫁 说: 我回复中最重要的观点有俩,一是「新用户影响客观度」是不对的,二是「统计评分与推荐度的相关度比作品素质更大」。

第一点,由于发展中的社群用户量基本是指数增长的(马太效应),所以新的「冲突」规模一定都会...
第一点,我并不是观察到矛盾增多而推导的结论,我观察的内容和简单统计验证方法在文末图表上方的附加内容有,观察到的内容也是主要在文章前半论述的。统计数字显然是有规律的,这三部近年来热门番最近两年注册用户平均分比两年以前都高了0.3,这不是规律什么是规律,你提出的统计我是认同的,但是我没办法实现,但是我相信结果肯定是倾向于支持我的论点的,如果你有办法统计可以拿数据再来反驳,我们这样猜想是没有意义的。
综上,我不知道你从哪方面反驳了我的推理链条,即没有具体数据也没有清晰的逻辑分析,如果是像我一样分析论证还希望能写清楚点,不然真的就只是“主观想法”了

第二点  

推荐度到底是一个什么东西……  这根本不能反映任何作品本身的性质  也说明不了什么  何况这个和网站环境关系很大  专门的评分网站没有推荐度一说

另外,你补充的这点就是我本身的观点,上面很多楼层应该有提到,或许你应该尝试去理解我的意思后再说明。
#55-5 - 2022-9-1 21:17
シャナ俺の嫁
宿星雨 说: 第一点,我并不是观察到矛盾增多而推导的结论,我观察的内容和简单统计验证方法在文末图表上方的附加内容有,观察到的内容也是主要在文章前半论述的。统计数字显然是有规律的,这三部近年来热门番最近两年注册用户平...
数字的话,从表来看由于每一年注册用户的评分都有波动而且0.3也还在波动范围内,所以我在第一个回复里提到这个,用来指出这个「增长」不是规律。而由于统计数字并没有反应什么规律,所以你的逻辑链断了。这是我说你的观点站不住脚的原因。我离相信你的结论差的正是令人信服的数据,表里的数据是不够的。

我说的第二点是这样一个结构:

1.  观众对作品的认知力是普遍缺陷的
2.  所以每个个体的评分比起他对作品素质的分析更接近他对作品喜好或说「推荐度」的反映
3. 由1得观察每个个体的评分都是不合理的,所以即使看到了大量只打10分1分的「新用户」也不能说明什么,顶多能观察极端打分的用户占他所在群体的比例以及这种行为对总统计结论的影响程度。但我觉得这在用户群本身就在指数增长的背景下应该能稀释掉。
4. 由2得统计而来的评分数字与每个个体的推荐度因果性更强,而与作品素质的因果性更弱,同时又因为统计能抹平每个个体非普遍选择带来的噪音,它又更接近客观。最后我们得到了一个a.与推荐度因果性更强b.且足够客观的统计数字。所以分数是「客观的推荐度度量」

另外其实我并不鲜明地反对你的观点,即我并不认为「新用户并没有损害评分/评价系统」,而是认为
1. 统计数字给你观点的支撑度不够,逻辑是有脆弱性的
2. 我自己并不强求分数系统要「公正地服从以作品真正素质为中心的正态分布」,而只视其为一个推荐度系统,甚至与b站的推荐度系统也并没有什么不同,所以我认为「某种形式地维护」分数系统并不很有必要。
#55-6 - 2022-9-1 21:50
宿星雨
シャナ俺の嫁 说: 数字的话,从表来看由于每一年注册用户的评分都有波动而且0.3也还在波动范围内,所以我在第一个回复里提到这个,用来指出这个「增长」不是规律。而由于统计数字并没有反应什么规律,所以你的逻辑链断了。这是我说...
第一点 如果你愿意相信这些数字没有规律就没有规律吧,这个没什么好说了的。
第二点  不是又回到了主观性的问题,我想这个问题我解释很清楚了。
澄清之二,新老用户对评分的影响不在于个体而在于统计趋势,如上段最后一句所示,不是说老用户的评分都是基于理性,而是所有人都有很大一部分基于个人观感,但是我们讨论的是针对评分的整体影响,所以只需比较其中的群体整体“受主观影响程度”、“欣赏能力”、而前提是:有基础的共识
其中各种偏离的情况总体中和必然符合回归其本身群体的相对理性值,从而得到一个合理的评分(在这个群体内)   
你第二点的论证完全忽略我已有的解释和很多明显不成立的观点,我也就是不一一补充了。
#55-7 - 2022-9-24 11:39
宿星雨
シャナ俺の嫁 说: 数字的话,从表来看由于每一年注册用户的评分都有波动而且0.3也还在波动范围内,所以我在第一个回复里提到这个,用来指出这个「增长」不是规律。而由于统计数字并没有反应什么规律,所以你的逻辑链断了。这是我说...
重新翻了翻你的评论  觉得我原来回复有些轻率
不知道你有没有兴趣重新阅读修改后的文章和 第98楼相关问题重新谈谈你的看法

包括你的推荐度看法应该我现在也可以给出更好的解释了。
#56 - 2022-9-1 09:07
设置新番在完结之前无法评分或许会好一点
#57 - 2022-9-1 10:34
感觉还是太把bgm的排名当回事了,虽然说自己也不能幸免.....自从知道了科学排名,感觉排名不对头就去看科排的,达到预期就爽了。
#58 - 2022-9-1 11:16
和厨子空间一样  把评分改成百分制    然后主要参考中位数
#59 - 2022-9-1 12:10
(Reality is an illusion.)
并不是所有人都这么关心评分的,,,如果楼主很关心评分的话,或许楼主应该自己做点什么,让别人认真评分未免有点管得太多。

如果楼主想要自己认识范围内更公正的评分,或许可以尝试把每个用户的评分调成一样的分布,然后删掉一些异常值,比如个人对作品的评分完全不正态分布,或者个人与总体相似性很差(这个求一个夹角或许就行)。不过之前的排名算法和科学排名中一定有比这种建议更可靠的做法。
#60 - 2022-9-1 17:23
目前看下来,新建一个鉴赏家评分排行,由少数资深成员担任最初评委,然后会员可以自由申请鉴赏家以逐渐扩充队伍可能是目前相对最好的解决方法。
鉴赏家权利及义务对等,可以参考国外论文评审机制,先随便抛个砖如下:
1. 鉴赏家资格测试:不少于比如说50篇漫评,并提交3篇自己认为最好的漫评给评审委员会审核
2. 鉴赏家权利:评分及意见在鉴赏家专栏显示,与普通会员分开;在普通会员评分统计中有一定加权
3. 鉴赏家义务:每年至少输出10篇符合一定标准的漫评(每月不到一篇,压力不会太大);年末每位鉴赏家的漫评随机发送给其他若干位鉴赏家,由他们进行匿名同行评审。当首次低于某个阈值时进行警告,再次出现则剥夺资格,并规定一定时间之内不得再申请。
细节太多暂且不谈,主旨思想大致如上。这是目前个人觉得成本收益比教高的方案,比起“教育”海量的不成熟人群可行的多。这么大一个社区,找一些德高望重的初始评委应该不是什么难事吧。
另外上面有人提到的借鉴批评空间的百分制,显示中位数评分等也是简单易行的好建议,可以先行实现。
#60-1 - 2022-9-1 17:26
宿星雨
有能力评分的用户不一定愿意去写漫评,这种事情肯定搞不起来的……
很显然我们可以猜想这么麻烦的机制导致有意愿的人数甚至达不到100人
#60-2 - 2022-9-1 17:29
Arctic
宿星雨 说: 有能力评分的用户不一定愿意去写漫评,这种事情肯定搞不起来的……
很显然我们可以猜想这么麻烦的机制导致有意愿的人数甚至达不到100人
我觉得你严重低估了有这个意愿的人数。
每个月都不到一篇,这个标准我个人觉得真的谈不上高。连这都嫌麻烦显然也不可能在日常中有足够意愿阅览新作品,这本身也算是一种筛选机制。
当然,具体标准可以再商榷,但权利义务必须对等。作为鉴赏家,必须持续证明自己有这个资格。可以不拘泥于漫评一种形式,但一定要有相应的有价值的输出。
#60-3 - 2022-9-1 18:03
宿星雨
Arctic 说: 我觉得你严重低估了有这个意愿的人数。
每个月都不到一篇,这个标准我个人觉得真的谈不上高。连这都嫌麻烦显然也不可能在日常中有足够意愿阅览新作品,这本身也算是一种筛选机制。
当然,具体标准可以再商榷,但权...
想法或许是好的,但是BGM肯定不可能这样干吧…  
估计会被喷死
#60-4 - 2022-9-1 18:03
宿星雨
Arctic 说: 我觉得你严重低估了有这个意愿的人数。
每个月都不到一篇,这个标准我个人觉得真的谈不上高。连这都嫌麻烦显然也不可能在日常中有足够意愿阅览新作品,这本身也算是一种筛选机制。
当然,具体标准可以再商榷,但权...
必要性没那么充分,实际上同意的人是极少数的。
#60-5 - 2022-9-1 19:45
Arctic
宿星雨 说: 必要性没那么充分,实际上同意的人是极少数的。
又是“喷死”又是“必要性没那么充分”,完全看不出你的逻辑依据在哪。感觉?
而且我发觉你的思路其实很模糊,你有自己想过你提出的问题该怎么解决么?主楼里说的“教育”显然是根本不切实际的。
要是教育是万能的,要监狱干嘛?
要是靠每个人的自学自律就行,那现在这些乱打分的又是哪来的??B站入站可是有整一套礼仪教程的
雅典式民主是不可能有好下场的。
#60-6 - 2022-9-1 20:12
宿星雨
Arctic 说: 又是“喷死”又是“必要性没那么充分”,完全看不出你的逻辑依据在哪。感觉?
而且我发觉你的思路其实很模糊,你有自己想过你提出的问题该怎么解决么?主楼里说的“教育”显然是根本不切实际的。
要是教育是万能的...
温和的意见都被骂得够呛,你愿意相信这样可以得到接受就好了。
再说了你这也不是个人感觉么……
这种问题没什么好争的,毕竟又不会听我们的,这个话题就到此为止吧。
#60-7 - 2022-9-1 20:36
Arctic
宿星雨 说: 温和的意见都被骂得够呛,你愿意相信这样可以得到接受就好了。
再说了你这也不是个人感觉么……
这种问题没什么好争的,毕竟又不会听我们的,这个话题就到此为止吧。
我好像把我的逻辑列出来了吧?我只是举证你的“解决方法”核心逻辑有不少问题而已。我甚至还没提像“注册时间”之类的“相关”当“因果”的逻辑问题……
比如我从天鹰战士还在电视台放的时候就开始看ACGN了,但是我2020年才来注册bgm,而且点格子也是纯看心情。同样有位b小将可能比我注册更早,并且把他喜欢的一大堆都打了10分,不喜欢的那堆打了1分。
按你的逻辑,他的打分比我更准?
言尽于此。
#60-8 - 2022-9-1 20:39
宿星雨
Arctic 说: 我好像把我的逻辑列出来了吧?我只是举证你的“解决方法”核心逻辑有不少问题而已。我甚至还没提像“注册时间”之类的“相关”当“因果”的逻辑问题……
比如我从天鹰战士还在电视台放的时候就开始看ACGN了,但...
我只能说你提出这样的问题代表你连文章中黑体的部分都没理解
2.对评分标准新老用户的具体澄清 之一:  首先  新老用户并不真正意味这注册时间或者单纯阅番量  更多的是一种对动画的了解程度以及对bgm评分机制规则的认同和理解  新与老仅仅用作一个简单的区别,其真正所指乃为具体的实体。  如果一个用户表面注册时间很新但是他拥有足够互相比较各种动漫的经验以及对bgm评分的相对性的理解,并按照这种理解去标记了自己想标记的作品,我就认为这是一个有“统计意义”的样本  如果一名资深老用户,按照bgm排行榜去补番或者在此基础上挑选,但是自己评分却完全主观(简而言之,就是自己的评分内部很难自洽或者说和bgm整个系统不接轨)(后者比如:给出大量10分的用户、还有一个用户(不点名了,他的评分机制是从1分到10分都有,很多“被认为神作”的作品在他那里5分以下,个人解释为:个人观看区分度”,但是这种行为对排行榜系统来说可以认为是无价值甚至是对机制的破坏)   当然,从统计角度对分数的影响而言,我们可以认为注册时间和标记量上意义的老用户在整体上更代表了“老用户”这个对评分系统支持的实体,那些新号只标了十几个或者几十个高分的同理可以认为后者。
#60-9 - 2022-9-1 20:48
Arctic
宿星雨 说: 我只能说你提出这样的问题代表你连文章中黑体的部分都没理解2.对评分标准新老用户的具体澄清 之一:&nbsp;&nbsp;首先&nbsp;&nbsp;新老用户并不真正意味这注册时间或者单纯阅番量&nbs...
笑,你自己看看你下面补的分数相关论据是啥。你补的数据充其量只能说明“注册时间”和“平均打分”有相关关系。
哪里体现“注册晚但阅历深”的?
说到底你提出的“注册晚但阅历深”和“注册早但阅历浅”有什么简洁高效的辨别手段?
#60-10 - 2022-9-1 20:56
宿星雨
Arctic 说: 笑,你自己看看你下面补的分数相关论据是啥。
哪里体现“注册晚但阅历深”的?
说到底你提出的“注册晚但阅历深”和“注册早但阅历浅”有什么简洁高效的辨别手段?
澄清之二,新老用户对评分的影响不在于个体而在于统计趋势,如上段最后一句所示,不是说老用户的评分都是基于理性,而是所有人都有很大一部分基于个人观感,但是我们讨论的是针对评分的整体影响,所以只需比较其中的群体整体“受主观影响程度”、“欣赏能力”、而前提是:有基础的共识
其中各种偏离的情况总体中和必然符合回归其本身群体的相对理性值,从而得到一个合理的评分(在这个群体内)
文中已经声明只是一个粗数据论证,目前只有这种数据统计是可行的,当然避免不了这种注册时间短当被算错位置的情况,不然您提供一个完美的统计方法?
况且,这种情况不正说明了两年内其实还有很多“老用户”,但是被算入新用户,所以新用户真实偏差值更大?

另外,“笑”,这种发言令人感到不适,如果带有情绪来讨论我认为还是最好算了,毕竟又不是来吵架的。
#60-11 - 2022-9-1 21:09
Arctic
宿星雨 说: 澄清之二,新老用户对评分的影响不在于个体而在于统计趋势,如上段最后一句所示,不是说老用户的评分都是基于理性,而是所有人都有很大一部分基于个人观感,但是我们讨论的是针对评分的整体影响,所以只需比较其中的...
证明不了就是证明不了,把自己的观点丢给我证明是怎么回事?
我其实上面都表达过类似的意思了:用注册时间和点格子数多少来度量问题很多,没有可操作性高的办法来分辨“注册晚但阅历深”之类的老用户,所以没必要在这个维度上纠缠,而应考虑从不同方向来解决问题。
另外我严重建议你在表达自己不适前先检视自己是否有双标行为。
#60-12 - 2022-9-2 17:07
回忆逝去之路
初看好像很不错的建议,然而非常扯淡。
能发现你是打算照搬steam鉴赏家的模式,问题在于steam这个模式也谈不上成功。很多鉴赏家也是乱写一通,不少水平也很堪忧。实际上steam有价值的是他比较成功的评分系统,你可以根据长评,评论用户游玩游戏时长,拥有游戏数量来判断价值。更何况steam本身并没有对游戏进行打分,它表示的是推荐度。
在我看来鉴赏家制度无非是塑造所谓权威并且用少数用户裹挟大众意志的行为罢了。
至于你说的“连这都嫌麻烦显然也不可能在日常中有足够意愿阅览新作品”这种暴论,简直毫无水平。
以我自己为例,作为一个小学看动画,10年正式入宅的用户,坐拥1500+番剧阅读量,我每个季度会阅览近8成番剧首集,大约会看完10部水平较高的作品。这还是最近几年人有点看不动了,实际上我15年之前基本上每年光新番就看了不下百部。我相信这个水平在bangumi上面也算是名列前茅,
然而我基本懒得写任何评论甚至于2年登录bangumi账号一次。难道正因为如此我就没有评论的资格吗?
我认识不少阅读量500以上阅历10年的老宅,很多都跟我一样懒得写评论,完全就是现实反驳你的暴论。
我们为什么不写,因为我们大多都工作了,你觉得工作一天下来看个动画已经不易,看完了我再点开bangumi洋洋洒洒写个评论?那我还不如睡觉去。
#60-13 - 2022-9-2 22:26
Arctic
回忆逝去之路 说: 初看好像很不错的建议,然而非常扯淡。
能发现你是打算照搬steam鉴赏家的模式,问题在于steam这个模式也谈不上成功。很多鉴赏家也是乱写一通,不少水平也很堪忧。实际上steam有价值的是他比较成功的...
你压根都没理解我表达的东西,一切的论据全是“你觉得怎么怎么”,“你的经历如何如何”,“你朋友如何如何”,搞了半天最后说这是抄steam的,笑死。
说实话,以你自己表述的10年才入宅,还标榜自己似乎阅历很深的腔调,我很怀疑跟你讨论什么都是白搭。
请 先 理 解:不是每个人都有能力,意愿,精力成为一名鉴赏家,鉴赏家没有那么廉价非鉴赏家仍然可以像原来一样该怎么打分就怎么打分想怎么评论就怎么评论,鉴赏家专栏是独立新增的。你爱看哪个看哪个。
我从来不是想“构建所谓权威并且用少数用户裹挟大众意志”,而是为了“避免某些乌合之众利用人数优势把真正有见地却未必有煽动力的意见淹没”。但凡你了解何谓“雅典式民主”…
看到你的回复让我更确信这种制度在bgm已经是很有必要的了。
另外我看到下面你列的所谓“标准”了,“只看数量不看质量”,还有“乱评也是有提升的”?我觉得没有进一步讨论的必要了。你爱怎么想怎么想吧。
#60-14 - 2022-9-3 11:30
回忆逝去之路
Arctic 说: 你压根都没理解我表达的东西,一切的论据全是“你觉得怎么怎么”,“你的经历如何如何”,“你朋友如何如何”,搞了半天最后说这是抄steam的,笑死。
说实话,以你自己表述的10年才入宅,还标榜自己似乎阅历...
你说了那么多,请问本质和steam鉴赏家有什么不同吗。
至于瑞典式民主,那玩意我12年读欧洲古代史的时候正式学过。说实话,你学过正规体系的欧洲史吗?
说白了,你乌托邦式的理想就跟空中楼阁一样。看似美好实则毫无可行之处。
而我不知道你是怎么断章取义总结出这两条结论。但总结基本上也说明了你能理解的高度,我也许是在对牛弹琴吧。
#60-15 - 2022-9-3 11:35
回忆逝去之路
Arctic 说: 你压根都没理解我表达的东西,一切的论据全是“你觉得怎么怎么”,“你的经历如何如何”,“你朋友如何如何”,搞了半天最后说这是抄steam的,笑死。
说实话,以你自己表述的10年才入宅,还标榜自己似乎阅历...
至于我翻了下你的记录,似乎你觉得从看国内放送天鹰战士看算入宅。欧,那你可能搞错了,在我的标准里面宅是正式追每季度番剧才算。如果说所谓小时候看动画也算,那我可能还可以往前推十年左右的样子。天鹰战士我是第一批在电视台追着看的人。而我看开始看动画的时候可能圣斗士星矢第一部引进国内的时候。
你的那点资历在我这里根本不够看。
#60-16 - 2022-9-4 00:57
Arctic
回忆逝去之路 说: 至于我翻了下你的记录,似乎你觉得从看国内放送天鹰战士看算入宅。欧,那你可能搞错了,在我的标准里面宅是正式追每季度番剧才算。如果说所谓小时候看动画也算,那我可能还可以往前推十年左右的样子。天鹰战士我是第...
话不投机半句多。
#60-17 - 2022-9-4 13:22
#60-18 - 2022-9-6 07:53
笙歌看水
回忆逝去之路 说: 你说了那么多,请问本质和steam鉴赏家有什么不同吗。
至于瑞典式民主,那玩意我12年读欧洲古代史的时候正式学过。说实话,你学过正规体系的欧洲史吗?
说白了,你乌托邦式的理想就跟空中楼阁一样。看似美好...
“瑞典式民主”真的笑死。
工作太忙或上BGM太随意不经意间打错了,我觉得这种理由最多骗骗初中生。
#61 - 2022-9-1 23:21
(下民易虐,上天難欺)
楼上提到的科学排名楼主可以看看
https://chii.ai/
还有使用的算法
https://ikely.me/tags/bangumi-research/
#62 - 2022-9-2 03:09
(每天度过称之为日常的生活,说不定是一个个奇迹的连续 ...)
如果热门作品因为新观众的涌入而评分偏高,
而知名度偏低的作品,因为观众阅历广口味刁钻反而评分偏低,
那评分系统反而是本末倒置了。
#63 - 2022-9-2 07:48
大家都好认真,大众排名在我心中一直都是看个乐,与其纠结大众排名好不好有没有问题,不如多关注些大佬以及志同道合的好友,好友评分和他们的短评才是是我觉得bangumi最核心的东西...有这时间不如多看看多学学多写写,涨涨姿势最重要
#63-1 - 2022-9-24 18:55
宿星雨
https://bgm.tv/group/topic/345856
https://anime.bakery.moe/
参考好友推荐以上两个可能有用
#64 - 2022-9-2 08:52
提几点我的观点吧:
1.前面一些楼层提过的打半分和百分制在很久以前就有人提出来过,从全球其他网站搜采用过半分的和百分制的anime来看会产生新的问题,按我的观点来说还不如十分制。
2.从建站之初评分战争就从未停止,只是现在热度高了让人以为现在评分战争打的多。高热度季度新番先升后降是非常正常的现象。从统计学来说热度是肯定包含在评分里的。
3.实际大多数用户不看讨论版,或者看的非常少。(讨论了那么多并没有什么用(bgm38)
由于沉默的是大多数,在个体/小团体下认知的观点和大众认知的观点差别很大也是正常的。
#65 - 2022-9-2 13:23
综上,如果单纯认为xxx作的xxx,xxx很棒,我很喜欢,所以给高分。 那么排行榜将丧失价值
楼主对于排行榜的定义是否过于扭曲
#65-1 - 2022-9-3 20:58
宿星雨
这个……陈述可能有些问题,这句话只是整个论点的一个提炼(虽然不太恰当),陈述稍微改了改,不过这也不是本文的核心意思,我个人的排行榜和评分系统的看法在全文应该还是比较清晰易懂的吧。
#66 - 2022-9-2 14:31
(I quit)
感觉可以定期清理僵尸评分
#67 - 2022-9-2 16:23
(acgn爱好者)
太多新人的评分只有两个极端,没有中间地带
#68 - 2022-9-2 16:59
(直到最后,也要相信自己!)
我还是保持我自己签名的意见。
阅番量在500以下的人是没有资格进行评分的。
当然由于bangumi可以任意标记,你可以质疑我说的500个可能是乱写的。
但我的意思放在这里,至于如何确认实际阅番量也是有优化空间的。
更何况,就算一个新人企图给xx番剧打不合理的高分低分而被迫标记500部番剧。
我相信对于他来说也是有提升的。

当然你可以说不同人本身水平就不同,就算阅读500部之后的差距也很明显。
可是那又如何。起码差距从我认为的1-100变成了60-100,我觉得这就是一种进步。

至于是十分钟还是百分制不过就是一个表象罢了,如果观众素质不过关,哪怕你改成1000分制一样是垃圾排名。
#69 - 2022-9-2 17:59
对于在圈子认真思考和做事的人,先点赞
然后继续吃瓜
#70 - 2022-9-2 19:52
(还是太闲了。)
支持数据流 具体怎么解读数据每个人都有自己的方式
但解读结果是赌别人嘴的我怎么都不认为是合理的 这只能让社区固步自封
不行计算总评分时把新人的加权降一些都可以
做大的社区总会发生人云亦云大势所趋而世俗 但封闭的社区维持住小众的不多 死的比较多
#71 - 2022-9-3 02:24
我算是比较倾向于交给时间决定吧,完结后过段时间自然会有一个相对合理的分数,无论这个分数是上涨还是下跌(bgm38),新用户是评分生态的一环不爽不要玩(bgm37)
我倒是有另一个想法:相对于一个定值分数,我倒是想看到一个动态的过程,既然bgm未完结可以评分,有没有一种办法监视评分趋势,放送中的番剧可以按每一集更新,放送完毕的可根据完结时间拉长监视周期,这样应该能看到更多有意思的情况,目前看来只能靠爬虫爬,有点希望bgm能内置这个功能呢(bgm38)
#71-1 - 2022-9-3 20:59
宿星雨
这个功能早有了,点头像–设置–超合金组件–评分插件plus
#71-2 - 2022-9-4 02:05
QSCFTHMKO
宿星雨 说: 这个功能早有了,点头像–设置–超合金组件–评分插件plus
啊好像没有这个名字的插件呢,不过细翻了一下还是找到了完美满足需求的在Netaba.re查看动画评分分布、变化趋势
顺便贴上趋势图(bgm38)
#71-3 - 2022-9-4 09:11
宿星雨
QSCFTHMKO 说: 啊好像没有这个名字的插件呢,不过细翻了一下还是找到了完美满足需求的在Netaba.re查看动画评分分布、变化趋势
顺便贴上趋势图
呃,有这个插件的,只是准确名字记不太清了,你仔细翻翻
#72 - 2022-9-3 13:07
(我曾经听人说过,当你不可以再拥有的时候。你唯一可以 ...)
评分的高涨跟bangumi“我的评分”中评分前的字(如 推荐 7)也有关吧
这种挺影响人的,每次打分时看到这些字,我就会动摇(太容易受影响了)……
像评分6.1的花右京女仆队我也挺推荐的,感受现在番剧没有的乐趣,虽然这作品确实……但我还挺喜欢的(bgm38)
不过不失 5 直接成为了我评分底线,导致我评分空间狭窄
所以,评分数字前的这些“定义”——不过不失、还行、推荐能不能删掉啊?
#72-1 - 2022-9-3 17:15
終末紀行
为什么,我觉得这是很好的参考,推荐,较差,还行,非常好且清晰的区分
#72-2 - 2022-9-3 19:07
王箬笯
TANIA 说: 为什么,我觉得这是很好的参考,推荐,较差,还行,非常好且清晰的区分
看评分时,这些“推荐”“还行”是挺好的,可供参考,但当自己打分时,这些“推荐”“还行”的出现就不那么好了。
7分=“推荐”6分=“还行”,但评分时有时会反过来想,认为“推荐”=7分这种情况
所以有时我脑抽,想打6分时,看到“推荐 7”,然后思考🤔,这部作品我个人推荐还是推荐的,然后打7分(然后过几天可能会改掉)
对我而言,这些“推荐”“还行”之类的具有误导作用,而且“推荐”嘛,每个人标准不同,即使是5.6分的作品我也可能推给别人看……
个人评分时最好别有这种官方定的评分分数定义
嘛,其实只是我容易受影响罢了(bgm38)
#73 - 2022-9-3 19:19
(Carry on)
MAL 我觉得的确早就让人看不懂了 看评论里大佬讲解 (@Faumeplder) 才意识到竟然有其他粉集体冲辉 3 去怼钢炼粉这种事情... 不知 anidb 目前还能相对算一块净土么?VNDB 以前还有提示说 10 分请最多只给两三部,后来我没注意不知怎么去掉了。我感觉像这里提到的不同人群割裂打分的情况在 VNDB 也已经存在,比如我只是看了评分去耐心全通了 うたわれるもの,到最后觉得除了制作精良帮了我学日语之外真的是 almost a complete waste of time, at least for my tastes... 亏 VNDB 还把一些如十三机兵那样众口皆碑故事性很强的给剔除,然而 Uta 根本就大部分是 RPG 粉在称赞吧...

比较好奇的一点是不知道这个 Bayesian 的评分机制会不会根据评分者本人的评分分布来做一个标准化,比如如果只有评九分十分而没有低分的人(事实上 B 站上那个评分传统真是让人感到很迷以及意义不明... 国外有这样的评价状况么,感觉就算亚马逊也不太一样吧)的评分这样就会受到一个加权处理。不过我想这的确可能也并不现实,比如有人会给觉得比较差的作品评 5 分,有的人就直接评 1 分了。还有一个就是像之前 VNDB 提到的(按比例?)限制能够投的 10 分的数量(事实上 VNDB 当时应该也没有硬性限制),然而本质上这也不能防止有人滥标。

只能说只要是评分系统就会有这样那样的不完美。和好几个 VN 粉聊他们说他们也就根本不看评分而是看 tag 看自己的口味,比如有一个人她就是特别喜欢 Nitroplus 全系列的作品的 style,完全不参考 VNDB,就算评价不见得是很高。只能说从个人用户角度来说,的确是希望目前的评分还是能多少起到个选作品时导向作用(至少 BGM 的圈子里面的人的口味可能还是有一定的类似性的,有好几部比如声之形,Spy x Family 和 MAL 甚至 anidb 就很不同),不会到 MAL 那样的地步,在那之上还是得根据个人的喜好来进一步考虑,然后选定了开始看的时候尽量抛开分数可能会带来的先入为主了。
#73-1 - 2022-9-3 21:06
宿星雨
你说的mal这个情况应该是众所周知了吧,imdb这种超大平台也有这种情况:复仇者联盟最后一部电影出来的时候也有很多人在imdb给教父刷1分导致教父永远成为了no2(老早是no1,被肖申克反超)
不过我不觉得真有人照着mal补番,至少有一定了解后都不会这么干了吧……至于b站评分……
至于参考tag,在data比较少的情况下可能有些用,比如bgm游戏区的avg作品,vndb还有就是口味问题,欧美口味和东亚还是不太一样的,比如白二在欧美的受欢迎程度完全不如东亚,看看vndb和批评空间的rank差别就知道了,甚至coda都是最近才汉化的……
但是至少我觉得vndb内部的评分逻辑性还是有一定的…
即,评价高的n+作品应该比低的相对更好,所以排评分还是有一定参考性的
#73-2 - 2022-9-6 04:49
Sho
内容已被用户删除
#73-3 - 2022-9-6 05:02
Sho
宿星雨 说: 你说的mal这个情况应该是众所周知了吧,imdb这种超大平台也有这种情况:复仇者联盟最后一部电影出来的时候也有很多人在imdb给教父刷1分导致教父永远成为了no2(老早是no1,被肖申克反超)
不过我...
> 至于参考tag,在data比较少的情况下可能有些用,比如bgm游戏区的avg作品

说到 tag 不得不说 VNDB 在这点上真是很厉害的,看遍各个网站感觉还是它的 tagging 系统恐怖地细致到位,0-3 分的适用程度和 0-2 分的 spoiler 程度机制都具备了。如果不是从其它地方学来的话感觉真是一个创举。BGM 虽然我不是那么熟(并没太用过 tag 来找),感觉 tag 当然比起 MAL 那些要好很多,可能也只能说是不好不坏,没有特别出彩的地方么。

> 甚至coda都是最近才汉化的

你指的是“英化”么 lol。我觉得白二从评分看来读过的人还是很欢迎的。完全翻译版去年底出来之后评分也在一路上升了,事实上现在平均分已经登顶了。因为某些原因流行程度有差异,我觉得这也不见得是东西方口味问题,是有各种机缘的咯。有些 EGS 评价很高 VNDB 不行的好像是翻译质量问题,比如 Cross Channel 听说类似机翻... 还有比如国内很火的尤斯蒂娅,一直没英化,情况相反的是灰色的果实,在西方特别火但是一直没汉化。还有 Muv-Luv Alternative 好像也是有人分析过,因为种种原因比如汉化晚,错过了和 CL FSN 一批在国内火起来的风口浪尖(与此类似,白二第一版英化也是 18 年才出的,我感觉大部分人在它刚出的时候甚至改编动画老早都做完了之后都没读过,想读也读不了... 所以现在这个读者量也属正常)。还有鬼兰,也是可能以前一直没汉化所以在中文圈没火起来,大家都注意到新的兰斯世界线和兰 10 上面。

うたわれるもの 是我最看不懂的评价。个人感觉故事平淡很多地方逻辑不清还老早就可以预测到各种发展... 敢情是作者玩了一些儒家概念之类的,西方读者没看过,觉得很新鲜么... 还是说就是你说的这个问题,评价的人群根本就不同。

感觉大部分评分在 EGS, VNDB 和 BGM 没有像一些动画那样非常大的差异。不知道是不是还是人群比较小而精的道理。

不过的确我也不知道 VNDB 最近是不是也有逐渐失守和恶性评分的状况... Alternative 的评分三四年间原因不明地掉了好多了,看来失去第一位只是时间问题。说实话他们的一帮核心 admins 包括 founder 感觉也是经常做些意义不明很有争议的操作,比如删十三机兵,比如把 Muv-Luv Unlimited The Day After 突然合到一个 entry 然后采取第一部的评分... (引来很大 backlash 然后好不容易稍微妥协了一点)。只能说这个问题指出来然后大家明白是件好事,讨论了这么多之后都认为解决不容易,感觉只能说大家在看评分的时候对这个现象多个心眼了,除非有人深入研究写个 paper,propose 一个对于这种公共评分网站万全的划时代评分机制,还能通过实践被检验然后大家来采用 [doge]。
#73-4 - 2022-9-6 05:34
Sho
宿星雨 说: 你说的mal这个情况应该是众所周知了吧,imdb这种超大平台也有这种情况:复仇者联盟最后一部电影出来的时候也有很多人在imdb给教父刷1分导致教父永远成为了no2(老早是no1,被肖申克反超)
不过我...
这么一说起来,我觉得至少有一点吧,那就是 BGM 的管理目前看起来还是在正轨上没有什么奇怪的操作,这其实不见得是那么容易的事情。国内的一些网站因各种因素就不用说了,比如萌百。国外 MFC MyFigureCollection 最近几年问题一箩筐,比如改变评论区排版取消 upvote 机制还把广告和评论放一起,比如执意禁止讨论不和日本相关的产品,一直怨声载道,只是人们一时找不到一个替代品。VNDB 也如我上面说的一直争议不断,而且感觉 implement 什么功能的决定很 arbitrary,如一直不 implement 如好友,custom profile 一类的系统。到 BGM 这边也出现这样的问题那就真麻烦大了。
#73-5 - 2022-9-6 07:27
宿星雨
Sho 说: > 至于参考tag,在data比较少的情况下可能有些用,比如bgm游戏区的avg作品

说到 tag 不得不说 VNDB 在这点上真是很厉害的,看遍各个网站感觉还是它的 tagging 系统恐怖地细致...
对对,那个汉化是“英化”的意思,一下没注意想当然了(bgm43)
#74 - 2022-9-3 20:05
内容已被用户删除
#74-1 - 2022-9-3 20:56
宿星雨
如果你看完了完整的整个楼应该知道这个问题的答案(bgm93)
#75 - 2022-9-3 22:18
感觉有好多人用该站做标记用处的 把看过的番和想看的番标记出来,评分也是顺手。偶尔看看评论手痒也想来几句来点锐评,没有具体的评分标准量化出来肯定是多多少少离不开主观因素的。
#76 - 2022-9-3 22:49
(你我如同隔镜视物,所见无非虚幻迷蒙 ... ... ... ... . ...)
行动力可嘉,不过会如此纠结这事确实像高二病。
其实任何榜单都有自己的自洽性同时也有自己的局限性,你再看不上mal也好bilibili也好都有自己的参考价值。
我理解你感情上想保持bgm的纯洁性,但你想想这事的反面就是纯血主义,就是那翠(所以左和右的事远没你教科书上学的那么单纯)
有一个终极物理定律就是熵增定律,任何系统都只会越来越混乱,地球是这样bgm也是这样,bgm终有一天参考性会低到你的阈值以下,谁也反抗不了,但到了那个时候也会有新的高纯度小众榜单网站出现。
#76-1 - 2022-9-4 06:40
Aeroblast
比较搞笑的是当#60提出进一步提纯的时候,评分警察发现自己被当成了杂质,纷纷反对。
#76-2 - 2022-9-4 13:25
#76-3 - 2022-9-4 13:25
冰水混合体
Aeroblast 说: 比较搞笑的是当#60提出进一步提纯的时候,评分警察发现自己被当成了杂质,纷纷反对。
那一楼确实看笑了
#76-4 - 2022-9-4 15:27
ぐ33333
内容已被用户删除
#77 - 2022-9-5 01:11
(家に帰るまでが遠足です)
作品的素质乃至于其间的对比不是一种内禀的事实,而是观测的结论。它不光没有客观性,也没有绝对性。因而一切试图追求接近它的过程都注定是是徒劳的,最多只能获得一个符合了追求者自身意愿的结论,而非素质的实体。
如果一个标准得到的结论与事实不同,这说明标准是错误的,不全面的。理论用以归纳描述而非指导现象。篡改数据是不可接受的学术不端。评分是一个事实,集合的设置是另一个事实,评分的集合又是一个事实。事实自身没有任何意义,意义只在人的解读中存在。一个以人的意志篡改过的事实仍然是一个事实,但它体现的不再是原本的事实,而是人的意志。
任何判断都需要标准,而采用标准的判断也是。这一无限自指的追溯无法完成,因此任何的判断也都无法完成。既然判断的标准没有其先天的价值,那一切由人所赋予的价值就无法凌驾于任何人之上。
#77-1 - 2022-9-5 02:05
宿星雨
虽然短短几句话充斥着大量哲学用语,不过表达的逻辑的连贯性和对象的适用性完全不及哲学作品……
一条一条解释
作品的素质乃至于其间的对比不是一种内禀的事实,而是观测的结论。它不光没有客观性,也没有绝对性。因而一切试图追求接近它的过程都注定是是徒劳的,最多只能获得一个符合了追求者自身意愿的结论,而非素质的实体。
第一句暂且赞同,第二句“作品的素质之间也没有客观性”不敢苟同,这种纯粹唯心或者不可知的观点用于单纯个人的评价或许适用,但是归于一个统计的整体显然在很大意义上其确实存在“素质的区别”,下一句我就真的是晕了,不知道你自己知道自己在讲什么么……“素质的实体”都冒出来了  大概意思还是能理解些,简单解释下:是的,在这样一个认同共同价值观的群体得出的评分排名就是一个符合我们整体追求者自身意愿的结论,它不代表“实在”的作品间的素质,但是为我们这个整体所认同并具有其自身的价值。     你所说的哲学意义的“素质的实体”并不是我们所追求的,而且你不能在这种意义上否定它本身的价值。
如果一个标准得到的结论与事实不同,这说明标准是错误的,不全面的。理论用以归纳描述而非指导现象。篡改数据是不可接受的学术不端。评分是一个事实,集合的设置是另一个事实,评分的集合又是一个事实。事实自身没有任何意义,意义只在人的解读中存在。一个以人的意志篡改过的事实仍然是一个事实,但它体现的不再是原本的事实,而是人的意志。
第一句,不知所云  第二句 我寻思我也没指导什么现象吧 第三句 认同,但是和本文无关吧 第四句 看上去“正确”的废话  第五句 看上去“正确”的废话  第六句 我寻思也没人篡改事实吧 也是看上去“正确”的废话  
总结,虽然我大概知道你表现什么,可是你的表达不仅不准确而且冗长.
具体概括:  你认为我的“意见”是对评分结果的一种篡改,是一种在个人主观看法下对“事实”的一种个人解读 不具有其体现“事实”的意义
具体回复:首先,本文并没有任何用于指导评分的理论和对数据篡改的“事实”。 并且,并没有人追求这种“原本的事实”,就那bgm来说,什么是原本的事实? 原始数据带来的评分结果?  在你第一段意义下本来就不存在“原本的事实”     在我个人意义上,这是一种“排行榜”意义上经过人设计的算法和有一定共识的用户共同评选的结果,是一种具有价值的“集体认识”
任何判断都需要标准,而采用标准的判断也是。这一无限自指的追溯无法完成,因此任何的判断也都无法完成。既然判断的标准没有其先天的价值,那一切由人所赋予的价值就无法凌驾于任何人之上。
看上去“正确”的废话   建议参考维根特斯坦《逻辑哲学论》和康德《纯粹理性批判》,具体不想解释了,也不知道你把这句话放这里做什么    并没有人想凌驾于任何人之上 到现在我已经搞不懂你是理性主义者还是纯粹唯心主义了 或许是什么主义不重要 重要的是你理解能力和好好说话的能力似乎很弱,我完全不知道你在反驳什么,想表达个什么东西,总而言之就是言之无物罢了……


以上。
#77-2 - 2022-9-5 23:03
英雄高天原
作品的素质有客观性,天气之子的画面就是比兽娘好,包括分镜演出脚本,都是可以客观评价的,你说的这个,说白了就是扯萝卜青菜各有所爱说的那么晦涩干嘛?却是有一理,但你完全否定的客观就错的离谱了,你把动画乃至人类迭代这么多年的发展都否定了,这是否有些逆天?
#77-3 - 2022-9-7 10:19
夏日勘探者
宿星雨 说: 虽然短短几句话充斥着大量哲学用语,不过表达的逻辑的连贯性和对象的适用性完全不及哲学作品……
一条一条解释第一句暂且赞同,第二句“作品的素质之间也没有客观性”不敢苟同,这种纯粹唯心或者不可知的观点用于单...
分了三段是因为它们是基于不同前提的假言式。先有完全的虚无,再由某些被人所承认而获得价值的前提出发来推导。因此他们之间出现矛盾是再自然不过的事情。
“我们”是不存在的。统计学只是对数据的处理而无力干涉数据的采集,换言之就是GIGO。数学和科学不是魔法,只是一种技术工具,应用它们只能抵达人力所及之处,但人力所及之处不具备绝对的权威。选取“我们”的过程本就是主观的体现,而这一过程只能导致主观的结果。即便收集了所有人的观点,那也不过是这个可能世界的体现,是基于观察者自身属性的巧合,既不具备正确性也不具备指导性。
在这种问题上,我不愿意谈任何具体的例子,因为人总是会混淆自己的信念与先天的事实,比如楼上。一个理念不因任何人或任何群体的承认或否认而变得更正确或更错误,因为可能世界中总是存在着与之严格相等的相反意见。这是对于所谓集体的意志与排行榜的价值的否定。
在跳过这种否定而假设某种基于共识的认知有其价值所在时,才有对于数据的处理的分析。而既然所谓的共识的唯一价值就来自于人数,来自于所谓的雅典式民主,那么分数的体现上就没有比众人的原始评分更能体现这种民主所在的了。若是众人中出现了一个并不包含所有人的群体,而这个群体基于其自身的某种共识而要求对众人的意见作出某种篡改,那就恰恰违背了作为其共识价值根源的原则。这导致其所试图作出的改变也成了无根之木。并不存在什么评分方式或排序算法因相信它的人更多而比另一种更为正确,因为一旦众人产生了这样的共识,他们的评分本就会是体现了共识的结果。试图推行一种观念恰恰说明这一观念是不被承认的。
对所谓新用户的界定与教化需要一种正义性,但绝对的正义并不存在,而相对的正义也无法凌驾于他们之上,那么这一行为自然是无法进行的。
第三段说的是更为原则性的,虚无主义的话题。因为太基本了所以不愿意谈可以不谈。而且到这个地步本来也没什么好谈的,只是做一个参考而已。人的相信是无价值的,只不过有些言论只有在假定它有价值的时候才说得出口。
#77-4 - 2022-9-7 12:33
宿星雨
夏日勘探者 说: 分了三段是因为它们是基于不同前提的假言式。先有完全的虚无,再由某些被人所承认而获得价值的前提出发来推导。因此他们之间出现矛盾是再自然不过的事情。
“我们”是不存在的。统计学只是对数据的处理而无力干涉数...
你的核心观点似乎是以虚无主义和绝对理性为基石,如我上述,可以认为这已经是在本文范畴之外的问题了,暂且不谈你的这种观点,而且我对你这种看法的本身有更本质上的疑惑。

有几个问题请你解释
提问一:请问你关于全年代动漫排行榜的看法是什么? 你看上去不认同任何人的意志在这样的一个过程中的作用,那么我是否可以认为你认为这样一个过程本身即是虚无的?
提问二:你是否认为我认为的理性状态是一种具有正确性、准确性和完备性的评分机制? 所以才发表这些评论,但是很遗憾,这种事情本来就是显然不可做到而且我从来也没这么期望,所以你不用在这点上对我进行提醒。

针对你
在跳过这种否定而假设某种基于共识的认知有其价值所在时,才有对于数据的处理的分析。而既然所谓的共识的唯一价值就来自于人数,来自于所谓的雅典式民主,那么分数的体现上就没有比众人的原始评分更能体现这种民主所在的了。若是众人中出现了一个并不包含所有人的群体,而这个群体基于其自身的某种共识而要求对众人的意见作出某种篡改,那就恰恰违背了作为其共识价值根源的原则。这导致其所试图作出的改变也成了无根之木。并不存在什么评分方式或排序算法因相信它的人更多而比另一种更为正确,因为一旦众人产生了这样的共识,他们的评分本就会是体现了共识的结果。试图推行一种观念恰恰说明这一观念是不被承认的。
这段做个解释:对数据的处理本身在你所说对数据收集的主观性上进行的,既然数据的收集的客观性和排行榜的个人理解无法保证一致,那么基于人的理性主观对数据的处理就可以认为是合理的,我并不是那么想讨论形而上学的问题在这里,特别是关乎价值判断这方面的问题。

对你的核心观点中的虚无主义这个话题再多说几句,我本身就是个虚无主义者,与其说是相信不如说是陷入了其意义的泥潭,它本身无法指导任何我们在“现实”中的生活,倒不如说是一种对精神的阻碍,如果你也以任何形式认同这种看法,那么我也能以同样的形式指出一切你关于本文的发言以及你关乎世界的看法是“无意义的”,所以我对你评论和回复的动机产生了一个疑问:难道这个过程在你眼中不具有如你所言的虚无的性质? 或者很大可能是一种在理解这个意义上作出的一种“荒诞”的行为?在缺乏一切这种意义和价值的情况下,{这种行为}还需要任何构成其的理性与原因么?或者,你关于自由意志的看法和对虚无的观点是否自洽?

从你的术语看,可以认为你至少对现代哲学有一定了解,但是我很疑惑这种哲学观点关乎“现实”问题的适用性,这不太可能是用于关乎我的文章和理论的一种解释,本身可以从更本质上解释这个问题,或者说这个话题就根本达不到哲学的高度罢了。


以上。
#77-5 - 2022-9-14 00:56
夏日勘探者
宿星雨 说: 你的核心观点似乎是以虚无主义和绝对理性为基石,如我上述,可以认为这已经是在本文范畴之外的问题了,暂且不谈你的这种观点,而且我对你这种看法的本身有更本质上的疑惑。

有几个问题请你解释
提问一:请问你关...
对于第一问
对价值的判断是给予事物价值的唯一手段,而能进行这一判断的主体就等同于人。而价值不能无中生有,人本就是无价值的,因此进行这一判断也无法传达任何价值,只是将无价值变成了零价值,虽然有区别,但在这个语境下跟没有也差不多。我在这里的发言当然跟其他任何事物一样,都是无意义的。但所谓的虚无本就意味着对意义的追求与需求也是同样虚无的。行为只是作为实体自然的存在,不出自、带有或需要任何意义。任何行为都是一种平行世界中的巧合,决定它们发生的只是单纯的人择原理。主体在摆脱了意义与价值后成为了他自己的绝对的王者,这并非是说他有着自由意志来决定自身的行为,而是说他的一切行为都成为了先于一切理论的实在。
对于第二问
我不对他人的思想做揣摩,只对发言作出相应的回应。既然这一话题总是带有些误导性,那么这种程度的说明总是必要的。其性质只能算是铺垫而非一种论证。只有先否定了评分机制的完美的可能性,才能对实质上并不完美的评分机制进行讨论。
对于解释
任何人或有着完全一致主观的格式塔群体当然都可以基于自身主观对数据做处理,无论是理性的感性的或者别的什么性的。但这也仅限于自身范围之内。若是要在更大的范围内产生影响,就需要坚实的理论后盾做支撑,但这样的支撑在铺垫完成后就是不可能存在的。

我在这里的反对并非出自那么本质的层面,而是在说你或其他任何人或任何群体对于评分在系统层面上的任何意见或干涉都是一种杰利蝾螈,其理论支撑本就是自相矛盾的。既然将共识或人数视为达成结论的基石,就不能将任何类型的人排除在外。
#77-6 - 2022-9-14 01:25
宿星雨
夏日勘探者 说: 对于第一问
对价值的判断是给予事物价值的唯一手段,而能进行这一判断的主体就等同于人。而价值不能无中生有,人本就是无价值的,因此进行这一判断也无法传达任何价值,只是将无价值变成了零价值,虽然有区别,但在...
针对你具体的反对作一个解释:收集的数据样本本身即蕴含了人的主观意志在其中,数据本身并没有价值,只有在一定前提共识下的得到数据才具有价值,这并不是对评分的一种干涉,更没有自相矛盾,而是对数据收集科学性和意义的一个前置假设。就像禁止刷分和极端评论一样,对原始数据的必要处理
这不是对特定观点的干涉,而是对在更高的层面上对数据有效性前提的一种认定。它只限定和选择了在评分有效性这个层面上数据,关于这种选择必要性的分歧是我们实质的分歧  而这是一个完全主观的问题  不能通过论证进行说明  不过我想说的只有一点,贯彻这种想法排行榜无一例外都是一堆没有意义的数据的集合,就像mal和豆瓣的动漫排行榜,它们本身确实没有将任何人排除在外,不过这种行为不也影响到了原始数据收集么?这种本身基于数据收集的主观性带来的排除影响远远大于人为设立门槛对数据的影响更大。

(如果是这样,你一开始就说人话,指出你具体反对的内容不就好了)
#77-7 - 2022-9-17 10:08
夏日勘探者
宿星雨 说: 针对你具体的反对作一个解释:收集的数据样本本身即蕴含了人的主观意志在其中,数据本身并没有价值,只有在一定前提共识下的得到数据才具有价值,这并不是对评分的一种干涉,更没有自相矛盾,而是对数据收集科学性和...
这就是为何要首先反对绝对的客观的价值的存在了。所谓“只有在一定前提共识下的得到数据才具有价值”指的是基于任何前提共识所得到的数据都对于那个特定的数据共识拥有价值。既不能证明它对其他的共识有价值,也不能证明没有。而且支撑这一共识被应用在包含了更多共识的更广大的范围的的正义性也是不存在的。这样的处理无法在共识自身循环论证式的相对必要之外被证明是绝对必要的。既然如此,它就无法在共识之外被应用。既然已经承认了某些用户并不持有这一共识,那又如何以某些用户的共识为标准去压迫其他用户的表达权呢?毕竟这样的共识所带有的价值对于其他用户而言并非一定是有价值的。并没有一个独立存在的数据有效性。作为一种评价,“有效”只能由一个特定的主体依据某个特定的标准作出。这样局限的概念是无法推而广之的。
作品没有价值,人没有价值,标准也没有价值。纵然人或群体作为一个主体去选择某个标准去对某个作品赋予特定的价值,那也是虚伪的价值。一旦变更了标准或主体,被赋予的价值也会随之变化。从无穷的可能中选择的标准本身也是被选的对象,这样的过程是不可能完成的,因此任何绝对的价值也是无法被赋予的。一个群体无论汇聚了多少个体,他们的共识也只是他们的共识,对于群体之外的个体毫无权威性可言。这种相对于总体而言的小群体一面以人数作为自己判断的价值的支撑,一边又对其他个体的人数视而不见,又或是指望以自身的数量为道具去撬动总体的标准来实现不成比例的声量放大,这是其自相矛盾之处。
#77-8 - 2022-9-17 11:27
宿星雨
夏日勘探者 说: 这就是为何要首先反对绝对的客观的价值的存在了。所谓“只有在一定前提共识下的得到数据才具有价值”指的是基于任何前提共识所得到的数据都对于那个特定的数据共识拥有价值。既不能证明它对其他的共识有价值,也不能...
这又回到了哲学问题上来,本文的共识当然只是一个针对理性评分的一个假定一般共识,即在认同这个共识的前提下进行论述。
我即不想证明它对其它共识有价值,也不想证明这种正义性 (事实上也证明不了 就如维根特斯坦 逻辑哲学论  6.41 世界的意义必然位于世界之外 和相关论述  )  本文仅仅是针对特定前提下的一般化论证,你不能认为它是一个哲学上严格且完备的可以解释关于这个价值的本源论证,你也太高看我了吧。你这种哲学上的否定把所有排行榜的价值都给否定了,因为这种人造形式必然不能满足哲学上的完备性和严格性,这就跟你可以用虚无主义,包括世界意义只在世界之外的这种观点否定整个世界,不过这也只是应一个视角而已。  虽然我承认某些用户并不持有这些价值,但不代表本文观点是去压迫他人的表达权吧......  再说表达权这种东西你能否证明它的正确性和完备性? 我是否可以认为有人并不持有每个人表达权都是平等的这种价值在此基础上写这篇文章进行表达? 这种套娃论述你怎么回应,就如否定表达权也是一种价值这点,你能在体系内做出任何回应么?我写这篇文章不属于你的表达权范畴么?

上面废话了很多,其实就想说明一点,我并不认为我的前提共识是完全一般化的适用于任何人的观点,这种前提性的东西本身就是完全主观的,就比如一个虚无主义者可以以这种哲学观点否认一切,那难道一切的普适价值就没有了么?我需要再这种哲学观念上推而广之么? 这种局限是所有含有人的意志的问题都有的局限,所以你要那这种主观论观点去否定一切这种话题么。
也就是说,在共识前提下即无法接受本文观点的,那么我只能说本文和这个人观点在本质上不合,但不能说明本文的错误,更不能以此就否定本文的价值。

关于你最后一段即相当于任何人都对一件事有平等的发言权 这显然也只是你个人的价值观  我完全可以在否定这一点上进行论述  对支持这种观点的人而言 这就没有任何矛盾之处  关于权威性  我也并没论述这种东西  

再者说  你这种观点本质上也只是一种和我论述地位相等的一种的价值  无法从任何层面对我本身的论述构成任何影响。
#77-9 - 2022-9-17 11:32
宿星雨
夏日勘探者 说: 这就是为何要首先反对绝对的客观的价值的存在了。所谓“只有在一定前提共识下的得到数据才具有价值”指的是基于任何前提共识所得到的数据都对于那个特定的数据共识拥有价值。既不能证明它对其他的共识有价值,也不能...
你的逻辑就是要论述关于排行榜问题的内部,就必须要从一种排行榜之上的本质前提出发 ,显然这是不可能实现的。从你的这种本质主义观点来看几乎所有社科研究都是无意义的  不过只是对持有这种观点的人而言  ,这种否定仅仅是哲学观点上否定,丝毫不能影响其自身和内部。
就像“世界的意义只存在于世界之外一样”  
难道没有这种“意义”,人就会去zs,世界就不会运行?
#77-10 - 2022-9-17 11:34
宿星雨
夏日勘探者 说: 这就是为何要首先反对绝对的客观的价值的存在了。所谓“只有在一定前提共识下的得到数据才具有价值”指的是基于任何前提共识所得到的数据都对于那个特定的数据共识拥有价值。既不能证明它对其他的共识有价值,也不能...
如果你只有这种和本文讨论范畴不一样层面上的反对,我已经不想回复了,心累,这不就是各说各的么。
#78 - 2022-9-5 09:14
新观众有一套自己的评分标准,实际就算是“老观众”也各有各的评分标准,只要有自己的评分标准,不是因为和作品无关的原因乱评(比如平衡党,辱辱人),哪怕只给喜欢的评高分我觉得都是合理的。
网站的用户群体本来就会不断更新,只是由老一批人逐渐变成新一批人而已,然后新一批人有自己的评分方式,这是非常自然的。十年前的和现在相比评分标准恐怕也不一样,要不要通过数据把和十年前的主流标准不一样的人筛掉再比较啊。
想靠入站学习让新用户强行接受旧评分标准不太现实,b站现在注册有个弹幕礼仪答题,也没见弹幕都是圣人了。要不跟b似得做个入站考试吧,然后根据考试分数划分阶级,分配评分权重(bgm38)
#79 - 2022-9-5 22:43
(你们脑子里是只有糖刀雷屎吗)
回来看一眼,不由得笑死。已经有好几个想当鉴赏家的了
#80 - 2022-9-5 23:39
根据屁股包围大脑理论,当一部动画有某一点让你喜欢,使你的屁股歪曲,其强大的牵引力会影响大脑忽视它的缺点甚至脑补出优点。我一开始称其为二次元青春期,认为这只是对于作品的鉴赏能力不足产生的现象,审美水平提升之后就不会发病,后来发现一些老东西也会出现这种现象,症状和人类发情期忽视对象缺点的现象相似,遂改称之为二次元发情期。
这不是某一类人,而是每个人都会出现的症状,区别只是让大家发情的作品不同,发情的程度不同,新用户不过是血气方刚经常发情而已。(bgm38)
#81 - 2022-9-5 23:43
(诸君,我喜欢战争)
幸苦了
#81-1 - 2022-9-6 00:04
神棍
按期刊的要求改一遍可能方便阅读:
200字梗概扔开头方便评分警察出警
原始数据扔最后,正文只讲处理过的数据
行文紧凑方便快速把握核心内容
最后一张图没有对颜色的注释
#81-2 - 2022-9-6 02:29
宿星雨
神棍 说: 按期刊的要求改一遍可能方便阅读:
200字梗概扔开头方便评分警察出警
原始数据扔最后,正文只讲处理过的数据
行文紧凑方便快速把握核心内容
最后一张图没有对颜色的注释
呃,难道要写个摘要
数据这块主要都是我请别人看到的人整理的,我也不太好去过多的加工,这块就算了
不过排版我感觉还可以改改,有时间吧
最后一张图的问题我虽然自己也看到了,不过我认为结合上下文应该还是可以分出来的,以防万一还是注释下吧。
#81-3 - 2022-9-6 15:02
神棍
宿星雨(id: suxingyu) 说: 呃,难道要写个摘要
数据这块主要都是我请别人看到的人整理的,我也不太好去过多的加工,这块就算了
不过排版我感觉还可以改改,有时间吧
最后一张图的问题我虽然自己也看到了,不过我认为结合上下文应该还是可以...
最后一张图主要是有颜色差异,柱状图里的橙色在下面没有对应色,要对比着看
你高二不刷题来这里发论文(bgm84)确定保送了?
#81-4 - 2022-9-6 16:37
宿星雨
神棍 说: 最后一张图主要是有颜色差异,柱状图里的橙色在下面没有对应色,要对比着看
你高二不刷题来这里发论文确定保送了?
不,疫情严重一直上网课呢,业余爱好而已。
#82 - 2022-9-6 01:38
(気まぐれの旅人)
你提出的問題所追求的東西跟龍哥一直一來講到的東西很類似,「評價的個別標準化」。

OO片就該比照OO片的評價體系,XX片就該比照XX片的評價體系,以理解了OO片的評價體系和評價環境後再進行評價才開始具有評價意義。有一定的道理,然而這件事情還真做不到。

除非「評價」能夠和「人不吃東西會死」一樣具有絕對法則,否則就無法限制個體行為及心理。而在缺乏絕對法則支配下的所有規則,到最後只會淪為群體和群體之間的劃分。連帶地產生「飯圈」,「鄙視鏈」,「二刺猿」,「阿宅」,「河豚」等等「差別對待」的無盡循環。

說白了60樓講的話只是試圖將樓主想表達的東西實踐化而已,樓主自己應該也曉得自己提出來的這個問題有多困難(與其說是困難,不如說是太認真對待這個問題了,社會上還有許多事情需要我們煩惱呢)。所以我的想法也傾向於順應自然,若「新用戶」成為主流是必然,那也不過是順應歷史的洪流,身為一葉輕舟的我們又何德何能蚍蜉撼樹呢。
#82-1 - 2022-9-6 02:32
宿星雨
60楼这个……他只是想靠大大提升评分成本来筛选,这本身包含了太多选择性的理论,和我的观点可以说除了方向是一样的,即偏保守,其他就完全没有共同认识了。
#83 - 2022-9-6 07:13
(秋深し 情けは人の ためならず)
最简单的方法:
1. 开发一个功能,在目前的评分旁边再显示“给50部以上的动画打过分的用户的综合评分”。嫌50部多就30部,这个数字给用户自定义恐怕很耗服务器资源。
2. 或者,开发一个功能,显示“XX-YY年注册的用户对这部动画的综合评分”,XX、YY可由用户自定义。
#83-1 - 2022-9-6 19:53
LunarShaddow🌙
我基本把全站打分当个笑话,也不太在意排行榜排名
我用“好友看”这个超合金组件,看自己加的(资深)班友的评分和短评就可以了(bgm39)
#83-2 - 2022-9-7 12:01
心的神话
LunarShaddow🌙 说: 我基本把全站打分当个笑话,也不太在意排行榜排名
我用“好友看”这个超合金组件,看自己加的(资深)班友的评分和短评就可以了
我印象里之前有很多人表态,愿意回加关注自己的人(我也认为不回关不妥当),很好奇这样的小众评分有什么意义——可能因为我不好意思去主动加好友吧,总觉得单项关注很尴尬。所以我是真的很不适合这种并非可以真正筛选数据的关注制,总觉得还是要通过交流来确定自己的可信对象,甚至希望可以关了这个并非建站之初就存在(若非如此或许它也会比现在好用许多)的好友评分功能(bgm39)
#83-3 - 2022-9-7 15:19
LunarShaddow🌙
心的神话 说: 我印象里之前有很多人表态,愿意回加关注自己的人(我也认为不回关不妥当),很好奇这样的小众评分有什么意义——可能因为我不好意思去主动加好友吧,总觉得单项关注很尴尬。所以我是真的很不适合这种并非可以真正筛...
哦哦,我的好友都是双向的(同在一个动漫/游戏Q群或者在班论坛交流过的人),你看我的个人介绍就知道了~
差不多就是朋友/熟人觉得好看的片我会愿意去尝试下的意思(bgm24)
#83-4 - 2022-9-7 16:42
心的神话
LunarShaddow🌙 说: 哦哦,我的好友都是双向的(同在一个动漫/游戏Q群或者在班论坛交流过的人),你看我的个人介绍就知道了~
差不多就是朋友/熟人觉得好看的片我会愿意去尝试下的意思
所以不是谁都有条件不理会大众评分。(bgm39)
#84 - 2022-9-6 09:03


数据令人信服了。

不过我对排行榜的看法与我对评分机制的看法差不多,起码出发点一样:它应该是一个关于推荐度的排行。所以新的热门动画在排行榜上获得短期优势倒也make sense也可以接受,不过需要有冷却或防过热的机制。

不如shadow score: 「评分客观度」或「参与度」未达标的用户能看到自己的评价和分数记录,但不计入总分统计中,等这个用户的数据冷却到典型区间后才将其计入统计
#85 - 2022-9-6 10:01
(你向着名为绝望的希望展露微笑)
观众审美变化和网站用户群体迭代都是没法避免的事情,很难说能在统计上想出一个办法消除这种影响,只能说对于用户个人来说,比如某某时间段的番评分自己降低0.5,像我自己就是18年以后的番自动降0.5,但也只用在补番的时候,毕竟看了这么多年都有点鉴赏力,扫雷就不看评分了,排行榜只有补老番的时候有点参考
#86 - 2022-9-6 11:24
(如果感到快乐与幸福是虚度年华,我没什么好悔恨的。 ... ...)
人越来越多,评分越来越搞笑,也就是让阅番数量多少,评分占比不同或者规定评分必须评价并且不少于多少字这种方法,让随便打分的人滚蛋。想怎么打分就怎么打分,大概是因为评分成本太低,高就好了。
#87 - 2022-9-7 14:11
(随缘打分,情绪不安定,正确的时间看舒服了就给高分 ...)
根据本站阅番量这个数据就已经不客观了。比如我不提童年,14年开始算再次入宅成体系看动画,17年注册本站,看的时候也很少在本站标记或评论。印象应该数据在50- ,然而不算童年我也看了8年动画了…
#87-1 - 2022-9-9 21:33
夜月千秋
你这个比如并不能说明不客观,只能说明——用户实际看番数量>本站标记数量,而现在数据很明显的标记数量越多的用户,评分越低。
像你这种看番多但不怎么标记的人,肯定比那种 标记数量大几百上千但实际看了大几千个的人,要多得多(即标记数量多的用户,他的标记数量应该是更趋近于实际看番数的)
这样看,楼主的数据反而偏低了,实际情况只会更夸张,即实际看番少的人评分会比统计数据更高
#88 - 2022-9-7 18:02
(横剑听风雨浸溪,无上清凉花满席。)
婆罗门车了我200楼,当年我写尼尔评测也是这种情况。
#89 - 2022-9-7 18:24
毫无意义。自由地评分就可以了。排行榜与分数本身没有意义,没有必要去争这些
#90 - 2022-9-8 23:55
(ちっちゃい子)
每个人都有自己的评分标准,求同存异才是正确的价值观;
lz的价值观已经显著扭曲了,与微博和破站的饭圈文化有何区别?

解决方法:加多点自己认同的好友,以后看好友评分即可(我已经这么做多年了)
#90-1 - 2022-9-8 23:59
The Laughing Whimsicott
可是你说的话显然逻辑不自恰捏, 你既然都要求同存异为什么还说楼主的价值观扭曲?
#90-2 - 2022-9-9 00:02
The Laughing Whimsicott
我帮你把你的潜意识明确说出来吧, 求同存异并不是你所期望的, 你所期望的是大家都跟你一样, 最好没有不一样的.
#90-3 - 2022-9-9 00:04
The Laughing Whimsicott
而且楼主从来没有否认求同存异, 他只是在追求一个尽可能客观的排行榜罢了.
#90-4 - 2022-9-9 00:10
宿星雨
The Laughing Whimsicott 说: 可是你说的话显然逻辑不自恰捏, 你既然都要求同存异为什么还说楼主的价值观扭曲?
其实这么武断的言论根本没有回复的必要,不是所有人都可以有效交流的。
#91 - 2022-9-9 21:44
评分机制本身就很敷衍,说是十分制其实很多时候还不如五星制,大多数情况就只是3选1,这种情况下7.5四舍五入打成8也可以说是客观了。评分成全的是“bangumi评分前100”这样的统计视频,在站内还是吐槽箱更有价值吧?5分是不过不失的话,低于5分的作品为什么屈指可数呢。我单方面认为先把评分改成百分制再来规范用户才有意义。
有个想法,可以设置给tag单独打分的功能,并且tag之间可以自由加权检索,例如(40%百合+20%2022+40%安済知佳),可以直接比较的话评分警察才有真正的落脚点(
#91-1 - 2022-9-9 22:12
宿星雨
这个给tag打分的想法很有意思,不过实际运用可能标记对用户分数就很麻烦了,这可能需要更高的用户素质,这样的话还是只能先从门槛和意愿这方面入手才可能实现。
#92 - 2022-9-9 23:54
评分本身就是主观的,再怎么改也会有一部分人不满,如果完全客观化动画前百能有几个tv?有这点时间搞评分不如把类别先分好,新老用户口味差的不是一星半点
#93 - 2022-9-10 15:13
(そして、谷から戻る。)
阅读理解:“评分置信度显著偏低”的意思是?(多选)
A.  Bangumi的用户评分和番剧排名不应该仅仅是Bangumi用户对番剧的看法,还应代表所有番剧的绝对公正客观的评分和排名。
B. Bangumi的评分标准应该“老用户”的评分标准一致,“新用户”的评分标准与之不合,降低了一致性的可信度。
C. “老用户”的评分标准代表了所有番剧的绝对公正客观的评分标准。
D. “新用户”的评分不能代表他自己的看法。
E. “新用户”不算Bangumi的用户。
#93-1 - 2022-9-10 22:12
宿星雨
首先,这里所有选项可以说都没理解我的意思
这里面评分置信度指的是“合理判断各个动漫之间差别的能力”(以及相关在比较性上的对排行榜的理解和重视),其次,既然你用了引号,那么我就认为你已经理解了本文新老用户具体所指的东西,这样,我不清楚你为什么还要纠结这个术语。
#93-2 - 2022-9-10 22:22
宿星雨
最后再具体对每一个选项作个回应吧
A  后半句是一个理想  但并不是应该是绝对客观意义上的  就我个人而言是科学的样本提交了足够的data即构成了统计学上的置信度可靠   
B 完全错误  如果你完整看完了文章就不会提出这样的质疑  关于我对主观性的解释部分
C完全错误 我想我应该在原文已经否定过了这点
D完全错误 任何人当然可以代表自己的看法  不过我不认为这和本文观点有什么关系
E完全错误  显然新用户是用户的子集 不过我不认为这和本文观点有什么关系

另外,我想如果你对本文的看法有什么疑问或者是质疑,也不应该已这种容易令人误解的方式提出,并且至少应该在完整看完并试图理解本文意思再做出判断。

以上。
#93-3 - 2022-9-13 01:06
谷戻り
宿星雨 说: 最后再具体对每一个选项作个回应吧
A&nbsp;&nbsp;后半句是一个理想&nbsp;&nbsp;但并不是应该是绝对客观意义上的&nbsp;&nbsp;就我个人而言是科学的样本提交了足够的data即...
A. 绝对的排序在统计学意义上靠置信度没问题,我只是想确认楼主认为排行榜的存在意义是否在于可用于观测绝对排序,也就是楼主所说的“具有比较价值”。
B. 原文已经说了“‘新老用户’必然有统计上的差异”,我这里的选项的本意应该是“‘新用户群体’的整体评分趋势和‘老用户群体’的整体评分趋势不合”,造成了歧义还请见谅。其实说白了就是搞了两个聚类。
C. 原文“我认为,每个用户在理解了排行榜的意义、评分的比较性和对bgm排行榜的具体分数和内容有一定了解后,他的评分才具有意义。”如果用户没有“在理解了排行榜的意义……有一定了解后”这个前提,楼主认为这个评分不具有意义,那客观上就是为排行榜设置了评分标准。所有不合标准的评分都应该被修正或者排除在排行榜之外以免“危害排行榜”。
D.E. 图一乐,还请见谅。

以上
#93-4 - 2022-9-13 02:39
宿星雨
谷戻り 说: A. 绝对的排序在统计学意义上靠置信度没问题,我只是想确认楼主认为排行榜的存在意义是否在于可用于观测绝对排序,也就是楼主所说的“具有比较价值”。
B. 原文已经说了“‘新老用户’必然有统计上的差异”,...
A 绝对的排序比较价值的前提只有在所有用户都是完全理性并且完全理解和认同的情况下,对这些用户来说才具有这样的价值。我并不认为这是一个可以达到的情况,不过全年代排行榜的比较高的参考性还是可以做到的。
B 趋势不合只是结果,我并不是因为不合而否认一个群体相对另外一个群体的评分价值,而是针对其他文中提到特点和观察到情况对这种群体的评分价值进行质疑。
C 是的,这是一个预设前提,是本文出发点的根基: “一个好的评价排名系统应该合理反映其内部元素的比较性”而这只有其用户都具有一定共识下才能实现。   
与其说这是一个标准,不如说我试图澄清排名本身的内在意义。
#93-5 - 2022-9-13 02:43
谷戻り
宿星雨 说: 最后再具体对每一个选项作个回应吧
A&nbsp;&nbsp;后半句是一个理想&nbsp;&nbsp;但并不是应该是绝对客观意义上的&nbsp;&nbsp;就我个人而言是科学的样本提交了足够的data即...
其实我觉得楼主洋洋洒洒那么长一篇文章,说白了就是样本的归一化问题。

不妨简化一下模型。我们忽视掉人文历史时代受众等因素的影响,假设一部番剧存在一个绝对客观评分,这个评分是全序的,也就是说分高的番剧肯定比分低的番剧好,而且这个评分符合正态分布。

假设每个人自己给出的评分都是绝对客观评分,但问题是我们不知道每个人的绝对客观评分分布,不知道这个分布的期望值和方差。如果每个人都给每部番剧打了分,那么把这些分布简单按人数加权相加,那得出来的分布仍然是绝对客观评分分布。但是如果没有都打分,这个加权就会出现问题。

就好比你拿BGM的评分和B站的评分直接按人数加权相加一样,假设BGM的用户对所有番剧都有评分,这个分布是绝对客观评分分布。但是B站的用户只对B站买了的新番做了评分,而没有对没买的老番做评分,而且假设B站的用户对所有番剧的绝对客观评分分布的期望比BGM用户的高,那么加权得出的分布中老番的评分,肯定比B站的用户对全部番剧都评了分的情况低。这就是楼主描述的现象。

楼主给出的解决方法是统一每个人的评分标准,也就是参考BGM的绝对评分分布评分,这样加权的结果确实没问题。也有人给出将用户的评分分布进行测算,将其缩放到BGM的绝对评分分布评分上,这实际是对楼主做法的统计学修正。

那么说到底,我们真的能忽视人文历史时代受众这些干扰因素吗?我们真的能建立绝对客观评分分布,或者说指定其期望值和方差,并期待每个人都能按照这个分布打分吗?我们真的能够对用户的数据进行回归分析,从而进行修正吗?BGM老番的评分一定是绝对客观评分分布吗?有没有可能现在发生在2022年新番的事情,在五年前或者十年前也发生过?我对这些问题的解答持悲观态度。(bgm38)
#93-6 - 2022-9-13 03:46
宿星雨
谷戻り 说: 其实我觉得楼主洋洋洒洒那么长一篇文章,说白了就是样本的归一化问题。

不妨简化一下模型。我们忽视掉人文历史时代受众等因素的影响,假设一部番剧存在一个绝对客观评分,这个评分是全序的,也就是说分高的番剧肯...
关于你这个想法,我觉得很有意思,不过其实在下面几楼已经有一个班友 心之刃 在第96楼提出了然后他到小组专门提出了一个设想  具体链接https://bgm.tv/group/topic/372943
关于这点我还没回复,在这里统一说明下我的看法吧。

样本归一化的这个想法和我本文的观点实质应该是几乎一样的,不过稍微有一个不同之处:即我认为的合理评分模型不要求每一个用户必须提供大量data并按照正态分布,只要求用户在具有这个共识下为每一个data负责。
而文章的冗长也非我本意,本文是从现象出发展开思考,是对近期bgm的一个矛盾点的分析与解决的尝试,而不是凭空冒出一个关于评分系统崩坏的想法,一种对思考过程的渐进性的体现。
或者说,本身bgm是不存在需要提出“样本归一化”的契机的,从这个新用户涌入的现象破坏原来已有的相对合理且符合正态分布的这么一个情况引发了关于本文的思考从而导入这么一个结论,我认为是值得且必须的。本身,本文不单单是想陈述这么一个想法,还包括相关的分析和介绍以及关于这方面的澄清和诠释,这在一定程度上帮助我们认识这个问题的实质。

关于你提出的这个模型作为对本文描述的一个理解,我是赞同的,你关于加权统计的数据缺失和未知的客观评分分布的疑问通过技术手段进行处理也并不是一个很难的问题,它实现的关键点我认为依然是本文提到的核心观点,或者用你的模型来说就是用户都是绝对理性的这个假设。

那么现在回到你最后的疑问,真正具有价值我的认为只有第一个,2,3利用技术手段处理应该不会成为太大问题,至于第四个问题发生过没发生过也并不是一个很大的问题,追求的目的仅仅是朝着这个设想发展,何必关心过往? 就算是有过少许这种情况我还是认为这是偶然且由data少引起的问题,并不会阻碍我们解决这个问题。

那么关于你的第一个问题,我的看法是没必要纠结于时代性这个干扰因素,作为一个无论唯心还是依赖技术的手段都无法消解的影响,可以把它当作一种潜在的共识进行看待,而且我认为这个影响对具体的作品影响是很小的,对于个人来说依靠自己对时代性的主观看法带来的影响远比这微小的评分干扰效用大,因为我们并不是在绝对理性的情况下建立其排序的,所以这种误差也只能靠个人主观对排行榜的理解去消解。
#94 - 2022-9-10 23:16
是这样的,以前一直用豆瓣评分,后来大量的用户(阿B)涌入,整个日漫的评分可以说崩的差不多 了,评分已经没有多少参考价值。当然相比200来部的看番数量,我主要还是看电影多了许多,目前的分数也还能支持,
BGM在动画的评分国内来说还是有价值的,当被大量用户涌入,不断的默认满分的冲击下,不知道还能不能保持住。
#95 - 2022-9-11 04:50
(象牙门的梦,午夜前的景。)
一群人的主观也还是主观,跟客观是不沾边的,顶多是理性与否。
认为排行榜有价值就参考,没价值就不参考,又不是只有一个。
这种数量级的数据,能得出怎样的结论都不奇怪。
关于「新老用户」的一些表述,个人感觉有一点循环论证的味道。

先不谈想表达的内容,就使用数据这种手段而言提几点疑问。如果只是想用数据让观点显得更有说服力而不是想通过数据总结出有建设性的规律,请自行忽略下面这段话。
在结论里面提及的研究对象必须有精确的定义。假设研究对象是划分为A类别还是B类别都会因人而转移,那么数据和结论就很难说得上有多大的联系。
类别的划分要尽量严谨。不知道0-50, 50-200, 200-500, 500-1000, 1000+这种划分是有什么讲究吗。每个区间的用户数量也不相等;看番数量的区间长度也不相等。
『四部作品不同标记数量用户的分数统计』的柱状图是要看高度吗?但纵坐标是绝对人数,不同颜色(类别)的用户数量也不相等啊,怎么比绝对人数?
『四部作品不同标记数量用户的分数统计』的折线图是怎么看的?不同颜色代表不同番剧?纵坐标是平均分?
置信度是专有名词,别使用它的「顾名思义」用法。
#95-1 - 2022-9-11 11:19
宿星雨
先关于数据部分作一个回应吧,如你所见,本文的所有相关数据都是别的热心网友按照本文假说而收集的,一开始我写这篇文章的时候是很难自己去实现的(因为某种原因,电脑不在身边,所以很难自己动手) 所以关于数据的具体处理都不是经过我手,我个人也只是把它当作一个参考资料样的辅助论据。
具体分条解释:
关于在确定研究对象下的可靠统计我想以现在的形式是根本无法统计的,所以必须认为这种误差不会带来很大影响的前提条件下才能进行相关量化说明。
下面几个数据处理细节不是我自己做的,我也没法给出一个说明
关于置信度这个用语,姑且还是了解了下是在统计学上具有专业意义的术语,不过这种术语以语言学立场或许已经很大程度下沉到生活,我认为应该不会引起很大歧义,就暂且在这里说明下吧。

关于你第一段的观点,我也认同这也应该是一个理性而非客观的问题,这点我在文中已经澄清。 关于排行榜价值和参考性这种唯心的东西,我也并不能就这方面确切的说些什么,不过我想这样的观点肯定还是具有一些现实意义的,毕竟个人完全唯心的想法和现实的“价值”并不能完全相合,我想这应该是两个纬度上的问题吧。

关于循环论证这点,我想就这样一个现象而言,能做到这样的表述已经是我个人能力的极限了,毕竟本文的很大一部分是根据“观察”而建立其的猜想下进行的。但是我认为它至少揭示了这个现象的一部分。
#96 - 2022-9-11 09:55
(??!)
关于对bgm评分机制规则的认同和理解,可以考虑把每个用户的所有已评分条目进行排序,然后按某种分布重新赋分,不知道这种评分机制能不能实现。
#97 - 2022-9-11 12:36
(生存战略!)
中肯的,这种打分方式只会让评分榜单逐步失去参考价值,就像豆瓣和b站一样的动画评分一样,谁也不想看到最后榜单分数最高的都是那几个当季的热门流量番吧
#98 - 2022-9-12 08:07
按照我的理解,作者的观点为:
两个定义:
1.好用户:个人的动画评分榜单随时间的演化逐渐趋近至正态分布,且他们给出评分的动画涉猎广泛。在评分时,好用户可以拥有完全自由的评分标准,并且,网站应该给予这批人更大的评分话语权。
2.坏用户:个人的动画评分榜单随着时间的演化是非正态的,具体来说,他们的榜单评分会始终聚集在高知名度动画的高分段(8-10)分。
这里的“好“,”坏”只做区分之用,不涉及道德上的评判。
核心观点:
早期的bgm是好用户占据主流,此时的动画评分拥有很高的参考价值,而近年来,越来越多的坏用户开始使用bgm,降低了bgm评分的参考价值。
具体体现:
蒜,赛马娘,辉夜3等的过高评分

不知我是否正确理解了作者的观点?如果不正确还请作者指正。如果我以上理解正确的话,我有几个问题想请教作者:
1.作者对于“坏”用户给出了比较量化的定义。但似乎没有给“好”用户一个量化的定义。上面的正态分布说是我个人的理解,作者能否对“好”用户给出一个量化的定义,还是已经写了我没有看到?
2.作者认为2021年以前注册的用户以“好”用户居多,那么按照我个人的理解,因为“好”用户的评分榜单理论上应该广泛涉猎,所以高排名动画的评分人数应和低排名的评分人数应该大致相同。但是,以均出品于2014年的白箱和魔法战争的对比为例。前者评分人数大概为12000,后者大概为1000,就算按作者数据中估计的6:4的新老用户比换算,白箱的评分人数也为7000人。两部动画的评分人数比为7:1,是否可以认为按热度来决定是否打分排名一直是普遍现象?这是否与“老用户大多是’好‘用户”这点相悖?
3.作者同时认为新用户大多是“坏”用户,理由是新用户给出的平均分数相比老用户更高。但是,能否定量化评估这其中新鲜感和情怀加成的影响?萌新第一部动画往往就是这些高热度动画,热度动画往往质量不算差,而新用户们处于萌新时期的接受度也相对较高。因此,哪怕假设新用户全都是“好”用户,在他们未来进行评分时,他们还是会因为第一次观看该类型篇时的新鲜感,以及情怀的加成,从而把这些动画排在靠前的位置,而老用户则反之,这同样可以解释作者观察到的结论。请问作者如何排除类似结论的影响?

另外是个人观感:
作者写文章的一些表述写的太晦涩了,”新老用户“这种文中具体含义和读者直观表意出现冲突的情况完全没必要。还有什么“系统内共识”,“统计学意义上的相对优势”,“相对影响”,这些词看上去高大上,在我看来只是凭空提高了领会作者意图的难度,换成更口语化的词汇就好了(bgm38)
#98-1 - 2022-9-12 09:43
宿星雨
首先我想你对本文的理解大概是没有问题的,有问题的我会在下面回答指出。
我文中对“新(好)用户”的定义是熟悉bgm排行榜并在评分时有能力根据个人经验对同类型和同分数作品进行一定的比较的这类用户,可以理解为随时间演化大致会逐渐接近正态分布,但是要指出的一点是,成为正态分布并不是成为一个“好用户”的必要条件。  比如一个人要对一个rank200的百合作品作出一个“合理”的判断,只要他足够了解rank200附近的作品和其他一些百合类作品,就可以认为他达到了本文的认定,也即是:一个“好用户”完全可以只通过观赏高分作品(比如rank前1500)达到本文合理判断的要求。

1.对“好用户”的量化定义? 嗯嗯... 其实这两类用户定义本身是由其某种内在的认识导出的,量化说明仅仅是试图去大致区分他们的一个人为手段,本身想要由统计去完全区别他们是很困难的,不过这样大致的量化区分我想带来的误差应该会在一个合理范围内。  量化只是一个描述方法,并不是精确的定义还请了解。

2.这个应该是一个理解错误,在用户具有一定的对排行榜中各个分数段和某种类型的优劣作品的理解后就可以认为他已经具有了合理的评分能力,只要他具有这种能力,那么只要他合理的评判每一个自己看过的动漫即可以认为这个数据在本文的意义上是有参考性的。  评分人数对动漫排名的影响是很低的在bgm,所以在这种意义上热度并不会影响一个动漫的评判。 也就是,对所有用户都是理性的情况下,热度只可能影响data数,不可能决定打分排名
3.首先这种量化评估的可行性显然是不能的。我是否可以认为,这种情怀作品数对老用户应该是很少的,而新用户则作作是情怀。
另外我想这种情怀的加成随着时间的流逝应该会逐渐消减,如果他真的具有这种能力的话,他应该会在后期对评分不断修正。
再者,如果假定这种影响对所有用户影响一致的情况下,对热门作品进行了统计,还是会显著发现新用户比老用户评分高,所以这种影响绝对不是仅仅由新鲜感和情怀引起的。对这种误差的调整已经超越了靠数据分辨的手段,不再本文探讨的影响范围内了。

关于你观感的问题,我想很难用其他词语更能准确表达我的意思,并且只是简单的词语组合,我想还是比较好理解的。以后有时间也会慢慢润色吧。

以上。
#98-2 - 2022-9-13 03:38
河津
宿星雨 说: 首先我想你对本文的理解大概是没有问题的,有问题的我会在下面回答指出。
我文中对“新(好)用户”的定义是熟悉bgm排行榜并在评分时有能力根据个人经验对同类型和同分数作品进行一定的比较的这类用户,可以理解...
感谢回复,可惜作者的回复目前还没有解决我的疑惑。回过头来看我的最初的提问,感觉还是涉猎太广。因此我想先聚焦一下,先就”好“,”坏“用户的定义,像作者提一个具体的问题:
现在我观察到了一个bgm用户,他所给出的动画评分全部落在8-9分这个区间,此时,他既有可能是作者正文中描述的,只给高热度作品打高分的“坏用户“;也有可能是作者在回复中描述的,阅片无数,对动画充满深刻理解,但只给自己欣赏的高分作品打分的”好用户“。请问,我该如何把他们区分开来?
我认为,如果作者真的想完善自己的理论的话,那么”好“,”坏“用户的定量化定义是十分必要的,因为它直接影响到我对于后续作者所给数据的理解。至少,能请作者提供一个能把“好用户”,“坏用户”完全分割成两个不相交的集合的定义(哪怕是粗糙的,我们可以在之后不断打补丁来完善)。否则,我完全可以将作者在文末给出的数据解读为不同世代的审美差异造成的系统性差距。
#98-3 - 2022-9-13 04:04
宿星雨
河津 说: 感谢回复,可惜作者的回复目前还没有解决我的疑惑。回过头来看我的最初的提问,感觉还是涉猎太广。因此我想先聚焦一下,先就”好“,”坏“用户的定义,像作者提一个具体的问题:
现在我观察到了一个bgm用户,他...
区分方法:当面去问问他关于评分的看法。
谈笑了,不过你要区分具体的用户我想只能用这个手段了。
从技术上看应该无法从用户提供的少量信息完全的区分出这两类用户,如果一定要完全量化区分所有用户的话只能通过从对个纬度建立类似用户画像的手段去尝试达到这个目的,如本文中按注册时间和评价数,如果引入更多更具体的参数那么就也许可以达到量化刻画这么一个水平,比如各大社交软件的大数据算法达到效果,所以这本质上是一个技术问题,还是要求极高的技术的问题。
也就是说本文的定义只能停留在定性的不精准的描述是有原因的,如果想要凭个人实现这个量化我认为是几乎不可能的,但是我认为按照文中的两个纬度应该已经可以反映这个现象的成因了。关于你所提出的例子可以认为只是极少数的情况,并且和与之相反的情况带来的影响相互抵消就可以认为这几乎不会对结论带来什么影响
在这种并不是完全明确的情况下对数据的解读是有一定空间的,不过我不认为审美差异在不同世代会有显著变化,因为时间跨度并没有那么长。


以上。
#98-4 - 2022-9-14 04:00
河津
宿星雨 说: 区分方法:当面去问问他关于评分的看法。
谈笑了,不过你要区分具体的用户我想只能用这个手段了。
从技术上看应该无法从用户提供的少量信息完全的区分出这两类用户,如果一定要完全量化区分所有用户的话只能通过从...
再次感谢作者的回复。
的确,如何精确地区分“好用户”和“坏用户”一直是无数评分网站梦寐以求,却同时遥遥无期的目标。即便他们有着数量和水平都高于你我的程序员和统计学家,却至今无法给出一个公认满意的答案。要求作者能给出一个没有漏洞的答案的确有些强人所难,不如说,如果作者真能给出一个自洽的答案,我建议作者可以考虑撰文投稿给专业的学术期刊。我也有幸能参与一个伟大的工作的讨论。

但是,我想重申的是,哪怕无法给出“定义”(充要条件),至少,我认为作者必须要给出一个用以判断“好”,“坏”用户的,定量化的“判定”(充分条件),这样才能保证这篇文章最基本的严谨性。这同时也是我认为本文最大的漏洞,具体论述如下:

作者在正文以及回复中均提到,“个人的动画评分榜单仅局限在高分区间”只是“坏用户“的”性质“(即必要条件);换句话说,“只给高评分”和“评分作品少”均无法判定一个用户的“好”与“坏”。然而,在正文结尾解读数据时,作者的逻辑链条是这样的:

“因为新用户评分高,所以新用户是‘坏用户’“

在我看来,这明显是犯了一个将“性质”(必要条件)当“判据”的逻辑错误。更重要的是,这个错误完美地融入了作者的核心论点,构成了一个经典的循环论证:

--“我认为某作品评分偏高了,因为有大部分的新评分用户都是坏用户,他们只会打高分”
--“为什么新评分用户是坏用户呢?”
--“因为他们的给的平均分偏高”

在我看来,作者犯下这个错误的原因,就在于在正文中使用“新老用户”来称呼“好坏用户”。作者试图从最开始的定义层面就尝试体现其最终的结论,结果在写作和论证的过程中连自己都把这两组概念混淆了。

当然,这只是基于我自己的阅读理解所得出的拙劣的结论,如果我哪里误解作者的观点和论证,还请不吝赐教。
#98-5 - 2022-9-14 11:24
宿星雨
河津 说: 再次感谢作者的回复。
的确,如何精确地区分“好用户”和“坏用户”一直是无数评分网站梦寐以求,却同时遥遥无期的目标。即便他们有着数量和水平都高于你我的程序员和统计学家,却至今无法给出一个公认满意的答案。...
关于你对量化的想法,我已经说明了这是不可能简单判定的,有关于人的研究即在社会科学中也不可能对人的内心想法进行简单的定量定性,充其量是通过调查的方法去得到一个关于定性定义的分布,我文中的定性定义则是关乎评分用户自身的一个看法,定性尚留有部分中间地带,不过这都是由于研究对象自身的特性决定的。

我提到的这类用户特征确实只是它们的一个性质,并不能就此判断这与我的定性定义是否符合,但由于以上对人内心主观性质进行定量统计的困难性和不可操作性,只有先假定这种性质和用户之间具有显著的相关性,是高度重合的一个群体,而且这种误差不是单向产生,是两个方向互相抵消的,所以我才在假设和逻辑下使论证得以进行。

我的论证逻辑简单说明如下:
1.(假说部分)在一个理性、能体现作品比较性的一个排行榜中,用户应该具有一定横向纵向比较相关作品的能力,并依照自身评价标准内部的比较性作出自己的评价。该类用户的一个显著特征是评分呈现正态分布。而“坏用户”则因为不能认识以上共识或者缺乏比较能力提供了无法自洽的数据。(简单概括,具体意思还请照原文理解)
2.通过对“坏用户”特征的分析,认定这与近年大量涌入的新用户高度重合,并用简单两个纬度的数据统计分析进行佐证,这一个结论也与观察到现象高度吻合。
3.得出对近期bgm评分争端问题产生的主要原因,并提供几个或许可行的意见。

以上。
#98-6 - 2022-9-15 03:42
河津
宿星雨 说: 关于你对量化的想法,我已经说明了这是不可能简单判定的,有关于人的研究即在社会科学中也不可能对人的内心想法进行简单的定量定性,充其量是通过调查的方法去得到一个关于定性定义的分布,我文中的定性定义则是关乎...
看来作者并没有看懂我在说什么:

“通过对“坏用户”特征的分析,认定这与近年大量涌入的新用户高度重合”----我可以承认你这个分析,即“坏用户”高度重合新用户,但是,新用户高度重合了“坏用户”吗?

“坏用户”都是新用户--OK,请问新用户都是“坏用户”吗?如果不是,新用户有多少是“坏用户”?能不能估计一个大概范围并简单论证?

这是简单的充分条件与必要条件,包含与被包含的关系。

作者本文要论述的任务有两点:1.新用户是“坏用户”,2。新用户打出了高分

作者最后的数据,我只能看到关于第2点的证明,即“新用户打出了高分”

如果方便,请作者务必向我重新论证第1点。
#98-7 - 2022-9-15 12:11
宿星雨
河津 说: 看来作者并没有看懂我在说什么:

“通过对“坏用户”特征的分析,认定这与近年大量涌入的新用户高度重合”----我可以承认你这个分析,即“坏用户”高度重合新用户,但是,新用户高度重合了“坏用户”吗?

...
就近年来bgm的用户而言,应该很大一部分是相重合的。
新用户是坏用户这种绝对的看法并不是本文要论证的要点,本文要论证的只是由于近年由于bgm名气越来越多,被各种地方引流、介绍来的新用户中属于坏用户的这一部分比例显著更高。而这一相对趋势引发了种种问题,使得情况朝着更坏的一边发展。再者,本文说指的“新用户”并不是真正的新用户,你这里已经忘记了前文的概念了吧,毕竟符合定义的这部分“新用户”就是“坏用户”的代名词,具体关于定义的内容你可以重新看一遍。
也就是说我不需要简单估计也很难去实际估计这一范围,并且简单论证这点需要大量时间去对用户数据人工分析,这是我个人很难做到的。我要说明的只是由于某些外部原因这个比例在扩大,不仅是相对数量,绝对数量更是,而排行榜是综合全部用户数据而得出,所以放在一起这种总体“坏用户”相对比例就是急剧上升。这点就是可以通过我的论述简单得出的结论,不知道你有想法。

以上。
#98-8 - 2022-9-16 02:43
河津
宿星雨 说: 就近年来bgm的用户而言,应该很大一部分是相重合的。
新用户是坏用户这种绝对的看法并不是本文要论证的要点,本文要论证的只是由于近年由于bgm名气越来越多,被各种地方引流、介绍来的新用户中属于坏用户的这...
我没有看到你给出任何可以量化的“定义”。你给出,可以量化的指标全部都是“性质”,“性质”无法作为“判定”,这是上过初中数学课的人都知道的知识。

请你不要断章取义,我要你做的不是证明新用户都是”坏用户“,而是,新用户有多少是“坏用户”?能不能估计一个大概范围并简单论证。如果你不能,那既然你都判断不出新用户中有多少坏用户,你又是怎么给出坏用户绝对和相对数量都增长的这个结论的?

我再强调一遍,现在你的数据最多能证明新用户打的平均分高,但是,请麻烦你详细说明,你是如何证明的”坏用户“在新用户中相对比例极具上升的?
#98-9 - 2022-9-16 08:04
宿星雨
河津 说: 我没有看到你给出任何可以量化的“定义”。你给出,可以量化的指标全部都是“性质”,“性质”无法作为“判定”,这是上过初中数学课的人都知道的知识。

请你不要断章取义,我要你做的不是证明新用户都是”坏用户...
1.不是所有东西都可以量化定义的,心累,性质为什么不能成为一个定性的判定? 这不是关乎数学,而是一个关乎社会科学的问题。

2.我并不需要估计这个范围并简单论证,显著相对增长这个结论难道从性质上难道就没有任何表现?  

3.不是所有东西都要用量化数据才能说明的,通过我的论证和其他辅助数据已经能够说明这一点了,关于这个结论的直接说明我想我已经解释过这是关乎人的内心的观点的统计,凭个人是不可能按你的想法去证明这一点的
#98-10 - 2022-9-17 06:21
河津
宿星雨 说: 1.不是所有东西都可以量化定义的,心累,性质为什么不能成为一个定性的判定? 这不是关乎数学,而是一个关乎社会科学的问题。

2.我并不需要估计这个范围并简单论证,显著相对增长这个结论难道从性质上难道就...
性质和判定,又或者称充分条件和必要条件,这是逻辑学的基本内容,不管是数学还是社会科学都适用,只要你自诩科学,就必须遵循基本的逻辑关系。举个例子,我说中国人具有人类的性质,那请问我看到一个人类就能判定他是中国人了吗?同理,坏用户都打高分,那打高分就是坏用户了吗?

我没有看到对于新用户和坏用户之间的数量关系和变化趋势有任何”推导论证“。如果你确实有,我请求你能够再简要阐述。

更何况,在没有量化证据的情况下,任何的推导都只能是假说,没有人能称之为可信结论,爱因斯坦不能,你也不能。

最后,我再再强调一遍,现在你宣称的辅助数据最多能证明新用户打的平均分高,但是,请麻烦你详细说明,你是如何证明的”坏用户“在新用户中相对比例极具上升的?
#98-11 - 2022-9-17 08:36
宿星雨
河津 说: 性质和判定,又或者称充分条件和必要条件,这是逻辑学的基本内容,不管是数学还是社会科学都适用,只要你自诩科学,就必须遵循基本的逻辑关系。举个例子,我说中国人具有人类的性质,那请问我看到一个人类就能判定他...
打高分并不是坏用户,而是符合定义的是坏用户,你这个问题没有意义...... 而且请问那本社科书籍对关乎人群分类的判断用量化来做的,请指教下,不过别把问卷调查这种的拿来就是了。  用性质判断唯心的内容是社科里一种近似定性的方法,不知道你认为怎么样的形式才可以论证?

数量关系和变化趋势:新用户大量增加,其中坏用户比例比以往显著上升,所以坏用户在总体用户相对比例显著上升    我不知道你要什么形式的推导论证  在状态论据下可以做到这样的论述已经是极限了   

对,这就是一个假说,就算有量化研究,大部分社会科学关于人的研究的取样方式、关于量化的前置条件和适用性也是相当有局限的,就访谈式调查这种相对可靠的量化方式也只能得到极少量数据,至于问卷调查这种采样方式不同时期不同团队得到截然不同的结果更是司空见惯,其他的种类量化数据就是类似本文的状况证据,这反而是更加可靠和被认可的,虽然这部分数据不能直接反应人的内心。  如果按照你的质疑方式、那么的确几乎所有关乎内心的社科研究都不能称之为可信结论了 。

这并不是一个需要严格证明的问题    类似于数学的 显然  
新用户平均分显著更高难度不能从尝识上说明这一点么   我这不是真正的论文   你也不能强人所难啊   我已经说了你要量化这就需要访谈式调查,坏用户是一个关乎内心的概念,仅仅凭任何可以采集到的统计数据你都可以说我无法直接证明这一点,因为这是一个关乎内心的问题,但是状况证据,和无数可观察的事实,都是和结论高度一致的,这只可能是唯一的解释。
如果你认为这可能是某种偏差或者是对数据错误解读,那么请你提出其他可能的对这种情况的合理的解释。你是否认为坏用户在新用户与往期只是略微增加或者是持平?如果是,相应的可能导致评分偏高的理由是什么? 其相对本文的论述是否更加合理有说服力?是否符合可以观察到的现象?

最后,关于论证过程的量化处理是在个人能力之外的,我不想对这块再作出什么回复了, 或者请你提出一种可行的又可以让你觉得严格的证明形式?不然一切都是空谈。 没有量化证据任何推导都是假说,但是理论科学也仅仅是建立在观察上的经验科学,数学仅仅是建立在公理上的形式科学,你当然可以说它们只是假说,是一种形式,它们都有一定的无法用论证说明的前提。这种局限性在我的文章中也是同理,你不可能要求我对所有说明都做到完美,这是统计上量化不可能做到的事情,不过难道一个论证不是完美的那么你就能说它是完全没有价值么?任何这种研究都不可能做到完美,如果你这样寻求直接的定量证据,不过这难道就能说明这些论证是无意义的么?

如果你只是认为我的论证不够严格,那么还请提出其他可能的原因,解释新用户平均分显著更高这个现象。
#98-12 - 2022-9-18 00:53
河津
宿星雨 说: 打高分并不是坏用户,而是符合定义的是坏用户,你这个问题没有意义...... 而且请问那本社科书籍对关乎人群分类的判断用量化来做的,请指教下,不过别把问卷调查这种的拿来就是了。&nbsp;&nbsp;用...
你的文章的结论是”坏用户在新用户中的占比上升,因此打分高“,当我要求你给出证明论证”为什么坏用户在新用户中占比上升“时,你居然回答我”显然“?

这就是典型的”车库里有一条隐形火龙“理论,火龙理论同样也是符合逻辑的,但是这种纯靠自由心证的,无法证伪的理论根本就沾不上科学性。当我问”为什么车库里会有火龙“的时候,我也会被回答”显然,他就在那里了“

请你不要小看社会科学了,虽然对人群的量化一直是大家面临的问题。但是永远是拿出数据的一方比自由心证的一方更可信。就单单对用户肖像侧写这块,你以为抖音是如何做到那么强的?你以为淘宝京东是靠自由心证给你推广告的吗?人家就是靠着”大数据“来完善量化用户侧写的,量化的越好,公司就做的越好。到你这就成了”没有人群分类的判断用量化来做的“。

这篇文章,一来你拿不出数据说明坏用户在新用户中的占比,二来连理论上坏用户与新用户之间的数量关系都用”显然“来代替。很遗憾,我认为这篇文章缺乏基本的严谨性,很难然我信服。
#98-13 - 2022-9-18 01:32
宿星雨
河津 说: 你的文章的结论是”坏用户在新用户中的占比上升,因此打分高“,当我要求你给出证明论证”为什么坏用户在新用户中占比上升“时,你居然回答我”显然“?

这就是典型的”车库里有一条隐形火龙“理论,火龙理论同样...
1. 本文重点不是论述为什么,不过这方面还是有说明的
关于坏用户在新用户占比上升这点的论述,我已经用纯粹的理论推导、观察到的现象以及其他状况证据进行了一个非量化的论证,你一直要求我给出应该量化论证,我已经说明这点在当前数据采样水平和个人能力是无法给出的,上面的回复说漏了点,我认为的是在已有的定性论述上是足够充分了的。

2.至于证伪这一点,对本文而已的基于定性的观点证伪就是提出其他合理的解释去说明这一个现象,你不能指望靠定量去说明这个东西。

3.我的意思也不是人群分类判断是不能用量化来做,我指的是社科专业上的问题相关论文的针对人群分类的问题,比如区分不同地区选民的政治素养,预测其对某一个争议话题的看法。在这种基于有限的信息(或许仅仅是网络问卷),在这种信息有限情况的下的对用户的判断。
你觉得这和抖音(淘宝同理)的按你喜欢的视频的类型、以及其他喜欢这类视频的人喜欢看得,和类似作者这些信息,给你推荐潜在的你可能喜欢的视频的这种算法,和我所说的社科里区分一类用户主观的看法是一回事么?要预测什么画像、首先就要有什么信息,这种大数据算法在你提供的数据不全的情况下,别说什么用户侧写,顶多就是过已有的喜好信息预测喜好罢了。
那么问题来了,你觉得社科里通过问卷调查(别跟我说访谈,这能有多少样本)得到的一个人不一定真实的关于某些问题的模糊选择判断得到的数据去判断这个人对于其它关于现实的问题判断,这个难度和可信度可以达到你量化的标准么? 这究竟是量化还是对数据的一定人为算法呢,这个算法本身不就是本文的一种基于假设的论证,一个在你看来又需要严格量化或者通过数学说明的东西,所以结论就是,这种论证是不可能完成的。何况本文可以达到的数据纬度还远远没有问卷调查这么高,几乎是目前可以达到的极限

4.你还有一个问题没有回答,你认为针对本文有哪些可能的量化论证形式?  如果这你没法说明,还要求我量化,不是强人所难么。


以上。
#98-14 - 2022-9-18 06:51
河津
宿星雨 说: 1. 本文重点不是论述为什么,不过这方面还是有说明的
关于坏用户在新用户占比上升这点的论述,我已经用纯粹的理论推导、观察到的现象以及其他状况证据进行了一个非量化的论证,你一直要求我给出应该量化论证,我...
”关于坏用户在新用户占比上升这点的论述,我已经用纯粹的理论推导、观察到的现象以及其他状况证据进行了一个非量化的论证“--我没有看到你关于这点给出了任何”纯粹理论推导“,更遑论”观察“和其他确凿的”证据“,我要求你能就你的“理论推导”再简要阐述一遍。(我已经反复多次要求你就这一问题给出论述了。)
#98-15 - 2022-9-18 08:12
宿星雨
河津 说: ”关于坏用户在新用户占比上升这点的论述,我已经用纯粹的理论推导、观察到的现象以及其他状况证据进行了一个非量化的论证“--我没有看到你关于这点给出了任何”纯粹理论推导“,更遑论”观察“和其他确凿的”证据...
理论推导就是新用户来源相比以前更偏向于网络社区引流(比如贴吧、b站)、动漫影响力增大和信息技术的发展带来观赏门槛降低、观察到的现象就是站内确实的情况,状况证据就是那两项有高相关性的数据

你不要逃避你面临的核心问题:你认为我的结论不可靠,但是你提出不了其他任何一个可能对这个现象解释的原因。

即上文的如果你认为这可能是某种偏差或者是对数据错误解读,那么请你提出其他可能的对这种情况的合理的解释。你是否认为坏用户在新用户与往期只是略微增加或者是持平?如果是,相应的可能导致评分偏高的理由是什么? 其相对本文的论述是否更加合理有说服力?是否符合可以观察到的现象?

我这不是真正的论文,如果你非要我个人在这种无法纯粹通过逻辑和纯粹通过直接数据证明的问题上都提出一个可以被接受的严格的论证,那我的回答就是做不到。但是这只能说明我的论证不是完美的,如果你对结论有质疑,不应该只质疑过程的不完美,而是提出其他可能的结论和解释。
#98-16 - 2022-9-18 23:08
河津
宿星雨 说: 理论推导就是新用户来源相比以前更偏向于网络社区引流(比如贴吧、b站)、动漫影响力增大和信息技术的发展带来观赏门槛降低、观察到的现象就是站内确实的情况,状况证据就是那两项有高相关性的数据

你不要逃避你...
“新用户来源偏向于网络引流”--有没有数据支持你的说法?还是只是“你觉得”?更近一步地,来源网站的用户素质和目标用户的多少程度能划上等号?举个例子说明,我能从中国境内中国公民的平均素质直接推导出旅居海外的中国公民的平均素质吗?

动漫影响力增大和信息技术的增加只能说明新用户增多。难道上世纪中国新增人口逐年递增可以推导出中国人口中素质低的人所占比例越来越大?

你观察到的现象现象只有新用户平均分比较高。不能直接说明这些高分就是坏用户打的

高相关数据--我没有看到你对于坏用户与高评分/低收藏之间的相关性有任何说明。正如之前说的,好用户也可以高评分/低收藏。你的所谓证据,正如我之前说的,只能说明新用户打分偏高,请你再严格论述新用户坏用户之间的关系。

另外,立论完全不是我面临的核心问题,这是你面临的核心问题。世界上暂时没有人能证明哥德巴赫猜想,但完全不妨碍我们判断一个证明的正确与错误。我只需要指出你的论证有哪些不完善的地方就够了。
#98-17 - 2022-9-18 23:29
宿星雨
河津 说: “新用户来源偏向于网络引流”--有没有数据支持你的说法?还是只是“你觉得”?更近一步地,来源网站的用户素质和目标用户的多少程度能划上等号?举个例子说明,我能从中国境内中国公民的平均素质直接推导出旅居海...
先说点题外话,我觉得以你这种真·批判性阅读的方式去阅读文章,没有一篇涉及到观点的文章的会让你满意,我还是比较佩服这种读者的。
不知有哪些你认可的观点类文章可以成为给我示范的样板,不过就算是一些某乎上看到的基于严格的量化的某些统计学专业答主的文章,结论也是根据有相关性的数据推测得来的结论,哪来那么多直接数据?

扯远了,关于来源网站用户素质多少程度可以划等号,这肯定是相当程度的   因为这在目标网站仅仅是一个不带门槛的信息展示
你举的例子是一个自带前置筛查条件的问题,有能力旅居海外的中国人经济实力几乎都是处于全国前百分之十这个范围内,这显然是不可以类比的  (上面只是大概的说理,我不想也懒得去用纯粹的推理去把所有观点都解释一遍)

第二段还是一个门槛的问题。不想解释了。

那有没有其他合理的解释说明我观察到现象的成因?

我已经说明了,但你不认为是说明,你认为只有量化直接证据才是说明,但你给不出任何可能的说明形式 ,如果没有一种可能的被你接受的严格论证的形式,你让我怎么去完成一个不可能的挑战

是的,这仅仅是不完善的地方,而且主要是基于问题的特殊性带来的限制,但是这完全不意味着相关的数据的含义是与我说明相悖的,就证伪这个角度出发甚至很难提出一个其他合理的解释与数据、可观测的事实吻合。不是我不愿意完善这个论证,而是没有可能的形式。
#98-18 - 2022-9-19 01:56
河津
宿星雨 说: 先说点题外话,我觉得以你这种真·批判性阅读的方式去阅读文章,没有一篇涉及到观点的文章的会让你满意,我还是比较佩服这种读者的。
不知有哪些你认可的观点类文章可以成为给我示范的样板,不过就算是一些某乎上看...
说点题外的话,我看的文章还不少,本身与接触的也是与统计息息相关的工作,我可以很明确的告诉你,我满意的文章有很多。你这篇文章,最大的问题可不是量化(我也没指望你能做到多准确的量化),而是缺乏基本的逻辑关系。具体地举例,明明你明白打高分是好坏用户都会有的行为,却强行说新用户的高分是新用户是坏用户的佐证。

原来你也知道要加一个来源和目标中间要加一个“门槛”?而不能直接推导啊,请问目标网站和来源网站之间真的没有门槛?如果没有门槛的话为啥网站之间用户量差那么多?注册填写个人信息的时间算不算门槛?管理个人账户,额外的搜索,门类添加算不算门槛?没有自己认识的好友和大v算不算门槛?为自己增加费劲吧啦的长文章阅读算不算门槛?用户之间如果真没门槛可以无障碍自由流通的话,理应一开始各个门户网站就不会存在差别。

我可没有只认“量化证据”。我只要求你的论证符合逻辑关系就行。至少,必要条件和充分条件能够理清吧。说明好你的定义是啥,假设是啥,然后按照基本的逻辑关系得到结论,并且保证假设和结论之间不搞循环论证。我觉得这对初中生来说都是不难理解的要求。

至于最后,阿蒂亚老爷子觉得很赞:“没有人比我更接近黎曼猜想,所以我就是对的”
#98-19 - 2022-9-19 07:39
宿星雨
河津 说: 说点题外的话,我看的文章还不少,本身与接触的也是与统计息息相关的工作,我可以很明确的告诉你,我满意的文章有很多。你这篇文章,最大的问题可不是量化(我也没指望你能做到多准确的量化),而是缺乏基本的逻辑关...
1.这是因为新用户的高分无论是平均分还是高分率都显著高于平均水平

2.这种门槛仅仅是百度一下bgm排行榜然后注册,而且bgm注册实在不算门槛,还没b站发弹幕门槛高。

3.我认为我的定义和假设都好好说明了,论证也是按照基本关系之间进行的,你认为我的循环论证的观点不如说是一种本文的基础前提,你可以认为这是一种形式的默认假设。不然是没有办法就已有的现象和相关数据进行任何说明的,也就是说脱离了某些必要的假设任何人都无法对这个现象进行“按基本逻辑关系”得到结论。

4.纯数学问题和社会类问题的接近、近似解,和最好的解释不是一个范畴的东西。

ps:你认可的文章可以发几篇到私信里让我瞻仰下么,看看是怎么样“按基本逻辑关系”得到结论。
#98-20 - 2022-9-19 07:53
宿星雨
河津 说: 说点题外的话,我看的文章还不少,本身与接触的也是与统计息息相关的工作,我可以很明确的告诉你,我满意的文章有很多。你这篇文章,最大的问题可不是量化(我也没指望你能做到多准确的量化),而是缺乏基本的逻辑关...
再次简单说明下我的定义,假设,和论证过程。

定义:从内心观点的区别,定义出两个不同用户类别。并基于这些观点推导出其各自所具有的性质和表现,虽然是一个唯心的定义,但由于这两个观点本质上是相当对立的,所以可以认为中间的模糊地带极少。  就目前的数据收集水平和对人内心调查的局限性,无法进一步提出任何可能的直接量化水平上的精确定义。

2.根据新用户平均分还是高分段比例都显著更高,推断出这类用户群体中坏用户的相对数量肯定更高 (因为仅仅靠评分口味我们应该认为这在全体用户中是平均分布的,没有任何理由认为新用户平均分应该偏高)(那么,新用户和其他用户的不同点很显然只体现在一个纬度上,就是对相对专门的网站类评分机制的了解和比较性的认同)

3得出结论

我不知道你认为论证过程中的哪部分是循环论证,不符合基本逻辑。
#98-21 - 2022-9-20 04:25
河津
宿星雨 说: 再次简单说明下我的定义,假设,和论证过程。

定义:从内心观点的区别,定义出两个不同用户类别。并基于这些观点推导出其各自所具有的性质和表现,虽然是一个唯心的定义,但由于这两个观点本质上是相当对立的,所...
基本逻辑错误就在于坏用户可以打高分,好用户也可以打高分。所以打高分推导不出打高分的人是坏用户。为什么评分口味在统计上不能是关于时间的函数?

80年代年轻女性喜欢穿喇叭裤,现在年轻女生喜欢穿紧身裤,而当年的年轻女性对紧身裤评价不高。然后你统计人们对于紧身裤的评分,发现紧身裤的评分在新用户中明显更高,于是你觉得是这是坏审美?
#98-22 - 2022-9-20 08:09
宿星雨
河津 说: 基本逻辑错误就在于坏用户可以打高分,好用户也可以打高分。所以打高分推导不出打高分的人是坏用户。为什么评分口味在统计上不能是关于时间的函数?

80年代年轻女性喜欢穿喇叭裤,现在年轻女生喜欢穿紧身裤,而...
关于推导,所有只要关于内心喜好的观点当然不能直接推导出,这是一个合情推理。
就如通过分析昆山市居民消费手机平均价格显著高于西藏,得出昆山市居民消费能力更强这一点,你也可以用“买更贵的手机推导不出西藏人民消费能力更弱,穷人可以买贵手机也可以买廉价手机,富人也可以买贵手机和廉价手机,这只能说明一种口味上喜好”  所以说你永远无法通过侧面论据直接说明一个问题,而是推理。当然上面的例子不太准确,可以用其他直接关乎经济指标的数据直接论证,但是,很多问题是并没有直接数据支撑的,就如本文的一样,你可以靠这种理论反驳一切没有办法得到直接论据的文章:“因为x可以,y也可以,所以推导不出,这是一个关于xx口味的问题,不能反映口味之外的任何事物。”

再就你认为评分口味是关于时间函数的一点作一个说明吧,
这显然是一个为了反驳而反驳找出的理由,我没见过有人会用“为什么不能xx”却提不出任何可靠理由去反驳另外一个有着深厚论据的观点,你同样也可以用这一点去提出无数的理由去反驳任何一篇这类观点论证型文章。但是这种没有任何证据支持的假设是不会被接受的,何况它还违背了已有的数据和证伪性原则。

具体解释:评分口味在时间上可能是关于时间的函数,但一定不是随时间的单调递增函数,遵循价格回归价值的经济学基本原理,这个影响在同一个社会环境下短期内是总体稳定的,是解释不了评分平均分在短期内上升是由于该因素导致,并且该因素有无法证伪性,你可以用xx口味是关于时间的一个函数解释任何一个品牌几年内的销量变化,口味本身可能是一个因素,不过问题是,有人会单纯只相信这一点么。

从bgm的总体情况来看平均分突然提高就是最近3-5年左右的事情,没有任何特别的理由认为最近几年评分口味函数随时间突然上升,并且这种分数增加是只明显体现在新用户上的,老用户评分还是平稳的一个状态,难道你认为评分口味函数在不同人群中会有显著差异? 这又是不可能的,这是一个平均的分布,所以这种用户间的差异不可能用口味进行解释,因为如果口味是一个随着时间的函数那么新老用户平均分应该都显著增加,并且口味是解释不了内部的评分差异问题的,为什么口味在人群中共同增加会带来群体评分差异?这只有可能是群体本身的原因带来的。

如果你认为新用户和老用户的口味应该分别计算,那么不仅违背逻辑,还无法证伪。你可以用这种口味论的论证方式去论证任何关于主观喜好的问题。

最后,你不觉得你应该对你的假说负责么?
一句为什么不能是关于时间的函数就能对本文产生任何影响么?
我并不需要一条一条用论证排除所有其他可能解释,如果你有其他可能的解释,你应该提出假设然后论证,我根据你的论证进行考虑然后再分析其可靠性。
你这样默认本文是完美的前提下提出“一句”不攻自破的假设我不知道有任何意义
#98-23 - 2022-9-20 08:10
宿星雨
河津 说: 基本逻辑错误就在于坏用户可以打高分,好用户也可以打高分。所以打高分推导不出打高分的人是坏用户。为什么评分口味在统计上不能是关于时间的函数?

80年代年轻女性喜欢穿喇叭裤,现在年轻女生喜欢穿紧身裤,而...
如果这都算基本逻辑错误那么除了少数严谨的社科论文没有任何文章在你眼里是符合基本逻辑的。
#98-24 - 2022-9-20 08:22
宿星雨
河津 说: 基本逻辑错误就在于坏用户可以打高分,好用户也可以打高分。所以打高分推导不出打高分的人是坏用户。为什么评分口味在统计上不能是关于时间的函数?

80年代年轻女性喜欢穿喇叭裤,现在年轻女生喜欢穿紧身裤,而...
关于你最后的类比,我想说明的是这是完全不一样的范畴,你这个例子本身说明不了任何东西

1.时间跨度,bgm出现这种现象是以某几年为明显分界点带来的问题,而时代审美问题并不会有一个明显分界点,而是代际认识缓慢变化的过程。

2.对象差异,服装审美在外在形态上是几乎具有完全不同辨识度的,但就动漫来看,从bgm诞生的09年到现在动漫的审美和美学形式并没有明显改变,22年内部动漫的表现差异远远大于12年最高分的动漫和22年最高分动漫的差异。老的
动漫在bgm的评分也几乎没有波动。

3.用户群体差异,我们没有理由认为几年内用户所处文化环境会有极大改变而带来这种口味差异


最后 你既然自诩统计相关工作人员,就应该明白类比这种方法本身说明不了任何关于问题本身的东西,它只是一个让人更加容易理解的道具,重要的是类比后的论证和分析。你这样的做法和某些为杠而杠的人有什么区别,我说了你不能认为我的论证应该是完美且方方面面都考虑到的,如果你对论证结论有其他的解释,你应该具体提出并论证,而不是提出100个其他的可能解释又不提出具体的过程和论据并让我去一一反驳,我没有这种义务。

请你观点鲜明一些,你究竟认为这个现象和数据说明了什么?
你打算有关于时间的函数解释这一切么?
#98-25 - 2022-9-21 05:24
河津
宿星雨 说: 关于你最后的类比,我想说明的是这是完全不一样的范畴,你这个例子本身说明不了任何东西

1.时间跨度,bgm出现这种现象是以某几年为明显分界点带来的问题,而时代审美问题并不会有一个明显分界点,而是代际认...
笑死我了,同样是逻辑自洽。凭啥你的理论就有着”深厚论据“,你压根没有提供任何符合逻辑的理论推导哪来的”深厚论证“?

1.时代审美不会突变?你错了,会的,但凡你动动手指,哪怕查查百度指数,就会发现”瑜伽裤“这个词条是在2021-4月出现断崖式增长,小红书上同类穿搭也是在2020年冬天突增,相比之下之前几乎没有,由此可见时代审美不全是代际缓慢变化的过程。并且,可以看出你不靠数据空口一张嘴的“深厚论证”得出的其他结论不可信度加一。

2.对象差异,“动漫的审美和美学形式并没有明显改变”--怎么衡量”明显改变“,凭你开口闭口一张嘴?。从画风来看,以十年为间隔,二者画风的差异是门外汉也看得出的。十年前的”乳袋“,”进气口发型“现在早已消声觅迹。网上花30秒搜索”日本动画变化“,结果比比皆是,算不算动画美学的”明显改变“?从题材上,十年前是IS为代表的校园后宫战斗轻改,现在则是异世界穿越轻改,你现在还能看到有类似IS题材的轻改成建制出现吗?这算不算题材的”明显改变“?十年前,以”钉宫四萌“为代表的傲娇系大行其道。现在来看傲娇系角色不断被吐槽退出环境,请问是不是审美的”明显改变“?你看,你又凭一张嘴”深厚论证“了”没有明显改变“这一错误观点。你的无数据空口一张嘴的”深厚论证“可信度再减一。

3.”我们没有理由认为几年内用户所处文化环境会有极大改变而带来这种口味差异“,你看又是空口”没有“,马云2019年人民日报发文后风评一夜之间转变。国内的新馆政策从2020年末的全民骄傲到现在的流言四起才多久?你空口一句”没理由“就是深厚论证了?你看,你的无数据空口”深厚论证“可行度再减一。

我可没打算在这里立论,如果你有基本的初中逻辑功底的话,就知道驳论和立论是两码事。我只需要指出你的逻辑存在纰漏就足够了。因为你是立论者,排除其他的可能性还真就是你的义务。

最后,杠精是个好帽子,好帽我戴。当讨论中有人开始动用帽子的时候,我大概就知道结果了。
#98-26 - 2022-9-21 08:24
宿星雨
河津 说: 笑死我了,同样是逻辑自洽。凭啥你的理论就有着”深厚论据“,你压根没有提供任何符合逻辑的理论推导哪来的”深厚论证“?

1.时代审美不会突变?你错了,会的,但凡你动动手指,哪怕查查百度指数,就会发现”瑜...
1.我提供给你了完整的逻辑推导,不过你认为这无法直接说明观点,但又提供不了一种可能的量化形式或者其他可能的解释。

1.百度指数上的灯笼裤只是个日均搜索指数不到500的关键词,巅峰时期也就1.5k,这对比中国将近1b的互联网用户规模能说明什么? 何况灯笼裤仅仅是一个新概念功能性产品,就审美来看你凭什么认为反映了其受众产生了审美上的差异?任何这样一种小众小圈子的产品倾向变化是完全无法说明审美观念的变化的,这是一种社会全体的接受度。

2.我不认为关于发型和服饰上关于服装的变化以及相关人物设定、美术设定上的变化能说明审美上的显著变化,以你这样的说法,任何影视产业每年审美都在显著改变。动漫与动漫之间的这种差异远远大于由社会对某个服饰或者设定或者题材的喜好之间的差异,何况就我所述新用户所评论的部分往往是各年经典作品或者是有一定热度的现象级作品,就动漫内部间当然有想你所述的风格差异,但是对动漫的整体观感是不会短期显著改变的,因为人对作品的观感是一个连续的过程,短期改变完全无法说明这一点。我说述的审美差异是各类用户对动漫的总体审美,而不是文化产业这种每年的风向的变化可以说明的审美改变。
再说说你所述的数据论述吧,你见过谁天天和别人讨论问题张口数据闭口数据?何况这种问题是只靠某类数据说明得了的问题?
动漫画风从几十年前的手绘作图再现在的画风,都不一定能说明动漫美学审美显著改变,这种讨论层级不一样的问题你列出一堆不相关的事实有什么意义? 你能不能仔细论证一下审美形式发生了显著改变? 不是我要衡量显著改变,是你认为用户审美随时间是一个函数,你不应该自己去论证?你提出这个观点时有任何量化数据?你不是开口闭口一张嘴?

3.这种改变和我所说的中国动漫观众文化观念是一个东西么,我佩服。这顶多只是大众舆论传播学沉默的螺旋的一种体现。你不能指望靠中国互联网的舆论的表现象反映关于中国动漫受众的文化观的任何变化。  再者你又要数据论证,说的到轻巧,你自己去找一个能准确说明这个问题的数据试一试?

4.所谓驳论,你指出的仅仅是一种形式上的不完美性,我已经重复多次说明这是问题本身的局限性,而不是我论证可以解决的问题,你这种所谓审美是关于时间的函数(但你又不指出任何关于函数的性质)的解释根本不能算一种解释,关于社科类问题数据解释按你的逻辑来岂不是成千上万?没有哪一个作者会去排除这种显然错误的解释。你要提出一个完整且合理的解释我才会去进行分析,而不是一句话提出一个没有根据的解释反而让作者用数据和论证去反驳。

5.我愿意回复这么多你还认为我只是戴帽子...... 戴帽子指的是只看对方部分观点或者立场就给别人标签化的攻击。
但我这是在和你交谈花费数小时后得出的一个关于你个人观点的感想,我想我应该有这点发言权,而且我原话完全不是直接称你为杠精,只是说明你这样的质疑方式和为杠而杠的人没有区别,是一个关于你方式的说明
#98-27 - 2022-9-21 08:28
宿星雨
河津 说: 笑死我了,同样是逻辑自洽。凭啥你的理论就有着”深厚论据“,你压根没有提供任何符合逻辑的理论推导哪来的”深厚论证“?

1.时代审美不会突变?你错了,会的,但凡你动动手指,哪怕查查百度指数,就会发现”瑜...
不要回避我给你提出的问题。

关于你的观点,你不提供任何说明和数据论证,反而说我的反驳没有数据是空口无凭......我也不知道谁才是空口无凭
#98-28 - 2022-9-21 08:35
宿星雨
河津 说: 笑死我了,同样是逻辑自洽。凭啥你的理论就有着”深厚论据“,你压根没有提供任何符合逻辑的理论推导哪来的”深厚论证“?

1.时代审美不会突变?你错了,会的,但凡你动动手指,哪怕查查百度指数,就会发现”瑜...
请不要选择性回避我上面回复第一段对你反驳的内容

请不要回避我说了你不能认为我的论证应该是完美且方方面面都考虑到的,如果你对论证结论有其他的解释,你应该具体提出并论证,而不是提出100个其他的可能解释又不提出具体的过程和论据并让我去一一反驳,我没有这种义务。
你用轻飘飘的一句话做出的解释却没有任何说明和论证过程,更别说你最在意的量化数据了。定性和定量你都没对这个所谓的函数作出任何说明,却要我用数据论证去反驳它,这不是可笑么?
反驳任何社科类文章只要提出一种 为什么某个相关变量不能是关于x的函数  然后要作者去用数据论证排除这可能性,还是作者义务。  问题是不是所有问题都可以用量化直接说明的,你自己的假说都没半点可信度无法说明关于它的任何性质,如果这只是一个随机的无关变量你让作者怎么用数据给你论证?

请你观点鲜明一些,你究竟认为这个现象和数据说明了什么?
你打算有关于时间的函数解释这一切么?
#98-29 - 2022-9-21 08:37
宿星雨
河津 说: 笑死我了,同样是逻辑自洽。凭啥你的理论就有着”深厚论据“,你压根没有提供任何符合逻辑的理论推导哪来的”深厚论证“?

1.时代审美不会突变?你错了,会的,但凡你动动手指,哪怕查查百度指数,就会发现”瑜...
当然如果你只是想说明我的论证存在纰漏那我也就不想再解释了,我本来就不认为这是一个可以严格解释且在形式上完美的问题。
#98-30 - 2022-9-21 08:53
宿星雨
河津 说: 笑死我了,同样是逻辑自洽。凭啥你的理论就有着”深厚论据“,你压根没有提供任何符合逻辑的理论推导哪来的”深厚论证“?

1.时代审美不会突变?你错了,会的,但凡你动动手指,哪怕查查百度指数,就会发现”瑜...
现在我对你“驳论”观点的回复就只有一条:我认为这是一个随机的不相关变量。 所以没法用数据进行说明
如果你认为这是一个函数,你应该具体论证并说明函数性质。
如果你认为这是一个相关变量,你应该具体论证并量化说明。

我完成了对这个解释的反驳,如果你认为我的反驳不合理,你应该使你的假设更加合理。
#98-31 - 2022-9-22 06:05
河津
宿星雨 说: 现在我对你“驳论”观点的回复就只有一条:我认为这是一个随机的不相关变量。 所以没法用数据进行说明
如果你认为这是一个函数,你应该具体论证并说明函数性质。
如果你认为这是一个相关变量,你应该具体论证并量...
”随机的不相关变量“--你看,又是一个毫无证据的”深厚论证“,凭证”我觉得,我认为“就完成了反驳,说实话让我忍俊不禁,让我也想用”我认为这是相关的“来反驳你。

审美具有时代性和时代趋势是毋庸置疑的。出生在不同年代的人的审美在统计学上会随着时间而改变。这恐怕也是公认的结论。否则也不会有”三年一代沟“这句话--如果审美不会随着时代变化,”三年一代沟“哪里来?

更严肃地,Olga Bradac, Aesthetic Trends in Russia and Czechoslovakia, The Journal of Aesthetics and Art Criticism, Volume 9, Issue 2, December 1950, Pages 97–105---好奇怪呀,这个人居然在研究审美的趋势欸,嗯嗯,”只是随机不相关变量而已,怎么会构成趋势呢“,嗯嗯,一定是他错了!

Datta R, Joshi D, Li J, et al. Studying aesthetics in photographic images using a computational approach[C]//European conference on computer vision. Springer, Berlin, Heidelberg, 2006: 288-301.-- 这位更是重量级,居然妄图使用计算方法来研究审美。引用量还不少--一定是整个学界错了,要我说文献也就图一乐,真结论还得看我bgm。

你看,你”深厚论证“的”随机不相关“和”没法用数据说明“又戳啦,哪怕你用中文搜”审美“,”趋势“这几个关键词都好啊,还搁那”我认为“呢?

你看,不同阶段的人在统计学上就是有不同的趋势,审美趋势还真就是随时间变化的。完全可以解释不同年段用户平均分会不同的现象。

十年前tfboys一骑绝尘,怎么,十年前的小妹妹成长到现在的小姐姐也许还能把tf当白月光。但架不住现在时代少年团更胜一筹,是的,这一定说明现在的小妹妹都是”坏粉丝“!

1995年大话西游刚上映时口碑欠佳,到1997年却在碟片市场声名鹊起。如果有人统计1996年前老观影用户和1996年后新观影用户的评分趋势,一定会得出这样的结论:”1996年以后的电影观众都是坏观众“!
#98-32 - 2022-9-22 07:22
宿星雨
宿星雨 说: 就近年来bgm的用户而言,应该很大一部分是相重合的。
新用户是坏用户这种绝对的看法并不是本文要论证的要点,本文要论证的只是由于近年由于bgm名气越来越多,被各种地方引流、介绍来的新用户中属于坏用户的这...
你别扯这些有的没的,首先你又再一次回避了我像你提出的所有尖锐的问题以及反驳,我每一次都是针对你回复一段一段写答复的,不过我已经累了,就不这么做了,做一个简短回应

我说的认为是随机变量,并不是我心里真正认为这是个无关变量,只是在一个人没有完整的论证和量化之前不想和他无用的争论了,既然你有相关资料,你就应该一开始就列举出来,并引用其中段落结合实际进行分析,并提出你最看中的量化数据。
很遗憾,你仅仅引用两篇论文却又不进行任何论证,这都是和本文无关的非直接研究,更不是你看重的可以说明本文问题的量化,我完全可以认为你在述诸权威。  不、连权威都算不上,也只能骗骗从来接触不到论文,看个引用标题就觉得“高大上”的网民了。
两篇论文都下载下来看了,第一篇,就几页综述,关于两个欧洲国家的1950年的文化变化研究,一大半是关于政治相关的或者是报菜名似的论述,没有任何你喜欢的量化数据,用你的质疑方式可以提出10000个问题质疑这篇本身就没什么说服力的水文,你居然还引用它还。
第二篇,关于视觉和摄像方向的评价预测定量研究,和本文研究的用户间差异是一个层级的么?这之间的直接性关联用你的话来说隔了不知道多少座山你应该清楚吧?

请问你所提到的论文对证明、完善你的观点有任何作用? 有相关量化论据? 和本文所指内容有多少关联性?论文里的情况适用于我们讨论的内容么?

你只是反驳我对你观点的反驳,这只能说明我那个本就无意认真不想在你有可靠论证情况下的反驳是不那么可靠的,但是这完全不能说明你的反驳是可靠的,所以你应该做的是完善你的观点,特别是量化。而不是回避所有尖锐问题,每次从我几百字回复挑两个有机可乘的来回复。
#98-33 - 2022-9-22 07:26
宿星雨
河津 说: ”随机的不相关变量“--你看,又是一个毫无证据的”深厚论证“,凭证”我觉得,我认为“就完成了反驳,说实话让我忍俊不禁,让我也想用”我认为这是相关的“来反驳你。

审美具有时代性和时代趋势是毋庸置疑的。...
就算审美具有时代性和时代趋势是毋庸置疑的,那又如何?

就算如此,审美对本文观点的影响就是一个关于时间的函数?
就算如此,审美就能解释新用户平均分显著更高的问题?审美变化不是全体用户的变化? 为什么会用这种差异?
就算如此,审美在我这个研究为什么就不能是一个随机变量?动漫评分和你说的审美有多少关联?
#98-34 - 2022-9-22 07:31
宿星雨
河津 说: ”随机的不相关变量“--你看,又是一个毫无证据的”深厚论证“,凭证”我觉得,我认为“就完成了反驳,说实话让我忍俊不禁,让我也想用”我认为这是相关的“来反驳你。

审美具有时代性和时代趋势是毋庸置疑的。...
你所提到的论文和观点仅仅可以说明审美会改变,但是为什么这个改变在我们这个审美讨论范围内不是随机的呢?为什么不是不相关的呢?这能支持你的函数论么?量化呢?直接论证呢?
#98-35 - 2022-9-22 07:34
宿星雨
河津 说: ”随机的不相关变量“--你看,又是一个毫无证据的”深厚论证“,凭证”我觉得,我认为“就完成了反驳,说实话让我忍俊不禁,让我也想用”我认为这是相关的“来反驳你。

审美具有时代性和时代趋势是毋庸置疑的。...
现在反驳有两条:1.审美仅仅是一个会变化的影响因素,但是这个因素对评分影响很小,如果你不同意,请具体论证并给出量化数据。
2.审美变化可能支持本文结论,即新用户本身更讨厌动漫,群体评分偏低,但由于样本的采集和类似沉默的螺旋导致来本网站评分的新用户群体显著高于全部新用户群体平均值,这反而支持了我的结论,新用户极端性更强了。如果你不同意,请具体论证并给出量化数据。

只反驳我的反驳并不会支持你的反驳。
#98-36 - 2022-9-22 08:39
宿星雨
河津 说: ”随机的不相关变量“--你看,又是一个毫无证据的”深厚论证“,凭证”我觉得,我认为“就完成了反驳,说实话让我忍俊不禁,让我也想用”我认为这是相关的“来反驳你。

审美具有时代性和时代趋势是毋庸置疑的。...
既然是统计相关工作者,就应该知道社科类论文在适用性和限定性上巨大的局限,既然你对动漫评分上的审美没有一个定性或者定量的定义,也没具体的分析论证和结论,又怎么能把这两篇研究领域相差十万八千里的论文拿出来说事? 1950年欧洲某两国“aesthetic trend”的一篇水文和一个视觉相关的研究,说明了关于这个问题的任何一点东西?

就如弗洛伊德的精神分析学在20世纪的流行一样,发表的相关paper恐怕不止几千篇,引用量和影响力就不用我说了吧。结果呢?二十世纪50年代因为其无法证伪的性质遭到广泛质疑,被认为是伪科学,70年代后就渐渐衰落,如今美国两大专业心理学会精神分析流派的占比只是个位数。


尝试引用两篇不仅在研究领域相差十万八千里,对本文适用性为零的社科论文还煞有其事介绍高引用量和“他一定是错的吧,言下之意,这是被认可的”的你真的很滑稽......
#98-37 - 2022-9-22 08:44
宿星雨
河津 说: ”随机的不相关变量“--你看,又是一个毫无证据的”深厚论证“,凭证”我觉得,我认为“就完成了反驳,说实话让我忍俊不禁,让我也想用”我认为这是相关的“来反驳你。

审美具有时代性和时代趋势是毋庸置疑的。...
你的态度
问我:要提供纯粹逻辑上的论证或者直接量化数据论证
自己的假说:就一句话,但要我提供纯粹逻辑上的论证或者直接量化数据论证反驳
对我对你观点的质疑或者其他疑问:回避,不回复
对我对你观点的反驳:引用两篇完全不相干的论文却还只是一句话,甚至没一句论证和具体说明,只是为了反驳我的反驳,却不去论证你自己的观点,诉诸假权威
对我的回复:挑几句然后旁敲侧击攻击一番,却不完善你的假说
#98-38 - 2022-9-23 04:09
河津
宿星雨 说: 你的态度
问我:要提供纯粹逻辑上的论证或者直接量化数据论证
自己的假说:就一句话,但要我提供纯粹逻辑上的论证或者直接量化数据论证反驳
对我对你观点的质疑或者其他疑问:回避,不回复
对我对你观点的反驳:...
你的态度:
论证:用错误地逻辑去得出结论。把充分条件当成必要条件。没有量化的数据不说,连事实佐证都没有,自己论证自己全靠臆测,美其名曰”深厚论证“。

对别人指出的错误:一句”我不认为“就是反驳,用”我做不到“代替”所有人都做不到“。没有引用,没有推导。一句社科重大的局限性就把动漫当成了一个真空臆测球形鸡。

对我指出的核心问题逃避不已:你什么时候才能论证打高分的用户就是坏用户啊?你自己都承认审美趋势会随时间变化了。那不同年段的用户打的平均分不同就更没啥奇怪的了。
#98-39 - 2022-9-23 04:20
河津
宿星雨 说: 你的态度
问我:要提供纯粹逻辑上的论证或者直接量化数据论证
自己的假说:就一句话,但要我提供纯粹逻辑上的论证或者直接量化数据论证反驳
对我对你观点的质疑或者其他疑问:回避,不回复
对我对你观点的反驳:...
我的观点似乎一直都相当明确,你的论证存在基本逻辑错误。打高分这一行为无法推导出用户时坏用户这一行为。你一直强行要我给出自已解释这套数据的全套理解。这才是典型的搅混水行为,通俗点就是”你行你上“错误。本质就是你自己根本无法把自己的论证逻辑说闭环。我再问一遍:打高分的既可能是坏用户,也可能是好用户。从大多数人打高分的行为如何推断出用户必然是坏用户?请不要再逃避你论证的核心问题了。
#98-40 - 2022-9-23 04:56
河津
宿星雨 说: 就算审美具有时代性和时代趋势是毋庸置疑的,那又如何?

就算如此,审美对本文观点的影响就是一个关于时间的函数?
就算如此,审美就能解释新用户平均分显著更高的问题?审美变化不是全体用户的变化? 为什么会...
作为立论者的你,面对我的怀疑的时候,用了大量”为什么不“这种反驳方式,企图把逼迫我另立一论,从而达成立论驳论立场互换的目的。这就证明了你无法反驳”为什么有“的可能性。作为驳论者,只要从你的论证中给出其他可能性,你的论证就是存疑且不完整的,我的任务也就完成了,我不是立论者,没有向你完善其他可能性的义务,把其他可能性严格排除是你的义务。
#98-41 - 2022-9-23 05:18
河津
宿星雨 说: 你的态度
问我:要提供纯粹逻辑上的论证或者直接量化数据论证
自己的假说:就一句话,但要我提供纯粹逻辑上的论证或者直接量化数据论证反驳
对我对你观点的质疑或者其他疑问:回避,不回复
对我对你观点的反驳:...
总结一下至今为止的讨论的话,我想应该是这样的:
我问:”你说新用户中坏用户很多,是不是因为你能大概估计出不懂年段用户中坏用户的比例,所以才有了这一个结论“
你:”我做不到量化,所以我给不出数据“

我:”那退而求其次吧,严格的论证逻辑遵守了就行,打高分只是坏用户的必要条件啊,怎么能用必要条件做推导呢?“
你:”...“.(说了一堆,但我至今不知道你为什么可以把必要条件当充分条件使用)

我:”那我在退而求此次吧,我给出其他的可能性,你把他严格排除掉,那证明我也认了“
你:”为什么不可以没有这个可能性呢“

你证明了半天哥德巴赫猜想,我指出逻辑漏洞,最后反驳我的方式居然是让我自己证一遍?
#98-42 - 2022-9-23 07:46
宿星雨
河津 说: 你的态度:
论证:用错误地逻辑去得出结论。把充分条件当成必要条件。没有量化的数据不说,连事实佐证都没有,自己论证自己全靠臆测,美其名曰”深厚论证“。

对别人指出的错误:一句”我不认为“就是反驳,用”...
1.我判定新用户大部分是“坏用户”是由其整体平均分显著偏高而推导的,新用户这整个群体显示出了平均分偏高这个“坏用户”的最主要甚至是唯一可以量化观察的数据,所以得到了相关判断。用性质上的明显分化对群体进行大致区分是在数据采集局限下合理或者说唯一可行的途径,我不知道这为什么就混淆充分和必要的关系?没有一篇社科论文可以用“充分”而“直接”的量化数据判定与人内心有关想法的一个定义。事实佐证没有? 这么多可以观察到的事实情况和就像你说的“业内共识”一样,所有事实佐证都是相符的。

说我反驳你的反驳不好之前  请先完善你的反驳。而不是提出一个不可知也无法衡量的东西让我去用论证和数据反驳。 请问你指出了什么错误?还是一个任何社科研究都必然会有的一种形式上的局限?你自己不把我文中这么长的推导当推导罢了,又给不出一种可能的直接衡量人内心的量化形式 ,又说“有人可以做到”     你连一种可能的量化形式都想不出来  还指望可以被实现你“认可”的“直接”量化推导?  还谈引用……  这么窄的一个领域    哪来相关的研究我倒是想知道。

我从来没说过打高分的用户“就是”坏用户,建议重新阅读文章 怕你已经忘记差不多了。

我说明的只是新用户这个群体平均分显著偏高,并且通过其刚刚注册不久,对排行榜的内部内容的了解和对评分相对性的理解程度低于平均水平   所以这一部分新用户相对群体有着更多的“坏用户” 比例,而且其总量大幅增加,造成了现在热门新条目的评分增加和引发了更多评分争论的问题。
#98-43 - 2022-9-23 07:49
宿星雨
河津 说: 你的态度:
论证:用错误地逻辑去得出结论。把充分条件当成必要条件。没有量化的数据不说,连事实佐证都没有,自己论证自己全靠臆测,美其名曰”深厚论证“。

对别人指出的错误:一句”我不认为“就是反驳,用”...
“你自己都承认审美趋势会随时间变化了。那不同年段的用户打的平均分不同就更没啥奇怪的了。”

只要一个社科研究无法控制所有的可能相关的变量,那么它的结论就都可能因为这个变量的不同而成为可能,所以都是不可靠的。

这就是你的逻辑的底层思想。

既然你认为这是一个对结果有影响的变量  就应该自己说明论证这个变量的形式已经可能的影响

你见过哪一个社科研究可能控制所有变量的么
#98-44 - 2022-9-23 07:50
宿星雨
河津 说: 我的观点似乎一直都相当明确,你的论证存在基本逻辑错误。打高分这一行为无法推导出用户时坏用户这一行为。你一直强行要我给出自已解释这套数据的全套理解。这才是典型的搅混水行为,通俗点就是”你行你上“错误。本...
我的观点才不是你说的新用户就是坏用户  看来你已经搞混了文章具体的意思可。
#98-45 - 2022-9-23 08:06
宿星雨
河津 说: 作为立论者的你,面对我的怀疑的时候,用了大量”为什么不“这种反驳方式,企图把逼迫我另立一论,从而达成立论驳论立场互换的目的。这就证明了你无法反驳”为什么有“的可能性。作为驳论者,只要从你的论证中给出其...
无论我的反驳形式如何,本来我面对一个不完善而显然错误的“质疑”,是没有任何必要和义务进行任何回应的。

“ 作为驳论者,只要从你的论证中给出其他可能性,你的论证就是存疑且不完整的,我的任务也就完成了,我不是立论者,没有向你完善其他可能性的义务,把其他可能性严格排除是你的义务。”

任何一篇社科文章都不可能排除其他所有可能性,特别是来自不同维度和适用范围的可能性,没有任何一个作者可以把其他可能性全部排除   这就是社科固有的局限性。

就如马克思经济学理论一样。    任何一个稍微有点现代经济学知识和社科相关知识的人都可以说:作为一个驳论者  我已经成功啦    马克思经济学是存疑且不完整的!我的任务完成了!

但是,那又如何?

只不过是指出了一类不可能完美的研究中必然出现在“适用性”“重复性”“应用性”“形式”上的一类问题罢了。

马经  无论在定义  还是假设  还是论证   

用你看法来看何止是这种定义上的逻辑错误  还有那么多无法定量分析的假说    还无法解释那么多实际问题   简直就是一个臆想和假说的集合嘛!
#98-46 - 2022-9-23 08:14
宿星雨
河津 说: 总结一下至今为止的讨论的话,我想应该是这样的:
我问:”你说新用户中坏用户很多,是不是因为你能大概估计出不懂年段用户中坏用户的比例,所以才有了这一个结论“
你:”我做不到量化,所以我给不出数据“

我...
第一点  直接量化确实做不到  这是由于已有可能数据的形式都无法成为你说的直接数据。

第二点  行吧  我找时间重新整理一下我们的交流  然后写到正文里去  现在已有的论证和说明比较杂乱  

第三点  和第一点一样   严格排除和控制所有变量  你觉得这是可以做到的?    参考第二个回复


最后一点  数学和社科的区别  看来你一点都不理解。
#98-47 - 2022-9-24 03:25
河津
宿星雨 说: 第一点&nbsp;&nbsp;直接量化确实做不到&nbsp;&nbsp;这是由于已有可能数据的形式都无法成为你说的直接数据。

第二点&nbsp;&nbsp;行吧&nbsp;&nbsp;我找时间重新整...
上一周事情挺多,有些回复写的比较杂乱,也没有斟酌用词。我首先为之前有些部分不严谨和刺头的用词的道歉。

我重新审视了之前的交流,把一些主要矛盾点和我的意见在阐述一遍:

共识:
1.从你你现在对好坏用户的定义来看,不存在任何第三方可观测的方法来判断一个用户的”好坏“,因此,直接量化做不到。
2.逻辑论证是存在瑕疵的,这是社会科学固有的局限性。

主要的分歧点在于:
1.针对问题一,分歧点就在于”我们究竟需要多少个维度的数据才能尽可能逼近一个用户的真实状态?“你认为平均分这一个维度就足以得出结论,我认为就平均分一个维度不足以还原。

2.针对问题二,你的观点也很明显--”局限性就在那里,改变不了“,我认为还能做些什么尽量再减小些局限性。

最后,你似乎认为我是在试图向你索取如同数学一样的完美逻辑形式和如同物理学一样的标准数据证明。实际上我并没有向你索取这些,我也知道社科上存在局限性。但是,局限性存在不代表不可以减小。正如你自己也提到的,上百年的社科发展早已从弗洛伊德式的自由心证转变到马经上的类数学形式论证再到现在的统计学的不断应用。如何能把你这文章中的局限性在我的认知范围内消减,才是我的目的所在。
#98-48 - 2022-9-24 04:02
河津
宿星雨 说: 第一点&nbsp;&nbsp;直接量化确实做不到&nbsp;&nbsp;这是由于已有可能数据的形式都无法成为你说的直接数据。

第二点&nbsp;&nbsp;行吧&nbsp;&nbsp;我找时间重新整...
针对分歧点一,我认为平均分不足以高置信地还原好坏用户的理由就在于。不同年龄段的人平均审美是不同的。

你似乎理解的”随时间的函数“是指的具体某一个人对同一个事物的看法会随时间变化。但是,我指的”随时间的函数“是指,在同一时刻,人们对同一事物的看法随着年段改变。具体地举例,就如同年轻一辈对于漏脐装的接受能力较高,而老一辈会倾向于认为这有伤风化。如果我开设一个对服装评分的网站,你也会观察到老用户和新用户对于漏脐装的评分有显著的差异。

相似的例子我也给了,在与动画相近的电影领域。《大话西游》于1995年上映,却在电影院遭遇失败,当时的主流电影观众对其的评分很低,并且至今依旧偏低,章金莱就是很好的代表。但在1997年进入碟片市场后,特别是2000年后,随着更年轻一辈进入电影市场,《大话西游》的评分才陡然升高。如果当时大家也都在用某一个评分网站,那么我在2000年统计平均分时,我会发现《大话西游》的评分将会在1997年注册后的用户中陡增,但是,事实也证明了,我不能说1997年后的观众中大部分都是坏观众,也不能说坏观众在1997年后新用户中所占的比例就一定比1997年前的老观众高。

基于此,我不认为”平均分“这一维度就足够评判一个观众群中的”坏用户“比例。

我的意见:
1.修改”坏用户“的定义,因为,现在“坏用户”的定义只局限在”极端高分“,我认为应该修改为”极端打分“,他们有可能打出极端高分,也有可能打出极端低分(佐证:b站的从零开始魔法书第二季)。

2.基于1的修改定义,我们则可以补充另外两个数据:
   1)方差或标准差,这在一个作品水品一般时可以成为很好的佐证,因为好观众的评分在统计上会趋于5-7分,而坏观众则要么8以上,要么10一下。
   2)对同一部作品,以高收藏用户的分数分布为模板,对比不同年龄段的分数分布进行拟合所得出的偏离度。因为你我都同意,高收藏用户是好用户的可信度很高,因此,他们的分数分布可以看成标准分数模板。
#98-49 - 2022-9-24 04:08
河津
宿星雨 说: 第一点&nbsp;&nbsp;直接量化确实做不到&nbsp;&nbsp;这是由于已有可能数据的形式都无法成为你说的直接数据。

第二点&nbsp;&nbsp;行吧&nbsp;&nbsp;我找时间重新整...
就我的观点来看,你目前的行文描述过于晦涩,如果你同意的话,我认为我们可以一起梳理你的行文,以确保文章的可读性和尽可能缩减文章的局限性。
#98-50 - 2022-9-24 12:27
宿星雨
河津 说: 就我的观点来看,你目前的行文描述过于晦涩,如果你同意的话,我认为我们可以一起梳理你的行文,以确保文章的可读性和尽可能缩减文章的局限性。
我重新改了下文章  精简和重写了很多部分 你先重新看一下吧
#98-51 - 2022-9-24 12:28
宿星雨
河津 说: 上一周事情挺多,有些回复写的比较杂乱,也没有斟酌用词。我首先为之前有些部分不严谨和刺头的用词的道歉。

我重新审视了之前的交流,把一些主要矛盾点和我的意见在阐述一遍:

共识:
1.从你你现在对好坏用...
我先尝试去试试看可不可以通过其他维度再找一些其他站内量化数据,然后再考虑从逻辑上再进行完善,你应该先重新看看这一版的文章。
#98-52 - 2022-9-24 12:30
宿星雨
河津 说: 针对分歧点一,我认为平均分不足以高置信地还原好坏用户的理由就在于。不同年龄段的人平均审美是不同的。

你似乎理解的”随时间的函数“是指的具体某一个人对同一个事物的看法会随时间变化。但是,我指的”随时间...
方差这方面我去试着爬数据下来,不过偏离度这个衡量工作量就是不是那么轻松了,或许得要一些比较专业的人才可以处理,
#98-53 - 2022-9-24 12:37
宿星雨
河津 说: 上一周事情挺多,有些回复写的比较杂乱,也没有斟酌用词。我首先为之前有些部分不严谨和刺头的用词的道歉。

我重新审视了之前的交流,把一些主要矛盾点和我的意见在阐述一遍:

共识:
1.从你你现在对好坏用...
对于上周我们之间的讨论变得逐渐对立和情绪化,主要原因是由于我们太过于在意矛盾了,忽略了问题本身的解决和完善,我也对有关我相关情绪化的反驳和指责道歉。

关于审美这一点的具体情况  应该尝试从其他角度进行分析和描述或者是进行一些可靠的观察  单凭定量和逻辑推导都是解决不了这个问题的

需要进一步考察 包括本文比较弱化的解决方法  重点集中放在了解释和说明上
#98-54 - 2022-9-24 19:36
宿星雨
河津 说: 上一周事情挺多,有些回复写的比较杂乱,也没有斟酌用词。我首先为之前有些部分不严谨和刺头的用词的道歉。

我重新审视了之前的交流,把一些主要矛盾点和我的意见在阐述一遍:

共识:
1.从你你现在对好坏用...
查了查相关资料
对于数据的处理,我们这个研究对象面临的问题主要是数据的异质性上的无法测量和数据本身存在内生性,既数据内部互为因果(simultaneity)、不可避免的遗漏解释变量以及测量误差。
不过就技术上还是我说的是很难解决的  我现在正在联系朋友尝试爬取比较完整的bgm站内数据建立一个比较完整的分析
在此基础上再给出其他基于量化的分析

不过这个数据处理和分析本身难度是不小的 可能需要数天去完成
#98-55 - 2022-9-24 21:05
河津
宿星雨 说: 查了查相关资料
对于数据的处理,我们这个研究对象面临的问题主要是数据的异质性上的无法测量和数据本身存在内生性,既数据内部互为因果(simultaneity)、不可避免的遗漏解释变量以及测量误差。
不过...
我重新看了修改后的文章,以下是我阅读完之后的观点。
1.坏用户的定义问题,我昨天认为你应该稍微修正一下你对坏用户的定义,从”极端高分“转变为”极端打分“。你今天提供的b站打分的表中似乎也证明的这一点,我可以观察以8分为界,低于8分的分数段的评分人数又开始上涨。虽然极端低分的人数还明显低于极端高分,但是这依旧是一股不容忽视的力量。尤其在近年来互联网两极化趋势越来越烈的基础上
#98-56 - 2022-9-24 21:18
河津
宿星雨 说: 查了查相关资料
对于数据的处理,我们这个研究对象面临的问题主要是数据的异质性上的无法测量和数据本身存在内生性,既数据内部互为因果(simultaneity)、不可避免的遗漏解释变量以及测量误差。
不过...
2.关于排除不同年段审美差异的问题,我没有看到你在正文中有针对性回复。我之前用”漏脐装“和”大话西游“为例,说明了我认为不同年段的审美差异是不容忽视的影响因素。现在我在就动画领域简要举例说明(为了方便,有很多地方我就直接用感觉证明了)。

十年以前的萌新对于”傲娇系“角色的喜爱程度,明显的高于现在的”萌新“。以《零之使魔》为例,其塑造的傲娇的露易丝形象可以说是经典中的经典,我想在当时的萌新眼里其必然是加分项。而时光流逝到今天,你让当年的”萌新“,即现在的老用户来看,他们估计会在感慨当年二次元辉煌的同时依旧给这部作品高分。而对于现在才刚开始看动画的”新用户“来说,露易丝的行为将成为不折不扣的减分点。因此,我们可预想的会在新老用户之间,观察到二者对于《零之使魔》的平均分差异。

但这足以靠可信度的说明新用户总体变坏了吗?估计不见得。

这就是为什么,我始终坚持”平均分“这一个维度是不够的,在统计学上,”平均分“只是一个零阶量,它所提供的信息太少以至于不能给群体内部做任何区分(要细分一个群体内部,至少要方差这种二阶量,拟合度则是你的分段越细阶数越高)。因此,个人角度,我认为至少要上方差。
#98-57 - 2022-9-24 21:25
河津
宿星雨 说: 查了查相关资料
对于数据的处理,我们这个研究对象面临的问题主要是数据的异质性上的无法测量和数据本身存在内生性,既数据内部互为因果(simultaneity)、不可避免的遗漏解释变量以及测量误差。
不过...
我很有兴趣和你一起探讨这个问题,我一直计算机苦手,不懂如何在网上趴取数据。但是如果有现成的数据的话,我想我也可以为获取正确的群体认知贡献自己的一些理解。不知是否私底下也能相互交流一下?
#98-58 - 2022-9-24 21:38
宿星雨
河津 说: 我很有兴趣和你一起探讨这个问题,我一直计算机苦手,不懂如何在网上趴取数据。但是如果有现成的数据的话,我想我也可以为获取正确的群体认知贡献自己的一些理解。不知是否私底下也能相互交流一下?
https://www.kaggle.com/datasets/oalvay/bangumi
这里有原来bgm用户爬取的现成数据、虽然时间不是最新的,数据维度也不完全,但是用作一般的分析还是绰绰有余了
我现在捣鼓的数据可能还要几天才可以做好、主要不是我自己做、请一个认识的人帮我处理的,这方面我也仅仅是略有了解的水平。
#98-59 - 2022-9-24 21:42
宿星雨
河津 说: 2.关于排除不同年段审美差异的问题,我没有看到你在正文中有针对性回复。我之前用”漏脐装“和”大话西游“为例,说明了我认为不同年段的审美差异是不容忽视的影响因素。现在我在就动画领域简要举例说明(为了方便...
另外关于你对零之使魔的分析应该是不太可信的
具体见下图  https://windrises.net/bgmtools/review/chart?id=1880

零之使魔从09年到18年平均分变化  最高与最低差距不超过0.2分  也并不是一直走低的趋势  排名不断下降是因为有新的动漫加入了排名

下图是18年到现在的平均分变化 可以看到相比18年反而上升了  回到了15年的水平
https://netaba.re/subject/1880
#98-60 - 2022-9-24 22:39
河津
宿星雨 说: 另外关于你对零之使魔的分析应该是不太可信的
具体见下图&nbsp;&nbsp;https://windrises.net/bgmtools/review/chart?id=1880

零之使魔从09年...
零之使魔是我随便一个例子,我也说了大部分都是凭感觉,实际上,定性的看,我的推导似乎也没有错,因为不同年段的平均分帝的确是走低了。定量细节上不符合我想并不影响我的主要结论”不同年龄群体给出的平均分不同“,你给的数据事实上也佐证了这一点,不同年龄段给的分数确实不同。

既然定性上这事的确存在,那我想,这就需要给出额外的论证来评估或排除这部分的影响了。不然将很有可能面临”莉可莉丝的高平均分是不是现在萌新群体平均上就更喜欢女同打枪好一口?诸如此类的质疑。
#99 - 2022-9-12 09:39
(三思而后行)
对于文章我没有看完,但是以现在BGM的现状而言。很久以前对bgm评分机制的讨论以及就一直没有停止过,我觉得随着bgm的慢慢壮大,评分系统是时候得做出改变了。我们需要做的是完善评分机制,并对新用户做出引导。我们改变不了他人,我们能够做的只有……
#100 - 2022-9-12 16:42
未来的评分网站中,或许有一部分会进化出这个样子:依据统计学习的手段划分出“好用户”和“坏用户”,i.e.哪些用户是真正用心在评分,而哪些用户的评分完全是一时冲动,轻易地给出不合理的分数——然后再根据评分员的“质量”进行最终分数的汇总生成。
#100-1 - 2022-9-13 01:19
curlfoxs
如果扩展性做不上去的话,中国的「anidb」还是有难度的,但排行榜是实打实的金字招牌,无论多艰难都要捍卫住它的荣耀。加权感觉是一种好方法,支持。
B站小鬼大都是盲目和冲动的,而婆罗门的看番量比较可观,评分权重可以有所提高。
无论效果如何,小鬼都需要走受教育程序和通过一个难度不低的考核后方有评分资格,而且刚开始的权重不能太高,等有所进步/贡献后可以慢慢成为骨干。
婆罗门可以不定时发布一些高质量的讲座和专题,为小鬼指点迷津,引领走向真正的鉴赏。
付费会员制是一种选择,通过经济手段过滤掉没有经济能力的小鬼,让排行榜更加理性和成熟。或者邀请推荐制也是一种选择,可让用户群体量级和质量得到一定程度的控制。
努力的方向就是向现实的社会教育政治制度看齐,打造一个更光明更美好的你班。

(只能说且行且珍惜, 等互联网往「群体分化」的方向越走越远时,说不定还会怀念现在的混沌和「相对」自由)
#101 - 2022-9-12 17:08
(Sic itur ad astra)
把bangumi**评分厨的ID砍了可能社区环境会好一些,天天首页热门条目讨论7条内容能有一半是争论评分合理不合理的,能不能*回小组自己去玩?平时被人管教还不够,上个网还想做虚拟社区大爹教育别人用自己认定的科学标准,作品评分本来就是主观导向强的结果,大样本的主观结果最后诞生出来的客观的大众评价,不想着增加用户评价还想设置门槛维持自己那一点因为早来而产生的“老用户”的优越感。真要这么玩,你以为你还配评论动画?
以上不针对楼主个人,不仅针对楼主及其他期望规训用户的发言以及天天在作品讨论版里拉屎的帖子
------------------------------------
自我规制一下攻击性用词
#101-1 - 2022-9-12 18:02
宿星雨
1.首先,本文根本不是对评分合理不合理的争议,而是基于机制的探讨,我并不认为本文对bgm社区环境带来的负面影响,而是相反,你的这种过激情绪化的评论对bgm社区环境带来了负面影响。 (但是我认为部分其他关于评分的短文有引战嫌疑,是不利于社区环境的)
2.本文没有任何“教育”他人关于科学标准的内容,如果你无法理解显然的汉语内容,那我也没有办法,选择点开本文是你的自由,但是不看完就凭自己的情绪进行人身攻击的这种自由,我想在任何一个网络社区都不存在。
3.关于大样本带来客观评价是显然错误的观点,参考豆瓣、mal和b站的评分结果,如果你认为这些是客观的结果,那么您为何在这个不客观data少的网站对一个关于评分的主观讨论发表高见呢?
4.关于我对动画的“个人评判”和“优越感”,不知道你从何得出这个结论,不过我知道一点,带着有色眼镜的人看什么都觉得是它的同类。
5.关于你的攻击性言论,劝你好自为之

以上
#101-2 - 2022-9-12 19:35
如将红莲
宿星雨 说: 1.首先,本文根本不是对评分合理不合理的争议,而是基于机制的探讨,我并不认为本文对bgm社区环境带来的负面影响,而是相反,你的这种过激情绪化的评论对bgm社区环境带来了负面影响。 (但是我认为部分其他...
1.所以你觉得目前是评分机制不合理但是评分结果合理?怎么会有这么割裂的思考方式?讲了半天机制不就是觉得评分结果不符合自己的预期么,评分警察别给自己脸上贴金。给我讲讲在2#1里提到的“关键是是有比较性的评分(即科学的评分,相对的)”中的科学的评分指的是什么?不是指评分合理不合理?
2.首先,“显然的汉语内容”是一个存在语病的搭配,其次,像您这样把“番剧”这种不规范造词和置信度这种词望文生义用在行文之中,我不觉得您的语文功底、逻辑能力和专业水平足以指摘我的阅读能力。当然,您说“本文没有任何‘教育’他人关于科学标准的内容”,我不知道主楼正文第四条个人展望中“入站前强制让每个用户学习并了解评分系统的意义和参考性和比较性的来源……”是否为您打的文字,可能是别的评分厨偷了您的账号偷偷编辑想要教育新用户吧。我也不知道您在主楼三番五次强调打分必须和bgm评分体系接轨算不算自以为是定下科学标准,可能你就是bangumi吧。
3.事实上豆瓣,MAL,B站的评分就反映了该时间段内该站用户群体的意向,评分也好投票也好都有其时代性和局限性,只有不切实际的理想主义者才会觉得背离了其他人只将自以为是的标准权重提高是一个普世的方案。至于你在这点中的反问,依然是可笑的捂嘴思路,觉得别人的评分不科学所以不让随便评分,认定别人不适合这个网站就希望不在讨论中回帖。那么我问你,你又是为什么要在这个你认为评分机制有问题的网站中评分呢?话又说回来,bgm评分体系是什么?一个社区的氛围是由早期成员定义的还是所有成员来定义的?由早期成员定义,站长定的评分机制我们这些老会员打出来的体系/机制轮得到你插嘴吗?由所有用户定义,那新来的打几分你管得着吗?早期成员还有不少给angle beats!打高分的呢,是对是错你说了算?明明是大众点评,以为自己是在做米其林指南。
4.如果您有阅读能力的话,想必能看到并且理解我最后说的“不仅……及其他……的发言……”。当然如果您一贯是这样自我中心根本不在乎别人说了什么只顾着发表自己的高见没注意到楼内其他人的意见,那么我向您道歉,以后针对您主楼的发言我会单独回复,针对站内或楼内其他人的回复我会另外开回复。
5.好,对不起。以后我会用文明的方式表达希望评分厨不要发言的想法,就如你们长篇大论围杀堵截不让你们看不上的新用户评分一样
-------------------------------------------------------------
算了,想了下应该也不会回复了,你怎样开心都好吧,希望最后能改变评分机制
#101-3 - 2022-9-12 20:25
宿星雨
如将红莲 说: 1.所以你觉得目前是评分机制不合理但是评分结果合理?怎么会有这么割裂的思考方式?讲了半天机制不就是觉得评分结果不符合自己的预期么,评分警察别给自己脸上贴金。给我讲讲在2#1里提到的“关键是是有比较性的...
1.我不觉得现在评分机制合理,所以我提出本文,但是我觉得bgm现在评分系统依然是所有排行榜里最合理的,难道在你眼里事物不是黑的就是白的? 至于你自己立稻草人自己打并且一言不合给别人戴帽子的思考方式,只是显露你自身的不智罢了。
2.关于语病、文章用语仅仅是我个人的文法错误和个人用法,我想这并不构成你对我批判的任何的一个要素,你把上面楼层别的用户提出的疑问又拿出来说一遍的这种行为,恕我不再回复。
至于我的个人展望部分的内容,这么明显的个人观点非要我在前面加上“我认为”几个字,发表自己的想法就是教育用户?再者,我并没有强调过和bgm评分体系接轨,甚至在文中早已反驳这并不是代表bgm主流的分数,而是一个共识和基础,并且只是一个关于问题的看法和讨论,难道这在你眼里就成为定下标准?
至于你的真正阅读能力和道德水平,还是让大家来评判吧。
3.你关于时代性和局限性的的观点在我看来就是一种中式辩证法,就算它“反映了该时间段内该站用户群体的意向”,那又如何? 一句都有其时代性和局限性就把它们的价值放在同一个维度上,这种做法我想大部分bgm用户是不会接受的,举个非常不恰当的例子,这就像把两条腿的人和鸡放在一起: “他们都反映了生物上的在进化上共同意向”,在生物学上有其时代性和局限性。
你把我对bgm评分机制的想法认为是自以为是的个人标准,我对这点不想过多解释。
关于我不让别人评分和评论这点,我完全不知道你何,何出此言,就在此声明下吧。
我在这个我觉得有问题的网站评分,是因为我希望它能变得更加科学,希望它能往好的方向发展。 我不知道你的这种质问从何而得。
bgm评分体系并不是可以确切定义的概念,但是我可以在这里回答你,这是一个长期过程中形成的的评分比较的纬度,在我看来这是每一个科学的评分系统应该具有的状态,不单单针对这个网站,只是bgm是在这方面少数早起做的很好,在一定程度上体现了排行榜的比较性的网站。也即,这是一个期望中理性的评分体系,能最大尺度体现其比较的意义的系统。
4. 一贯是这样自我中心根本不在乎别人说了什么只顾着发表自己的高见没注意到楼内其他人的意见,这不正好适合送给你自己么,您的阅读能力原来就是指理解:不仅仅是骂你,只是包括了你,所以就不是人身攻击?    把别人骂了一通加上个免责声明就万事大吉?对不起,我还真理解不了。
5.如果你真心为你的不文明发言感到抱歉,我想我会很乐意接受,不过我想任何人从你这番敷衍的话中都感受不到任何诚意,不如说是敌意。


最后,我并不认为你一上来就直接骂人,然后字里行间如此咄咄逼人带有人格批判的极端情绪化态度是从有效的讨论和交流出发的,所以我想我不会再回复你关于这个话题的回复了

以上。
#101-4 - 2022-9-12 20:30
宿星雨
如将红莲 说: 1.所以你觉得目前是评分机制不合理但是评分结果合理?怎么会有这么割裂的思考方式?讲了半天机制不就是觉得评分结果不符合自己的预期么,评分警察别给自己脸上贴金。给我讲讲在2#1里提到的“关键是是有比较性的...
在批判别人之前,最好先审视一下自己,到底是哪些人认真在考虑这个社区的问题,又是哪些人在破坏社区友好的环境,公正自在人心。
#101-5 - 2022-9-12 20:42
Aeroblast
宿星雨 说: 在批判别人之前,最好先审视一下自己,到底是哪些人认真在考虑这个社区的问题,又是哪些人在破坏社区友好的环境,公正自在人心。
为社区着想的话能不能先自删去你们专门的小组重发,方便大家屏蔽,也不会天天占着热门讨论。删之前留个web archive就能保留内容。
#101-6 - 2022-9-12 20:54
宿星雨
Aeroblast 说: 为社区着想的话能不能先自删去你们专门的小组重发,方便大家屏蔽,也不会天天占着热门讨论。删之前留个web archive就能保留内容。
这恐怕不行,我并不认为这个讨论版中的内容应该只局限在小组讨论,并且里面很多评论中贡献的内容到了现在也不是我一个人可以决定的
关于占热门这点,我并不认为如果没了我这个讨论就可以空出位置留给一些优质的讨论版,这并不是毫无意义的水贴,我希望它让更多用户看到
如果你不认同本文的观点,你自己不点开看就是了,还有认可的人和获得了一些启发的人愿意看,何出“方便屏蔽”一言?
#101-7 - 2022-9-12 21:21
Aeroblast
宿星雨 说: 这恐怕不行,我并不认为这个讨论版中的内容应该只局限在小组讨论,并且里面很多评论中贡献的内容到了现在也不是我一个人可以决定的
关于占热门这点,我并不认为如果没了我这个讨论就可以空出位置留给一些优质的讨论...
是啊,全是评分警察互相吵架,谁还愿意发正常讨论啊,恶性循环。
有朋友都直接关闭热门条目块了,但我觉得还是应该明确表达一下反感,不然评分小鬼会真的以为自己很受欢迎。虽说即使没有认真的评分小鬼也会有评分乐子人钓鱼,但少一个是一个,对吧?
已经说了可以用web archive保留内容,既然你不愿意从自己做起,我也只能呸一口走人咯。那句“热度高争论大所以发在这里”真够恶心的。
#101-8 - 2022-9-12 21:28
宿星雨
Aeroblast 说: 是啊,全是评分警察互相吵架,谁还愿意发正常讨论啊,恶性循环。
有朋友都直接关闭热门条目块了,但我觉得还是应该明确表达一下反感,不然评分小鬼会真的以为自己很受欢迎。虽说即使没有认真的评分小鬼也会有评分乐...
你要理解为:“评分小鬼”  是为了受欢迎才写这篇文章,这种文章不该存在,少一个是一个
我只能告诉你这篇文章不是写给你一个看的,你或许自我感觉过于良好了。
我想至少这种试图从原理上进行的考察和设想是有利于问题的解决的,再不济也至少揭示了其一部分的性质  你把“评分警察”间的争吵怪罪到我头上,那我无话可说。

自己写的文章想让更多人看到不知触动你哪根纤弱的神经让你感到恶心,真是抱歉。
#101-9 - 2022-9-12 21:39
Aeroblast
内容因违反「社区指导原则」已被删除
#101-10 - 2022-9-12 22:05
笙歌看水
如将红莲 说: 1.所以你觉得目前是评分机制不合理但是评分结果合理?怎么会有这么割裂的思考方式?讲了半天机制不就是觉得评分结果不符合自己的预期么,评分警察别给自己脸上贴金。给我讲讲在2#1里提到的“关键是是有比较性的...
无意参与你们的争执,只是好奇“显然的汉语内容”语病在哪?是“显然的”不能做形容词,还是“汉语”不能修饰“内容”?
#101-11 - 2022-9-12 23:31
如将红莲
笙歌看水 说: 无意参与你们的争执,只是好奇“显然的汉语内容”语病在哪?是“显然的”不能做形容词,还是“汉语”不能修饰“内容”?
我最初的理解是他提到的“汉语内容”不具有显然属性。显然当然可以做定语来修饰名词,汉语也可以修饰内容。但是显然修饰的往往是内容之下未直接表现的含义。也就是说推理的结果可以显然,而前置的条件不会是显然的。(或者说,当它是“显然”的时候,我们已经有一个将这个前置条件推理出来的过程了)
所以并不是语法结构上的问题,而是语感上的违和。
如果你有更专业的想法也请不吝赐教
刚才又读了遍感觉要口语化地理解成“显然的汉语内容(所表达的意思)”也不是不行,但是吵架这种事肯定抠字眼了
#101-12 - 2022-9-13 06:10
笙歌看水
如将红莲 说: 我最初的理解是他提到的“汉语内容”不具有显然属性。显然当然可以做定语来修饰名词,汉语也可以修饰内容。但是显然修饰的往往是内容之下未直接表现的含义。也就是说推理的结果可以显然,而前置的条件不会是显然的。...
你说语感上有点违和我有同感,更准确的说我觉得表意上有些模糊(我不确定是不是语病,不过就像你说的,至少口语化的交流不会有严重的障碍),就是我觉得这应该不算搭配问题。
(我就是单纯好奇这个问题,希望我的表达没有招来误解)
#101-13 - 2022-9-13 11:39
curlfoxs
笙歌看水 说: 你说语感上有点违和我有同感,更准确的说我觉得表意上有些模糊(我不确定是不是语病,不过就像你说的,至少口语化的交流不会有严重的障碍),就是我觉得这应该不算搭配问题。
(我就是单纯好奇这个问题,希望我的表...
有可能孤陋寡闻,这样的搭配是第一次见。语病说不上,只能说是用词准确度的问题。
感觉「中文内容」「中文表述」「文字内容」会稍微好一点。
而「显然的内容」就基本是搭配错误了吧。「显然」很多时候都是用作副词或表语的,做定语的用法比较少见,「显然的好处」算是一个。而且,「显然」通常用来修饰某个有明确方向的推论,而「内容」本身是没有偏向性的,所以搭配起来有点怪。估计原文是想表达「浅显易懂」「显而易见」「不言而喻」之类的意思。
#101-14 - 2022-9-13 12:21
宿星雨
curlfoxs 说: 有可能孤陋寡闻,这样的搭配是第一次见。语病说不上,只能说是用词准确度的问题。
感觉「中文内容」「中文表述」「文字内容」会稍微好一点。
而「显然的内容」就基本是搭配错误了吧。「显然」很多时候都是用作副词...
(bgm38)你们讨论这些都不是重点吧(bgm38)
#101-15 - 2022-9-13 13:56
笙歌看水
curlfoxs 说: 有可能孤陋寡闻,这样的搭配是第一次见。语病说不上,只能说是用词准确度的问题。
感觉「中文内容」「中文表述」「文字内容」会稍微好一点。
而「显然的内容」就基本是搭配错误了吧。「显然」很多时候都是用作副词...
我觉得“显然的内容”没啥问题啊,“显然的”做定语是少但又不是不能做,难道“隐晦的内容”“含蓄的内容”是搭配不当?包括“明确方向”说也挺奇怪的,“显然的态度/意图”有什么问题吗?你可以说一般都说成“意图/态度显然”,但这应该不是一个搭配问题。
当然用“清晰的内容”大概更好一点,我觉得“显然的内容”最多存在表意不清的问题,因为内容在不同的语境下可能有不同的侧重。
“汉语内容”如你所言是一个比较罕见拗口的搭配,但应该也不是不当。
#101-16 - 2022-9-13 18:58
curlfoxs
笙歌看水 说: 我觉得“显然的内容”没啥问题啊,“显然的”做定语是少但又不是不能做,难道“隐晦的内容”“含蓄的内容”是搭配不当?包括“明确方向”说也挺奇怪的,“显然的态度/意图”有什么问题吗?你可以说一般都说成“意图...
你举的例子不太好,或者是我的用词准确度和表达能力有限,在我的理解,「态度」「意图」「好处」「推论」等这些词本身包含了可识别的、可判断的意思。
『内容在不同的语境下可能有不同的侧重』你这句话我很认同,其实就是我想表达的意思,「不同的侧重」和我说的「方向性」「可判断性」想表达的东西基本是一致的。如果「内容」加上一些修饰词划分为若干个可分类、可判断的集合后,再被「显然」修饰的话就不会有这种违和感。
例如,原文估计是想修饰「内容」为容易看懂,那么,基于「内容是否容易看懂」这点出发,使用「显然容易看懂的内容」就很好。而「显然的好内容」「显然重要的内容」「显然的长内容」这些在我看来也都没问题。
类似「显然的内容」,像「显然的视频」「显然的文章」也是如此,可以说是表意不清,也可以说是搭配问题。
#101-17 - 2022-9-13 23:48
如将红莲
笙歌看水 说: 我觉得“显然的内容”没啥问题啊,“显然的”做定语是少但又不是不能做,难道“隐晦的内容”“含蓄的内容”是搭配不当?包括“明确方向”说也挺奇怪的,“显然的态度/意图”有什么问题吗?你可以说一般都说成“意图...
我还是认为是搭配上的问题,就表意来说,其实应该算是能说清楚这回事了。
隐晦的内容 OK,“隐晦的”就是含义不明确
但是隐晦的含义相对就少用,起码我没见用过。
车的速度快 OK 车快 NG 当然我们日常生活中默认会在对话中省略/补充为“车(的行驶速度)快”,所以这么用也行,但是严格来说,快/慢只能用来形容速度,而不能加之于“车”上
如果内容可以用显然来修饰,那么货币就可以用昂贵来修饰,多少有些不恰当,但是类比的话这是我目前能想到最接近的例子了。
到这里已经是我解释能力的极限了。毕竟我非专业出身,没有足以作为标准的凭据,再说下去就完全成为语感之争,没啥意思了。101-16举例的「显然的视频」「显然的文章」也是我试图要表达的意思
#101-18 - 2022-9-14 12:01
笙歌看水
如将红莲 说: 我还是认为是搭配上的问题,就表意来说,其实应该算是能说清楚这回事了。
隐晦的内容 OK,“隐晦的”就是含义不明确
但是隐晦的含义相对就少用,起码我没见用过。
车的速度快 OK 车快 NG 当然我们日常...
“显然的文章/视频”显然是错误搭配,但我还是觉得内容不是,是语感的问题。
举个例子:
“这内容挺显然的呀,不知道你在琢磨什么。”
你觉得这句话有问题吗?
反正我觉得没有,而且我在生活中应该遇到过。
我觉得问题还是在于“显然的”做定语比较罕见,读起来会让人不舒服。
我同意快是用来形容速度而不是车的,但“好快的车”肯定不是病句对吧,即使“内容显然”的含义是“内容的意思显然”,我也不觉得这个省略是错误的,汉语并不是一个逻辑非常严密的语言,许多省略是符合表述习惯或语法的。
当然,我也不是专业的,上面这段回复算是我的看法,不坚持自己观点的绝对正确性。
#101-19 - 2022-9-14 13:06
笙歌看水
如将红莲 说: 我还是认为是搭配上的问题,就表意来说,其实应该算是能说清楚这回事了。
隐晦的内容 OK,“隐晦的”就是含义不明确
但是隐晦的含义相对就少用,起码我没见用过。
车的速度快 OK 车快 NG 当然我们日常...
就这个问题我简单和我的老师讨论了下,他的观点如下:
1.“显然”一般用作谓语或状语,定语应该用“明显”。
2.一般不用“明显”修饰偏静态的名词,用来修饰“内容”不顺口。
根据说法2,你和那位的说法都是有道理的,对此我也没有更多的异议,这个问题就到此为止吧。
#102 - 2022-9-12 22:34
本质上是必然存在而又无法根除的问题。因为评分网站没有资格定义并区分 好用户 和 坏用户,更没有资格处理他们或者阻止他们流入。评分网站能做的最多是对数据小幅度再加工,这样连治标都谈不上。只能说放宽心吧,只要有需求,这样的贴子应该会多起来吧,凑合着也能用。
#103 - 2022-9-14 10:46
(Void.)
评分这种非科学的,不能用实践直接检验真理的东西,从来都是客观 = 大众的主观啊
不知道在出警什么,只有婆的评分才算评分?
#103-1 - 2022-9-14 10:57
宿星雨
我也很好奇你认为我在出警什么,毕竟我这是只是关于评分的前提共识作出的讨论,还有婆究竟是一个什么东西?你从我文中哪里得出我认同这样的观点?
反驳也要讲逻辑,而不是没看完文章就给别人戴上帽子批斗一番,只用情绪就能解决问题那么世界该多么美好。

以上
#103-2 - 2022-9-14 16:41
NiHiL
宿星雨 说: 我也很好奇你认为我在出警什么,毕竟我这是只是关于评分的前提共识作出的讨论,还有婆究竟是一个什么东西?你从我文中哪里得出我认同这样的观点?
反驳也要讲逻辑,而不是没看完文章就给别人戴上帽子批斗一番,只用...
说这么多 主楼装的很客观 上面你也回了不少评论 啥意思有必要装糊涂吗?
不就是觉得某些数据不够多 资历不够深的"外来"新用户不配打分嘛,和原有的婆人层次级别都不一样, 然后斥之为"不正当"。
哈哈。人民群众喜闻乐见的,你不喜欢,你觉得不正当,你算老几。
混这里也七八年了,但是就目前互联网的状况来看,我觉得直接摆立场要更直接也更效率,因为绝大部分人是不可能被说服的。

以上。
#103-3 - 2022-9-14 16:55
宿星雨
NiHiL 说: 说这么多 主楼装的很客观 上面你也回了不少评论 啥意思有必要装糊涂吗?
不就是觉得某些数据不够多 资历不够深的"外来"新用户不配打分嘛,和原有的婆人层次级别都不一样, 然后斥之为"不正当"。
哈哈。人...
1. 什么叫装得客观,那么我的具体想法是什么还请指出,你这种话术适用于任何想反驳的文章,可真是方便啊,一句话就可以否定一切
2.不就是之后的全部只是你个人狭隘的偏见罢了,还是说您理解不了显然的文字表述就开始自我臆想?
我何时说过和你所述意思相近的一句话还请指出,不要在这只会想当然的曲解他人看法以此攻击对方。
3. 我何时说过我不喜欢我觉得不正当  你是不是内心戏有点多 和自己意见不同的就这样无中生有,还拿人民群众为挡箭牌,你算老几?
4.就是互联网这种只有立场和屁股,没有思想和脑子的人,舆论环境才越来越差,原因就是你说的,因为这种人是不可能被说服的。
#104 - 2022-9-15 16:26
本人属于楼主提到的新用户群体,自己备忘录存了也就十几部番的评价吧,都是那种我想要去评价的(阅番两年多点,总量在100-150部之间,以新番为主,近半年前看完了石头门后才开始狂补老番)我发现自己备忘录确实偏向7-9的区间,而且由于现在时间不是很充裕,在上高三,在bgm标的都是个人印象较深所以全是8-10
但是吧,这个,我真的想解释一下就是,我作为一个新人是很认可BGM的排名的,但是就是有一个“补偿心理”。举个例子:《彼方的阿斯特拉》在我的备忘录评价综合值是8.84,而《命运石之门》是8.86。以我个人的标准来看前者是相当优秀的基本媲美石头门。但是它在bgm上只有7.5的评价,点进去发现很多低于7的差评所谈论的点在我看来也莫名其妙。甚至有一些根本就没看完的人给了1-3。
因此,本来打到9分,后来想了想,就又改成了10。
总的说呢就是,即便我之前就认可bgm的排名,但当我真正去了解的时候还是会感到不公平,想要去拉高一些我认可的作品的分数。
最多只能说是尽量不会给一些“热度”作品高分就是了。
#104-1 - 2022-9-22 03:42
相川实幽语
实际上,这种补偿心理(包括反向补偿)在之前也必然会是影响最终得分的一个环节。你有没有想过,有一些低分的人,也是看到前排有人给他们认为不值的作品打了过高的分数而想要“调节”?这种心理可能不是少数,但也不会是全部,于是最终以一定比例的相互对冲,而影响到最终的评分。
往大了说,整个BGM站点,哪部作品敢说完全没有受到“补偿心理”的影响呢?如果你认为这是一种不太合适的做法,那至少你做起来也不会太夸张吧。
对了,最后聊一句彼方的阿斯特拉...时间有点久了,但对我来说,里面的部分Bug有些好像还是有点硬了(虽然现在回想不太起来),我还确实比较赞同BGM当前的评分结果。
#105 - 2022-9-17 11:32
(年上大姐姐控、非二次元动画观众)
说实话一方面我认为有必要制订所谓的评分“标准”,来规范评分环境,使bangumi的评分体系能够维持在一个相对合理、让更多人接受的范围内。

另一方面,就个人而言,我并不是特别在意网站怎么对我喜欢、或者我觉得不太行的作品是如何评分的,我只会按照个人标准去评定,因为观赏体验是相对个人的,也没必要屈从于什么规范。

但因为作品中有部分不能接受的内容,转而极端、报复性的评分,或者莫名的高分确实会使评分体系遭到不小的冲击……至于什么保守派、自由派,我可能是保守派吧,也确实认为一些新番有超越预期的评分……但这也是新观看动画的观众的涌入带来的必然趋势,我觉得。

综上,虽然不同观众的审美不一样,但评分还是应该维持在一个大家都能接受的位置,所以我其实还是觉得有必要规范一下评分环境,但需要制订的具体评分机制细则,可能需要更多的探讨
#106 - 2022-9-17 11:47
(请证明你是机器人)
不行的话在评分下方多划分一个按用户注册年份数进行评分细则统计,并且支持新老用户评分不同的排行榜(bgm38)不过想搞专业一点的评分也许搞个五维图评分统计会好点,这样的话就能看见用户评分高分低分的大致理由了
#107 - 2022-9-17 14:51
BGM这边我是新玩家,还不太清楚。
不过,单就评分这一点来看,只要每个评分的都是真实用户,那其实问题不大。
呆的时间长了,自然就会有自己的评分体系。
如果呆的时间不长,也评不了多少番剧的分,影响不大。
我比较担心的反倒是未来有机器刷分这个问题。
#108 - 2022-9-17 18:48
先说一句,我支持关于bgm评分的认真讨论 ,反对直球攻击新番、新用户的打分。
我觉得让每个人打分前都了解并学习bgm的评价体系是比较困难的,更何况评价体系这种东西本身就随着用户群体的变化和人的成长不断改变,不如更改用户的评分权重。但是,给婆罗门更高的的权重,普通观众较低的权重显然是不合理的,因为bgm目前仍然是一个“大众评分网站”,而不是专业的,需要什么资格认证的打分媒体。
所以,我个人的看法是,在一部动画下,A用户看完后发表了文字,就给予他在此动画下评分更大的权重,而B用户看完这部动画却没有留下任何评价,则给予他较小的权重。同时,如果一名用户为了获得更大的权重而只在评价栏留了个+1,则仍然给予他较大的权重,这是为了保证评分的民主性和每个评分个体的主体性。不然总有人会说“评分不就图一乐吗”“我打分就是给自己看的而已”,这个+1代表的是评分者的主体性,主动的参与排行榜的建设也意味着主动的承担责任,每个人都应该意识到自己主动打出的分数是他人的参考。而不留下任何内容的用户也仍然需要保留较小的权重,这样排行榜才不是小圈子的自娱自乐,而是每个用户的意见的侧写
个人看法
#108-1 - 2022-9-17 19:30
SPUZH
+1
#108-2 - 2022-9-24 11:58
宿星雨
或许是一个筛去完全不了解bgm这个网站的新用户的一个不错的办法  不过只是一时之计而已。

不仅仅需要的是主动性  还需要一种切实的规范以达到理解和认可的目的。
#109 - 2022-9-18 02:15
思考冰水混合物的发言。我认为,如果用户真的要以自己个人的标准来评分的话,为了更好保持bangumi评分榜在大众眼光中的比多数评分网站更强的参考性。bangumi是不是需要增设分类评分榜呢?例如把新用户的评分默认为『大众评分榜』,而更有行动力的用户可以通过答题过关(题目可以是此分类榜单的常识「真的就是常识」)自由切换榜单,并以不同的标准给同一部番评分。这样的话,追求对动画整体品质评分的用户,容身之地就更清澈了一点。而不同喜好的人也能更好地在不同的榜单上找到适合自己的番剧。
——
以下为对帖主说的新老用户分裂的思考。
当然,如果bangumi的用户群体不再追求参考性,那么也可以像现在这样自由评分。网站公开又可以随意注册,随着bangumi关注度的增长,新用户的涌进不可避免,网站上人多起来,谁有精力去单独管理?没人管、用户又多,那么用户少的时候积累起来的评分分数标准就会崩溃。如果bangumi不采取措施,必然会有用户失望,觉得没以前那味。具体的还是要看bangumi站主自己的想法如何。选择权不在用户手里,而是在站主手里。如果想保护参考性,那么必然会引起新用户不满。如果想引流做大网站,那么老用户肯定多少有些失望。要是想折中,就不得不分级分类了吧。
——
以上均为个人意见,另外,我是个新用户,说的有什么不对的地方,请大佬多谅解。
#109-1 - 2022-9-24 12:04
宿星雨
分类这个想法楼上其实已经有很多人提出了  
不过在目前积累了足够多的data的情况下是很难通过增设另外一个来控制的  反而只会引发更大的混乱

关于用户分裂  本质不是那么主观的话题  采取简单的门槛也不必管所谓的什么不满  社区环境和机制坏掉了谁也没好处

bgm也从来没主动引流做成大网站 这反而会使bgm丧失它的核心优势。
#110 - 2022-9-19 00:53
(sonow)
(bgm38)实在没必要,时间会决定一切
#111 - 2022-9-19 00:55
(sonow)
(bgm38)bgm来来回回就这么点人,说真的只要不违法,我感觉老板真的懒得管这个网站会成什么样,如果bgm真的想搞商业化就不会只有那么点人
#112 - 2022-9-21 21:34
(“我们所度过的每个平凡的日常,也许就是连续发生的奇迹 ...)
你能认真分析问题并且寻找论据来支持论点在当下的环境已经是难得可贵了,而且我关于石蒜的评分以及相关评分机制的用户问题等很多观点和你不谋而合,所有方便能加个好友吗?
#112-1 - 2022-9-22 00:27
宿星雨
通过了,这种问题最好别发楼里了,无用的闲谈式评论太多导致楼层太高,感觉劝退了很大一部分想就文章本身继续讨论的读者,爬楼太耗时间了。
(不过你删了这楼还是会在的,所以没必要了)
#113 - 2022-9-22 03:30
赞同新用户普遍愿意打高分的说法和统计。而且我在想,会不会部分作品的低分也是被放大了呢?
这种背后,或许和这些年的情绪相关表达的整体放大都有关系,比起一部作品究竟怎么样,现在的观众(当然,从结果来说几乎多数是年轻代的观众)更在意的是,这部作品“我的感官与情绪如何”。我不完全反对这一点,因为一部作品,是否能让观众本身感到满意,也是评价的重要一环。
我个人的评分习惯,其实是很谨慎的,如果你不了解某个评分体系的含义,那你给出的只是一个无意义的数字罢了。在这两年终于注册进BGM之前,我被本站的邮箱验证卡了N久,而这之前我至少自认还是认真研究了许多作品的分数的,而这让我大致了解了某个分数段的作品,对于我来说大致是什么样的水平。说自己的评分和别人没有分歧是不可能的,但至少,自己会有个框架搭出来。(不过目前并没有回去一个一个补分数的精力)
但另一方面,给较差作品打低分可能天然也会偏少:当一部作品出现某些硬伤,现在的我可能就会直接放弃,而如果这个放弃发生较早,那么我就不会贸然去评分。结果就是,评分的可能本身天然就是高质量高分的作品,低质量的作品却未必会得到低分。每个季度开头我都习惯列个追番的表单,然后再一点一点弃掉,于是开追的可能有10部,到一个月后就只剩下3部了。评分?那7部大概率我都不会去评。
回到楼主的观点,其实你说的这一点,或许可以变为:本站的评分,过去往往观众仍然能意识到自己的情绪只是评价的一个组成部分,进而在打分时更为慎重;新的评分群体,在不熟悉这里评价的习惯的情况下,简单的套用自己在其他平台养成的以情绪为主导的评分准则,进而和过去的评分产生割裂。
如何避免这一点?其实让评分人去学习、乃至去考试,是很难实现的一个思路。纯学习,可能就单纯是个挂机或熬时长;而其他站点的考卷如何?事实证明总能从其他地方搜到答案。我认为如果管理者有心,那一些醒目的提醒(比如评分前大字红色弹窗?)或许能一定程度的缓解。但根本方法,或许还得是时间——但这需要用户增长速度的放缓,否则新旧用户转化速度不如新增,那问题还会继续。
#113-1 - 2022-9-24 12:11
宿星雨
1.低分本身比较性现在就几乎无法体现了,因为区间过密以及本身的评价维度到这已经很难达成共识了  但是这本身不是那么重要的问题  比如一部rank3000和rank4000的大家可能感觉上并没什么区别 这时个人口味反而起了主导作用  参考性已经很难体现出了。

2.关于喜欢的人更有可能看完并打高分  不喜欢一开始直接放弃就不打分了这点对所有动漫都应该有影响  不过这种影响是程度应该是不一样的  这又是另外一个话题了  应该具体分析

3.本文主要是解释现象  对解决方法没有深入的讨论  这方面如果有机会应该重新写一遍完整的文章进行分析  

不过你说的过去往往观众仍然能意识到自己的情绪只是评价的一个组成部分,进而在打分时更为慎重这点我觉得是一个很有意思的看法  或许说明了情绪和理解对评分影响的一个方面 但还是无法说明本文中用户群体之间的本质差别
#114 - 2022-9-22 11:33
(El Psy Kongroo)
内容已被用户删除
#115 - 2022-9-22 16:50
解决办法也不是没有,开双线,主观评分和客观评分双评分体系。让新用户(判定办法如:注册时间少于半年或阅片数少于50)只能打主观分,老用户无限制。想筛选流行的热门内容就参考主观分,想筛选质量过硬的内容就参考客观分。
#115-1 - 2022-9-22 21:07
Sóra
一种就是现行的bgm评分体系,一种就是steam这样好评差评双元(B站评分其实也差不多是这个感觉了)
#115-2 - 2022-9-24 14:05
AbleO
当注册没有硬性需求的时候,我觉得你所谓的客观评分根本是无意义。如何判定所谓的老用户所写出来的就是客观评分呢?到目前为止在各种还没上映的番剧里提前打分的老用户并不在少数,所以这些有‘资格’的老用户的评价真的合适当作客观评分吗。老实说,会不会有些人总是把自己的高度抬到什么专业打分媒体人之类的程度才会有这种想法吧?对于大众来说好看就给高分,不好看就给低分(当然也有除了10分就是1分的二极管)不是很合理吗,要求别人站在客观的角度去评价一部自己觉得不好看的作品才是奇怪的地方吧,不是很理解老用户的评分才叫客观评分是什么思路。
#115-3 - 2022-9-24 14:23
江子盾
AbleO 说: 当注册没有硬性需求的时候,我觉得你所谓的客观评分根本是无意义。如何判定所谓的老用户所写出来的就是客观评分呢?到目前为止在各种还没上映的番剧里提前打分的老用户并不在少数,所以这些有‘资格’的老用户的评价...
说一句,没上映提前打分的都是打着玩的。真正的评分会在番剧完结后重打
#115-4 - 2022-9-24 14:28
AbleO
江子盾 说: 说一句,没上映提前打分的都是打着玩的。真正的评分会在番剧完结后重打
所以在上映前都能吵起来觉得别人打了一星自己就必须10星来反对的人,重打之后真的合适叫做客观评价吗。
#115-5 - 2022-9-24 14:31
江子盾
AbleO 说: 所以在上映前都能吵起来觉得别人打了一星自己就必须10星来反对的人,重打之后真的合适叫做客观评价吗。
我认为这点没太大必要讨论,可以看看117层主的回复,我个人也不太在乎评分这东西,我低分的番也能看出很浓的味。说到底还是主观的……
#115-6 - 2022-9-24 14:53
AbleO
江子盾 说: 我认为这点没太大必要讨论,可以看看117层主的回复,我个人也不太在乎评分这东西,我低分的番也能看出很浓的味。说到底还是主观的……
我也只是觉得在大众评分网站去追求一个评分基准简直就是在痴人说梦而已,人类又不是ai。
#115-7 - 2022-9-25 02:48
小泉空
AbleO 说: 当注册没有硬性需求的时候,我觉得你所谓的客观评分根本是无意义。如何判定所谓的老用户所写出来的就是客观评分呢?到目前为止在各种还没上映的番剧里提前打分的老用户并不在少数,所以这些有‘资格’的老用户的评价...
并不是为了让老二次元秀优越感,打个评分还能打出优越感?一方面是因为阅片量太少的观众没有足够拿来横向比较的参考,甚至连bgm的大概分值对应什么段位的作品都不一定不明白,"有我喜欢的cp!xxx我老婆!我要传教!"脑袋一热就猛打10分的情况应该不算少见,甚至于,"我老婆的评分怎么可以这么低,我要建100个小号来给老婆刷分!",或者梗中毒,一大批观众抱着恶趣味的心态来给作品疯狂上分,等等各种情况都可能发生。

    但多数老用户的对评分最重要的需求是,分值在大众标准下对应作品的质量,而不是对稍微有点喜欢的作品闷头打高分。因为时间有限,绝大多数人都没法做到每一部作品都去试看两集,也没人想看烂片,所以5分微妙6分及格7分良好8分卓越9分神作低于5分眼瞎,这个粗略的标准基本已经是共识了。所以大多数老用户打分会稍微负责一些,有这种环境才方便自己选番。相对的有些新用户满脑子都是自己的"最爱",只想给他们传教挣分,完全不会考虑以后通过相对客观的评价分数来筛选观看或者放弃某些番。

  所以我看你也使劲给很多番打八九十分,这对我们老用户来说是在削弱评分的参考价值。就像淘宝真实的买家评论在逐渐变成清一色的卖家刷出来的好评一样。个人见解,能打8分的作品应该是全程都能高度吸引你,没有任何水分和短板且某方面让你感到震撼的作品,9分的作品应该是声乐画剧情多方面让你感到震撼的作品,对你的人生观带来了巨大的冲击。10分的作品虽不能说没有,但按照一辈子最多给10部或者一部没有这样的掂量去打分就差不多。

   所以新老用户的需求其实不一样,新用户也会逐渐变成老用户,就会逐渐发现有比以前打10分的作品还要好的作品,甚至还有更更更好的作品,但最多也只能打10分,体现不出和其他作品的差距,对这样的神作岂不是很不公平?这种时候就会明白,当初的自己还是太冲动了
    所以分开打分不好?是歧视新用户?
#115-8 - 2022-9-25 03:35
AbleO
小泉空 说: 并不是为了让老二次元秀优越感,打个评分还能打出优越感?一方面是因为阅片量太少的观众没有足够拿来横向比较的参考,甚至连bgm的大概分值对应什么段位的作品都不一定不明白,"有我喜欢的cp!xxx我老婆!我...
不是很能理解你能提出【"有我喜欢的cp!xxx我老婆!我要传教!"脑袋一热就猛打10分的情况应该不算少见,甚至于,"我老婆的评分怎么可以这么低,我要建100个小号来给老婆刷分!",或者梗中毒,一大批观众抱着恶趣味的心态来给作品疯狂上分】这种少数极端的新用户例子,但是在老用户方面却以【但多数老用户的对评分最重要的需求是】来对比是什么意思。拿个大多数,和个极少数二极管对比有意义吗?老用户里没有诸如此类的二极管吗?新用户里没有对评分参考价值有需求的人吗?
基于我的打分大都是8-10分,难道你不能理解为什么我抛弃的占比在我标记的作品里占比也算高吗?难道你不能理解我个人觉得不好看的番我压根不会去看吗?
打了8-10分就削弱了你老用户的参考价值,是否你的8-10分的评分又影响到11年注册的更老用户的参考价值呢?以及下面的评分标准应该是你自己的标准吧?为什么你有自信觉得人人都得按照你这个标准走呢?为什么你觉得我当时看这部番就没这个心情呢?是因为你是老用户?还是因为bgm有硬性规定的评分标准,但凡你没感动哭你就不能评10分?又或者被你代表的我,内心的所有情感都由你所知?(另外我比较现实,有可能看完一部作品会有感动有留念,但是像你这这种九分就需要给人生观带来巨大冲击莫名其妙我是搞不太懂,还有就是想问一下10分的无职想必让你的人生翻天覆地了吧?基于无职主人公的前世设定,我是不好猜测你是从什么程度转变成什么程度就是了)基于你的评分标准,我的评价是bgm管理员你来当,9分10分你来删。
还有就是不知道你在评分的时候是否像你言中如此清高的为比你先注册的老用户考虑参考价值呢,我也想说一句,你标记里某些对我来说甚至连看的想法都没有但是评分确高于5的屑作也影响到我的参考价值,希望你今后评分的时候能多加思考,减少我这种由新变老的用户对评分的参考价值的影响。
开头就写着【并不是为了让老二次元秀优越感,打个评分还能打出优越感?】但却通篇的优越感,不是很能理解你这种做不到清高又自视清高的矛盾。
连大众评分是什么概念都理解不了我觉得你完全没必要来参与这个话题秀你可悲的优越感,先去理解一下我个人在bgm所有100以上votes的作品里全打10分对评分的影响再来喊因为我的评分导致削弱你这个所谓的老用户对评分的参考价值。当然如果把比你晚注册的新用户都视作你眼中的瞎打分还闲着没事看见就打,那影响确实挺大的,不过你要是往这个方向理解,我只能说2014-2-21 之前加入的老用户牛逼,至于他们愿不愿意被你代表就是另外一回事了。
#115-9 - 2022-9-25 03:47
AbleO
小泉空 说: 并不是为了让老二次元秀优越感,打个评分还能打出优越感?一方面是因为阅片量太少的观众没有足够拿来横向比较的参考,甚至连bgm的大概分值对应什么段位的作品都不一定不明白,"有我喜欢的cp!xxx我老婆!我...
还有我看个番打个分,为什么你会觉得我会有【等多年后回过头来发现为什么最高只能打10分,以前的10分果然是太冲动】这种想法?是空虚吗?是寂寞吗?是在找自我安慰自我感动吗?
不是很能理解你这个老用户至今8年却也没在bgm放出来个响屁(有点点意义的评分解析文章)却又能自视清高到给别人定义评分标准,甚至还帮忙塑造多年后因为打分而后悔的桥段到底是怎么做到的。
哦,以上嘲讽在你表明自己是某家出版社的小编,某部小说、漫画以及所有涉及文化领域作品的作者或者诸如此类有比大众更高层次的评分资格时本人自动道歉磕头。(虽然不觉得这类人会在大半夜跑bgm里秀下限就是了)
#115-10 - 2022-9-25 05:02
小泉空
AbleO 说: 不是很能理解你能提出【"有我喜欢的cp!xxx我老婆!我要传教!"脑袋一热就猛打10分的情况应该不算少见,甚至于,"我老婆的评分怎么可以这么低,我要建100个小号来给老婆刷分!",或者梗中毒,一大批观...
不好意思,是夜猫子,所以现在正是精神的时候。
只是列举了一些可能的情况,我也没说是普遍现象,但算不算是罕见现象,在没数据支撑的情况下我不好说不是,你也不好说是。伪证大概可以看看B站的高飙的评分,不知道和那里年轻人多是否有必然联系,当然始终只是伪证,可以忽略。

以偏概全无端联想这些熟悉的操作我也不想再吐槽什么。

固然老用户也有漫天打分,但比例不高,综合下来的分数自然还能用作参考。至于新用户喜欢打高分的比例,本贴正文已经有说明。

我的逻辑是,不希望传统的评分走势受到太多影响,不然会影响我筛选看番。bgm本来就是个数据为主的弱社交网站,我主要在意这里的数据,因为这些数据有价值,什么新老用户和我完全没关系,实际上也不关心,仅此而已。

但网站确实是大家的,新用户大量涌入,爱怎么打分打分确实也是他们的自由,所谓后浪推前浪,就算以后彻底变成新生代的聚集地也是很自然而然的事。

虽然我确实是个什么都不是的卑微人物,但来这里秀优越感?我真是吃饱了撑着😅
有人总觉得别人在针对自己这个群体,实际喜欢针对别人的人也确实很多,但我自认为算半个明白人我会问自己,针对别人对我有什么好处?哦~那一定是我吃饱了撑着😅
但有人就是觉得被针对了,那也许也是吃饱了撑着了😅,奇遇ですね
#115-11 - 2022-9-25 16:58
AbleO
小泉空 说: 不好意思,是夜猫子,所以现在正是精神的时候。
只是列举了一些可能的情况,我也没说是普遍现象,但算不算是罕见现象,在没数据支撑的情况下我不好说不是,你也不好说是。伪证大概可以看看B站的高飙的评分,不知道...
举个例子(你给对你带来巨大震撼的【末终的后宫】打了6分影响到了我的参考价值,害我浪费时间去点开了这部对我来说甚至不值得点开的屑作)按照你对评分的要求以及觉得大众对评分需要的严谨,我是否可以以这个理由来说你影响到了所有觉得这部番剧不值6分的人的参考价值?
一口一个新老用户没有关系 ,一口一个自由,但言中却充斥着评分标准以及老用户怎么样怎么样,我是不太懂你【固然老用户也有漫天打分,但比例不高】这个结论又是从哪来得来的,是老用户由你来代表?或者是bgm老用户仅你一人并且你觉得你没有打过高分?
还有不知道为什么在讨论bgm评分但是你为什么要举个b站高彪评分来做例子?另外你不会把所谓的大量注册新号以及水军也称做新用户并且拿这些特殊情况当作大部分新用户的代表吧?
总结完毕就是你发了两段话但好像打字打着打着就忘了自己之前打过什么字从而在下文打自己脸。
你说你是不是吃饱了撑,这个我是不太清楚可能你撑到自己都不知道吧?但是我确确实实看到了我被你代表了,还要你帮忙给我制定评分标准甚至觉得我现在打的分往后会因为评分只有10分而后悔的特殊逻辑就是了。
【只是列举了一些可能的情况,我也没说是普遍现象,但算不算是罕见现象,在没数据支撑的情况下我不好说不是,你也不好说是。】像这种废话有时候你不说出来可能会比较好,说出来了给人感觉就是:我不知道但我觉得你也不知道,所以就按照我的想法来走一样睿智。
【有人总觉得别人在针对自己这个群体,实际喜欢针对别人的人也确实很多,但我自认为算半个明白人我会问自己,针对别人对我有什么好处?哦~那一定是我吃饱了撑着😅】【我看你也使劲给很多番打八九十分,这对我们老用户来说是在削弱评分的参考价值。就像淘宝真实的买家评论在逐渐变成清一色的卖家刷出来的好评一样】有时候我都不知道你是不是在骂你自己
总之就是希望你以后打分能像你上文一样考虑一下对别人参考价值的影响,少打出均分以上的评分以免削弱别人对评分的参考价值就是了。口嫌体正直谁都会,要求别人以你的标准以你的愿望来走不如先想想你自己有没有这个‘资格’,对于别人打分是否会影响到你的参考价值,我只能说看不惯别看,不然就把bgm买下来把我号封了最好再让我所有的ip地址都注册不了就是了。
#115-12 - 2022-9-26 05:16
小泉空
AbleO 说: 举个例子(你给对你带来巨大震撼的【末终的后宫】打了6分影响到了我的参考价值,害我浪费时间去点开了这部对我来说甚至不值得点开的屑作)按照你对评分的要求以及觉得大众对评分需要的严谨,我是否可以以这个理由来...


前三部番算是近年来最火,有一定出圈现象,同时厨力也相对较高的番,10分的得分率都在5%以上。综合得分都在7.5以下。

后三部番当中,宝石之国当年的热度和厨力并不在前三部番之下,但是是年代较远的17年,异兽魔都20年,哈萨维21年,距离现在较近,但都是属于没厨力的番,相对小众,10分得分率在5%以下。但综合得分都在7.5以上。

不难得出结论,近年来厨力较高的番,被猛刷10分的趋势有不小的增长。至于是否和新用户的快速增长有必然联系,或者说其实都是老用户xp觉醒开始猛打10分请自行判断。

无端联想:bgm的新用户快速增长是来自于众多up对bgm评分的引用,up只要提及网站评分,基本就是国内BGM 欧美MAL 日本ANK,但国内评分为什么不引用B站评分?相信大家心里都有点B数。说明这些UP都觉得BGM的评分相对客观更有参考价值。所以在up们无意的推广下就“慕名而来”了很多新用户。应该有不少新用户都是冲着较高可信度的评分来的,但是自己却又使劲注水。就像各处的网红打卡景点,大家慕名而来看风景,但却总有人不爱护环境,导致风景受到破坏。

无职转生当时就是个典型的例子,因为某坐拥数百万粉丝的大UP愤然批判,掀起了腥风血雨,导致不少吃瓜群众跑来怒打1分,其中不乏只标记过无职转生这一部作品的热腾腾的新号。既然他们可以出于正义感打1分,那我也只好出于正义感给了个10分,希望能稍微抵消一下局外人对分数带来的影响。本来以为无职的情况是百年不遇的意外,可但一看今天的莉可丽丝和契约之吻粉丝间的掐架,似乎类似的故事还在继续着。
#116 - 2022-9-22 18:29
从新用户到老用户,有多少人会结合当下的阅历定期修改自己以前的评分呢?
如果新用户是从其他平台迁移过来的(比如豆瓣?)评分估值又该怎么算呢?
应该还有是很大一部分是追番的时候没有接触到BGM这个平台,开始用bgm了也没有特意去点以前看过的番,没精力去维护已经看过的番重新评价打分的用户应该不是少数。懒狗的天性
我有一个朋友在接触这类网站之前是用的一张Excel表格记录的
#116-1 - 2022-9-24 14:13
AbleO
赞同,我不是很理解每次这种帖子都会拿老用户新用户来作区分,有时候我总是在想是不是以前的bgm注册的硬性标准有诸如:在杂志上发表自己对某个作品评价见解,出版过自己的小说、漫画、画集,写出来过某个游戏,在某某出版社或者自媒体工作过的经历。
#116-2 - 2022-9-24 14:31
宿星雨
AbleO 说: 赞同,我不是很理解每次这种帖子都会拿老用户新用户来作区分,有时候我总是在想是不是以前的bgm注册的硬性标准有诸如:在杂志上发表自己对某个作品评价见解,出版过自己的小说、漫画、画集,写出来过某个游戏,在...
如果你只看到“新”“老”的实际含义,那么你还没理解清楚本文的意思。
关于群体划分定义的部分你应该重新看一遍
或者应该重新完整的看一遍,才能把握住整体意思
#116-3 - 2022-9-24 14:38
AbleO
宿星雨 说: 如果你只看到“新”“老”的实际含义,那么你还没理解清楚本文的意思。
关于群体划分定义的部分你应该重新看一遍
或者应该重新完整的看一遍,才能把握住整体意思
老实说就基于在大众评分网上你发表这种长篇大论就已经让我没兴趣看下去了,一千个人心中有一千个哈姆雷特这句话应该很少人没看过吧?
如果你觉得我说不必要区分新老用户是错的那我的回答就是写给你看的,如果你觉得我是对的,那即使你写的我一个字没看你也没有理由来反驳才对。当然我所嘲笑的仅仅是区分新老用户以及在大众评分网站上扯客观评分和专业性的人而已,你的长篇大论研究用户如果是在研究什么用户会打什么分的话我根本没兴趣。。。。
#117 - 2022-9-24 14:14
总是在大众评分网站上扯客观评分和专业性,真是因催丝汀。
#117-1 - 2022-9-24 14:35
宿星雨
统计学的应用对象就是大众
请问我哪里强调客观和专业了
自言自语我就看不懂了
#117-2 - 2022-9-24 14:48
AbleO
宿星雨 说: 统计学的应用对象就是大众
请问我哪里强调客观和专业了
自言自语我就看不懂了
【虽然以上这种又“新用户”涌入带来影响目前看来还并不是那么严重  但是长久以往 必然导致评分的进一步分化和排名相对意义的丧失  不利于社区的长远发展
可以看出“新用户”评分显著更高,“新用户”数量不可忽略,得到更多“新用户”评分的动漫获得了不正当的“相对优势”。】
我是觉得你挺在意客观和专业的
第一段话能理解为你觉得新用户涌进会导致评分排名趋向无意义对吧?都能分析到这个份上了说你不专业你可能会不高兴吧?
第二段可以理解为新用户评分就是比老用户不客观对吧?
#117-3 - 2022-9-24 14:56
宿星雨
AbleO 说: 【虽然以上这种又“新用户”涌入带来影响目前看来还并不是那么严重&nbsp;&nbsp;但是长久以往 必然导致评分的进一步分化和排名相对意义的丧失&nbsp;&nbsp;不利于社区的长远发展
可以看出“...
你是习惯于看文章直接看结论的部分么?
关于意义的假设观点 我在第一段就写了 但凡认真看了文章也不会一点印象都没有
第二段…… 我写了这么多字去解释和区分  去论证  你怎么就是看不见过程   然后断章取义的理解?
你恐怕连我术语的意思和我实际表达的意思一个都没看懂
#117-4 - 2022-9-24 15:06
AbleO
宿星雨 说: 你是习惯于看文章直接看结论的部分么?
关于意义的假设观点 我在第一段就写了 但凡认真看了文章也不会一点印象都没有
第二段…… 我写了这么多字去解释和区分&nbsp;&nbsp;去论证&nbsp;&nb...
意思就是结论不代表是你要说的意思咯?我一开始就说过对你的研究内容和过程不感兴趣,会去找你的结论也只是要回答你【请问我哪里强调客观和专业了】而已。
【这是“新用户”的涌入导致Bangumi原有的“评分相对比较共识”和“参考性”受到了破坏 。】特地拉上去看你正文也看不出来你这两段话到底有其他什么意思,基本上我的结论也只是【区分新老用户以及在大众评分网站上扯客观评分和专业性】是无意义而已。
还要一点不懂的,你口中的新用户难不成只是用注册时间来区分?那这个时间界限是有人规定好了吗?21年注册的你达到不是‘新用户’的界限了吗,未达到的话你的评分是否也可以视为破坏了你班的共识性和参考性呢?还是说短短两年的时间你已经变成了最合适bgm的那块形状呢?
那还麻烦您能比较浅显易懂的解释给我这个木头脑袋听听这两段话还有其他能理解的意思呢。
最后术语都出来了真不说你专业恐怕真是不行了。
#117-5 - 2022-9-24 15:21
宿星雨
AbleO 说: 意思就是结论不代表是你要说的意思咯?我一开始就说过对你的研究内容和过程不感兴趣,会去找你的结论也只是要回答你【请问我哪里强调客观和专业了】而已。
【这是“新用户”的涌入导致Bangumi原有的“评分相...
既然你连文章甚至都没完整看一遍,你又如何得知我的意图? 连边都没挨上。你否定的我的意思全是你假想中的意思罢了。
还要一点不懂的,你口中的新用户难不成只是用注册时间来区分?
难不成只是还好意思来问我?
文中写的清清楚楚
#117-6 - 2022-9-24 15:25
宿星雨
AbleO 说: 意思就是结论不代表是你要说的意思咯?我一开始就说过对你的研究内容和过程不感兴趣,会去找你的结论也只是要回答你【请问我哪里强调客观和专业了】而已。
【这是“新用户”的涌入导致Bangumi原有的“评分相...
定义、澄清之一以及第98楼的讨论都完全否定你这个误解的看法  你连文章都不看完倒好  先凭空揣测作者的意思然后批判几句就好啦!
和精神胜利法没什么区别。
#117-7 - 2022-9-24 15:27
宿星雨
AbleO 说: 意思就是结论不代表是你要说的意思咯?我一开始就说过对你的研究内容和过程不感兴趣,会去找你的结论也只是要回答你【请问我哪里强调客观和专业了】而已。
【这是“新用户”的涌入导致Bangumi原有的“评分相...
原来你连我结论都没看就认为我在“扯”客观和专业性
#117-8 - 2022-9-24 15:36
AbleO
宿星雨 说: 既然你连文章甚至都没完整看一遍,你又如何得知我的意图? 连边都没挨上。你否定的我的意思全是你假想中的意思罢了。 还要一点不懂的,你口中的新用户难不成只是用注册时间来区分?难不成只是还好意思来问我?
文...
太典了,早就说看完并不觉得你那两段话有其他能理解的意思,到后面还来句【原来你连我结论都没看就认为我在“扯”客观和专业性】你该不会把你刚刚说过的【你是习惯于看文章直接看结论的部分么?】直接给忘了吧?
不过从一开始你发的话到现在我也只能理解出来一个意思:我不是,我没有,你的观点和我的观点不同所以你没理解我的意思。
好像也确实没必要进行这种无意义的讨论,毕竟你都把自己摆在专业人士的角度上了。
【这是“新用户”的涌入导致Bangumi原有的“评分相对比较共识”和“参考性”受到了破坏 。】现在看来,这段话是如此的经典,您这统计学统计得太精辟了,如何解决这个问题呢?解答:停止新用户注册或者把注册条件提高到至少会统计以及我不是我没有你可别乱说的专业高度。
#117-9 - 2022-9-24 15:38
AbleO
AbleO 说: 太典了,早就说看完并不觉得你那两段话有其他能理解的意思,到后面还来句【原来你连我结论都没看就认为我在“扯”客观和专业性】你该不会把你刚刚说过的【你是习惯于看文章直接看结论的部分么?】直接给忘了吧?
不...
对不起,看了你之前的话还以为文中确实有什么特殊地方特地去看的我就是个baka。另外精神胜利法比较合适用在理解你下午针对我的发言。
#117-10 - 2022-9-24 15:44
宿星雨
AbleO 说: 太典了,早就说看完并不觉得你那两段话有其他能理解的意思,到后面还来句【原来你连我结论都没看就认为我在“扯”客观和专业性】你该不会把你刚刚说过的【你是习惯于看文章直接看结论的部分么?】直接给忘了吧?
不...
“我对过程不感兴趣”“我不认为你那两段话有其他能理解的意思”“我去找结论只是因为……而已”


断章取义最高的境界,就是别人指出你连文章甚至都没看完后、还能从立场和其他角度冷静的反驳
#118 - 2022-9-24 14:16
新层回好了。

仔细辨析一下的话,本楼里所含的所有观点其实并不完全指向同一个问题。

从网站系统或者「rank机制方法论」之类的角度出发,与评分者或说评分这个行为出发,探讨的核心原理和方案是不一样的。


我看po主的回复基本集中在前者,即试图讨论评分这个机制的作用、成效、运转现状。

从这个角度出发的话,以下观点都是显然的:
-  一个良好的客观排名总是有指导意义的
-  排名机制需要良好的数据样本输入作为支撑
-  数据样本的优劣是可判定的

于是对一部分群体给出数据的优劣度进行判定,容易得出有损排名/评分系统的结论。 这完全没有问题。



但其实不少人的回复,包括 #2 包括我,在说的其实是另一个问题,即打分这个行为,或者说给出的分数,对于评分者来说意味着什么。

我们常说数据反映相关性,但往往并不能反映因果。或许数据样本更优的「老用户群体」给出的统计分分布与作品普遍认知素质拟合得更好,但从用户的评分行为动机出发,想要推出为什么这个作品就应该是这个分数,的因果逻辑,是难以建立的。就比如我在 #55-5  所述的观点,我会认为评分与推荐度的因果关系更明确,而与作品本身剧本叙事演出历史意义等硬性素质的等级是无法一一对应的。于是基于前面这个认知前提,我就不会热衷于维护「评分的纯洁度」—— 说白了感觉吃力不讨好。


总的来说,如果从网站或社区的角度出发,我完全赞同实现更科学的评分或维护分数数据的努力。但自己对评分系统的感知度并不高,也不认为有必要认真地去维护改进分数系统。综合一下的话  ——  把标准差超标和打分数量过少的用户当做噪音filter掉也就够了。分数漂移和当季热番的额外加成……一来并不好解决,二来真的需要解决吗,我持保留意见。
#118-1 - 2022-9-24 21:29
宿星雨
想了很久 总感觉还是不在一个频道上……

关于评分数据反映的重点并不是提供数据的用户,这种评分反映的是关于动漫作品自身的一个统计结果,维护这种体系的参考性这种底层根基是意义重大的,就像我说的,用户动机有再多其他可能的影响变量、但是最核心的永远还是关乎作品本身的素质,你所提及的这类误差无论是由于什么原因造成的、本质上都是一个一般误差而已  

推荐度这个概念也就是所谓的喜好在同一个价值共识和一定参照基准下本身与作品素质就是高度相关的

按照你的说法、就又回到了纯粹的个人主观喜好论、但是事实显然不是这样的、同一个类型的ranktop100作品和rank3000作品对于同一类人的评分结果也是显著差异的  
这就说明了你所说的喜好影响仅仅是一个一般的影响、并且根据这种喜好在大众应该是平均分散和抵消
#118-2 - 2022-9-24 21:32
宿星雨
排行榜评分数据并不需要反映用户打分动机上的因果、只是显示出关于作品本身的素质和性质。

而且这种无为的思想…… 肯定是有人会行动和改变的吧、 经济学发现的最重要的社会宏观原理就是人会对外部刺激产生反应
#119 - 2022-9-24 20:05
#120 - 2022-9-24 23:39
插个眼
#121 - 2022-9-25 12:55
我觉得很大一部分原因是因为不同的人对评分的看法不一样吧,像b站那种评分方式和典型的评分用户,好=10分,没有“比较好”和“特别好”的区别,导致大部分片子在小数点后面争来争去(bgm38)虽然我希望评分能够客观反映作品的质量,但是一旦评分就很难削除主观要素,或者很难界定削除到什么程度。
比起规训用户应该按什么标准进行评分,或许更重要的是用户都意识到审美是非常私人的事,在有自己的看法的基础上参考评分比完全盲信评分更重要。