#1 - 2017-3-3 00:41
乂谦则明远 (数据库是得不出任何结论的)
https://www.zhihu.com/question/29545191/answer/128493860
在知乎上看到的sai老板给这个答案点了赞,答主说mal比bgm客观性更高,然后评论区里发生了激烈的争吵。
其实我仔细一想,无论是mal还是bgm,都不能说客观,更不能说一个网站就比另一个网站客观,尽管mal的样本比bgm大,但是评分本身就是一种主观的行为,和客观的样本是没有关系的。答主一方面在说mal样本多是客观的,这个客观是取“义1:在意识之外,不依赖主观意识而存在的”之意,然后又说mal比bgm更客观,在这里又取了“义2:按事物本来面目去考察,与一切个人感情、偏见或意见都无关”之意,因为不依赖主观意识而存在的事实是无法做出比较的,所以一个客观(义1)的事实是无法推出更加客观(义2)的,我觉得本身就是有点问题的。
所以,以后客观这个词是不是应该谨慎一些用?
在知乎上看到的sai老板给这个答案点了赞,答主说mal比bgm客观性更高,然后评论区里发生了激烈的争吵。
其实我仔细一想,无论是mal还是bgm,都不能说客观,更不能说一个网站就比另一个网站客观,尽管mal的样本比bgm大,但是评分本身就是一种主观的行为,和客观的样本是没有关系的。答主一方面在说mal样本多是客观的,这个客观是取“义1:在意识之外,不依赖主观意识而存在的”之意,然后又说mal比bgm更客观,在这里又取了“义2:按事物本来面目去考察,与一切个人感情、偏见或意见都无关”之意,因为不依赖主观意识而存在的事实是无法做出比较的,所以一个客观(义1)的事实是无法推出更加客观(义2)的,我觉得本身就是有点问题的。
所以,以后客观这个词是不是应该谨慎一些用?
不过要是更新了评分系统,以前的评分如何处理是个问题
不同的objective function得到不同的排名结果是很正常的
我觉得可以有作画、剧情、人物、音乐、个人私心这几项,之所以加最后一项怕没这项的话会影响到其他项的公正性,不过对全10分党没什么用就是了
我已经预见到一大堆再“剧情”这一项打4分以下的情况了
举例(摘自SATI):
p.s.这里的“作画”最好理解成画面的综合素质,而不仅仅是作画功力的体现
星际牛仔
作画4.5 音乐4.8 剧本4.4 演出4.5 配音4.8 人物4.6
攻壳机动队SAC
作画4.5 音乐4.6 剧本4.9 演出4.6 配音4.6 人物4.6
CLANNAD ~AFTER STORY~
作画4.4 音乐4.6 剧本4.5 演出4.5 配音4.5 人物4.5
银河英雄传说
作画3.4 音乐4.5 剧本4.8 演出4.0 配音4.8 人物4.8
EVA
作画4.0 音乐4.5 剧本4.0 演出4.3 配音4.5 人物4.5
浪客剑心 追忆篇
作画4.6 音乐4.5 剧本4.9 演出4.8 配音4.4 人物4.5
水星领航员第三季
作画4.6 音乐4.8 剧本4.6 演出4.6 配音4.6 人物4.8
凉宫春日的消失
作画4.8 音乐4.3 剧本4.6 演出4.6 配音4.6 人物4.5
天空之城
作画4.6 音乐4.8 剧本4.9 演出4.8 配音4.5 人物4.8
再看看一些某方面特别突出的代表性评分:
攻壳机动队2 无罪
作画5.0(恐怖的满分) 音乐4.5 剧本4.0 演出4.8 配音4.6 人物4.4
红线
作画4.5 音乐4.3 剧本3.0 演出4.0 配音3.2 人物3.7
异邦人 无皇刃谭
作画4.8 音乐4.0 剧本3.5 演出3.9 配音3.4 人物3.7
少女与战车 剧场版
作画4.5 音乐4.3 剧本3.7 演出4.5 配音4.1 人物4.4
悠久之翼
作画4.5 音乐4.6 剧本4.4 演出4.6 配音3.9 人物4.1
阿基拉
作画4.5 音乐4.0 剧本3.7 演出4.3 配音3.7 人物4.0
自新世界
作画3.2 音乐4.3 剧本4.5 演出3.7 配音4.0 人物3.9
至于bangumi选择哪几项作为参考标准,这甚至可以另外开主题战个痛
个人觉得配音可以和人物合并一起算作人物塑造
最后估计还要加一句“本评分不计入总评分,请客观理性评价”
而且SATI对于评分是自由的,自己觉得没有把握的项目可以跳过不评分
算法再怎么优化也不如从源头控制管用bgm38
还想修正一下这里的正态分布不是指样本数值自身,而是平均值在一定范围内的可能性,这个可能性的区间是正态分布的,评价1分的人越少,那么求的范围越小,平均值就比较可信?的感觉。
抱歉描述的可能不太清楚,就是跟Semantic Differential method一样的算法。这里不是统计学或者专业,只是专业里面有用到这个方法,感觉应该比较相似
第一、样本大这一客观事实就代表了评分的更加客观?
第二、大众的群体和小众的相对核心向的群体哪一个评分更加客观?
最终的问题是:评分网站的客观性标准是什么?
虽然我觉得这个问题是没有意义的,形式上主观的评分的集合就算是样本大依然是主观的,也就无法比较他们的客观性
你最後的問題我的回答如最後一段,定個標準吧,他們吵起來不就是覺得標準定的有爭議?
好似我虛無化了客觀?
鼓勵大家找自己滿意的用戶群,但是或許有些人只能窮盡到自己一人而已
但是不影響存在規則就可以比較出高下(有方法的話)
其中一位还指出,这并不是重复使用的问题。因为“私”在日语里是“我”,但在汉语里“私”是“窃”。
层主你偏偏相信了最后面的那位用户
不对,是我的阅读还有待提高
多少人注册个账号然后给eva打个10分然后就再也没上过,想想都觉得好笑。
其实也没什么不对的,大家喜欢烂番打高分,资深宅也必须承认烂番抓住了大多数人的心理,就像当下的流行音乐,在技法上与古典乐没法比,也不能就说流行乐是垃圾。
但潜意识里就是这样,如果真的没人看的话,虽然嘴上不会承认,但多半心里不会觉得爽,甚至绕着弯子怪观众智商低的也有不少
当然也有可能是我小人之心度君子之腹恶意揣测他们了
然而问题在于,做个排名是可以用数学手法处理的,但是很多事情客观与否大都是很难切实判定的
第三方专业测评机构只对它的客户负责。如果客户是一般用户,那么它会讨好一般用户;如果客户是学术群体,它会讨好学术群体;如果客户是业界人士,它会讨好业界人士。
我支持每个人都充分地阅读了他人的观点后,再决定自己的评分(争议过大可以不评分)
虽然排行榜(总榜)只有一个,但评价体系应该更加多元一点,有利于发掘作品潜在的闪光点。
第三方机构只对客户负责就够了,对所有人负责就是对任何人不负责。诚然任何一个评分体系都算不上客观,但是把所有门类的权威机构评分汇总就最大可能接近客观(我觉得做成多边形更好,虽然很难看,但是不管用何种方法取单一数值都有损客观性)。
个人评价体系应该多元没有问题,但真正能做到的很少,没有那么多既能欣赏配乐还能欣赏配音、作画、演出、美术风格、后期摄影、脚本等等的人,而且目前大众评分网站只能给出单一分数(还是整数),多元评分必须得换算成一元评分,又客观不起来了。
媒体测评和第三方测评还是有不同的。媒体测评是一种宣传手段,或多或少有倾向性。专业测评则是客户决策的第一手资料,反而不会预设立场。
当然,专业测评可遇而不可求,我还是倾向于猫眼的多位专业影评人联合打分。
你怎么知道你所信任的评分人的评分机制是什么呢?
例如说你是从女权看,可人家是从环境角度评分。
又或者评分人试图量化作品,而你或者作品拒绝量化。(也可能反过来)
但即使写出了影评,解释了给出评分的原因,你理解了影评人给出这个评价的原因,但这个结果真的能代表客观吗?
而我觉得给出多数影评人的评分这个行为本身,就是承认个人的不客观的同时,用数量试图达到客观,而一个平台所聚集的多数影评人,总有其自身特色,也就是说,无论如何都不可能达到真正意义上的客观。
影评人看似很客观,但他们的评价方法(早晚)会成为一种体系,这种单一化的评价思路(职业发展所需)对电影和电影观众都是有害的。
第三方评测的问题在于,它们期许自身成为一种权威,在电影和观众之间隔开了一道沟壑,借此剥夺了观众的独立思考能力,和电影创作者和观众的直接对话。他们的终极目标是要挟观众和制片方,从双方赚取评测的回报。这也是有害的。
bgm大多数用户的评分标准倾向于自身的主观感受,即使不太客观,但他们没有直接受到影评人、媒体、第三方测评机构的“引导”(假如他们只是单纯的观影用户)。他们在自身主观体验的基础上,做出评价抉择,这就有了后续改进的可能。
真正客观的评价方法只有一种,匿名下的创作者互评(参考严肃文学奖项),时间因素也是很重要的(多年以后,评价标注会发生变化,早起的错评会翻案)
借助的专业评价体系才有可能把评分的条件外部化,才有可能从更多的层面对作品进行评价,而非如观众一般,多数从主观感受出发。
然而,建立一个复杂的评价体系之后,它本身是对观众不友好的。大多数观众都没法评价演出、作画、运镜等要素,只有专家和资深票友能够操作这个体系。这个结果就类似于猫眼的影评人评分。
毕竟是艺术作品(?),规则框死的评分有时很蠢。维度再多也不可能涵盖作品的全部魅力所在,对于超脱常理的作品,评分机构有时会给出很迷的结果。
而且,评分机构这回事,既然对客户(钱)负责,那么是不是可信度更低?(花钱买高分之类。)
觉得还是靠集体意识来评分好。
建立复杂的评价体系,目的是从尽可能多的层面评价作品,把作品的评价指标外部化,而非刻意放大某个情绪要点,干扰评分。这样能够排除电波因素,得到一个更具有一般性的看片指导。
然后,由于体系复杂化了,所以它只适合专业人员来操作。
我从没有否认数量的重要性,但是专业要优先于数量
你如果考虑专业人员的商业性,也要考虑大众网站的水军。抛开这个问题,我还是认为专业机构的评分会更有指导意义
为此,我们需要...
你的评价体系是什么?
再者,我觉得一个评价体系本身的客观性只可能局限在这个体系内。
就是说,没有跨体系的客观,从这个角度上讲,这个方法本身就是一种不客观。
可我们能达到最客观的地方,或许就是在评价前先描述一遍所用的体系而已。
否则,这么多作品你没法一一体验,每个人总需要一个社区/评分/媒体做初步筛选…
即使是逻辑严谨的体系,也会因为人为选择而不客观。我对艺术类作品的态度一向是我看我的,关其他人p事……(当然其他人也和我无关)
关于电影院大火人们不顾秩序争相逃生这一行为,既可以用理性选择理论解释,也可以用进化理论解释,这两者都是客观的,但是不一定正确。
一个客观的评价体系,是尽可能的削弱评价者的主观感受,通过外部条件的评价来达到相对公正,而非唯一解。比如,有些观众因为君名的一两个情感段落让自己飙泪给它高分,结果上让它与千年女优的评分相当,就不够客观。因为在这几个段落里,你是按照自身的状况取了情感的极值而非平均值。
我当然知道观众看片更多是一种情感体验,但是如上所说,度量大众情感是不现实的,这是一种过于主观的感受。因此,我们要尝试把这种感受给外部化,通过对激发观众情感的叙事、运镜、作画、演出等因素的考察去给这些情感段落评分,避免极化行为带来的各种自来水…
一切社会现象都包含了人类活动,是否代表了对社会的考察根本不可能客观,客观并非一个值得欲求的价值取向?
如果一个外部化的评价体系,因为由人建立且由人操作就不是客观,那么法治是否不存在?因为法律也是由人建立且由人操作的
如果你真的想要一套客观的评价标准,那我只能给你严肃文学的评价方法了——匿名化的评价委员会。
很简单。
保持原样,修正部分偏差(主观情绪浓郁的高分萌片、童年回忆系列等等)
要客观,就按上面的标准做。
…………
所以大概不存在客观这回事吧。我们只能说尽量客观,却不能说客观。
不可能客观不等于不可能无限接近客观,客观当然是个值得追求的价值。
法律么……合适就好,无所谓啦。我是不怎么在乎正义、道德这些社会准则的
你看,客观和正确、权威没有关系,但是它需要一定的技术手段,去分离自己的情感和预测观众情感的平均值,去给出一个更一般化的指导意见。它不需要达到匿名化专业委员会的程度,这个方式只是增加了评价的权威性,而非客观性
所以说,一般化的行为规范更看重客观这个价值取向,例如法律、新闻这种大众取向的工具,会尤其重视这个标尺。但是,具体到文学影视上,客观更多是入门级的取向,多数票友们还是在找电波…
通过考察引发感情的技巧来达到客观?
但最大的问题是,现在的日本动画(可能)不值得花费这么大的精力去做。
电影也好、文学也好,早就有人这么做了。
我的看法在后面说了,观众会倾向于从主观感受出发取情感的极值,专业人员会倾向于从情感的激发点(运镜、演出、叙事、作画)出发取情感的均值。专业评分当然不会给你作品的体验峰值(这需要自己去体验),但是它至少能够告诉你,这种体验大多数情况下会在某种水平之上
这种把情感外部化的取向,会更适合大众观众。一旦你进入到小众领域,去找电波片,客观化评价自然也不重要了
如果你不把作品的评价条件外部化,凭什么说它是客观
大众都不看它,它不存在一个大众取向,客观评价它干嘛…少数几部作品,扔在电影的分类里就好了
大家找声优、找监督、找公司、找原画、找原作、找老司机,找各种电波,不是玩得很嗨吗
对于商业性浓郁的新片,谁出头,就打谁
明明大家对细田守的新片评价得那么客观...
大家就开始讨论日式动画的光明未来了
顺带一提,我对小乖的那个排行很满意
之前,不是还有人问“这个动画很好,但是我不喜欢”是什么情况吗…大家就是要没事炸一炸
http://rankit.ikely.me
这个榜单挺好的。
对萌元素的批判是日本动画永恒的旋律。
比较好奇你对于这种客观持什么态度
请参考各类文学奖项(因为历史原因会遗漏部分优秀作品,但总体来说,评选上的作品都不会太次)
对于票友们没什么作用,票友们都是在作品中追寻情感体验的极值而非均值,早就形成了具有相似认知结构的小众圈子…
我查了一下诺贝尔文学和普利策奖奖的评选过程,好像并没有提到匿名创作者互评的方式,创作者之间存在的互相竞争的关系,会不会影响到评选的结果
对于大众,客观化的评价要给出,你去看这部作品大多数状况下,情感体验不会低于某个水平(情感的平均值)。对于票友,更主观的圈内评价能告诉他,去看这部作品,情感体验的峰值是什么(情感的极值)。
后一种评价不可能给到大众观众,因为大众的情感偏好太过模糊了…
不然,帕格森、罗素、丘吉尔、某民谣歌手为什么拿诺奖
这种评选方式是顾及到权威,和客观性关系不大…大佬打起来了,你让大家怎么站队
另外我觉得虽然定量肯定很难, 但定性还是可以的。我相信目前的专业人士还是能确定比如说4星的配乐和5星的区别,而且能按照op、ed、战斗部分bgm、日常部分bgm、抒情部分bgm等等分类来打分。
虽然目前让人类来做确实工程量太大,但是今后的ai或许能胜任。
在这里讨论人口基数是没啥用处的,因为原答主是在讨论bgm和mal的相对客观性,这样的话人数上的差距就能看出来了
以bgm和mal为例子,假设一部番在bgm(高分)和mal(低分)的评分相差较大,那么可能就会导致觉得这部分高分的人跑来bgm评分、相反的人就会去mal评分,这样在样本的选择随机性上就会出现问题。
假设,你想要以bgm的评分结果,来代表全体社会人群的评分结果,这肯定是不够客观的(很容易理解)。
那么,如果想要达到相对的客观要怎么做?
第一,定下你想要用这个评分来代表的群体,例如全体动画迷之类的;
第二,对于作品的喜恶比例和选定的群体尽可能一致(为了模拟出随机性)。
而其中伴随着两个问题,
第一、没办法做出自然随机,选择使用bgm还是mal并不一定是随机的,可能会受到评分的影响。
第二、由于不随机而导致的偏差的大小无法测量,或者说不随机的程度无法测量。
我所说的基数是指看动画的人群基数,并不是所有人都会去评分。
真要做到相对的客观的话,我觉得就应该准备一个足够大的样本数,并且不以评分网站的方式来进行统计。
找到了客观的评分网站->我的想法和评分网站一致->发帖
而是
我的想法是客观的->找到和我的想法一致的网站->发帖。
(我也认为)量化的思路不可取,只能作为观影指南,不能作为评价标准。
300个人,每部动画先内部写300篇日志吗
然后再总结成一篇,再处理其他作品,这工作量巨大。
没记错的话是古希腊那会……?
这是什么neta?
所以人体试验那个就是300?
我记得之前我在虎扑看到一个引战帖,就是说日本最伟大的十部冻鳗,里面无非是火影海贼龙珠宫崎骏,最充分的理由就是市场表现。但是我感觉我陷入了思维陷阱,顾客主观的认为这部作品值得买,所以才会有好的市场,这样子看来也不算是客观的(义2)吧。这样子看来这些诸如评分人数,票房,销量这些数据也是出于主观的意向吧。客观这两个定义的确是很容易混淆啊
因此,我走我的阳关道你过你的独木桥,这是比较好的一个解决方法。如果没有这点人心争论,把所谓的“客观评分”看作客观的也未尝不可,可是这完全不可能实现嘛。
@阿良良木翔 不能因为都是四个汉字的 ID 就分不清啊
你们俩不只是ID,留言风格也都是挤成一团...
板砖加身 说: 我们就要带把儿的小姐姐!
关于q,我倒觉得用X(i)的标准差比上X(i)的平均值 (即std(X)/EX,反映用户评分数的差异程度)来衡量客观性会更好。
本来为了体现评分数量的一致性,第一反应就是评分作品数的标准差,但想想太不直观就想到除以平均值。
2銷量都帶主觀的意願,就沒有客觀了。難道還要人類之外的智慧來判定作品的優劣才算客觀嗎?那樣的客觀對人類又有什麼意義?假如是通過某種機制來計算,那這種機制由人決定,還是主觀的。所以世界上就沒有客觀了,客觀只是相對的。
感觉我有点钻牛角尖了。。。
不过Objectivity为啥前面还要加个定语啊