ıɐs 说: 算法开发者表示这样才有趣⋯⋯
レクター 说: interesting, but unusable...
夜夜無夢 说: 打错了可以点右上角的edit改掉的……
Leeiio 说: 怪了,之前为啥我没看到啊...真是瞎了我的狗眼...现在看到edit了
fancl20 说: MH 是怎么回事233333 喜欢 KON 又喜欢 MH 的是不是都只用笛子
Kane 说: 取决于你采用什么样的假设吧,假设这玩意儿没有太多理论根据,说的通就行 其实我一直在有考虑类似这个New Feature的功能应该怎么实现。想到的方法基本上就是先根据爱好和评分对用户之间的相似度进行度...
aligo 说: http://bangumi.tv/group/tomodachi “大概会喜欢”这个字眼完全是sai想出来的 然后按类型推荐这事也与我无关,要过滤也应是查询的时候过滤。虽然我是觉得不过滤更好
Kane 说: 取决于你采用什么样的假设吧,假设这玩意儿没有太多理论根据,说的通就行 其实我一直在有考虑类似这个New Feature的功能应该怎么实现,不过考虑的是给每个用户推荐条目,而不是给作品推荐。想到的方法...
aligo 说: 预测评分被抛弃了,太慢了,虽然可能会更准确一点,特别是数据不够的时候,不过现在数据不够的问题也解决了,例如: http://bangumi.tv/subject/3256
Kane 说: 预测评分你说的是这个么http://bangumi.tv/group/topic/2033 为了解决数据不够而补齐数据?不过没太明白是怎么补的 话说你的算法可以做递推计算么,就是当有用户更新收藏与评...
aligo 说: 只可以单独更新某一个条目的相似记录 同时过一段时间重新全部计算是很有必要的。。。
Kane 说: 嗯我觉得蛮好的,短时间内根据更新进行一些近似修改,一段时间重新计算一次把误差补回来,这种方式还是可以接受的
aligo 说: 我想用户发言的内容,来计算用户相似度-A- 这个最能反映用户的性格习惯之类的
Kane 说: 这个还要用到自然语言处理。。太高端了。。 我觉得用收藏条目交集数占各自收藏条目数的比例、以及交集部分评分的一个相关系数,这三个量基本就足矣整合出一个靠谱的相似度了
aligo 说: 这可是商业机密,我连sai都不打算告诉 不过可以偷偷告诉你-A-
ıɐs 说: 那就移掉这个功能。 嘿嘿~~
ıɐs 说: 其实现在每个条目只算出了 15 个,再过滤的话估计就不剩几个了。
ıɐs 说: 按这个算法会打 CP 大战的⋯⋯
aligo 说: CP大战是啥?
知弦之玄 说: 路人甲(ıɐsXsai派)在浏览天窗看见ıɐsXsai的cp本果断点了收藏,正准备去官网预订,向下一看喜欢本条目的会员大概会喜欢RuocaledXıɐs的cp本子。于是路人甲恼羞成怒,之后.........
Ruocaled 说: 两本都要入!
喜欢 KON 又喜欢 MH 的是不是都只用笛子
不过“大概会喜欢”和“也喜欢”是两个概念吧,前一个有推断,后一个纯统计。
现在发现好像把所有的类型放在一起有点违和。。。。对于条目推荐类似的比较好,比如动画推动画,音乐推音乐。。
其实我一直在有考虑类似这个New Feature的功能应该怎么实现,不过考虑的是给每个用户推荐条目,而不是给作品推荐。想到的方法基本上就是先根据爱好和评分对用户之间的相似度进行度量,再根据爱好相似的用户对你没有接触过的作品的评价给出一个预测评分。大体思路上应该是这样没错,剩下就是具体采用怎样的度量,以及考虑计算负担的问题了。
所以说比起“喜欢这个条目的人还会喜欢”我还是希望有个“你的好基友们都喜欢”这样的功能。。嘛总之球你现在这个算法的详细。。
“大概会喜欢”这个字眼完全是sai想出来的
然后按类型推荐这事也与我无关,要过滤也应是查询的时候过滤。虽然我是觉得不过滤更好
http://bgm.tv/subject/3256
为了解决数据不够而补齐数据?不过没太明白是怎么补的
话说你的算法可以做递推计算么,就是当有用户更新收藏与评分的时候,花较小的代价进行一次计算更新全部的计算结果。还是说只能隔一段时间整个算一次?
同时过一段时间重新全部计算是很有必要的。。。
补齐数据就是建立用户模型,预测用户可能的打分
以前的算法计算3000多条目要近1小时,现在的话同样条件有近20000多条目,估计得算上一天
这个最能反映用户的性格习惯之类的
我觉得用收藏条目交集数占各自收藏条目数的比例、以及交集部分评分的一个相关系数,这三个量基本就足矣整合出一个靠谱的相似度了
以前网易就做过(http://www.youdao.com/blogender/,例如我blog测出来是100%男性T_T),不过只是简单地和男性和女性两组统计数据对比相似度,并没有在所有用户之间对比相似度
我就是希望找出语言风格啊性格啊相似的bangumi用户XD
不过可以偷偷告诉你-A-
嘿嘿~~
嘿嘿
如果全部保留每个条目可以有几千条的关联
而且计算难度是一样的,现在只是保留了前15名