#1 - 2011-7-15 17:29
Sai🖖 (Awesome!)
经过 aligo 多年的开发与催促下,这个功能终于上线了。

点击任意条目即可看到。

因为使用了管理猿理解不能的高科技算法,所以经常会有意想不到的结果[1]算出来,欢迎大家鞭策 aligo 改进。

[1] http://bgm.tv/subject/276 出现了大菠萝和 TBBT⋯⋯
#2 - 2011-7-15 17:32
三次元条目混进来各种违和……
#3 - 2011-7-15 17:34
(いつか忘れる本の題名)
3次元违和+1 另外总觉得分一下类的推荐比较好?比如说在动画条目里只出现动画...?什么的?
#3-1 - 2011-7-15 17:36
Sai🖖
算法开发者表示这样才有趣⋯⋯
#3-2 - 2011-7-15 17:39
R
ıɐs 说: 算法开发者表示这样才有趣⋯⋯
interesting, but unusable...(bgm76)
#3-3 - 2011-7-15 20:35
我不存在
レクター 说: interesting, but unusable...
like mathematicians...
#4 - 2011-7-15 17:38
不希望有三次元混入。。
#5 - 2011-7-15 17:40
只要属性一直,我觉得混入三次元没有什么问题...
#6 - 2011-7-15 17:41
呃,是属性一致...
#6-1 - 2011-7-15 18:13
夜々無夢
打错了可以点右上角的edit改掉的……
#6-2 - 2011-7-16 01:36
Leeiio
夜夜無夢 说: 打错了可以点右上角的edit改掉的……
怪了,之前为啥我没看到啊...真是瞎了我的狗眼...现在看到edit了
#6-3 - 2011-7-16 12:07
夜々無夢
Leeiio 说: 怪了,之前为啥我没看到啊...真是瞎了我的狗眼...现在看到edit了
回复之后不会马上出现,要刷新一下才有
#7 - 2011-7-15 17:42
喂喂,LS里出现D2和TBBT太违和了。。。
#8 - 2011-7-15 17:45
(行って 人間の生きざまに触れてこい )
哦哦~ 夏娃的时间下出现了激动战士刚大木
#9 - 2011-7-15 17:46
(the x makes it sound cool)
确实有些违和~
不过刚好 脑残星 大菠萝和 TBBT咱都很喜欢啊(bgm24)
#10 - 2011-7-15 17:52
说实话我也不知道怎么会这样,只是采取一视同仁的算法而已嘛。。。
如果部分结果是对的:
http://bgm.tv/subject/1424
那么就应该认为看上去不对的部分也是对的
别打我
#10-1 - 2011-7-16 11:48
fancl20
MH 是怎么回事233333
喜欢 KON 又喜欢 MH 的是不是都只用笛子
#10-2 - 2011-7-16 12:01
‌aligo
fancl20 说: MH 是怎么回事233333
喜欢 KON 又喜欢 MH 的是不是都只用笛子
具体原因我也不知道啊,可能有潜在联系吧- -
#11 - 2011-7-15 17:54
(关于我被绑架到Bangumi当不认真样本这件事 ...)
这个……莫非跟先前放出的那个15.5MB 的 Mio.txt有关?!
#11-1 - 2011-7-15 20:13
v仔💎
15.5MB(bgm38)这是怎样的巨坑啊!
#12 - 2011-7-15 18:41
(Ruby ❤ Sapphire)
唔~~在明天之前看到了这一功能啊~~

好高兴!

不过觉得比豆瓣还不靠谱啊(bgm39)
#13 - 2011-7-15 18:44
(Hibernate Mode ON)
没有觉得三次元违和啊....
#14 - 2011-7-15 18:46
最近BGM改动越来越频繁了啊……支持支持
#15 - 2011-7-15 20:49
(for Necessity)
不太靠谱啊……
#16 - 2011-7-15 20:49
(加班时在做什么?有没有空?可以补番吗? ...)
好棒! &&继续加油吧

咱只要 http://bangumi.tv/subject/8019 时能出够多的结果就行 (拖走
#16-1 - 2011-7-15 20:50
v仔💎
喂!
#17 - 2011-7-15 21:15
我问大家一个问题:
喜欢一个东西(讨厌)的一群人,同时也喜欢(讨厌)别的东西,他们一定要是同系列吗?

之前听说过一次故事,一家超市发现买啤酒的人,有不少同时也会买尿布。最后发现是很多居家男人到超市来,就买这两样东西。于是超市就把这两样东西摆在了一起促销

(继续找打
#17-1 - 2011-7-15 21:20
粘土火星
显然不一定wwww

不过“大概会喜欢”和“也喜欢”是两个概念吧,前一个有推断,后一个纯统计。

现在发现好像把所有的类型放在一起有点违和。。。。对于条目推荐类似的比较好,比如动画推动画,音乐推音乐。。
#17-2 - 2011-7-15 21:29
Kane
取决于你采用什么样的假设吧,假设这玩意儿没有太多理论根据,说的通就行

其实我一直在有考虑类似这个New Feature的功能应该怎么实现,不过考虑的是给每个用户推荐条目,而不是给作品推荐。想到的方法基本上就是先根据爱好和评分对用户之间的相似度进行度量,再根据爱好相似的用户对你没有接触过的作品的评价给出一个预测评分。大体思路上应该是这样没错,剩下就是具体采用怎样的度量,以及考虑计算负担的问题了。

所以说比起“喜欢这个条目的人还会喜欢”我还是希望有个“你的好基友们都喜欢”这样的功能。。嘛总之球你现在这个算法的详细。。
#17-3 - 2011-7-15 21:31
‌aligo
Kane 说: 取决于你采用什么样的假设吧,假设这玩意儿没有太多理论根据,说的通就行

其实我一直在有考虑类似这个New Feature的功能应该怎么实现。想到的方法基本上就是先根据爱好和评分对用户之间的相似度进行度...
http://bgm.tv/group/tomodachi
“大概会喜欢”这个字眼完全是sai想出来的
然后按类型推荐这事也与我无关,要过滤也应是查询的时候过滤。虽然我是觉得不过滤更好
#17-4 - 2011-7-15 21:39
Kane
aligo 说: http://bangumi.tv/group/tomodachi
“大概会喜欢”这个字眼完全是sai想出来的
然后按类型推荐这事也与我无关,要过滤也应是查询的时候过滤。虽然我是觉得不过滤更好
哦我错了。。我发现我想的问题和你实现的还不一样。。已在上面的回复里更正。。
#17-5 - 2011-7-15 21:43
‌aligo
Kane 说: 取决于你采用什么样的假设吧,假设这玩意儿没有太多理论根据,说的通就行

其实我一直在有考虑类似这个New Feature的功能应该怎么实现,不过考虑的是给每个用户推荐条目,而不是给作品推荐。想到的方法...
预测评分被抛弃了,太慢了,虽然可能会更准确一点,特别是数据不够的时候,不过现在数据不够的问题也解决了,例如:
http://bgm.tv/subject/3256
#17-6 - 2011-7-15 21:53
Kane
aligo 说: 预测评分被抛弃了,太慢了,虽然可能会更准确一点,特别是数据不够的时候,不过现在数据不够的问题也解决了,例如:
http://bangumi.tv/subject/3256
预测评分你说的是这个么http://bgm.tv/group/topic/2033
为了解决数据不够而补齐数据?不过没太明白是怎么补的

话说你的算法可以做递推计算么,就是当有用户更新收藏与评分的时候,花较小的代价进行一次计算更新全部的计算结果。还是说只能隔一段时间整个算一次?
#17-7 - 2011-7-15 21:56
‌aligo
Kane 说: 预测评分你说的是这个么http://bangumi.tv/group/topic/2033
为了解决数据不够而补齐数据?不过没太明白是怎么补的

话说你的算法可以做递推计算么,就是当有用户更新收藏与评...
只可以单独更新某一个条目的相似记录
同时过一段时间重新全部计算是很有必要的。。。

补齐数据就是建立用户模型,预测用户可能的打分

以前的算法计算3000多条目要近1小时,现在的话同样条件有近20000多条目,估计得算上一天
#17-8 - 2011-7-15 21:58
void****
貌似现有的兴趣推荐算法都是这么干的吧 >.<
#17-9 - 2011-7-15 21:59
Kane
aligo 说: 只可以单独更新某一个条目的相似记录
同时过一段时间重新全部计算是很有必要的。。。
嗯我觉得蛮好的,短时间内根据更新进行一些近似修改,一段时间重新计算一次把误差补回来,这种方式还是可以接受的
#17-10 - 2011-7-15 22:02
‌aligo
Kane 说: 嗯我觉得蛮好的,短时间内根据更新进行一些近似修改,一段时间重新计算一次把误差补回来,这种方式还是可以接受的
单独更新就是只更新A对N的,按现在的规模一条是在0.1-2.0左右,而N对A的话,除非全部重新计算,否则是更新不过来的
#17-11 - 2011-7-15 22:32
夢遊中
=w=;;; 敵人的敵人一定是朋友,但是朋友的敵人不一定是敵人。
#18 - 2011-7-15 21:44
(この勝利を、近所のおばさんに捧げる!)
话说我莫名觉得这类问题在各个地方都会遇到。。比如,osu的难度与排名都不靠谱,我一直在想能从玩家打各个map的分数中,同时给出map难度和玩家水平这样的估计的问题。。其实和找共同爱好这种蛮像的
#18-1 - 2011-7-15 21:55
‌aligo
我想用户发言的内容,来计算用户相似度-A-
这个最能反映用户的性格习惯之类的
#18-2 - 2011-7-15 21:57
Kane
aligo 说: 我想用户发言的内容,来计算用户相似度-A-
这个最能反映用户的性格习惯之类的
这个还要用到自然语言处理。。太高端了。。

我觉得用收藏条目交集数占各自收藏条目数的比例、以及交集部分评分的一个相关系数,这三个量基本就足矣整合出一个靠谱的相似度了
#18-3 - 2011-7-15 22:04
‌aligo
Kane 说: 这个还要用到自然语言处理。。太高端了。。

我觉得用收藏条目交集数占各自收藏条目数的比例、以及交集部分评分的一个相关系数,这三个量基本就足矣整合出一个靠谱的相似度了
不需要自然语言处理,简单地分词就好了
以前网易就做过(http://www.youdao.com/blogender/,例如我blog测出来是100%男性T_T),不过只是简单地和男性和女性两组统计数据对比相似度,并没有在所有用户之间对比相似度
我就是希望找出语言风格啊性格啊相似的bangumi用户XD
#19 - 2011-7-15 21:52
其实分类推荐会比较好,都挤在一起就有点乱了
#20 - 2011-7-15 22:08
(旅行真好。)
到底用了甚麼算法啊-A-⋯⋯
#20-1 - 2011-7-15 22:18
‌aligo
这可是商业机密,我连sai都不打算告诉
不过可以偷偷告诉你-A-
#20-2 - 2011-7-15 22:21
Sai🖖
aligo 说: 这可是商业机密,我连sai都不打算告诉
不过可以偷偷告诉你-A-
那就移掉这个功能。
嘿嘿~~
#20-3 - 2011-7-15 22:26
‌aligo
ıɐs 说: 那就移掉这个功能。
嘿嘿~~
那我一样也不会告诉你啊
嘿嘿
#20-4 - 2011-7-15 22:29
夢遊中
aligo 说: 这可是商业机密,我连sai都不打算告诉
不过可以偷偷告诉你-A-
+_+ 求告訴~!
#21 - 2011-7-16 02:21
(VIP已到期,请尽快续费)
算法还是很给力的 起码没有出现我讨厌的东西 主要还是需要sai把看过的过滤掉。类型的问题可以用tab的ui简单解决
#21-1 - 2011-7-16 02:23
Sai🖖
其实现在每个条目只算出了 15 个,再过滤的话估计就不剩几个了。
#21-2 - 2011-7-16 07:44
若卡
ıɐs 说: 其实现在每个条目只算出了 15 个,再过滤的话估计就不剩几个了。
ting hao a ... kan guo de zai duo ye mei yong a ...
#21-3 - 2011-7-16 12:03
‌aligo
ıɐs 说: 其实现在每个条目只算出了 15 个,再过滤的话估计就不剩几个了。
不是你让我只保留一部分吗。。。
如果全部保留每个条目可以有几千条的关联
而且计算难度是一样的,现在只是保留了前15名
#22 - 2011-7-16 03:02
(你老婆真棒)
我看了近半个小时才终于理解这究竟说的是啥....(bgm27)
#23 - 2011-7-16 11:20
(bgm72)把这个功能放在天窗里怎样?
感兴趣的同人作品都不怎么好找到。
#23-1 - 2011-7-16 11:24
Sai🖖
按这个算法会打 CP 大战的⋯⋯
#23-2 - 2011-7-16 12:03
‌aligo
ıɐs 说: 按这个算法会打 CP 大战的⋯⋯
CP大战是啥?
#23-3 - 2011-7-16 12:47
E
aligo 说: CP大战是啥?
路人甲(ıɐsXsai派)在浏览天窗看见ıɐsXsai的cp本果断点了收藏,正准备去官网预订,向下一看喜欢本条目的会员大概会喜欢RuocaledXıɐs的cp本子。于是路人甲恼羞成怒,之后......bad end
#23-4 - 2011-7-16 15:01
若卡
知弦之玄 说: 路人甲(ıɐsXsai派)在浏览天窗看见ıɐsXsai的cp本果断点了收藏,正准备去官网预订,向下一看喜欢本条目的会员大概会喜欢RuocaledXıɐs的cp本子。于是路人甲恼羞成怒,之后.........
两本都要入!
#23-5 - 2011-7-16 15:38
E
Ruocaled 说: 两本都要入!
ıɐsXsai会有的,RuocaledXıɐs也会有的。策划中(雾)
#24 - 2011-7-16 15:09
(买漫画切记远离烂店“漫爵”&“神话典传” ...)
说实话我喜欢幸运星也喜欢玩D2 (bgm81)
#25 - 2011-7-17 00:49
我只想知道,我能不能屏蔽了它...
#26 - 2012-12-26 15:58
(平行)
话说...时间过了一年半了,数据能不能更新一下?要不直接干掉也好
#27 - 2012-12-26 16:08
我想屏蔽了这功能!