#1 - 2017-3-29 17:53
满舰饰假子 (公众号:冷静的历史碎片。B站:满舰饰假子。 ... ... ...)
RT?
#2 - 2017-3-29 18:38
(你谁啊?我准许你套近乎了吗?)
http://bgm.tv/group/topic/45649(咦网站好像挂掉了?
#2-1 - 2017-3-29 20:35
fifth
404了23333
@小乖
#3 - 2017-3-29 19:47
(已淡出bgm38)
和你同步率最高的是那些只标了几部动画的人
同步数目最多的才有意义
#3-1 - 2017-3-29 22:33
满舰饰假子
然则。。如何查?
#4 - 2017-3-29 20:34
(人型自走单线程大脑培养皿#5)
同步率计算有问题,同步率高没意义
想快速看用户和自己的同步率可以去使用我写的斯托卡插件
#4-1 - 2017-3-29 20:59
Mr.Tang
我在想啊,如果对方的收藏和自己完全一样,打的分却完全相反,这算是口味一样嘛
#4-2 - 2017-3-29 22:33
满舰饰假子
咋看?
#4-3 - 2017-3-30 00:44
fifth
满舰饰真子 说: 咋看?
https://bgm.tv/group/topic/342298
#4-4 - 2017-3-30 01:09
小T
Mr.Tang 说: 我在想啊,如果对方的收藏和自己完全一样,打的分却完全相反,这算是口味一样嘛
我记得是要好评(>7还是>6)且同样标记才算同步的,另外都不打分的在计算同步率有优势。
#5 - 2017-3-30 01:13
(Information doesn't harm)
小乖的那个同步率和bgm的同步率算法不一样的
我最近在一个很小的dataset上(采集于三月初,用户评分至少100个评分,并且1分10分少于30%,动画至少30个评分,总共6147用户,4995动画) 做了个类似的,也不知道准不准,排名靠前的几位倒是确实有已经加的好友,下面是你的结果:第一列是用户id,第二列是“某种同步率“,第三列是是否和你已经是好友
('zq0504032', 1.0, False),
('grubstreet', 0.98501635, True),
('xeo', 0.98356628, False),
('derrick', 0.98237044, True),
('sai', 0.98203665, False),
('18128', 0.98149741, False),
('haohao69', 0.98132014, True),
('kurichan', 0.98038864, False),
('62325', 0.98020768, False),
('matrix67', 0.97928727, False),
('oisris', 0.97846574, True),
('wyxacl', 0.97783244, True),
('vince19', 0.97753513, True),
('saker', 0.97639561, True),
('seraphim_chen', 0.97610331, True),
('222420', 0.97552401, True),
('zolunx10', 0.97550267, False),
('airlandon', 0.97333634, False),
('lostanother', 0.97318602, True),
('ruocaled', 0.97243267, True)
#5-1 - 2017-3-30 09:05
丸梓
赞!能不能麻烦也看一下我的呢??
#5-2 - 2017-3-30 09:11
Genius🌟小乖💯
Oh it looks nice! You can start thinking about onboarding your similarity retrieval system to production environment and serve public users.
#5-3 - 2017-3-30 09:12
Hentyclopedia
芥末酱油丸 说: 赞!能不能麻烦也看一下我的呢??
('apocalypse_shu', 1.0, False),
('grubstreet', 0.96718556, True),
('oisris', 0.96701944, False),
('sai', 0.96666586, True),
('18128', 0.96472096, False),
('akito_sakurai', 0.96318054, True),
('vince19', 0.96296251, False),
('233550', 0.96281499, False),
('kurichan', 0.96090686, False),
('haohao69', 0.96029615, False),
('saker', 0.95996654, False),
('rainshiner', 0.9594872, False),
('zq0504032', 0.95921475, False),
('nakedbaby', 0.95883942, False),
('lasteaster', 0.9579131, False),
('wenzhlove', 0.95676237, False),
('shameimaruaya', 0.95622432, False),
('chu2otaku', 0.95606077, False),
('ethereal', 0.95588112, False),
('wyxacl', 0.95552611, False)
#5-4 - 2017-3-30 09:38
Hentyclopedia
Genius、小乖 说: Oh it looks nice! You can start thinking about onboarding your similarity retrieval system to produc...
网络服务这块一窍不懂,等我闲下来买个Raspberry PI一起研究研究
我训练时还加了一些social regularization来增强泛化能力,来让互为好友且Pearson correlation比较大的人在latent space上距离近一些,而且让有关联的动画(比如第一季和第二季)在latent space上距离也近一些,结果是加上这些确实有助于减小validation set上的RMSE

然后我试着在latent space上跑了下K-means看看能不能把用户分类,最后感觉分四类差别比较明显,然而除了平均评分的差别以外没什么太大的收获,大致可以分为
A类:高分党,占大约40%的人
B类:中高分党,占大约17%的人
C类:中低分党,然而里番高于B类,肉番还有后宫只比B类少一点,占大约25%的人
D类:低分党,占大约18%的人
考察了一下这四类之间好友关系的密度,发现BD两类占了75%的好友关系,隐隐感到给工口条目评分高的人不大爱加好友(bgm38)
#5-5 - 2017-3-30 09:57
丸梓
Hentyclopedia 说: ('apocalypse_shu', 1.0, False),
('grubstreet', 0.96718556, True),
('oisris', 0.96701944, False),
...
挺有趣的,不过我的和上面层主的list里有些可疑的overlap。。。比如小寒和sai,不知是什么原因
#5-6 - 2017-3-30 10:12
Hentyclopedia
芥末酱油丸 说: 挺有趣的,不过我的和上面层主的list里有些可疑的overlap。。。比如小寒和sai,不知是什么原因
可能是我模型的原因,因为我训练时刻意让互为好友的人Euclidean距离更近一些(虽然同步率算的是cosine similarity也就是夹角,不过拿来做求同步率的东西感觉有点cheating?),我怀疑好友多并且评分比较主流化的人会更容易出现在榜单上
#5-7 - 2017-3-30 20:31
丸梓
Hentyclopedia 说: 可能是我模型的原因,因为我训练时刻意让互为好友的人Euclidean距离更近一些(虽然同步率算的是cosine similarity也就是夹角,不过拿来做求同步率的东西感觉有点cheating?),我...
嗯,我也是这样怀疑的。。。
#6 - 2017-4-1 21:35
(套路没有关系,带来诗意的从来细节和超细节 ... ... ... ...)
我好像看不懂中文了