#1 - 2017-6-16 10:18
Icemic
昨晚先发v2(https://www.v2ex.com/t/368723)了,好像程序上没什么问题,于是今天正式发到这边。
如题,能根据你选择的某个动画,推荐与其相似的其他动画。
相似是指「喜欢该动画的人大多也会喜欢」
比如找合适自己的老番来看之类的~
最早是今年年初在 Coursera 学吴恩达的机器学习课程时练手用的,后来发现还挺准确的。
于是花了一些时间把 Matlab 程序改成了 Python 实现,这两周继续做了网站供人查询。
支持移动端,包括 Chrome 和 Safari 的「添加到主屏幕」,但不支持离线使用
使用了一些新的浏览器特性,部分较旧浏览器可能会有兼容问题。
地址:https://search.bakery.moe/ (注:使用前请先阅读「关于」)
网站源码: https://github.com/Icemic/search.bakery.moe (欢迎 pr )
===============
注意看使用方法,搜索只是搜索,点进去才是推荐…
各位觉得不准的说下搜索的是哪个动画,觉得准也在下面留个言。
特别冷门或久远的就放弃吧,样本数不够肯定不准确的,而且那时候评分人的口味也和现在人不太一样
=======2018.2.23更新========
数据更新到2018.2.21,可根据2018年1月番以前的动画查询推荐。
如题,能根据你选择的某个动画,推荐与其相似的其他动画。
相似是指「喜欢该动画的人大多也会喜欢」
比如找合适自己的老番来看之类的~
最早是今年年初在 Coursera 学吴恩达的机器学习课程时练手用的,后来发现还挺准确的。
于是花了一些时间把 Matlab 程序改成了 Python 实现,这两周继续做了网站供人查询。
支持移动端,包括 Chrome 和 Safari 的「添加到主屏幕」,但不支持离线使用
使用了一些新的浏览器特性,部分较旧浏览器可能会有兼容问题。
地址:https://search.bakery.moe/ (注:使用前请先阅读「关于」)
网站源码: https://github.com/Icemic/search.bakery.moe (欢迎 pr )
===============
注意看使用方法,搜索只是搜索,点进去才是推荐…
各位觉得不准的说下搜索的是哪个动画,觉得准也在下面留个言。
特别冷门或久远的就放弃吧,样本数不够肯定不准确的,而且那时候评分人的口味也和现在人不太一样
=======2018.2.23更新========
数据更新到2018.2.21,可根据2018年1月番以前的动画查询推荐。
我是不想做基于标签化内容(staff、tag这类)的推荐的,因为它无法反映真实评价。比如staff中某个高权重的人做了作品A和B,A很好B崩坏,怎么能说这两个相似呢
其实有一些我也觉得很不准,比如为什么 New Game 跟点兔的相似度那么高……社畜多萝莉控?
我的应该和你的差不多吧,低秩矩阵分解做PCA,相似度是余弦
扔掉了评分少于7的用户
我找到一拨人总体评分比其他人第一些但是里番和后宫比别人高,但是我没法衡量这个结论的正确程度,因为视奸了几个这类用户发现有些是确实喜欢后宫和里番,有些只是物语厨(毕竟垃圾君开后宫
你的意思是deep model解释性不强,不如用特征工程的方法容易推出“有趣的结论么”
Failed to load resource: net::ERR_BLOCKED_BY_CLIENT
index.js:1 Uncaught ReferenceError: _czc is not defined
at t (index.js:1)
at index.js:1
at f._constructComponentWithoutOwner (vendor.js:20)
at f._constructComponent (vendor.js:20)
at f.mountComponent (vendor.js:20)
at Object.mountComponent (vendor.js:6)
at f.performInitialMount (vendor.js:20)
at f.mountComponent (vendor.js:20)
at Object.mountComponent (vendor.js:6)
at h.mountChildren (vendor.js:20)
雷锋原来是那种故事吗
同理staff汇总页的作用和推荐中的staff权是一回事?你懂不懂加权如何操作?同staff风格相似的很可能用户都会喜欢,但同staff有更多的风格不相似、质量不高的作品要排除,那么多staff要查看哪个才对,推荐算法该做的事凭什么还要用户耗费大力去一个个筛选排查
这是“推荐”不是“数据挖掘”,相比意想不到的新发现或是有趣的结论,我更想要传统的、成熟的、可靠的“相似”结果,做到这些后你再在10个推荐位里放1-2个惊喜,没人会反对
而只看**,**不看的人,怎么样的推荐工具都不适合他们,请服用小圈子抱团取暖论坛或群。
我想了想,花开出雷锋,也许已经计入都打低分这项了,可怕
「注意看使用方法,搜索只是搜索,点进去才是推荐… 」
ww
其实这种应该滤出去或者加上tag和staff相似度的修正比较好。
---
好吧,关于里也写了
应该确实和看过有关。