协调滤波
* 方法总结
* 协同过滤
1. 基于领域的方法
ok@@@Empirical analysis of predictive algorithms for collabotive filtering ok@@@Toward the next generation of recommender system: A survey of the state-of -the -art and possible extensions ok@@@Evaluation of Item-based Top-N Recommendation Algorithms
(a) user-based
ok@@@ GroupLens:applying collative filtering to Usenet news ok@@@Recommending and Evaluting chices in a virtual community of use ok@@@ Social information filtring:Algorithm for automating "word of mouth"
(b) item-based
ok@@@ Item-based top-N recommendation algorithms ok@@@ Amazon.com Recommendations: Item-to-Item Collabotive filtering
2. 基于模型的方法
* 基于领域的方法:在预测中直接使用已有的数据
*### 基于模型的方法:使用评分生成预测模型
(a) 贝叶斯聚类
@@@ Empirical analysis of predictive algorithms for collabotive filtering
(b) 潜在语义分析(LSA)
@@@Collative filtering via Guassian probabilistic latent sematic analysis
(c) 潜在狄利克雷(LDA)
@@@ Latent dirichlet allocation
(d) 最大熵
@@@ Maximun entropy for collaborative filtering
(e) 玻尔兹曼机
Restricted Bolzman machines for collaborative
(f) 支持向量机
KNN versus SVM in the Collaborative filtering framework
(g) 奇异值分解
@@@ Modeling relationship at multiple scales to improve accuracy of large recommender systems @@@Factorization meets the neighborhood: a multifaceted collaborative filtering model @@@ Collabotive filtering with temporal dynamics @@@ Matrix factorization and neighbor based algorithms for netflix prize problem @@@Investigation of various matrix factorization methods for large recommender system @@@ Scalable collaborative filtering approaches for large recommender system
(h)Factorization machine(LibFM)
@@@Factorization machines with LibFM
(i) 深度学习
@@@Collaborative Deep Learning for Recommender Systems
领域算法和模型算法 的比较
- 精度上模型优于领域
@@@Factorization meets the neighborhood: a multifaceted collaborative filtering model
@@@Major components of the gravity recommendation system
- 惊喜度方面领域算法优
@@@ Combining collaborative filtering with personal agents for better recommendations
- 新颖度: 推荐给用户一个他喜欢的导演,但是他没有想到的电影
- 惊喜度:完全没想到
* 领域算法的优势
- 简单
- 合理
- 高效
- 稳定
1. 问题的定义
问题定义
- 用户:$$u$$;物品集合:$$T$$;系统评分集合:$$R$$;可选分数集合:$$S$$
- 用户$$u$$对于物品$$i$$的评分:$$r_{ui}$$
- 已经对物品$$i$$评分的$$u$$的集合:$$u_i$$
- 用户$$u$$ 所评价的物品集合: $$T_u$$
- 同时被用户$$u$$和$$v$$评价过的集合:$$T_{uv}$$
- 对物品$$i$$和$$j$$都评分的用户集合:$$u_{ij}$$
最优项(评分问题)
- 用户$$u$$最感兴趣的物品$$i$$的分数
- 评分值存在,则转换为一个回归或者是分类问题(多分类);目标是学习 函数$$f:u*T \rightarrow S$$ 来预测用户$$u$$对$$i$$的评分$$f(u,i)$$
然后选择$$i^{*}=argmax f(u_a,j)$$ ; u对那个物品的评分最高
平均绝对误差(MAE) $$MAE(f)=\frac{1}{|R{test}|}\sum|f(u,i)-r{ui}|$$
均方根误差
$$RMSE(f)=\sqrt{\frac{1}{|R{test}|}\sum(f(u,i)-r{ui})^2}$$
Top-N
- 没有评分信息,则转换为推荐Top-N列表
@@@itembased_collaborative_filtering_recommendation_algorithms
@@@Item-based_top-n_recommendation_algorithms
评价方法: $$L(u)$$ 包含用户$$u_a$$最感兴趣的 $$N$$个物品 $$T(u)$$是用户u对物品$i$的二级正反馈 准确率: $$Precision(L)=\frac{1}{|U|}\sum|L(u) \bigcap T(u)| / |L(u)|$$ $$Recall(L)=\frac{1}{|U|}\sum|L(u) \bigcap T(u)| / |T(u)|$$
缺点: $$L(u)$$中所有物品对于用户u的兴趣程度被认为是相同的