协调滤波


* 方法总结

* 协同过滤

1. 基于领域的方法

ok@@@Empirical analysis of predictive algorithms for collabotive filtering ok@@@Toward the next generation of recommender system: A survey of the state-of -the -art and possible extensions ok@@@Evaluation of Item-based Top-N Recommendation Algorithms

(a) user-based

ok@@@ GroupLens:applying collative filtering to Usenet news ok@@@Recommending and Evaluting chices in a virtual community of use ok@@@ Social information filtring:Algorithm for automating "word of mouth"

(b) item-based

ok@@@ Item-based top-N recommendation algorithms ok@@@ Amazon.com Recommendations: Item-to-Item Collabotive filtering

2. 基于模型的方法

* 基于领域的方法:在预测中直接使用已有的数据

*### 基于模型的方法:使用评分生成预测模型

(a) 贝叶斯聚类

@@@ Empirical analysis of predictive algorithms for collabotive filtering

(b) 潜在语义分析(LSA)

@@@Collative filtering via Guassian probabilistic latent sematic analysis

(c) 潜在狄利克雷(LDA)

@@@ Latent dirichlet allocation

(d) 最大熵

@@@ Maximun entropy for collaborative filtering

(e) 玻尔兹曼机

Restricted Bolzman machines for collaborative

(f) 支持向量机

KNN versus SVM in the Collaborative filtering framework

(g) 奇异值分解

@@@ Modeling relationship at multiple scales to improve accuracy of large recommender systems @@@Factorization meets the neighborhood: a multifaceted collaborative filtering model @@@ Collabotive filtering with temporal dynamics @@@ Matrix factorization and neighbor based algorithms for netflix prize problem @@@Investigation of various matrix factorization methods for large recommender system @@@ Scalable collaborative filtering approaches for large recommender system

(h)Factorization machine(LibFM)

@@@Factorization machines with LibFM

(i) 深度学习

@@@Collaborative Deep Learning for Recommender Systems


领域算法和模型算法 的比较

  • 精度上模型优于领域

@@@Factorization meets the neighborhood: a multifaceted collaborative filtering model

@@@Major components of the gravity recommendation system

  • 惊喜度方面领域算法优

@@@ Combining collaborative filtering with personal agents for better recommendations

  • 新颖度: 推荐给用户一个他喜欢的导演,但是他没有想到的电影
  • 惊喜度:完全没想到

* 领域算法的优势

  1. 简单
  2. 合理
  3. 高效
  4. 稳定

1. 问题的定义

问题定义

  • 用户:$$u$$;物品集合:$$T$$;系统评分集合:$$R$$;可选分数集合:$$S$$
  • 用户$$u$$对于物品$$i$$的评分:$$r_{ui}$$
  • 已经对物品$$i$$评分的$$u$$的集合:$$u_i$$
  • 用户$$u$$ 所评价的物品集合: $$T_u$$
  • 同时被用户$$u$$和$$v$$评价过的集合:$$T_{uv}$$
  • 对物品$$i$$和$$j$$都评分的用户集合:$$u_{ij}$$

最优项(评分问题)

  • 用户$$u$$最感兴趣的物品$$i$$的分数
  • 评分值存在,则转换为一个回归或者是分类问题(多分类);目标是学习 函数$$f:u*T \rightarrow S$$ 来预测用户$$u$$对$$i$$的评分$$f(u,i)$$
  • 然后选择$$i^{*}=argmax f(u_a,j)$$ ; u对那个物品的评分最高

  • 平均绝对误差(MAE) $$MAE(f)=\frac{1}{|R{test}|}\sum|f(u,i)-r{ui}|$$

  • 均方根误差

$$RMSE(f)=\sqrt{\frac{1}{|R{test}|}\sum(f(u,i)-r{ui})^2}$$


Top-N

  • 没有评分信息,则转换为推荐Top-N列表

@@@itembased_collaborative_filtering_recommendation_algorithms

@@@Item-based_top-n_recommendation_algorithms

  • 评价方法: $$L(u)$$ 包含用户$$u_a$$最感兴趣的 $$N$$个物品 $$T(u)$$是用户u对物品$i$的二级正反馈 准确率: $$Precision(L)=\frac{1}{|U|}\sum|L(u) \bigcap T(u)| / |L(u)|$$ $$Recall(L)=\frac{1}{|U|}\sum|L(u) \bigcap T(u)| / |T(u)|$$

  • 缺点: $$L(u)$$中所有物品对于用户u的兴趣程度被认为是相同的

results matching ""

    No results matching ""