Netflix经典推荐系统架构
Netflix经典推荐系统架构
挑战:
架构既能处理海量数据,又能及时响应用户交互
在线层:
特点:快速响应,使用最新的数据输入,比如200MS
缺点:不能使用复杂的算法,只能读取少量数据
离线层:
特点:大部分计算包括模型训练都在这层完成
优点:可采用复杂算法、可扫描海量数据
缺点:不能对最新情景和新数据做响应,比如天粒度
近线层:
特点:离线和在线的折中,一般将结果存入高速缓存
优点:能使用几乎最新数据计算,延迟10秒~1分钟级别
优点:允许更复杂的算法处理,加载查询更多数据
组合使用的例子:
1、天粒度:离线层做矩阵分解,得到用户向量和物品向量做数据存储MySQL
2、10秒钟:近线层根据用户行为,查询TOPN相似的物品列表,存入Cassandra
3、200毫秒:在线层查询第2步骤的结果,更新推荐列表
信号和模型
事件和数据分发
参考资料
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 Jacker-zzk's Blog!