AutoRec模型

论文原文利用自编码器做协同过滤，协同过滤主要有如下两种情景user-based：userA和userB臭味相投，那么A喜欢看的电影可以推荐给Bitem-based:movieX和movieY比较相似，那么用喜欢看movieX，那么可以将movieY也推荐给他Rating matrix比如在电影推荐场景中，用户对电影（item）的打分可以构成一个R∈Rm×nR \in \mathb...

很吵请安青争

1372人浏览 · 2020-04-27 17:41:41

很吵请安青争 · 2020-04-27 17:41:41 发布

论文原文
利用自编码器做协同过滤，协同过滤主要有如下两种情景

user-based：userA和userB臭味相投，那么A喜欢看的电影可以推荐给B
item-based: movieX和movieY比较相似，那么用喜欢看movieX，那么可以将movieY也推荐给他

Rating matrix

比如在电影推荐场景中，用户对电影（item）的打分可以构成一个 $\in \mathbb{R}^{m \times n}$ 矩阵：

行向量：m个user， $\in U=\{1 \ldots m\}$ ，其中每个user可以表示为 $\mathbf{r}^{(u)}=\left(R_{u 1}, \ldots R_{u n}\right) \in \mathbb{R}^{n}$ ，表示该用户对各个item的打分
列向量：n个item， $\in I=\{1 \ldots n\}$ ，其中每个item可以表示为 $\mathbf{r}^{(i)}=\left(R_{1 i}, \ldots R_{m i}\right) \in \mathbb{R}^{m}$ ，表示该item在各个用户下被打的分

模型训练

AutoEncoder的思想就是用输出当做label,如下图所示，这是一个item-based场景下的AutoRec模型，输入 $r^{(i)}$ 为 $item^{i}$ 对应的 $m$ 维向量，分别作为输出和输出，输入层通过权重 $V$ 得到隐藏层，再通过权重 $W$ 到输出层，通过训练更新参数矩阵 $W$ 和 $V$ 使得输入输出尽可能的相同。
在这里插入图片描述

损失函数

AutoRec模型的损失函数如下所示
$\min _{\theta} \sum_{i=1}^{n}\left\|\mathbf{r}^{(i)}-h\left(\mathbf{r}^{(i)} ; \theta\right)\right\|_{\mathcal{O}}^{2}+\frac{\lambda}{2} \cdot\left(\|\mathbf{W}\|_{F}^{2}+\|\mathbf{V}\|_{F}^{2}\right)$ 其中 $\|\cdot\|_{\mathcal{O}}^{2}$ 表示只对观测到的数据去损失函数，即在Rating Matrix中，没有打分的部分不管他，encode decode的过程中只让模型去拟合已有的打分部分，让这一部分充分拟合好，然后对于没有数据的部分，训练好的权重会给出一个非零值，这就是模型预测的结果。

最终，原来Rating Matrix中为零的部分在模型训练完后也变也有了数值，可以根据此来做推荐。

MCP技术社区

欢迎加入 MCP 技术社区！与志同道合者携手前行，一同解锁 MCP 技术的无限可能！

更多推荐

8种封装的1700V国产碳化硅(SiC)功率模块产品介绍及应用

MCP技术社区

（一篇入门）汽车电子电器之电机MCU控制器四

MCP技术社区

OpenCV C++ 入门实战：从基础操作到类封装全解析

Mat数据结构、图像读写、颜色空间转换、像素操作、算术运算和轨迹栏交互，以及面向对象封装思想。图像处理：学习滤波（高斯滤波、中值滤波）、边缘检测（Canny、Sobel）、形态学操作（腐蚀、膨胀）。目标检测：掌握轮廓提取（）、特征匹配（）、Haar 级联分类器。视频处理：使用读取视频，对帧进行实时处理。性能优化：学习多线程、GPU 加速（cv::cuda模块），提升处理速度。通过持续实践，可逐步掌