用户画像(一)

时间: | 分类: 差分隐私

《用户网络行为画像》笔记

主流推荐方法的分类

  • 协同过滤的推荐方法

协同过滤方法的局限

    • 冷启动问题
    • 因为不对视频的内容做分析,所以无法一句深层特征和属性来推荐比较复杂的视频,是的用户会对推荐结果的可信度产生质疑
    • 用户打分稀疏性问题的约束
    • 碎着用户和视频数量的增大、系统计算量的增大,收到算法可拓展性问题的约束
    • 基于内容的推荐方法(Content Based)

    起源于信息检索和信息过滤领域

    在得到了用户画像和物品画像的前提下,通过相似度比较来做出推荐。基于信息检索的启发式算法和基于机器学习的自适应算法是基于内容的两大类推荐算法。

    基于内容的推荐算法的局限性:

    • 容易受到信息获取技术的约束,难以提取视频的内容特征,而使用标签对视频进行标注的方法工作量巨大而效用低
    • 需要有足够的数据用来构造决策分类器,用户画像的建立需要大量的用户浏览记录
    • 难以为用户发现新的兴趣信息,只能推荐与用户已有兴趣相似的视频
    • 基于知识的推荐方法(Knowledge Based)

    通过与用户的交互获取信息做推荐,能够很好地给出视频的推荐理由。系统不依赖于用户偏好信息,因此不存在用户的冷启动问题,基于只是的推荐系统能够与用户交互从而及时响应用户需求,用户偏好发生改变时不需要任何训练

    局限性:

    • 只是的获取比较困难
    • 用户必须说明他的需求,系统才能做出推荐,在这个过程中若不找到合适的推荐视频,用户需要修改其需求
    • 混合推荐方法

    协同过滤推荐方法

    1534317311001.png

    • 基于用户的协同过滤 VS 基于物品的协同过滤

    基于用户的协同过滤是找出与现有用户相似的用户群然后基于用户群的历史偏好信息为当前用户进行推荐

    基于物品的的协同过滤是返现物品之间的相似度,然后根据用户的历史偏好信息,将类似的物品推荐给用户

    U-U矩阵

    Pearson Correlation Coefficient在基于用户的相似度计算方面的表现要优于其他计算方法

    • 算法原理:

    1534321865408.png

    $r_{i,c}$表示用户$i$ 对视频$c$ 的评价值,$\overline{r_i}$表示用户$i$ 对视频的平均评价

    • 算法局限

    在遇到用户指对非常少的共同项目评分时会出现预测不准的情况

    V-V矩阵

    通常使用余弦相似度来计算

    • 算法原理

    若求得余弦值接近1,则说明相似,接近0表示不同

    1534323058242.png

    • 局限

    余弦相似度没有考虑到用户评分标准的差异问题,所以在直接计算不同用户的余弦相似度时会导致最终的预测发生很大的偏差。通过减去用户对物品的平均评分,改善问题

    1534474315377

    ##### U-V矩阵

    U-V矩阵表示了用户与物品的关系

    基于用户的协同过滤

    • 收集用户和视频的历史信息,计算用户$u$ 和其他用户的相似度$Sim(u, N_i)$ , 找到与目标用户相似度高的用户集合$N(u)$
    • 根据所有$N_i \in N(u)$ 对视频的评分情况,选出$N(u)$ 中的用户喜欢的且目标用户没有观看过的视频推荐给目标用户

    用户对视频的喜好程度:

    1534477071323.png

    基于物品的协同过滤

    面对用户数量非常庞大且不断动态变化的情况

    1534487503289.png1534487525077.png


    用户画像 协同过滤



    失学失业还秃头


    文章归档