首页 > 技术,让世界更美好。 > 阿里算法策略简介

阿里算法策略简介

2018年3月9日
法策略名称 简介 技术点 备注
基于内容的推荐 1.根据物品表的keywords(one-hot),description(分词),properties(one-hot)字段抽取特征

2.使用特征通过相识度算法建立物品-物品topN,再根据用户行为对用户做出推荐

    1. 相识度算法
    1. 特征工程(分词,特征抽取,特征标准化,one-hot编码,特征变换算法)
    2. 物品特征如何计算相识度矩阵
4
默认推荐 基于pv、权重、随机分桶、最新上架、物品信息的其中一个策略产生默认推荐
基于itemCF的推荐 1.根据行为提取<user_id, item_id, score>三元组

2.根据物品相似度算法建立物品相似度矩阵,根据矩阵对用户的行为做出推荐

    1. 相识度算法
    2. 近线离线数据流程配合
物品冷启动 1.根据物品表的keywords(one-hot),description(分词),properties(one-hot)字段抽取特征

2.然后使用聚类聚20类,根据itemCF分析用户对类别的偏好。

3.新物品近线接入后根据特征划分类别

4.在线根据用户偏好推荐类别

    1. 聚类算法
    1. 特征工程(分词,特征抽取,特征标准化,one-hot编码,特征变换算法),近线离线数据流程配合
    2. 离线近线数据流程配合
3
基于因子分解的推荐 根据行为提取<user_id, item_id, score>三元组,根据因子分解算法建立物品特征和用户特征,再根据物品物品和用户物品两个相似度算法,计算用户的物品和物品的物品推荐。
    1. 因子分解算法
    1. 用户/物品相似度计算方法,物品/物品相似度计算方法
    1. 特征工程(分词,特征抽取,特征标准化,one-hot编码,特征变换算法)
3
基于userCF的推荐 1.根据行为提取<user_id, item_id, score>三元组

2.根据用户相似度算法建立用户相似度矩阵,根据矩阵对用户的行为做出推荐

    1. 相识度算法
    2. 近线离线数据流程配合
2
不带标签的用户冷启动 1.根据物品表的keywords(one-hot),description(分词),properties(one-hot)字段抽取特征

2.然后使用聚类聚20类,在线存储类目top100,物品类目信息

3.近线根据用户对类目的正向行为,更新用户对类目偏好

4.在线获取用户的topN个偏好类目,推荐类目中的商品

    1. 特征工程(分词,特征抽取,特征标准化,one-hot编码,特征变换算法)
    2. explorer-exploit算法
    3. 离线近线数据流程配合
    4. 聚类算法
1
带标签的用户冷启动 1.对用户进行特征工程抽取特征

2.把用户聚类成20个群

3.对每个用户itemcf产生推荐

4.根据2,3产生用户群的推荐

5.近线计算用户的归属群,针对群进行推荐

    1. 特征工程(分词,特征抽取,特征标准化,one-hot编码,特征变换算法)
    2. 聚类算法
    3. itemCf和聚类结合
1

 

本文的评论功能被关闭了.