基于电商的用户画像
采集用户行为数据,挖掘有价值的东西,做到精准营销
构建用户画像的意义就是精准营销
用户画像作用
- 精准营销
- 用户统计
- 数据挖掘
- 进行效果评估
- 对服务或产品进行私人定制
构建一个用户画像,包括数据源端数据收集、数据预处理、行为建模、构建用户画像
- 1.采集数据源
- 2.数据预处理
- 3.建设数仓、打标签
- 4.形成用户画像
- 第一层:原始数据拉过来
- 第二层:数据预处理
- 第三层:SQL做聚合统计
- 第四层:结果做高度聚合,拼接成宽表
统计类标签
- 对数据表进行一系列的统计分析
规则类标签
- 由运营和数据人员共同协商确定的规则
挖掘类标签
- 机器学习算法的预测判断
用户画像的目标是通过分析用户行为,最终为每个用户打上标签,以及该标签的权重
如,红酒 0.8、李宁 0.6。
标签:表现了内容,用户对该内容有兴趣、偏好、需求等等。
权重:表现了指数,用户的兴趣、偏好指数,也可能表现用户的需求度,可以简单的理解为可信度,概率。
根据用户所填写的属性标签和推算出来的标签。用于了解用户的人口属性的基本情况和按不同属性维度统计。
作用:按人口属性营销、比如营销80后,对金牛座的优惠,生日营销。
主要数据来源:用户表、用户调查表、孕妇模型表、马甲模型表。
- 用户表:记录用户最基本的属性特性。
- 用户调查表:补充用户的其他基本信息。
模型算法—性别模型
模型算法—用户汽车模型
模型算法—用户忠诚度模型
模型算法—用户身高尺码模型
模型算法—用户马甲标志模型
模型算法—手机相关标签模型
根据客户消费的情况提取的客户标签,用于了解用户的消费总体情况,
最终的目的根据用户消费习惯与消费能力做营销。
主要数据来源:订单表、退货表、用户表、购物车表
订单表可以得到相关标签:
退货表可以得到相关标签:
购物车表可以得到相关标签:
订单表和用户表可以得到相关标签:
根据客户购买类目的情况提取客户标签,用于了解类目的购买人群情况和针对某一类目的营销等
主要数据来源:订单表、购物车表、类目维表
类目维表可以得到相关标签:
订单表和类目维表可以得到相关标签:
购物车表和类目维表可以得到相关标签:
根据客户访问的情况提取相关客户标签。
用于了解用户的访问总体情况,方便根据客户游览习惯做营销
主要数据来源:点击流日志行为表(PC/APP端)
点击流日志行为表可以得到相关标签:
存放用户访问app时点击相关控件的打点记录,通过客户端做埋点,从日志数据中解析出来
- 1、搭建hadoop集群
- 2、安装hive构建数据仓库
- 3、安装spark集群
- 4、sparksql 整合hive
这里我们采用的是京东的数据仓库分层模式,是根据标准的模型演化而来。
这里采用脚本方式,也可以用spark SQL 直接创建并添加数据
订单表(bdm_order)
订单明细表(bdm_order_des)
订单表(fdm_order)
订单表明细表(fdm_order_desc)
订单模型表(gdm_order)
订单地址模型表(gdm_user_order_addr_model)
订单商品表(bdm_order_goods)
订单商品表 (fdm_order_goods)
客户消费订单模型表-临时表01(gdm.gdm_user_consume_order_temp_01
购物车表(bdm_order_cart)
购物车表(fdm_order_cart)
购物车临时模型表–临时表 02(gdm.gdm_user_consume_order_temp_02
常用地址和常用支付方式-临时表 03(gdm_user_consume_order_temp_03)
购物车表和订单表整合(gdm_user_consume_order_temp_100)
客户消费订单表 ***(gdm_user_consume_order)
计算订单中客户购买情况(gdm_user_buy_category_temp)
购物车中类目情况(gdm_user_cart_category_temp)
类目表(gdm_category_code)
整合购买情况和类目情况(gdm_user_category_total)
spark sql 的 shuffle默认并行度是200