概述:
随着科学技术和信息技术的不断发展和创新,全球电子商务进入了一个快速发展的时期。仅2019年,中国电子商务总销售额就达到2万亿美元,占全球半部分,美国全年在线零售额达到6000亿美元。全国共有7亿人参与了网上购物和销售。
根据艾瑞的统计,中国网上购物市场的交易在过去五年中有所增长27.5%复合增长率远远超过社会消费品零售增长率。因此,电子商务平台将成为产品营销的重要平台。然而,随着中国互联网红利的逐渐减少,新用户的增长变得极其困难,以新客户为导向的利润逐渐减弱。
因此,基于数据的用户属性和消费行为数据分析可以帮助电子商务平台准确定位营销和运营方法,帮助电子商务更好地了解客户,从而大大提高销售能力。
简介本分析分析了2019年12月至2020年2月北美某大型销售平台化妆品分公司的用户行为数据。通过交易和产品信息,评估平台的运营健康状况,利用用户记录管理用户,实现准确运营、提高平台收入能力的目标。本文分为五个部分
思维结构的数据介绍&模型方法数据清理数据分析总结1. 数据介绍:本项目的数据集来自大型网店化妆品分店的用户行为数据:
数据量:1195W时间:2019-12-01 到 2020-02-29数据来源:大型网店化妆品分店的用户行为数据2. 思维架构&模型方法:电子商务模型AARRR模型RFM电子商务模型的客户价值模型:从这个流程图中,我们可以清楚地了解电子商务的基本客户消费流程和客户渠道获取:
AARRR分析法&漏斗模型:帮助电子商务更好地阶段更好地理解和维护客户
RFM客户价值模型用户价值通过三个维度体现
3. 数据处理空值使用CASE 函数计算数据NULL值和空值:
count(*),sum(Case When event_time = '' or event_time is null then 1 else 0 end) as NA_event_time,sum(Case When event_type = '' or event_type is null then 1 else 0 end) as NA_event_type ,sum(Case When product_id = '' or product_id is null then 1 else 0 end) as NA_product_id ,sum(Case When category_id = '' or category_id is null then 1 else 0 end) as NA_category_id ,sum(Case When category_code = '' or category_code is null then 1 else 0 end) as NA_category_code ,sum(Case When brand = '' or brand is null then 1 else 0 end) as NA_brand ,sum(Case When price = '' or price is null then 1 else 0 end) as NA_price,sum(Case When user_id = '' or price is null then 1 else 0 end) as NA_user_id,sum(Case When user_session = '' or price is null then 1 else 0 end) as NA_user_sessionFROM e_commercial;从空值计算表可以看出,项目类别代码严重缺失高达98%,但我们可以用项目类别代码代替这一特征,因此我们删除了类别代码列。同时,我们删除了大约50%的品牌缺失值:
Alter table e_commercial drop column category_code;Alter table e_commercial drop column brand;虽然产品价值的存在确实值,但占数据总数的比例很小0.8约%,我们选择保留计算保留,在计算中RFM时删除。
2.时间单位
时间单位显示为TEXT类型:
建立两个表示时间的列,一个是DATE格式,一个是Timestamp格式拆分原时间表:
ALTER TABLE e_commercial add column date_time VARCHAR(256);ALTER TABLE e_commercial add column dates DATE;UPDATE e_commercial SET date_time = timestamp(left(event_time,19));UPDATE e_commercial SET dates = Date(left(event_time,10));4. 数据分析活跃分析:从2019年12月到2020年2月此电商平台日活在缓慢上涨,但在2019-12-31异常下降。
异常点分析
确认SQL正确的取数公式:#DAU计算SELECT dates,count(DISTINCT(user_id)) AS Active_UserFROM e_commercialgroup by datesOrder by dates;SQL公式基于UV和日期计算日活,准确无误。
维度拆分周期层面:从日活跃人数的角度来看,这个化妆品网站的日活跃有趋势
这个电商平台周一开始浏览量达到顶峰,周二开始逐渐下降,周末浏览量被低估。
从平台周期来看,12月31日-周二与12月24日-周二,UV12月31日,周二的下降并不是自然周期的下降。
客户层面:与老客户相比,新客户的下降对日常生活的影响更大提取新用户数:
select A.Dates AS 日期,count(DISTINCT user_id) AS NEW_C from (select user_id,min(dates) Dates from e_commercial group by user_id) A group by dates having dates BETWEEN DATE("2019-12-24") AND DATE("2019-12-31")order by dates;2019-12-24到2019-12-31新老客户从2019-12-24到2019年-12月29日下降趋势相对统一,新客户从30日起下降DAU与老客户的影响拉开差距。
从图中可以看出,新客户的影响系数是0.66,老用户的影响系数是0.34,新客户对DAU影响远大于老客户,需要从各种渠道入口分析新客户的问题。
新用户 = 渠道a 渠道b 渠道c
用户行为:从2019-12-24至2019-12-31,网站PV悬崖式下降,PV环比下降56%,Cart数量环比下降73%,购买量环比下降83%。
从维度分析的角度来看,主要是DNU日常生活的下降,
猜测内部因素:
渠道问题导致客户无法进入浏览页面。
猜测外部因素:PEST分析法
P:网站违规,政府关闭网站入口。
E:重大经济事件的发生导致用户购买行为下降。
S:31今天是新年,大多数客户不浏览网站,手机粘度下降。
产品&品牌分析
产品分析:580910网站爆款,但产品ID5560754产品是最有价值的产品,总销量最大。
销售价值前五:#销售价值前五的产品SELECT sum(price) AS 购买价值,product_id FROM e_commercialWHERE event_type = "purchase"GROUP BY product_idORDER BY 购买价值 DescLimit 5;#购买频次SELECT COUNT(*) AS 购买次数,product_id FROM e_commercialWHERE event_type = "purchase"GROUP BY product_id;热门商品(购买频率前五):商品代码580910占前五名购买份额的36%,销售价值最高的5560754未出现在购买频率最高的热门商品中
从页面浏览量、购物车添加量和购买量来看,商品580910是热门产品SELECT count(*) AS 个数,product_id FROM e_commercialWHERE event_type = "Views"group by product_idORDER BY 个数 DescLimit 5;SELECT count(*) AS 个数,product_id FROM e_commercialWHERE event_type = "cart"group by product_idORDER BY 个数 DescLimit 5;SELECT count(*) AS 个数,product_id FROM e_commercialWHERE event_type = "purchase"group by product_idORDER BY 个数 DescLimit 5;品牌
除过"无品牌"商品外,Runail与其他品牌相比,销售件数遥遥领先。
#计算购买总件数为前五名的品牌SELECT brand,COUNT(distinct user_id) as purchases_time from e_commercialwhere brand!="" and event_type= "purchase"group by brandorder by purchases_time DESClimit 5;通过品牌分析,我们发现购买频率较高的产品集中在美甲行业。
#总收入前五的品牌SELECT brand,sum(price) as price_total from e_commercialwhere brand!="" and event_type= "purchase"group by brandorder by price_total DESClimit 5;从总交易量来看Runail它仍然排名第一,前三名是美甲产品行业,唯一的护肤品制造商UNO排名第五。
美甲产品为此电商平台的头部产品,给平台带来巨大的收入,但同时头部产品品类单一化,对平台的长久发展造成了影响。
解决方法:
加强对面膜、口红、护肤品等其他化妆品的宣传。在保持美甲头部利润的同时,加强推荐其他类别的产品,引导平台的多元化发展。同时,头部产品Runail为引线 ** 客户消费,如品牌捆绑消费策略。
转化分析
总转化率漏斗模型:从页面到购物车的转化率一般,从购物车到购物页面的转化率差,性能相对普通
SELECT event_type,COUNT(1) AS Number FROM e_commercialGROUP BY event_type;从漏斗图可以看出,此换妆品分站页面转化率一般为21%,同时购买转化率较差,3.506%。这款电商购物车的放弃率为86%,在行业内表现相对较差,可以通过运营手段和实施AB-Tests降低购物车放弃率。
模拟AB Test :改进购物车-购买转化率改变购买按钮的位置,提高购物车到完成购买的转化率。确定测量指标:购物车到购买的转化率时间周期和样品数量:周期---样本数量确定为14天(两个周期)(Alpha=0.05,Stats Power=80%,过去的普通转化率22.31计算网站:3% )计算网站:https:// ** .optimizely.com/sample-size-calculator/?conversion=22&effect=2&significance=954. 使用假设实验--使用Z-test进行试验。
5. 收获结果,进行统计 分析
6. 分析是否上线新版本购物车案件。
通过提示的方式发送通知提醒客户购物车物品残留,促进购买。通过对购物车物品的时间的计算进行合理折扣的设定促成购买。使用AB-test优化购物车购买渠道页面添加多种购买方式,和支付方式。RFM客户价值分析:
此电商的客户主要集中在重点保持用户组,与潜在客户组。
图片来源:https://blog.csdn.net/qq_36327687/article/details/84791579SELECT R.user_id, Recent_date,Frequency,c.Total FROM(Select user_id, datediff(DATE('2020-03-01'),DATE(a.R_Dates)) as Recent_dateFROM (SELECT user_id , ** x(dates) as R_dates from e_commercial where event_type= 'purchase'group by user_id) a) RLEFT JOIN (SELECT user_id, count(*) as Frequency FROM e_commercialWHERE event_type='purchase'group by user_id) bON R.user_id = b.user_idLeft join(SELECT user_id, sum(price) as TotalFROM e_commercialWHERE event_type = 'purchase'group by user_id) con R.user_id=c.user_id从RFM模型用户分类的效果来看,39%的客户属于重点维持客户,37%的用户为流失用户与潜在用户只有1位客户属于重要价值用户。
流失用户:
大部分用户已经流失,需要小部分的关注度。
重点挽留用
单次购买数额较大,但频次与最近购买评分较低,可以选择推送激活,与电话召回,以及捆包销售的方案对客户进行挽留。
一般保持客户
购买频次较高,但上次购买久远,购买总额不大,可以结合推送和coupon的形式对用户进行消费 ** 。
重点保持用户
距离上次消费时间相对较久,可使用邮件推送与短信提示等方法持续激活用户。
高价值用户
需要专员进行1v1服务,进行重点的维护。
留存分析
同比大型电商,此平台留存率表现较差。
SELECT first_date, count(distinct e.user_id) as 日活跃, round(count(distinct case when datediff(dates, first_date) = 1 then e.user_id else null end)/(count(distinct e.user_id)),2) as day1,round(count(distinct case when datediff(dates, first_date) = 6 then e.user_id else null end)/(count(distinct e.user_id)),2) as day7,round(count(distinct case when datediff(dates, first_date) = 29 then e.user_id else null end)/(count(distinct e.user_id)),2) as day30FROM e_commercial eLeft Join(SELECT user_id as id, min(dates) as first_dateFROM e_commercialgroup by user_id) ton e.user_id = t.id group by first_date;从折线图来看,此平台次日留存的平均水平在6%,30日留存跌至1%左右。虽然化妆品购买周期相对较长,但用户留存表现很差。
建议优化:
建议电商平台采用VIP,或者积分制度,签到领券活动来培养用户的平台登陆习惯。给于第一次购买用户折扣,给与下次购买的动力。复购率分析(90天)
本电商平台90天复购率达到18.16%
#90天复购Select count(user_id), count(if (times>1,1,null)) as num_again, count(if (times>1,1,null))/count(user_id) as RR_12FROM(SELECT user_id, count(distinct user_session) as timesfrom e_commercial ewhere event_type = "purchase"group by user_id) t;90天复购率高于15%,达到18.16%,表现良好。
证明该平台还处于混合经营模式,需要平衡在新用户转化和老用户留存,复购上的精力和资源。--精益数据分析策略:
会员卡机制,提高忠诚用户转化。基于用户画像,和购买的产品周期进行产品推荐周期性推荐,硬件推荐。总结
201-12-31日,DAU大幅度下降从多维度分析发现主要原因是因为DNU的大幅度下降,同时DOU也有明显下降,主要是因为过年期间用户对手机或互联网的依赖下降,导致各个渠道DNU下降。从产品出发,物品代号5809910的商品在前五中占36%的购买份额,销售价值最高的5560754未出现在购买频次的热门商品中,电商平台可以考虑用头部物品使用捆包销售的策略带动尾部产品的售卖。从品牌分析发现,此化妆品电商的头部化妆产品是美甲产品系列,销售量前五的品牌均为美甲行业,销售总额前四为美甲行业,第五为UNO皮肤管理产品,建议加重其他化妆品品类的宣传,例如面膜,口红,以及护肤品。在保持美甲的头部利润的同时加强推荐其他类别产品,从而引导平台多元化发展。同时以头部产品Runail为引线 ** 客户的消费例如,品牌的打包消费此化妆品电商的页面转化率表现一般为21%,同时购买转化率表现较差,3.506%。此电商的购物车放弃率为86%,在业内表现也相对较差。可使用AB-test优化购买键位。从运营的角度:通过提示的方式发送通知提醒客户购物车物品残留,促进购买。通过对购物车物品的时间的计算进行合理折扣的设定促成购买。添加多种购买方式,和支付方式等。从RFM分析模型发现,此电商客户集中在重点维护用户与流失用户群体建议使用邮件推送与短信提示等方法持续激活重点维护用户。使用用户找回,和打折券组合的方式挽回流失用户。从留存率来看,但用户留存表现很差,平台次日留存的平均水平在6%,30日留存跌至1%左右。建议电商平台采用VIP,或者积分制度,签到领券活动来培养用户的平台登陆习惯。给于第一次购买用户折扣,给与下次购买的动力。复购率达到18%,为新老用户的混合经营模式,在同级别电商表现相对较好。会员卡机制,提高忠诚用户转化。基于用户画像,和购买的产品周期进行产品推荐周期性推荐,设置持续登陆奖励。Reference
29、RFM客户价值分析(有图有案例)_人工智能_UP Lee博客-CSDN博客https:// ** .optimizely.com/sample-size-calculator/?conversion=22&effect=2&significance=95
扫码咨询与免费使用
申请免费使用