您可以捐助,支持我们的公益事业。

1元 10元 50元





认证码:  验证码,看不清楚?请点击刷新验证码 必填



  求知 文章 文库 Lib 视频 iPerson 课程 认证 咨询 工具 讲座 Model Center   Code  
会员   
   
 
     
   
 订阅
  捐助
数据分析应用实例
 
作者:王鹏宇
 
  2062  次浏览      15
2020-10-23
 
编辑推荐:
本文主要运用2012-2015年发生在淘宝天猫交易平台母婴用品的交易数据作为实例进行讲解数据分析的应用。
本文来自知乎,由火龙果软件Alice编辑、推荐。

分析背景

随着电商平台的迅猛发展,网上购物已经成为人们生活中最为常用的购物行为。各电商平台下的商家为了获得更多的用户,提升产品销量,需要从不同的维度采取多种分析的方法对经营过程中产生的数据进行分析,为了发现经营过程中存在的问题加以改进,同时寻找新的经营模式,为自身带来更大的收益。

本实例的数据为2012-2015年发生在淘宝天猫交易平台母婴用品的交易数据。其中包括两个表格,分别的是商品信息表和婴儿信息表。

数据来源:阿里巴巴天池Baby Goods Info Data-数据集-阿里云天池

2. 理解数据

表一:

user_id:用户编号

auction_id:购买行为编号,区分交易类型

cat_id:商品种类ID,用于区分商品种类

cat1:商品种类的二级ID(对同一类商品再次分类)

property:商品属性,属性值可以是大小,可以是尺码、毫升等数字,还可以指品牌等,一切可以描述商品特征的都可以称为属性值

buy_mount:购买数量

day:购买日期

表二:

user_id:用户id

birthday:出生日期

gender:性别(0 男性;1 女性)

3. 提出问题

不同性别的婴儿对产品销量有何影响?

不同性别的婴儿对产品类别需求差异比较

不同年龄的婴儿对产品销量有何影响?

不同种类产品的销量差异

月成交数量的差异及原因分析

不同种类商品的复购率对比

针对以上问题整理出相应的分析思路:

4. 构建模型分析问题

在开始分析之前,我们对原数据进行清洗,在之前的文章中有详细过程,这里就不重复了,有需要的小伙伴可以自行翻看(https://zhuanlan.zhihu.com/p/103503037)

这里主要说一下最后数据清洗的最后一步:异常值处理。因为我们的分析的关键指标是销量,所以我们要着重对数据中的购买数量进行异常值处理。对购买数量借助execl数据分析工具进行描述性分析:

购买数量的中位数和众数都为1,最大值为10000。虽然有可能并非异常值,但是其值已经占了2013年一整年销量的25%,对分析的结果有非常大的影响,因此将其删除。

4. 构建模型分析问题

(1)产品角度

不同类别的产品销量差异

由图表可以看出商品28,50014815和50008168占据销量前三,为畅销商品。其中商品28销量最高,是最受欢迎的商品。

月成交数量的差异及原因分析

各年份商品销量随时间变化情况如折线图所示:

问题1:每年的5,9月份商品销量上升的原因?

假设1:在5,9月份因为节日等原因,销量增长。

数据证明:

从图中可以看到在5月的3日,9-13日,20日每年都会有销量的增长,这些日期临近“母亲节”,“520”,6.1儿童节等节日,因此可以认为是由于节日原因造成的销量增长。但于此同时,我们也可以发现,在2014年,有很多非节日原因的增长点,比如5.22日的销量就达到了当月的最高值,但当日并非节日,因分析依据不足,无法证明与节日有关。可以猜测此增长而可能和当时商家的促销活动或者个别用户因特殊需要大量购买有关。

在九月,销量最高点的20日也并非节日,因此不能证明9月的销量增长和节日有关。

假设2:5,9月份销量的增长和换季有关

通过各年份商品销量随时间变化情况如折线图我们可以发现每年的5,9月份都会迎来一个销量的增长。通过假设1我们得知,其增长原因和临近节日有一定关系,但并不足以说明,可以换个角度,每年的5月和九月正是春夏,夏秋换季的月份,用户需要为婴儿购买不同的季节的产品,因此商家会组织换季促销活动,以推动销量增长,因此销量增长可能和换季有关。

得出结论:5,9月份的销量增长受节日和换季活动的共同影响

问题:11月销量增长是否和“双十一”活动有关?

假设1:11月销量增长和“双十一”活动有关

数据证明:

从图中可以看出,在11日销量在各年份都会大幅度增长,因此可以认为,此增长和“双十一”活动有关。虽然在其他日期也出现了销量大规模增长,但并不时每年都有,可能和当年当日的促销活动有关。不影响双十一活动是促使11月商品销量增长的重要原因。

得出结论:11月的销量增长是因为“双十一”的活动促销导致

问题:每年的1,2月都会来到销量的最低值是什么原因?

假设1:1-2月为春节假期,因店铺停业,物流停运等原因,用户的购买欲望相对较低

数据证明:

从图中我们可以看出在2014年的1月25日-2月3日和2013年的2月2日-2月15,这两个时间段销量几乎为0,经过查阅,2014年的春节是1月31日,2013年的春节是2月10日,和销量的最低值的时间是吻合的,因此证明假设正确。

得出结论:春节假期会导致商品的销量降低

不同种类商品的复购率对比

可以发现,重复购买的只有25个ID,复购率为25/29914,极低。由此可见,商品销量都是由新用户带来的,绝大多数用户都是购买一次后不在购买,用户黏度极低。因此商家要认真反思问题所在。是产品质量差,还是售后服务差,包括客服,物流,退换货等环节。亦或是市场竞争激烈,核心竞争力不足等。因为数据较少,因此无法提供有意义的分析。

(2)用户角度

不同性别的婴儿对产品销量有何影响?

可以发现,男婴儿的购买需求比女婴儿要强。销量占比男婴儿比女婴儿高27%。接下来,细化到商品类别进一步分析

不同性别的婴儿对产品类别需求差异比较

从图中可以发现,除了28和50014815两类产品外,其他商品受性别的影响不是很大,可以采用相同的销售方法,而28和50014815两类商品销量差距明显。都是男婴儿的销量更高,因此在销售时可以制定侧重于男婴儿的销售策略。

不同年龄的婴儿对产品销量有何影响?

可以发现,主要的用户人群是未出生和0-3岁的婴儿,3岁随着年龄的增长产品销量递减,因此,正在销售时一定找好合适的人群,也就是未出生和0-3岁的婴儿,制定有针对性的营销策略。

5. 结论于建议

(1)商品28,50014815和50008168占据销量前三,为畅销商品。要做好针对性的销售策略,保持的同时稳步增长。其中商品28为热销商品,在销售时可以推出和其他产品捆绑销售的活动,以提高其他产品的销量。

(2)商品每年会在5,9,11月份商品销量会有大幅度的增长。其中5,8月份是因为节日密集和换季等原因,要做好相应的活动策划,加大商品供应。11月的增长的主要原因是双十一的活动,因此要抓住机会,可以加大优惠力度,提高宣传力度,增加销量的同时,获取更多的新用户。

(3)商品复购率极低,需要从多方面,每个销售环节寻找原因,比如产品,市场,运营等方向都要加强。可以获取同行业的数据做对比,找出自身产品和服务的不足,尽快改善此现象。

(4)男婴儿对商品的需求程度较强,因此要围绕这一特点制定有针对的营销策略。同时,女婴儿商品可以借鉴男婴儿商品的销售特点,以提高女婴儿产品销量。

(5)28和50014815两款商品男婴儿需求比例较高,因此应对这两款商品侧重男婴儿宣传

(6)商品销量主要集中在未出生和0-3岁的年龄段婴儿,因此,在营销时要找好主要销售对象,提高广告投放的精准度,主推这个年龄段的商品。

 
   
2062 次浏览       15
相关文章

基于EA的数据库建模
数据流建模(EA指南)
“数据湖”:概念、特征、架构与案例
在线商城数据库系统设计 思路+效果
 
相关文档

Greenplum数据库基础培训
MySQL5.1性能优化方案
某电商数据中台架构实践
MySQL高扩展架构设计
相关课程

数据治理、数据架构及数据标准
MongoDB实战课程
并发、大容量、高性能数据库设计与优化
PostgreSQL数据库实战培训
最新课程计划
信息架构建模(基于UML+EA)3-21[北京]
软件架构设计师 3-21[北京]
图数据库与知识图谱 3-25[北京]
业务架构设计 4-11[北京]
SysML和EA系统设计与建模 4-22[北京]
DoDAF规范、模型与实例 5-23[北京]
 
最新文章
大数据平台下的数据治理
如何设计实时数据平台(技术篇)
大数据资产管理总体框架概述
Kafka架构和原理
ELK多种架构及优劣
最新课程
大数据平台搭建与高性能计算
大数据平台架构与应用实战
大数据系统运维
大数据分析与管理
Python及数据分析
更多...   
成功案例
某通信设备企业 Python数据分析与挖掘
某银行 人工智能+Python+大数据
北京 Python及数据分析
神龙汽车 大数据技术平台-Hadoop
中国电信 大数据时代与现代企业的数据化运营实践
更多...