书签 分享 收藏 举报 版权申诉 / 62
上传文档赚钱

类型第5章-Python数据分析案例实战-客户价值分析课件.pptx

  • 上传人(卖家):晟晟文业
  • 文档编号:4424244
  • 上传时间:2022-12-08
  • 格式:PPTX
  • 页数:62
  • 大小:2.13MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《第5章-Python数据分析案例实战-客户价值分析课件.pptx》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    Python 数据 分析 案例 实战 客户 价值 课件
    资源描述:

    1、 随着电商行业竞争越来越激烈,推广费用也是越来越高,加之电商法的出台,刷单冲销量的运营思路已不再适应企业需求,而应将更多的思路应转向客户客户,做好客户运营客户运营才是企业生存的王道王道。运营好客户,我们首先就要了解客户、分析客户,找出哪些是重要保持客户重要保持客户、哪些是发展客户发展客户、哪些是潜在客户潜在客户,根据不同类别的客户采取不同的营销模式:如分类营销、一对一多样化营销、个性化营销等模式,从而使企业的利润最大化。应用场景:某淘宝店铺客户多,消费行为复杂,客户价值很难人工评估。RFM模型重要保持客户发展客户潜在客户系统系统结构图结构图客户价值分析客户价值分析获取获取Excel数据数据数据

    2、数据抽取抽取数据探索分析数据探索分析数据规约数据规约数据数据清洗清洗数据转换数据转换客户聚类客户聚类客户价值分析客户价值分析获取数据获取数据数据分析数据分析数据数据处理处理业务流程图业务流程图用户数据是否缺失、异常抽取近两年数据YN标准化处理客户聚类客户价值分析填充、删除处理系统预览系统预览客户群0客户群1客户群2客户群3755人273人560人2人系统预览系统预览开发环境及工具开发环境及工具 操作系统:Windows 7、Windows 10 开发工具:Pycharm 第三方模块:pandas、numpy、matplotlib、sklearn项目文件结构项目文件结构RFM模型聚类分析聚类算法

    3、RFMRFM模型模型RFM模型最近消费时间间隔 Recency消费频率 Frequency消费金额 MonetaryRFM聚类分析聚类分析 聚类聚类类似于分类分类,不同的是聚类划分的类是未知的未知的,也就是说我们不知道应该属于哪类,而是通过一定的算法自动分类算法自动分类。而在实际应用中,聚类就是将数据数据集集中某些方面相似的数据相似的数据进行分类分类组织组织的过程。应用领域应用领域聚类分析主要应用领域:聚类分析主要应用领域:商业商业生物保险行业因特网电子商务K-meansK-means聚类聚类算法算法传统的聚类算法包括五类:划分方法 层次方法 基于密度方法 基于网络方法 基于模型方法K-mea

    4、ns聚类算法K-meansK-means聚类聚类算法算法 k k均值聚类均值聚类是给定一个数据点集合和需要的聚类数目k,k由用户指定,k均值算法根据某个距离函数反复把数据分入k个聚类中。01 创建k个点作为起始质心,可以随机选择(位于数据边界内)02 当任意一个点的簇分配结果发生改变时03 对数据集中每一个点04 对每个质心05 计算质心与数据点之间的距离06 将数据点分配到距其最近的簇07 对每一个簇,计算簇中所有点的均值并将均值作为质心伪代码K-meansK-means聚类聚类算法算法终止条件可以是以下任意一个:没有(或最小数目)对象被重新分配给不同的聚类。没有(或最小数目)聚类中心再发生

    5、变化。误差平方和局部最小。SklearnSklearn模块模块 K-meansK-means聚类聚类 PandasPandas模块模块SklearnSklearn模块模块 SklearnSklearn模块模块(全称Scikit-learn)是Python的第三方模块,它是机器学习领域当中知名的Python模块之一,它对常用的机器学习算法进行了封装,包括回归回归(Regression)、降维降维(Dimensionality Reduction)、分类分类(Classfication)和聚类聚类(Clustering)四大机器学习算法。Sklearn具有以下特点:简单高效的数据挖掘和数据分析工具

    6、 让每个人能够在复杂环境中重复使用 Sklearn模块是Scipy模块的扩展,是建立在NumPy和Scipy基础上的模块SklearnSklearn模块模块 SklearnSklearn模块的安装模块的安装 使用pip命令安装 Python版本为2.7以上、NumPy版本1.8以上、SciPy版本0.13.3以上。首先,安装NumPy和SciPy,如果已经安装NumPy和SciPy,那么安装scikit-learn可以在命令提示符下(cmd)使用安装命令:pip install scikit-learn 在Pycharm开发环境下安装K-meansK-means聚类聚类 调用调用KMeansK

    7、Means类类 from sklearn.cluster import KMeans 客户价值分析系统主要是通过Scikitlearn的cluster模块提供的Kmeans函数来处理K-means聚类问题的,首先调用Kmeans类。K-meansK-means聚类聚类 基本语法基本语法 kmodel=KMeans(n_clusters=8,init=k-means+,n_init=10,max_iter=300,tol=0.0001,precompute_distances=auto,verbose=0,random_state=None,copy_x=True,n_jobs=None,alg

    8、orithm=auto)常用参数及说明常用参数及说明参数参数说明说明n_clusters整型,默认值8,表示生成的聚类数init3个可选值分别为 k-means+、random或者提供一个数组。默认值为 k-means+n_init整型,表示算法的运行次数,默认值为10max_iter整型,默认值300,表示每执行一次k-means算法的最大迭代次数tolfloat类型,表示算法收敛的阈值,默认值为0.0001precompute_distances3个可选值分别为auto、True或者False。该参数用于提前计算好样本之间的距离。默认值为autoverbose整型,默认值=0常用参数及说明

    9、常用参数及说明参数参数说明说明random_state整型,表示随机数生成器的种子。默认值为Nonen_jobs整型,表示指定计算所用的进程数。默认值为1属性说明属性说明 cluster_centers_:返回返回ndarray。表示分类簇的均值向量。表示分类簇的均值向量 labels_:返回返回ndarray。表示每个样本所属的簇的标记。表示每个样本所属的簇的标记 inertia_:返回返回ndarray。表示每个样本距离它们各自最近表示每个样本距离它们各自最近簇的中心之和簇的中心之和pandaspandas模块模块 Pandas是Python的一个核心模块,主要用于数据处理与数据分析,它提

    10、供了快速、灵活、明确的数据结构,能够简单、直观地处理关系型、标记型数据。数据抽取数据抽取 数据抽取是从数据源中抽取数据的过程。淘宝电商存在大量的历史销售数据,我们从中抽取近两年的数据20172017年年1 1月月1 1日日20182018年年1212月月3131日日 业务数据库1业务数据库2业务数据库n抽取数据数据仓库仓库数据探索分析数据探索分析 数据探索分析主要分析与客户价值RFM模型有关的数据是否存在数据缺失、数据异常的情况,分析出数据的规律。主要使用:describedescribe函数函数开发步骤开发步骤 导入模块导入模块pandaspandas 使用使用pandaspandas读取读

    11、取ExcelExcel数据数据 使用使用describedescribe函数函数统统计数据计数据 计算空值数计算空值数(缺失数据缺失数据)导出结果导出结果最终实现效果最终实现效果开发步骤开发步骤 数据规约数据规约 数据清洗数据清洗 数据转换数据转换数据规约数据规约 数据数据规约规约是指在接近或保持原始数据完整性的同时将数据集规模减小,以提高数据处理的速度。58列买家会员名买家会员名订单付款时间订单付款时间买家实际支付买家实际支付金额金额数据采集时间数据采集时间编写编写相关代码相关代码aa=rTB201812.xlsdf=pd.DataFrame(pd.read_excel(aa)df1=df订

    12、单付款时间,买家会员名,买家实际支付金额,数据采集时间指定指定ExcelExcel文件文件读取读取ExcelExcel文件文件选取需要的数据选取需要的数据数据清洗数据清洗 通过前面的数据探索分析,我们发现在淘宝电商历史销售数据中存在一些缺失值缺失值,例如“订单付款日期订单付款日期”为空、“买家实际支付金额买家实际支付金额”最小值为0,下面将这部分数据清理掉,关键代码如下:#去除空值,订单付款时间非空值才保留#去除买家实际支付金额为0的记录df1=df1df1订单付款时间.notnull()&df1买家实际支付金额!=0数据转换数据转换 数据数据转换转换是将数据转换成“适当的”格式,以适应数据分

    13、析数据分析和数据挖掘算法挖掘算法的需要。下面将清理后的数据进行标准化处理。最终实现效果最终实现效果客户聚类客户聚类 客户客户聚类聚类主要使用Python第三方模块SklearnSklearn模块模块中提供的K-meansK-means聚类方法对客户数据进行分类。根据业务需要,这里分为4 4类类。开发步骤开发步骤 导导入数据入数据 数据塞进数据塞进模型模型 客户聚类客户聚类最终实现效果最终实现效果客户价值分析结果解析客户价值分析结果解析客户价值分析结果解析客户价值分析结果解析常见错误与解决常见错误与解决 1 1、缺少、缺少模块导致程序运行错误模块导致程序运行错误 2 2、模块版本不适合导致程序运

    14、行错误、模块版本不适合导致程序运行错误常见错误与解决常见错误与解决 3 3、ExcelExcel文件打开时程序运行错误文件打开时程序运行错误注意事项注意事项 4 4、数据结果保存、数据结果保存ExcelExcel文件时文件时 注意:index参数,是否输出索引安装缺失的安装缺失的模块模块安装缺失的模块安装缺失的模块 在Available PackagesAvailable Packages窗口的搜索框中输入模块名称,比如xlrd,模块搜索到后勾选安装复选框,然后单击Install PackageInstall Package按钮即可安装该模块。模块安装版本选择模块安装版本选择 在File菜单中选择Settings打开Available Packages窗口,在该窗口中找到Specify versionSpecify version复选框复选框,在下拉列表中选择0.21.00.21.0版本

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:第5章-Python数据分析案例实战-客户价值分析课件.pptx
    链接地址:https://www.163wenku.com/p-4424244.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库