菜鸟学习数据分析教程课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《菜鸟学习数据分析教程课件.ppt》由用户(ziliao2023)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 菜鸟 学习 数据 分析 教程 课件
- 资源描述:
-
1、菜鸟学习数据分析教程2023-5-12主 要 内 容1.1.分析分析那些事儿那些事儿2.2.方法方法结构为王结构为王成长之路成长之路3.3.数据数据搜集导入搜集导入4.处理清洗加工5.5.分析分析方法工具方法工具6.6.呈现呈现制表画图制表画图菜菜鸟鸟第一章、数据分析那些事一、数据分析是什么?(1)数据分析为何物?简述:收集数据-适当方法-提炼信息-描述现象发现规律预测未来,帮助判断、决策。(2)数据分析的作用?简述:现状分析、原因分析、预测分析。二、数据分析六部曲?先决条件 提供方向明确目的 数据库 其他媒介数据收集 清洗、转化、提取、计算数据处理 统计分析 数据挖掘数据分析 图表表格文字数
2、据展现 框架清晰 明确结论 提出建议报告撰写一般数据分析用一般数据分析用ExcelExcel可以完成,若高级数据分析,则需要使用数据分析工具,如可以完成,若高级数据分析,则需要使用数据分析工具,如SPSSSPSS Statistics、SAS等。第一章、数据分析那些事三、数据分析的三大误区?(1)分析目的不明确,为了分析而分析(结果:自己玩!)故:分析一定要结合业务实际问题,有目的的展开。(2)缺乏业务知识,分析结果偏离实际(结果:遭鄙视!)故:弄清业务逻辑,懂点营销和管理等理论。(3)一味追求高级方法,热衷研究模型(结果:削脚适履!)故:能简单处理的,不选复杂方法;不管是白猫还是黑猫,只要能
3、抓老鼠就是好猫”四、数据分析师的职业发展?(1)前景如何?展望未来:1.数据矿山越积越多;2.社会越发达,人们对数据越依赖;3.数据分析越发受管理层重视。管理大师彼得.德鲁克:“如果不能衡量,就无法管理”(2)职业要求?五“懂”:业务+管理+分析+工具+设计(3)基本素质?态度严谨负责,好奇心强烈,逻辑思维清晰,擅长模仿,勇于创新!,1.1.分析分析那些事儿那些事儿2.2.方法方法结构为王结构为王成长之路成长之路3.3.数据数据搜集导入搜集导入4.处理清洗加工5.5.分析分析方法工具方法工具6.6.呈现呈现制表画图制表画图第二章、结构为王思路方法第二章、结构为王思路方法一、数据分析的方法论是什
4、么?(1)数据分析的方法论?简述:论述分析的思路,指导数据分析者进行一次完整的数据分析。例如:我应该从哪几个方面展开分析?各方面包含什么内容和指标?(2)数据分析方法论与数据分析方法的区别?举例说明:一个是整体思路(类似宏观作战方案);一个是工具性解决办法(类似刺刀、冲锋枪、坦克、轰炸机等)。二、常用的方法论?7(2)逻辑树分析法(业务问题专题分析)逻辑树分析法是将一个已知问题当成树干,然后考虑这个问题和哪些问题有关。每想到一点,就给这个问题所在的树干加一个树枝,并标明树枝代表什么问题。逻辑树方法又称问题树、演绎树或分解树。第二章、结构为王思路方法要素化:把相同问题归纳总结成要素框架化:将各个
5、要素组成框架,遵守 不重不漏的原则关联化:框架内的各元素保持必要的相互关系,简单不孤立逻辑树适用遵循的原则缺点:缺点:涉及相关问题可能会有遗漏。例:利润分析例:利润分析利润增长缓慢收入收入成本成本其他其他客户少?质量变差?对手竞争?材料成本?人工成本?广告成本?避免办法:避免办法:头脑风暴/专家座谈等。(3)PEST分析法(主要用于行业分析)PEST是指对政治(Political)、经济(Economic)、技术(Technological)和社会(Social)这四类影响企业的主要外部环境因素进行分析。一般用于对宏观环境的分析,由于行业和企业自身的特点和经营方式,分析的具体内容可能会稍有差异
6、。经济环境政治环境社会环境技术环境包括一个国家的社会制度,执政党的性质、方针政策等。宏观指国家国民收入、国民生产总值及变化情况。微观指行业所在地区消费者的收入水平、消费偏好等。包括一个国家的或地区的居民受教育程度和文化水平、信仰风俗、价值观念等。技术环境除了要考察与企业所处领域直接相关的技术手段的发展变化外,还应了解:国家对科技开发的投资和支持重点、技术转移和技术商品化速度、专利及其保护情况、该领域发展动态和研究费用总额等。行业、企业第二章、结构为王思路方法(4)4P营销理论(公司整体经营状况)4P营销理论产生于20世纪60年代的美国,它随着营销组合理论的提出而出现。它将营销要素概括为四类:产
7、品(product)、价格(price)、渠道(place)、促销(promotion)。如果需要了解公司的整体运营情况,就可以采用4P营销理论进行分析指导。第二章、结构为王思路方法投入多少促销资源?效果如何?投放多少宣传广告?效果如何?例例 4P营销公司业务分析产品价格渠道促销公司销售收入怎样?增长还是减少?用户接受的合理价格是多少?用户购买支付方式怎样?公司在各地区有多少销售渠道?用户通过何种渠道购买?公司渠道政策是否具有吸引力?公司提供什么产品和服务?哪个销量好?与用户需求是否一致?购买产品的用户都是何人?(5)用户行为理论用户使用行为是指用户为获取、使用物品或服务所采用的各种行动,一般
8、按照以下过程:对产品有一个认知、熟悉的过程,然后试用,再决定是否继续消费使用,最后成为忠实用户。第二章、结构为王思路方法1.1.分析分析那些事儿那些事儿2.2.方法方法结构为王结构为王成长之路成长之路3.3.数据数据搜集导入搜集导入4.处理清洗加工5.5.分析分析方法工具方法工具6.6.呈现呈现制表画图制表画图第三章、数据收集导入第三章、数据收集导入一、数据类型(设置单元格格式)二、数据表类型(一维表和二维表)一维表特征:一条记录就看到完整的信息;一边有字段指标。二维表特征:需要纵横两个纬度看,才能得到完整的信息;两边有字段指标。(1)二维表变一维表?-数据透视向导(演示,见视频)(2)一维表
9、变二维表?-数据透视表(演示,见视频)第三章、数据搜集导入三、数据搜集导入(1)文本导入:满意度调查(演示)(2)网络:股票数据(演示)(3)调查数据:满意度调查问卷表设计(演示)1.1.分析分析那些事儿那些事儿2.2.方法方法结构为王结构为王成长之路成长之路3.3.数据数据搜集导入搜集导入4.处理清洗加工5.5.分析分析方法工具方法工具6.6.呈现呈现制表画图制表画图第四章、数据处理一、为啥要数据处理?(1)数据有多余、重复的、空白的(2)数据出错(不同于异常数据)(3)数据的组织格式或字段的再加工,得到适用于分析的内容格式。菜鸟总结:第四章、数据处理二、重复数据处理发现重复数据(1)使用C
10、OUNTIF函数(演示)重复次数COUNTIF(A:A,A2)第几次出现COUNTIF(A$2:A2,A2)(2)用菜单操作来筛选(演示)“数据”“排序与筛选”高级(3)使用条件格式(演示)“开始”“条件格式”“突出显示单元格规格”“重复值”(4)数据透视表(后边讲解)删除重复的数据(1)菜单-删除重复项(2)在发现的基础上,删除。第四章、数据处理三、缺失值处理(1 1)如何定位缺失值?)如何定位缺失值?编辑-查询和选择-定位条件Ctrl+G快捷键-定位条件Ctrl+F快捷键-查找Ctrl+H快捷键-替换(2 2)缺失值处理?)缺失值处理?模拟值(平均值、回归、插值、历史等)部分排除整条删除等
11、。Ctrl+Enter快捷键(小白举例)第四章、数据处理四、逻辑检查-逻辑函数逻辑函数逻辑函数第四章、数据处理五、加工数据1.字段分列(1)菜单法(演示)(2)函数法第四章、数据处理五、加工数据2.字段合并(1)“&”连接符 举例:10kg=10&kg(2)Concatenate(,)函数第四章、数据处理五、加工数据3.字段匹配举例:目的站,城市比对第四章、数据处理五、加工数据4.字段运算(1)简单 运算符“+”“-”“*”“/”()(2)常用函数Sum()、Average()、count()Today()、now()、datedif()DATEIF(start-date,end-date,u
12、nit)Unit有Y/M/D/MD/YM/YD六种格式 MD:为start-date,end-date日期中天数的差,忽略日期中的月和年 YM:为start-date,end-date日期中月数的差,忽略日期中的日和年 YD:为start-date,end-date日期中天数的差,忽略日期中的年第四章、数据处理入职日期入职日期2000-10-12000-10-1现在日期现在日期2011-11-72011-11-7工龄(年)工龄(年)4 4年年=DATEIF(B1,B2,=DATEIF(B1,B2,“Y”)&Y”)&“年年”工龄(年月)工龄(年月)4 4年年1 1月月=DATEIF(B1,B2,
13、=DATEIF(B1,B2,“Y Y”)&)&“年年”&DATEIF(B1,B2,”&DATEIF(B1,B2,“YMYM”)&)&“月月”)算工龄?算工龄?五、加工数据5.数据分组&数据表行列互换(1)数据分组举例:地区工资分组(2)行列互换 选择性粘贴第四章、数据处理第四章、数据处理错误值含义解决办法输入到单元格中的数据太长或单元格公式所产生的结果太大,使结果在单元格中显示不下。或是日期和时间格式的单元格做减法,出现了负值增加列的宽度,使结果能够完全显示。如果是由日期或时间相减产生了负值引起的,可以改变单元格的格式,比如改为文本格式,结果为负的时间量。DIV/0!试图除以0。这个错误的产生
展开阅读全文