书签 分享 收藏 举报 版权申诉 / 59
上传文档赚钱

类型统计分析方法-描述性统计课件.ppt

  • 上传人(卖家):三亚风情
  • 文档编号:3280580
  • 上传时间:2022-08-16
  • 格式:PPT
  • 页数:59
  • 大小:167.51KB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《统计分析方法-描述性统计课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    统计分析 方法 描述 统计 课件
    资源描述:

    1、2022-8-16北京大学光华管理学院 胡健颖1市场调研市场调研Marketing Research主讲人:蔡清毅厦门理工学院文化传播系2007年5月2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅2市场调研市场调研描述性统计描述性统计频数分布:列联表和假设检验频数分布:列联表和假设检验2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅31.1.数据的表现数据的表现统计数字和统计图表统计数字和统计图表l假如你已经获得了所要的全部数据;l认识数据的第一步:你得到的是什么类型的数据?l利用图和表来展示数据中的信息;l运用指标刻画数据的某些特

    2、征和程度;l使用EXCEL来完成对数据的描述。2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅4数据变量的分类数据变量的分类l按照取值类型:品质数据和数量数据;l按照测量水平:定类(Nominal)、定序(Ordinal)、定距(Interval)、定比(Ratio)等四类;l按照获取时间:截面数据、时间序列;l不同类型的数据应使用不同的统计方法;l问题:刚才的数据表中分别是什么类型?2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅5区分不同的测量水平区分不同的测量水平l区分原则:定类数据没有大小之分;定序数据有大小之分,差值有意义;

    3、定距数据有大小之分,差值有意义,但其比值无意义;定比数据比值有意义。l定比定距数据可以向前化成定序或者定类数据,但是将损失一定信息;反之,不能将定序定类数据化成定距定比数据。2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅6品质标志的描述方法(品质标志的描述方法(1 1)频数分布、相对分布、百分比频数分布频数分布、相对分布、百分比频数分布是否锻炼 人数(频数)相对频数 百分比 累计百分比 非常喜欢 4 0.2 20.00%20.00%喜欢 6 0.3 30.00%50.00%一般 5 0.25 25.00%75.00%不太喜欢 1 0.5 5.00%80.00%讨

    4、厌 2 0.1 10.00%90.00%很讨厌 2 0.1 10.00%100.00%求和 20 1 100.00%100%某校学生对体育锻炼的态度2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅7品质标志描述方法(品质标志描述方法(2 2)条形图、柱形图条形图、柱形图某校学生对体育锻炼态度调查结果0.00%5.00%10.00%15.00%20.00%25.00%30.00%35.00%非常喜欢喜欢一般不太喜欢讨厌很讨厌2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅8品质标志的描述方法(品质标志的描述方法(3 3)饼图饼图某校学生

    5、对体育锻炼态度调查结果20%30%25%5%10%10%非常喜欢喜欢一般不太喜欢讨厌很讨厌2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅9对矿泉水市场的调查对矿泉水市场的调查北京市居民矿泉水最喜欢品牌33%32%19%5%4%3%2%2%乐百氏农夫山泉娃哈哈可赛雀巢蓝涧获特满其它2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅10数量标志的描述方法(数量标志的描述方法(1 1)l频数分布单项式分布组距式分布:等组距、不等组距 有关概念:组数、组限(上限、下限)、开口组、闭口组、组距、组中值 2022-8-16北京大学光华管理学院 胡

    6、健颖 厦门理工学院文化传播系 蔡清毅11如何按品质标志分类如何按标志标志分类假设某年某月某工地100名工人所得工资资料如下:(单位:元)450 520 540 580 650 720 580 780 650 620首先:编制一个序列其次:编制变量数列数量标志的描述方法(数量标志的描述方法(1 1)案例:案例:2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅12(1)单项变量数列表1 某年某工地某年某工地100名工人的月工资情况名工人的月工资情况按工资水平分组(元)工人数(人)4204504808804234合计100数量标志的描述方法(数量标志的描述方法(1 1)

    7、2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅13(2)等组距变量数列表2 某年某工地某年某工地100名工人的月工资情况名工人的月工资情况按工资水平分组(元)工人数(人)4005001050060035600700207008002080090015合计100数量标志的描述方法(数量标志的描述方法(1 1)2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅14表3 某年某工地某年某工地100名工人的月工资情况名工人的月工资情况按工资水平分组(元)工人数(人)500以下10500600356007002070080020800以上15合

    8、计100数量标志的描述方法(数量标志的描述方法(1 1)2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅15注意几个问题:第一 工资水平是连续变量 要用重叠组限第二 组限的确定,即分组界限的确定第三 组距大小的确定第四 组数的确定,组数全距组距数量标志的描述方法(数量标志的描述方法(1 1)2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅16(3)不等组距变量数列如在生命统计中,人口死亡率将人口按年龄分组1岁以下11.9岁22.9岁33.9岁44.9岁组距为159.9岁1014.9岁1519.9岁组距为52029.9岁3039.9岁4

    9、049.9岁5059.9岁组距为106064.9岁组距为5数量标志的描述方法(数量标志的描述方法(1 1)2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅17数量标志的描述方法(数量标志的描述方法(2 2)某校某校20名学生的身高分布表名学生的身高分布表2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅18数量标志的描述方法(数量标志的描述方法(3 3)直方图直方图 X185.0180.0175.0170.0165.0160.0155.0150.0Histogram Fitting Density CurvesNormal Curve(

    10、Mu=168.0 Sigma=9.94)65432102022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅19数量标志的描述方法(数量标志的描述方法(4 4)l对数据进行探索性分析:J.W.Tukey;l茎叶图(Stem-leaf)茎叶次数153,4,4315611601165,7,7,8,85170,2,3,44175,5,9,94180,12体重体重2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅20描述两个变量的关系描述两个变量的关系l研究两个变量之间的关系:两个变量的类型分别是什么?l两个品质变量之间的关系;l一个品质变量和一个数

    11、量变量的关系;l两个数量变量之间的关系。2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅21交叉分组列表(列联表)交叉分组列表(列联表)表1 学生性别对体育锻炼的态度调查结果比较2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅2245岁以下 45岁或以上45岁以下 45岁或以上是60%40%35%65%否40%60%65%35%调查对象人数300300200200是否希望出国旅行男性女性表2 年龄和性别对出国旅行的愿望的影响交叉分组列表(列联表)交叉分组列表(列联表)2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播

    12、系 蔡清毅23图形展示两个变量的关系图形展示两个变量的关系2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅24描述两个数量型的变量描述两个数量型的变量 散点图散点图通过这个图,你觉得身高和体重是什么关系?2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅25数据描述的数值方法数据描述的数值方法l通过数据指标来概括数据中的信息;l如何刻画数据的集中程度,或集中位置;l如何刻画数据的变异程度;l如何刻画检验异常值;l如何刻画两个变量之间的关系;l探索性分析。2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅26数

    13、据集中位置的度量数据集中位置的度量l平均数(Mean)l中位数(Median)l众数(Mode)l四分位数(Quartiles)l百分位数(Percentiles)l调整(或截尾)平均数(Trimmed Mean)2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅27一个例子一个例子某城市一居室月租金(美元)的70个数据2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅28平均月租金平均月租金美元80.49070356,34nxxi2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅29月租金的中位数月租金的中位

    14、数中位数=(475+475)/2=475美元2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅30月租金的众数月租金的众数众数是450,450出现的最多,频数是72022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅31理解百分数理解百分数lP百分数是这样一个数,它使得至多有p%的数据项小于这个数,而且至多有(100-p)%的数据的数据大于这个数。l中位数和上下四分位数都是特殊的百分位数。P%(100-p)%P百分位数2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅32计算第计算第P P百分位数的步骤百分位数的步

    15、骤以递增顺序排列原始数据(由小到大);计算 I=(p/100)n;如果I不是整数,将I向上取整。大于I的毗邻整数指示第p百分位数的位置;如果I是整数,则第p百分位数是第I项与第I+1项的平均值。2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅33月租金的第月租金的第9090百分位数百分位数计算I=(90/100)70=63。所以第90百分位数是第63和64个数的平均值。2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅34四分位数四分位数l第一个四分位数 =第25百分位数l第三个四分位数 =第75百分位数1Q3Q2022-8-16北京大

    16、学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅35截尾均值截尾均值去除%的最大和最小值,计算剩余数的平均值。月租金的5%的截尾值=487.194254304304354354354354354404404404404404454454454454454504504504504504504504604604604654654654704704724754754754804804804804854904904905005005005005105105155255255255355495505705705755755805906006006006006156152022-8-16北京大学光华

    17、管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅36考虑数据的类型考虑数据的类型l不同类型的数据应该采用不同类型的指标来刻画他们的集中位置。l对于定类数据你能够做什么?l对于定序数据你能够做什么?l对于定距数据和定比数据你能够做什么?2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅37数据变异程度的度量数据变异程度的度量l全距(Range)l四分位间距(IQR)l方差(Variance)l标准差(Standard Deviation)l变异系数(Coefficient of Variance,CV)2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传

    18、播系 蔡清毅38月租金的全距和四分位间距月租金的全距和四分位间距2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅39关于方差和标准差关于方差和标准差总体方差 样本方差 总体标准差,样本标准差s。样本的标准差系数=NXi22)(1)(22Nxxsi()100%sx2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅40月租金的标准差月租金的标准差方差 标准差标准差系数 16.996.22s74.542ss%75.11%100 xs2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅41探索性的数据分析探索性的数据分

    19、析l五数概括 最小值(Min),第一个四分位数(),中位数(),第三个四分位数(),最大值(Max).2Q3Q1Q2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅42用用EXCELEXCEL对数据进行描述分析对数据进行描述分析l数据录入l制作图表l数据分析l计算描述统计量l相关系数2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅433.3.假设检验假设检验l假设检验问题的提出假设检验是首先对总体提出假设,从而抽取一个随机样本,然后以样本的统计值来验证这个假设是否成立,可以说假设检验是统计推论的反证法。2022-8-16北京大学光华管理

    20、学院 胡健颖 厦门理工学院文化传播系 蔡清毅443.3.假设检验假设检验l假设检验的一般步骤1)建立零假设 和备择假设 ;2)选择适当的用来决定是否拒绝零假设的统计方法和相应的检验统计量;3)选择显著水平的大小。在实践中,进行假设检验的人员确定允许拒绝第一类错误概率的最大值称为检验的显著性水平。显著性水平一般选择0.05和0.01;1H0H2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅453.3.假设检验假设检验4)决定样本规模并收集数据,计算检验统计值,如样本均值、样本比例、样本标准差等等;5)用检验统计量的抽样分布来决定检验统计量在零假设条件下的概率,以及检

    21、验统计量的临界值(即指拒绝域的边界),以便将检验统计量的值与临界值比较;2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅463.3.假设检验假设检验6)做出是否拒绝零假设的决定。有四种拒绝零假设的方式:如果最终统计量落入拒绝域之内,则拒绝零假设H0如果最终统计量(它的绝对值)大于临界值,则拒绝零假设H0 如果概率值小于显著性水平,则拒绝零假设H0 如果零假设的值落在置信区间之外,则拒绝零假设H02022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅473.3.假设检验假设检验7)用市场营销研究的语言说明统计决定的意义。注意,如果零假设没有被

    22、拒绝,那么最好将结论叙述为“无法拒绝零假设”而不是“接受零假设”,因为从逻辑上讲“无法拒绝 H0”并不一定就意味着可以接受 H0。否则在一些情况下可能会出现严重的问题,或者只给出概率值,让决策者进一步考虑。如前述,最重要的抽样分布是正态分布,作为最终统计量的z 比值常常用于大样本的情况(例如120n的时候),其计算方法为:检验统计量的标准误差原假设的值)(检验统计量比值/z 2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅483.3.假设检验假设检验对于零假设的检验称为单尾检验,因为备择假设是以单方向形式表述的。如果要进行双侧检验,常用的理论如下:如果64.1z,

    23、那么结果在 10%的水平下是显著的(或在 10%的显著水平下拒绝 H0接受 H1)如果96.1z,那么结果在 5%的水平下是显著的(或在 5%的显著水平下拒绝 H0接受 H1)如果58.2z,那么结果在 1%的水平下是显著的(或在 1%的显著水平下拒绝 H0接受 H1)如果29.3z,那么结果在 0.1%的水平下是显著的(或在 0.1%的显著水平下拒绝 H0接受 H1)在商业性营销研究中,单尾检验比双尾检验更常用。通常,研究收集的证据所支持的结论都有一定的方向性,例如销售额越高产品质量就越高。2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅49课堂练习课堂练习 某

    24、百货商场正在考虑是否提供网上购物服务,如果网络用户中40%通过网络购物,就可以推出这项服务。结合这个例子,第一步应该如何考虑?建立假设 对零假设检验的表述方式为:40.0:0pH 40.0:1pH 2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅50课堂练习课堂练习 如果研究者需要检验通过网络购物的网络用户比例是否是40%,就要进行双尾检验,假设表达方式变为:40.0:0pH 40.0:1pH 2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅51课堂练习课堂练习 第二步选择适当的检验方法 由于检验统计量通常服从某种分布,比如正态分布、

    25、t分布或者卡方分布。在网络购物服务的例子中,适用的是z统计量,它服从正态分布,其计算方法如下:(1)p PzPPn 当P已知时 2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅52课堂练习课堂练习 2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅53课堂练习课堂练习 2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅54课堂练习课堂练习 第一类错误第一类错误是指样本结果拒绝了实际上正确的零假设。本例,如果通过样本数据得出,认为偏好新的服务的客户比例超过40名,而实际数字却等于或小于40名,我们就犯了第一类错

    26、误。第一类错误发生的概率 也叫显著性水平,即原假设是正确的,却接受了对立假设。2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅55课堂练习课堂练习 第第二二类类错错误误是指根据样本结果接受了实际上错误的零假设。本例,如果我们根据样本数据认为偏好新服务的顾客等于或少于40 名,而实际上却大于 40 名,我们就犯了第二类错误,即对立假设是正确的,却接受了原假设。第二类错误发生的概率用 表示。换句话说和被分别称为犯第一类错误和第二类错误的概率。犯第一类错误的概率也被叫做显著性程度。(参考书第 552 页)2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传

    27、播系 蔡清毅56课堂练习课堂练习 2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅57课堂练习课堂练习2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅58课堂练习课堂练习 2022-8-16北京大学光华管理学院 胡健颖 厦门理工学院文化传播系 蔡清毅59课堂练习课堂练习二试实验生产电视机显像管的新工序是否明显优于传统的旧工序的显像管。解:零假设为“新工序生产的显像管的总体平均寿命 1200 小时与旧工序生产 的没有什么差异”,即 1200:1200:1100HH 又知:100n%5 1265x 300S 则:样本均值x的标准差=30100/300/ns 64.117.230/)12001265(z 结论:差异是显著的,因而在 5%的显著性水平下拒绝零假设,即新工序生产的 显像管的平均寿命显著地长于传统旧工序,这一检验的错误水平为 5%。

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:统计分析方法-描述性统计课件.ppt
    链接地址:https://www.163wenku.com/p-3280580.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库