市场调研数据分析方法课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《市场调研数据分析方法课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 市场调研 数据 分析 方法 课件
- 资源描述:
-
1、第六章市场研究的数据分析方法第六章市场研究的数据分析方法第一节线性回归分析一、线性回归方程的基本模型 线性回归方程从样本资料出发,一般利用最小二乘法,根据回归直线与样本数据点在垂直方向上的偏离程度最低的原则,进行回归方程的参数的求解。线性回归分析是考察变量之间的数量关系变化规律,它通过一定的数学表达式回归方程,来描述这种关系,以确定一个或几个变量的变化对另一个变量的影响程度,为预测提供数学依据。1.一元线性回归模型模型是:式中:为被解释变量(因变量);为解释变量(自变量),是随机误差项,i为观测值下标,n为样本容量,与 是待估参数,称 为回归常数,为回归系数。ii10ixyyx0101 2.多
2、元回归模型 多元线性回归模型中自变量的个数在2个以上,模型的一般形式为:i=1,2,n 其中,为被解释变量(因变量),为解释变量(自变量),是随机误差项,i为观测值下标,n为样本容量,为k+1个待估参数,称为回归常数,称为回归系数。ikiki22i 110ix.xxyyk21x,.,x,xk210,.,k,.,21在应用线性回归模型时,必须满足以下假设:(1)解释变量 是确定性变量,而且解释变量之间不相关。(2)随机误差项具有0均值和同方差。(3)随机误差项在不同样本点之间是独立的,不存在序列相关。(4)随机误差限于解释变量之间不相关。(5)随机误差项服从0均值和同方差的正态分布。k21x,.
3、,x,x二、线性回归方程的统计检验 1.回归方程拟合优度检验 2.回归方程的显著性检验 3.回归系数显着性检验 三、回归分析假设条件的检验 1.残差分析 2.多重共线性 3.误差项的序列相关 四、线性回归分析的基本步骤1.确定回归中的自变量和因变量2.从收集到样本资料出发确定自变量和因变量之间的数学关系,即建立回归方程3.对回归方程进行各种统计检验4.利用回归方程进行预测 五、实例分析 例:Checkers Pizza公司是休斯敦附近Westbury镇上仅有的从事比萨饼送货业务的两家公司之一,其直接竞争对手是欧文公司,提供相同的产品与服务。另外麦当劳也是它的一个重要竞争者。在过去的24个月中,
4、该公司的销售量(Q)、价格(P),小镇上居民的人均收入(M),欧文公司产品的价格(P欧文)以及麦当劳产品的价格(P麦当劳)。假定下个月公司产品价格为9.05元,人均收入为26 614元,欧文公司产品的价格10.2元,麦当劳产品的价格为1.15元,请预测该公司下个月的销售量。首先Checkers Pizza公司根据资料估计下面的线性需求方程的参数:Qab Pc Md P欧文e P麦当劳式中:Q比萨饼的销量 P比萨饼的价格 M小镇居民的人均收入 P欧文欧文公司产品的价格 P麦当劳麦当劳产品的价格下面是SPSS11.0的输出结果:M Mo od de el l S Su um mm ma ar ry
5、 y.985a.970.96434.70896Model1RR SquareAdjusted RSquareStd.Error ofthe EstimatePredictors:(Constant),P麦当劳,P欧文,M,Pa.A AN NO OV VA Ab b736912.314184228.078152.923.000a22889.523191204.712759801.8323RegressionResidualTotalModel1Sum ofSquaresdfMean SquareFSig.Predictors:(Constant),P麦当劳,P欧文,M,Pa.Dependent
6、Variable:Qb.C Co oe ef ff fi ic ci ie en nt ts sa a-343.784414.076-.830.417-195.89511.041-1.037-17.743.0007.472E-02.010.4057.359.000174.40331.712.2325.500.00081.05722.166.1663.657.002(Constant)PMP欧文P麦当劳Model1BStd.ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.Dependent Variable:Qa.从
7、上面的输出结果可以看出,模型可以解释97%的比萨饼销售量的变化;模型整体非常显着,F统计的相伴概率值P=0.000;四个参数b,c,d,e非常显着,T统计的相伴概率值P都远小于0.01。所以,回归方程为:Q 343.748195.895P0.0742M174.403 P欧文 81.057 P麦当劳 该公司下一个月比萨饼的销量为:Q343.748195.8959.050.074 226 614174.403 10.2 81.057 1.15 1 730.287 2第二节判 别 分 析 一、判别分析法的基本思想 判别分析包括以下两步:1.分析和解释各类指标之间存在的差异,并建立判别函数2.以第一步
8、的分析结果为依据,将对那些未知分类属性的案例进行判别分类 二、判别分析基本模型与统计术语(一)假设条件 1.每一个类别都取自一个多元正态总体的样本 2.所有正态总体的协方差矩阵或相关矩阵都相等(二)基本模型 (三)统计术语 1.先验概率 2.后验概率 3.判别系数 4.结构系数 5.分组的矩心 6.判别力指数 7.残余判别力 三、分析的基本步骤 判别分析一般都是通过现成的统计软件进行分析。一般而言,利用统计软件的判别分析具体包括以下步骤:1.确定研究的问题 2.获取判别分析的数据 3.进行判别分析 4.评价和解释分析结果 四、实例分析 某公司生产一新产品,该公司在新产品末大量上市以前,进行了一
9、次市场调查。公司将新产品寄给15个代理商,并附意见调查表,要求对该产品给予评估并说明是否愿意购买。评估的因素有:式样、包装及耐久性。评分采用10分制,高分表示特性良好,低分则较差。其中有三位代理商没有表明自己的购买意愿。那么这些代理商是属于“非购买组”还是“购买组”?以下是SPSS11.0的部分输出结果:S St ta an nd da ar rd di iz ze ed d C Ca an no on ni ic ca al l D Di is sc cr ri im mi in na an nt tF Fu un nc ct ti io on n C Co oe ef ff fi ic c
10、i ie en nt ts s.910.083.254式样包装耐久性1Function 表中,式样、包装和耐用性的标准化系数分别为0.91、0.083、0.254。因而,式样是最重要的判别变量,其次是耐用性,最后是包装。C Ca as se ew wi is se e S St ta at ti is st ti ic cs s11.50011.000.4542.00017.8772.15511.4201.969.6512.0317.548.67411.16411.0001.9352.00024.4522.87211.6481.991.2082.0099.5951.02411.9251.999
11、.0092.00113.3131.57511.9691.998.0012.00212.3581.44211.3911.963.7362.0377.269.62322.6181.989.2491.0119.336-1.57522.7601.995.0941.00510.550-1.76722.1311.7212.2811.2794.177-.56322.57211.000.3191.00016.962-2.63822.08011.0003.0641.00028.136-3.823ungrouped2.3871.962.7481.0387.230-1.208ungrouped1.6481.991.
12、2082.0099.5951.024ungrouped2.7991.996.0651.00410.885-1.81811.66331.0001.5842.00018.18911.8003.9611.0062.0397.39811.17831.0004.9102.00031.80011.2473.9644.1422.03610.72412*.0003.97485.9341.02693.19411.8623.996.7482.00411.65511.6463.9451.6602.0557.36222.9343.984.4281.0168.69822.0623.9467.3201.05413.042
13、21*.09131.0006.4572.00021.79022.57431.0001.9941.00017.42822.02731.0009.2081.00045.539Case Number123456789101112131415123456789101112OriginalCross-validatedaActual GroupPredictedGrouppdfP(Dd|G=g)P(G=g|D=d)SquaredMahalanobisDistance toCentroidHighest GroupGroupP(G=g|D=d)SquaredMahalanobisDistance toCe
14、ntroidSecond Highest GroupFunction 1DiscriminantScoresFor the original data,squared Mahalanobis distance is based on canonical functions.For the cross-validated data,squared Mahalanobis distance is based on observations.Misclassified case*.Cross validation is done only for those cases in the analysi
15、s.In cross validation,each case is classified by the functions derived from all cases other than thatcase.a.表中最大概率组一栏是判别分析得出的组别。13、15号代理商属于“非购买组”,14号代理商属于“购买组”。第三节聚 类 分 析 一、聚类分析的基本思想 聚类分析(又称数字分类学)是新近发展起来的一种研究分类问题的多元统计分析方法。它是根据事物本身的特性研究个体分类的方法,其基本原则是同类的个体有较大的相似性,而不同类的个体的差异很大。在聚类分析中,根据分类对象的不同可分为样品聚类(Q
展开阅读全文