1、第6章 统计数据的特征值6.1、样本统计量6.2、从正态分布导出的几个重要分布6.3、抽样分布和抽样误差6.4、双样本均值之差、比例之差、方差之 比的抽样分布6.1 样本统计量6.1.1 统计量的概念统计量(statistic)是样本观察值的函数,是样本信息的汇总,是作为推断数据总体特征的基础和依据。统计量是一个随机变量6.1.2 常用统计量 1、样本矩统计量 原点矩:中心矩:kikxna1kikxxnm)(12、次序统计量 把样本 由小到大排列,称样本观察值为样本的第i次序统计量。如第4章讲到的分位数,本身根据样本计算的。nxxx,.,21)(ix6.2 从正态分布导出的几个重要分布1、(卡
2、方)分布2、t分布3、F分布21、分布 是标准正态随机变量平方和的分布。设随机变量 相互独立,且服从标准正态分布 ,那么n个随机变量的平方和服从自由度为n的卡方分布。2nXXX,.,21)1,0(N)(2122nXni 卡方分布的形态和自由度n有关,n越大越趋近于对称分布,n较小时存在右偏。卡方分布的概率密度函数比较复杂,在一般的统计教科书中,都给出了卡方分布分位数表,一般是在不同的自由度下,给出右尾概率为10%、5%和1%的临界值。在Excel中查卡方临界值的函数为CHIINV()。卡方分布的右尾临界值2、t分布t分布是由格赛特(W.S.Gosset)于1908年首次提出,也被称作学生(st
3、udent)t分布。如果随机变量随机变量 ,那么:t分布是相对于标准正态分布而言稍微平缓的分布。1)t分布也是以0为中心 2)对称分布。)1,0(NX)(2nY)(/ntnYXt 3、F 分布F分布是卡方均值的之比,1924年由英国统计学家Fisher提出。设Y与Z为相互独立的随机变量,且那么,F分布有两个自由度,)(),(22nZmY),(/nmFnZmYF),(1),()1(mnFnmF6.3 抽样分布和抽样误差抽样分布是指样本统计量的抽样分布规律。样本统计量是推断总体参数的基础。由于抽样的随机性,样本统计量本身具有随机性,样本统计量与总体参数之间的差异称为抽样误差,根据概率理论,可以估计
4、平均抽样误差。6.3.1 样本平均数的分布规律及抽样平均误差1、总体分布、样本分布和抽样分布首先让我们从一个例子出发,来分析样本平均数的分布规律。假设总体中有四个人,即N=4,年龄分别为18、20、22、24,那么在总体中,变量值共有4个,它们出现的概率都是1/4,我们可以认为总体分布是均匀分布:总体参数:2142422201854)2124()2122()2120()2118(22222抽取n=2 的样本,所有可能样本及样本均值18,1820,1822,1824,1818,2020,2022,2024,2018,2220,22,22,2224,2218,2420,2424,2424,2418
5、1920211920212220212223212223242116124223322421320219118)(xxEnxDx22222221161)124(.2)2119(1)2118()(总体分布与抽样分布的关系示意图2、的抽样分布分布及中心极限定理设 为取自某一总体的独立随机样本,当总体变量 时,其样本均值当 取自总体 时,当样本容量n足够大时(n30),样本均值近似xnXXX,.,21),(2NX),(2nNxnXXX,.,21),(2nNx2)(,)(XDXE6.3.2 样本比例的分布规律比例可以看做0-1变量的平均数,比如研究某市家庭拥有小轿车的比例,假设某市家庭数N,拥有轿车的
6、家庭数M,那么总体比例令随机变量可见,NM表示未拥有小轿车表示拥有小轿车01iXNMNMNMXEi)(01)()1()()0()1()(22NMNMXDi参照样本均值分布的中心极限定理,当样本容量n足够大时,样本比例p的分布规律:由于样本比例的分布形态与总体比例有关,所以对于样本容量n的大小要求:)1(,(nNp5)1(,5pnnp同时6.3.3 样本方差的分布规律设 为取自正态总体 的独立随机样本,即 对于样本方差统计量 而言:注:nXXX,.,21),(2NX22)(11xxns2222)1(/)1(nsn22222)1(/)1(nxxsn6.4 双样本均值之差、比例之差、方差之比的分布6.4.1 双样本平均值之差的分布规律(独立样本)212121)()()(xExExxE2221212121)()()(nnxDxDxxD6.4.2 双样本比例之差的分布规律212121)()()(pEpEppE2221112121)1()1()()()(nnpDpDppD6.4.3 双样本方差之比的分布规律设 来自正态总体 的样本容量 为 的随机样本,来自正态总体 的样本容量为 的随机样本,两个样本相互独立,则构造统计量:)1,1(/2122212221nnFssFnXXX,.,21),(2111NXnYYY,.,21),(2222NY1n2n