《新编MATLAB&Simulink自学一本通》课件第17章 描述性统计.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《《新编MATLAB&Simulink自学一本通》课件第17章 描述性统计.pptx》由用户(momomo)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 新编MATLAB&Simulink自学一本通 新编MATLAB&Simulink自学一本通课件第17章 描述性统计 新编 MATLAB Simulink 自学 课件 17 描述 统计
- 资源描述:
-
1、2023-5-5 案例背景案例背景 案例描述案例描述 描述性统计量描述性统计量 统计图统计图 频数和频率分布表频数和频率分布表主要内容:主要内容:2023-5-5第一节第一节 案例背景案例背景2023-5-5 从一封情书开始说起从一封情书开始说起亲爱的莲:亲爱的莲:我们的感情,在组织的亲切关怀下、在领导的亲自过我们的感情,在组织的亲切关怀下、在领导的亲自过问下,一年来正沿着健康的道路蓬勃发展。这主要表现在:问下,一年来正沿着健康的道路蓬勃发展。这主要表现在:(一)我们共通信(一)我们共通信121121封,平均封,平均3.013.01天一封。其中你给天一封。其中你给我的信我的信5151封,占封,
2、占42.1%42.1%;我给你的信;我给你的信7070封,占封,占57.9%57.9%。每封。每封信平均信平均15021502字,最长的达字,最长的达52155215字,最短的也有字,最短的也有624624字。字。(二)约会共(二)约会共9898次,平均次,平均3.73.7天一次。其中你主动约我天一次。其中你主动约我3838次,占次,占38.7%38.7%;我主动约你;我主动约你6060次,占次,占61.3%61.3%。每次约会平。每次约会平均均3.83.8小时小时,最长达最长达6.46.4小时,最短的也有小时,最短的也有1.61.6小时。小时。(三)我到你家看望你父母(三)我到你家看望你父母
3、3838次,平均每次,平均每 9.49.4天一次;天一次;你到我家看望我父母你到我家看望我父母3636次,平均次,平均1010天一次。以上充分证明天一次。以上充分证明一年来的交往我们已形成了恋爱的共识,我们爱情的主流一年来的交往我们已形成了恋爱的共识,我们爱情的主流是互相了解、互相关心、互相帮助,是平等互利的。是互相了解、互相关心、互相帮助,是平等互利的。当然,任何事物都是一分为二的,缺点的存在是不可避免当然,任何事物都是一分为二的,缺点的存在是不可避免的。我们二人虽然都是积极的,但从以上的数据看,发展还不的。我们二人虽然都是积极的,但从以上的数据看,发展还不太平衡,积极性还存在一定的差距,这
4、是前进中的缺点。太平衡,积极性还存在一定的差距,这是前进中的缺点。相信在新的一年里,我们一定会发扬成绩、克服缺点、携手前相信在新的一年里,我们一定会发扬成绩、克服缺点、携手前进,开创我们爱情的新局面。因此,我提出三点意见供你参考:进,开创我们爱情的新局面。因此,我提出三点意见供你参考:(一)要围绕一个(一)要围绕一个“爱爱”字,字,(二)要狠抓一个(二)要狠抓一个“亲亲”字,字,(三)要落实一个(三)要落实一个“合合”字。字。让我们弘扬团结拼搏的精神,共同振兴我们的爱情,争取让我们弘扬团结拼搏的精神,共同振兴我们的爱情,争取达到一个新高度,登上一个新台阶。本着达到一个新高度,登上一个新台阶。本
5、着“我们的婚事我们办,我们的婚事我们办,办好婚事为我们办好婚事为我们”的精神,共创辉煌。的精神,共创辉煌。你的憨哥你的憨哥2023-5-5 统计学家当奶爸统计学家当奶爸 有个从未管过自己孩子的统计学家,在一个星期六下午有个从未管过自己孩子的统计学家,在一个星期六下午妻子要外出买东西时,勉强答应照看一下四个年幼好动的妻子要外出买东西时,勉强答应照看一下四个年幼好动的孩子。当妻子回家时,他交给妻子一张纸条,上面写着:孩子。当妻子回家时,他交给妻子一张纸条,上面写着:“擦眼泪擦眼泪1111次;系鞋带次;系鞋带1515次;给每个孩子吹玩具气球各次;给每个孩子吹玩具气球各5 5次;次;每个气球的平均寿命
6、每个气球的平均寿命1010秒钟;警告孩子不要横穿马路秒钟;警告孩子不要横穿马路2626次;次;孩子坚持要穿马路孩子坚持要穿马路2626次;我还要再过这样的星期六次;我还要再过这样的星期六0 0次。次。”2023-5-5第二节第二节 案例描述案例描述2023-5-5【例例17.2-1】现有现有某两个班的某门课程的考试成绩,某两个班的某门课程的考试成绩,如如下下表表所示。试对成绩数据进行统计分析(计算描述性统计量,绘所示。试对成绩数据进行统计分析(计算描述性统计量,绘制统计图),分析成绩是否服从正态分布。制统计图),分析成绩是否服从正态分布。序号序号学号学号姓名姓名成绩成绩序号序号学号学号姓名姓名
7、成绩成绩序号序号学号学号姓名姓名成绩成绩16010101陈亮63186010118肖君扬80356010211尹浩天9026010102李旭73196010119徐欣露69366010212曾松涛8036010103刘鹏飞*206010120杨姗姗81376010213张小兵8046010104任时迁82216010121姚丽娜49386010214奚才7356010105苏宏宇80226010122张萌91396010215郭以纯7366010106王海涛70236010123张婷婷76406010216黄惠雯7276010107王洋88246010124褚子贞76416010217刘丽79
8、86010108徐靖磊80256010201曹不凡72426010218聂茜茜8096010109阎世杰92266010202付程远89436010219苏红妹81106010110姚前树84276010203李林森77446010220唐芸82116010111张金铭95286010204李强64456010221王飞燕73126010112朱星宇82296010205林志远94466010222徐思漫83136010113韩宏洁75306010206盛世74476010223许佳慧87146010114刘菲71316010207宋天清98486010224杨雨婷*156010115苗艳红7
9、0326010208王润泽89496010225曾亦可90166010116宋佳艺80336010209吴鹏辉49506010226张阳85176010117王峥瑶78346010210徐佳80516010227张梓涵922023-5-5第三节第三节 描述性统计量描述性统计量2023-5-5一、均值一、均值 定义:定义:11niiXXn 一首打油诗:张村有个张千万,隔壁一首打油诗:张村有个张千万,隔壁9个穷光蛋,平均个穷光蛋,平均起来算一算,人人都是张百万。起来算一算,人人都是张百万。报纸上报道有个人在一条河中淹死了,这条河的平均深报纸上报道有个人在一条河中淹死了,这条河的平均深度仅度仅10c
10、m,你信吗?,你信吗?来自国家统计局天津调查总队最新的数据显示,今年上来自国家统计局天津调查总队最新的数据显示,今年上半年天津城市居民人均可支配收入半年天津城市居民人均可支配收入12861元,北京元,北京17068元、上海元、上海18382元、重庆元、重庆11134元。元。2023-5-5二、方差和标准差二、方差和标准差 方差:方差:2211()1niiSXXn 标准差:标准差:211()1niiSXXn最常用最常用三、最大值和最小值三、最大值和最小值 最大值:最大值:()12max,nnXXXX 最小值:最小值:(1)12min,nXXXX2023-5-5四、极差四、极差 极差:极差:()(
11、1)nRangeXX五、中位数五、中位数(1)/2)(/2)(1/2),1(),2nnnXnXXXn为奇数为偶数六、六、p分位数分位数(1)()(1),12nppnpnpXnpmXXnp若不是整数,若是整数七、众数:七、众数:样本数据中出现最频繁的数样本数据中出现最频繁的数2023-5-5八、变异系数八、变异系数covarS X九、九、k k阶原点矩阶原点矩11,1,2,nkkiiAXkn十、十、k k阶中心矩阶中心矩11(),2,3,nkkiiBXXkn十一、偏度十一、偏度331.5312()(1)(2)nisiBXXnbBnnS十二、峰度十二、峰度4223kBbB2023-5-5十三、第一
12、四分位数:十三、第一四分位数:0.251Qm 样本数据中小于等于此数的数据占整个数据集的样本数据中小于等于此数的数据占整个数据集的25%十四、第三四分位数:十四、第三四分位数:0.753Qm 样本数据中小于等于此数的数据占整个数据集的样本数据中小于等于此数的数据占整个数据集的75%十五、四分位间距:十五、四分位间距:31IQRQQ最稳健最稳健2023-5-5【例例17.3-1】根据根据表表17.2-1中数据中数据,计算描述性统计,计算描述性统计量量。%求均值求均值score=xlsread(examp7_1_1.xls,Sheet1,G2:G52);score=score(score 0);s
13、core_mean=mean(score)%求方差和标准差求方差和标准差SS1=var(score)%计算计算(17.3-1)式的方差式的方差SS1=var(score,0)%也是计算也是计算(17.3-1)式的方差式的方差SS2=var(score,1)%计算计算(17.3-2)式的方差式的方差s1=std(score)%计算计算(17.3-3)式的标准差式的标准差s1=std(score,0)%也是计算也是计算(17.3-3)式的标准差式的标准差s2=std(score,1)%计算计算(17.3-4)式的标准差式的标准差%求最大值和最小值求最大值和最小值score_max=max(scor
14、e)score_min=min(score)%求极差求极差score_range=range(score)%求中位数求中位数score_median=median(score)%求分位数求分位数score_m1=quantile(score,0.25,0.5,0.75)score_m2=prctile(score,25,50,75)%求众数求众数score_mode=mode(score)%求变异系数求变异系数score_cvar=std(score)/mean(score)%求原点矩求原点矩A2=mean(score.2)%求中心矩求中心矩B1=moment(score,1)B2=momen
15、t(score,2)%求偏度求偏度score_skewness=skewness(score)%求峰度求峰度score_kurtosis=kurtosis(score)2023-5-5第四节第四节 统计图统计图一、一、样本的频数分布与频率分布样本的频数分布与频率分布将样本观测值将样本观测值12,nx xx从小到大排列得:从小到大排列得:,列出样本频率分布表如下,列出样本频率分布表如下(1)(2)()lxxx观测值观测值x(1)x(2)x(l)总计总计频数频数n1n2nln频率频率111nfn22nfnllnfn 称称函数函数(1)()(1)1()0()1,2,11inkiiklxxF xfxx
16、xilxx为样本分布函数(或为样本分布函数(或经验分布函数经验分布函数)。它满足分)。它满足分布函数所具有的性质。布函数所具有的性质。二、样本经验分布函数图二、样本经验分布函数图1.定义定义2.格里汶科定理格里汶科定理设总体设总体X 的的分布函数为分布函数为F(x),样本,样本limsup|()()|01nnxPF xF x 此定理表明:当样本容量此定理表明:当样本容量n n相当大时,经验分布函相当大时,经验分布函数是总体分布函数的一个良好的近似。数是总体分布函数的一个良好的近似。12,nXXX的经验的经验分布函数为分布函数为Fn(x),则有,则有3.MATLAB实现实现 cdfplot和和e
17、cdf函数函数函数函数调用方式:调用方式:cdfplot(X)f,x=ecdf(y)功能:功能:绘制经验分布函数图绘制经验分布函数图40506070809010000.10.20.30.40.50.60.70.80.91xF(x)Empirical CDF 经验分布函数理论正态分布2023-5-5【例例17.4-1】根据根据表表17.2-1中数据中数据,绘制经验分布函数图。,绘制经验分布函数图。%经验分布函数图经验分布函数图score=xlsread(examp7_1_1.xls,Sheet1,G2:G52);score=score(score 0);figure;h,stats=cdfplo
18、t(score)set(h,color,k,LineWidth,2);x=40:0.5:100;y=normcdf(x,stats.mean,stats.std);hold onplot(x,y,:k,LineWidth,2);legend(经验分布函数经验分布函数,理论正态分布理论正态分布,Location,NorthWest);(1)(1)找出样本观测值的最小值找出样本观测值的最小值x(1)和最大值和最大值x(l);011kkattttb(2)(2)取取ax(1)和和bx(l),将区间,将区间a,b分成分成k个子区间;个子区间;01121,(,(,kkt tt ttt(3)(3)计算样本观
19、测值落入各子区间内的频数计算样本观测值落入各子区间内的频数ni 和频率和频率 ;iinfn(4)(4)在在x 轴上以各子区间为底边,以轴上以各子区间为底边,以ni(或(或 )为高)为高 作小矩形即得频数(或频率)直方图。作小矩形即得频数(或频率)直方图。1()iiiftt三、频数与频率直方图三、频数与频率直方图1.1.步骤步骤2.MATLAB实现实现 hist、ecdf和和ecdfhist函数函数函数函数调用方式:调用方式:%频数直方图频数直方图hist(Y,nbins)%频率直方图频率直方图f,x=ecdf(y)ecdfhist(f,x)功能:功能:hist函数,用来绘制频数直方图函数,用来
20、绘制频数直方图 ecdf和和ecdfhist函数,用来绘制频率直方图函数,用来绘制频率直方图40506070809010000.0050.010.0150.020.0250.030.0350.040.0450.05考试成绩f(x)频率直方图正态分布密度曲线2023-5-5【例例17.4-2】根据根据表表17.2-1中数据中数据,绘制频率直方图。,绘制频率直方图。%频数(率)直方图频数(率)直方图figure;f,xc=ecdf(score);ecdfhist(f,xc,7);xlabel(考试成绩考试成绩);ylabel(f(x);x=40:0.5:100;y=normpdf(x,mean(s
展开阅读全文