第一章数据分析模型-医学课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第一章数据分析模型-医学课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第一章 数据 分析 模型 医学 课件
- 资源描述:
-
1、1. 数据分析模型数据分析模型怎样表述、解读、分析、发现规律?怎样表述、解读、分析、发现规律?现实生活中的现实生活中的数据数据:数量繁多数量繁多、杂乱无章杂乱无章. . 找出有代表性的数值或者利用图形表述,分析、找出有代表性的数值或者利用图形表述,分析、 解释相关的实际现象解释相关的实际现象. . 利用统计方法通过大量数据探索、发现研究对象利用统计方法通过大量数据探索、发现研究对象 的数量规律的数量规律. . (本书提高篇第(本书提高篇第7章)章)1.1 薪金到底是多少薪金到底是多少1.2 评选举重总冠军评选举重总冠军1.3 估计出租车的总数估计出租车的总数1.4 解读解读CPI1.5 NBA
2、赛程的分析与评价赛程的分析与评价全国全国 大学生数学建模竞赛大学生数学建模竞赛2008年年D题题1. 数据分析模型数据分析模型1.1 薪金到底是多少薪金到底是多少日常生活中遇到日常生活中遇到的的数据数据:一个班一个班的的考试成绩及按成绩的排考试成绩及按成绩的排 名名一个年级全部男同学的身高一个年级全部男同学的身高超市中各个品牌牙膏一个月的销量超市中各个品牌牙膏一个月的销量公司里每位职工一个月的薪金公司里每位职工一个月的薪金用用几几个数简明地个数简明地表示表示一组数据一组数据整体整体的大小的大小.n个数据的代表数个数据的代表数平均数平均数 n个数据的算术平均值个数据的算术平均值.n 个数据的个数
3、据的代表数代表数中位数中位数 n个数据从小到大个数据从小到大(或从大到小)(或从大到小)排序排序 位于正中的数位于正中的数.若若n为偶数,取位于正中的为偶数,取位于正中的2个数的平均值个数的平均值.众数众数 n个数据中出现次数最多的那个个数据中出现次数最多的那个(或几个或几个)数数.3个个代表数代表数反映一组数据反映一组数据整体整体大小的大小的不同侧面不同侧面. 某公司某公司100位位职工的月薪职工的月薪/千元千元月薪月薪402520151086543人数人数126812171824102 薪金到底是多少薪金到底是多少平均数平均数 :8.6千元千元.中位数中位数 :6千元千元(第第50、51人
4、都是人都是6000元元).众数众数 : 5千元千元(5千元千元的人数最多)的人数最多).公司高层对外宣传公司高层对外宣传.工会干部为职工争取福利工会干部为职工争取福利.税务部门调查个人所得税的起征点税务部门调查个人所得税的起征点.3个代表数的特点个代表数的特点平均数平均数 平等利用每一数据的信息,反映数据整体平等利用每一数据的信息,反映数据整体 大小大小;有方便的计算公式,应用最广有方便的计算公式,应用最广.受少数特大或特小数据影响,受少数特大或特小数据影响,会会失去代表性失去代表性.中位数中位数 只取决于按大小排列的位置,不受特大或只取决于按大小排列的位置,不受特大或 特小数据影响,能反映数
5、据的中等水平特小数据影响,能反映数据的中等水平.未未充分利用信息充分利用信息; 数据量大时计算较繁数据量大时计算较繁.众数众数 常作为选择常作为选择 “最多最多” , “最佳最佳”的依据的依据.未未充分利用信息充分利用信息; “并列第一并列第一”时时无法无法做做唯一抉择唯一抉择.如何选用代表数与与10年前同龄男生身高作对比年前同龄男生身高作对比, 估计增长量估计增长量.数据:数据:某高三年级全部男同学的身高某高三年级全部男同学的身高.定制校服尺寸的参考定制校服尺寸的参考.数据:数据:生产小组生产小组15个工人每人一天生产零件的数目个工人每人一天生产零件的数目与其他小组比较,作为评选先进的参考与
6、其他小组比较,作为评选先进的参考.制定标准日产量,使多数人能超产制定标准日产量,使多数人能超产.平均数平均数众数众数平均数平均数中位数中位数数据数据:班上班上20名学生一次考试成绩名学生一次考试成绩:15人人80分,分, 2人人90分,分,1人人10分,分,1人人15分,分,小李小李75分分.如何选用代表数与其他班级或本班以前成绩对比与其他班级或本班以前成绩对比.小李衡量自己小李衡量自己的的标准标准.其他代表数其他代表数平均分平均分74分分中位数中位数80分分高于平均分高于平均分! 倒数第倒数第3名名! 跳水比赛的评分标准跳水比赛的评分标准7位裁判位裁判的的分数去掉一个最高分和一个最低分,剩下
7、分数去掉一个最高分和一个最低分,剩下5个分数个分数的的总和乘以动作难度系数,为最后得分总和乘以动作难度系数,为最后得分.中位数和平均数的结合中位数和平均数的结合哪种解读更有道理哪种解读更有道理 某股份制公司某股份制公司50名职工和名职工和5位股东近位股东近3年的利润分配年的利润分配年份年份职工薪金总额职工薪金总额/万元万元股东分红总额股东分红总额/万元万元201130010020124001502013500200职工薪金职工薪金股东分红股东分红5004003002001002011 2012 2013a. 总额总额/万元万元 职工薪金职工薪金股东分红股东分红200 150 1002011 2
8、012 2013b. 增长率增长率/% 职工职工薪金薪金股东股东分红分红403020102011 2012 2013c.人人均均/(万元万元/人人) 公司老板:公司老板:职职工薪金比股东工薪金比股东分红增长得更分红增长得更多、更快,可多、更快,可谓有福同享谓有福同享.哪种解读更有道理哪种解读更有道理 工会负责人工会负责人:2013年职工薪金年职工薪金增长到增长到167%,股东分红增长到股东分红增长到200%,应更顾,应更顾及职工利益及职工利益.职工职工:与股东与股东人人均分红相比,均分红相比,职工职工人人均薪金均薪金增长得太慢,增长得太慢,呼吁大幅度增呼吁大幅度增加职工的薪金加职工的薪金.职工
9、薪金职工薪金股东分红股东分红5004003002001002011 2012 2013a. 总额总额/万元万元 职工薪金职工薪金股东分红股东分红200 150 1002011 2012 2013b. 增长率增长率/% 职工职工薪金薪金股东股东分红分红403020102011 2012 2013c.人人均均/(万元万元/人人) 哪种解读更有道理哪种解读更有道理 职工薪金职工薪金股东分红股东分红5004003002001002011 2012 2013 a. 总额总额/万元万元 职工薪金职工薪金股东分红股东分红200 150 1002011 2012 2013 b. 增长率增长率/%职工薪金均值职
10、工薪金均值股东分红均值股东分红均值403020102011 2012 2013 c. 均值均值/(万元万元/人人)k=0,1,2 (2011, 2012, 2013)xk职工薪金总额职工薪金总额, yk股东分红总额股东分红总额xk斜率斜率大于大于yk斜率斜率yk/y0斜率斜率大于大于xk/x0斜率斜率斜率相差斜率相差5倍倍职工薪金职工薪金增长快增长快股东分红股东分红增长快增长快股东股东人人均分红增长快均分红增长快数值随时间的变化可以用绝对增长数值随时间的变化可以用绝对增长或或相对增长相对增长表示表示, 二者说明二者说明同同一问题的不同侧面一问题的不同侧面.小结与评注小结与评注同样的一组数据可以
11、有同样的一组数据可以有不同的表述和解读不同的表述和解读办法办法,取决于取决于要说明什么问题要说明什么问题,达到什么目的达到什么目的.3个常用的代表数个常用的代表数:平均数、中位数和众数平均数、中位数和众数,具有具有各自各自的特点和用法的特点和用法.举重举重1.2 评选举重总冠军评选举重总冠军依靠运动员全身力量完成依靠运动员全身力量完成的体育项目的体育项目按照运动员体重划分按照运动员体重划分级别级别进行比赛进行比赛.赛艇赛艇拳击拳击摔跤摔跤每个级别都每个级别都有有一个一个冠军冠军.能评选出一个能评选出一个“总冠军总冠军”吗?吗?56kg, 62kg, 69kg, 77kg, 85kg, 94kg
12、, 105kg, 105kg以上以上. 1.2 评选举重总冠军评选举重总冠军男子举重比赛按运动员体重男子举重比赛按运动员体重 (上限上限)分为分为8个级别个级别:问题问题每个级别设每个级别设3个项目:抓举、挺举个项目:抓举、挺举、总成绩总成绩.每个级别每个级别、每个项目都产生、每个项目都产生一个冠军一个冠军.同一项目同一项目 (如抓举如抓举) 的的8个冠军个冠军中中怎样怎样选出选出“总冠军总冠军”?不同级别冠军成绩不同级别冠军成绩按体重按体重 “折合折合”到到某个标准级别,某个标准级别,比较比较折合成绩折合成绩,选出最高的作为,选出最高的作为总冠军总冠军.1.2 评选举重总冠军评选举重总冠军问
13、题分析问题分析比赛比赛产生产生各级别冠军成绩的各级别冠军成绩的实际值实际值建立体重与举重成绩的建立体重与举重成绩的数学模型数学模型计算各级别冠军举重成绩的计算各级别冠军举重成绩的理论值理论值计算实际值与理论值的计算实际值与理论值的比值比值构造一个简单、合适的指标作为构造一个简单、合适的指标作为折合成绩折合成绩各级别冠军折合成绩最各级别冠军折合成绩最高的高的为为总冠军总冠军数据收集数据收集利用举重比赛的利用举重比赛的世界纪录世界纪录建立建立数学模型数学模型.62 kg级级抓举抓举153 kg石智勇(中国)石智勇(中国)2002.6.28世界大学生举重锦标赛世界大学生举重锦标赛挺举挺举182 kg
14、乐茂盛(中国)乐茂盛(中国)2002.10.2第第14届亚洲运动会届亚洲运动会总成绩总成绩 327 kg金恩国(朝鲜)金恩国(朝鲜)2012.7.31伦敦第伦敦第30届奥运会届奥运会69 kg级级抓举抓举165 kg马尔科夫(保加利亚)马尔科夫(保加利亚)2000.9.20悉尼第悉尼第27届奥运会届奥运会挺举挺举198 kg廖辉廖辉(中国)(中国)2013.10.23 2013年世界举重锦标赛年世界举重锦标赛总成绩总成绩 358 kg廖辉(中国)廖辉(中国)2013.10.23 2013年世界举重锦标赛年世界举重锦标赛级别级别项目项目纪录纪录纪录保持者纪录保持者日期日期比赛名称比赛名称多年积累
15、下来的世界记录与某一次比赛成绩相比,多年积累下来的世界记录与某一次比赛成绩相比,更能避免偶然性更能避免偶然性.不同级别成绩的差别基本上由运动员体重决定不同级别成绩的差别基本上由运动员体重决定.不掌握创造记录的运动员的实际体重不掌握创造记录的运动员的实际体重.因为因为体重越大、举得越重,比赛时运动员体重体重越大、举得越重,比赛时运动员体重都会调整到非常接近各级别的上限都会调整到非常接近各级别的上限.105 kg以上级未设上限,只在其余以上级未设上限,只在其余7个级别中选总冠军个级别中选总冠军. 数据收集数据收集利用举重比赛的利用举重比赛的世界纪录世界纪录建立建立数学模型数学模型.用用每个级别的每
16、个级别的上限上限代表运动员的实际体重代表运动员的实际体重.世界记录与体重数据世界记录与体重数据的的散点图散点图数据分析数据分析大致呈线性关系大致呈线性关系大级别成绩的增加变慢大级别成绩的增加变慢线性关系有所改进线性关系有所改进幂函数幂函数(幂次小于幂次小于1)可能更合适可能更合适556065707580859095100105110100150200250300350400450 x 抓举+ 挺举* 总成绩世世界界记记录录体重体重普通坐标普通坐标1.71.751.81.851.91.9522.12.22.32.42.52.62.7x 抓举+ 挺举* 总成绩世世界界记记录录体重体重对数坐标对数坐
17、标建立举重建立举重总成绩总成绩y与与运动员运动员体重体重w的的数学数学模型模型模型模型建立建立模型模型1 线性模型线性模型 最小二乘法编程计算最小二乘法编程计算 k = 2.7039-60k 430/160= 2.69估算估算线性模型线性模型-60-40-20020406080100120050100150200250300350400450wyyw430160模型模型2 幂函数模型幂函数模型 运动生理学运动生理学确定幂函数的幂次确定幂函数的幂次举重举重总成绩总成绩y与与运动员运动员体重体重w的模型的模型s 肌肉截面积肌肉截面积l 身体尺寸身体尺寸最小二乘法编程计算最小二乘法编程计算 k =
18、20.4711幂函数模型幂函数模型 14151617181920212223300320340360380400420440w2/3 yyw2/3模型模型3 幂函数改进模型幂函数改进模型 举重举重总成绩总成绩y与与运动员运动员体重体重w的模型的模型最小二乘法最小二乘法举重过程中力量的损失及身体尺寸的变化举重过程中力量的损失及身体尺寸的变化.50名顶尖运动员成绩名顶尖运动员成绩的的统计分析统计分析幂函数幂函数改进改进模型模型 非肌肉部分举重举重总成绩总成绩y与与运动员运动员体重体重w的模型的模型5060708090100110300350400450线性模型线性模型506070809010011
19、0250300350400450500幂函数模型幂函数模型 5060708090100110250300350400450幂函数幂函数改进改进模型模型 级别级别总成绩纪录总成绩纪录线性模型线性模型幂函数模型幂函数模型幂函数改进模型幂函数改进模型56 kg级级305 kg313.6486 (-2.76%)299.6405 (1.79%)298.2689 (2.26%)62 kg级级327 kg329.8718 (-0.87%)320.6784 (1.97%)324.3317 (0.82%)69 kg级级358 kg348.7988 (2.64%)344.3827 (3.95%)350.2363
20、(2.22%)77 kg级级379 kg370.4298 (2.58%)370.5121 (2.56%)375.7952 (1.12%)两个幂函数模型比线性模型改进两个幂函数模型比线性模型改进不大不大. .1.71% 2.32% 1.47%总平均误差总平均误差评选总冠军评选总冠军wi (i=1, 2, , 7) 从轻到重从轻到重7个级别个级别的的体重体重(上限上限)线性模型线性模型幂函数模型幂函数模型 幂函数幂函数改进改进模型模型 各级别冠军的各级别冠军的理论成绩理论成绩yi 一次比赛中各级别冠军的一次比赛中各级别冠军的实际成绩实际成绩级别级别i冠军在评选总冠军中冠军在评选总冠军中实力实力以以
21、线性模线性模型型为例为例评选总冠军评选总冠军任取级别任取级别i=4 (w4=77kg级级)为为标准标准使使 z4=y4与与实力实力成正比的成正比的指标指标按按7个级别冠军的折合成绩排名,第一者为个级别冠军的折合成绩排名,第一者为总冠军总冠军. 将体重折合成将体重折合成77kg级后级别级后级别i冠军的实际成绩冠军的实际成绩.折合成绩折合成绩模型中系数模型中系数k随世界纪录的刷新而改变随世界纪录的刷新而改变.评选总冠军评选总冠军折合成绩折合成绩线性模型线性模型幂函数模型幂函数模型 幂函数幂函数改进改进模型模型 评选评选2008年北京奥运会男子举重比赛年北京奥运会男子举重比赛总冠军总冠军 级别级别
22、冠军获得者冠军获得者总成绩总成绩折合成绩及名次折合成绩及名次线性模型线性模型幂函数模型幂函数模型幂函数改进模型幂函数改进模型56 kg级级龙清泉(中)龙清泉(中)292 kg344.8621(7) 361.0644 (5) 367.8969 (4)62 kg级级张湘祥(中)张湘祥(中)319 kg358.2213(6) 368.5729 (3) 369.6175 (3)69 kg级级廖辉(中)廖辉(中)348 kg369.5814(2) 374.4039 (1) 373.3957 (1)77 kg级级史才秀(韩)史才秀(韩)366 kg366.0000(3) 366.0000 (4) 366.
23、0000 (6)85 kg级级陆永(中)陆永(中)394 kg372.2621(1) 368.8735 (2) 371.7543 (2)94 kg级级伊利亚(哈)伊利亚(哈)406 kg361.1818(5) 355.4413 (6) 362.5143 (7)105 kg级级阿拉姆诺夫(白)阿拉姆诺夫(白)436 kg362.0121(4) 354.5581 (7) 367.7366 (5)69 kg级级廖辉(中)廖辉(中)348 kg369.5814(2) 374.4039 (1) 373.3957 (1)3个模型中都个模型中都只有一个只有一个以因子形式出现的以因子形式出现的系数系数k,可以
24、在可以在构造折合成绩构造折合成绩时消去时消去,便于评选便于评选总冠军总冠军.小结与评注小结与评注举重成绩与体重举重成绩与体重关系关系的数学模型的数学模型是评选总冠军是评选总冠军方法的基础方法的基础.通过世界纪录通过世界纪录数据观察数据观察和和机理分析机理分析分别分别建立建立线性模型、幂函数模型和幂函数改进模型线性模型、幂函数模型和幂函数改进模型.1.3 估计出租车的总数估计出租车的总数一些人喜欢一些人喜欢记驶过身旁记驶过身旁的的汽车汽车牌牌号号.两难境地的决策两难境地的决策与朋友打赌的与朋友打赌的“骰子骰子”共识共识:出现出现任何号码汽车的任何号码汽车的机会机会相同相同.随意记下驶过的随意记下
25、驶过的10辆出租车牌号:辆出租车牌号:0421, 0128, 0702, 0410, 0598, 0674, 0712, 0529, 0867, 0312估计这座城市出租车的总数估计这座城市出租车的总数.出租车牌号从某一个数字出租车牌号从某一个数字0101按顺序发放按顺序发放.1.3 估计出租车的总数估计出租车的总数问题分析问题分析0 x0 x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x10个号码从小到大重新排列个号码从小到大重新排列. x0, x 区间内全部整数值区间内全部整数值 总体总体x1, x2, , x10 总体的一个总体的一个样本样本根据样本和根据样本和x0对总体
展开阅读全文