使用EXCEL进行数据分析教材课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《使用EXCEL进行数据分析教材课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 使用 EXCEL 进行 数据 分析 教材 课件
- 资源描述:
-
1、数 据信 息统计分析(报表)数据挖掘(专业工具和算法)掌握EXCEL的常用统计函数;熟悉使用EXCEL透视表进行数据分析和分类汇总;了解使用EXCEL进行数据分析版本:EXCEL 2000 完全安装典型安装最小化安装常用统计函数常用统计函数数据透视分析数据透视分析图表图表数据透视表数据透视表( (图图) )数据分析数据分析描述统计描述统计检验分析检验分析z- z-检验:双样本平均检验:双样本平均差检验差检验 F-F-检验:双样本方差检验:双样本方差 t- t-检验:双样本等方差检验:双样本等方差假设假设 t- t-检验:双样本异方差检验:双样本异方差假设假设 t- t-检验:平均值的成对检验:
2、平均值的成对二样本分析二样本分析 方差分析方差分析单因素方差分析单因素方差分析 无重复双因素分析无重复双因素分析 可重复双因素分析可重复双因素分析 相关系数与回归分析相关系数与回归分析 协方差协方差 相关系数相关系数 回归分析回归分析 一般统计函数:用来统计给定某个区域的数据的平均值、最大值或者最小值等 数理统计函数:对数据进行相关的概率分 布的统计,进行回归分析等。 某班级的成绩表,如下图所示,其中有两个学生的该门课程缺考,需要分别用到AVERAGE和和AVERAGEA函数函数来计算两个不同的平均值。 在单元格D3中输入公式“=AVERAGE(B2:B9)”,可以计算参加考试学生的平均成绩,
3、函数AVERAGE在计算时对缺考的两个学生的成绩自动认为是0。 在单元格D6中输入公式“=AVERAGEA(B2:B9)”,可以计算全体学生的平均成绩,对缺考的学生成绩,AVERAGE函数将自动忽略。 某班级的成绩表,如下图所示。需要用到FREQUENCY函数来来统计各个分数段的分布学生人数。 功能:统计指定单元格区域中数据的频率分布频率分布。由于函数 FREQUENCY 返回一个数组,必须以数组公式的形式输入。 语法形式: FREQUENCY(data_array,bins_array) data_array为一数组或对一组数值的引用,用来计算频率。如果 data_array 中不包含任何数
4、值,函数 FREQUENCY 返回零数组。 bins_array为一数组或对数组区域的引用,设定对 data_array 进行频率计算的分段点。如果 bins_array 中不包含任何数值,函数 FREQUENCY 返回 data_array 元素的数目。 在E4E7单元格输入进行频率计算的分段点59,70,80,90; 选中F4F8单元格,作为输出统计结果的单元格; 在公式栏输入“=FREQUENCY(B2:B11,E4:E8)”,然后按下“CtrlShiftEnter” 组合键锁定数组公式即可。 输入数组公式首先必须选择用来存放结果的单元格区域(可以是一个单元格),在编辑栏输入公式,然后按
5、CtrlShiftEnter组合键锁定数组公式,Excel将在公式两边自动加上花括号“ ”。 功能是单元格区域中的两个数列之间的相关系数。 表达式为CORREL(arrnyl,arrny2)。arrnyl和arrny2表示的都是两个数据列CORREL函数可以用来分辨两种属性之间的关系。 某医生为了探讨缺碘地区母婴TSH水平关系,应用免疫放射分析测定了160名孕妇(孕周1517w)及分娩时脐带血TSH水平(mU/L),现随机抽取10对数据如图2-8所示,试求脐带血TSH水平对母血TSH水平的相关系数。选中结果输出单元格B14;在公式栏输入“=CORREL(C3:C12,B3:B12)”,点击公式
6、栏 按钮;在单元格A14输入“相关系数”即可。 某地120名7岁男童的身高,已知身高均数为119.41cm,标准差为4.38cm。试估计该地7岁男童身高在110cm以下者的概率,身高在110cm120cm之间的概率。如果要制定一个健康标准使得90的7岁男童符合健康标准,那么健康标准应该定多少? NORMDIST函数 功能:返回指定平均值和标准偏差的正态分布函数 表达式:NORMDIST(x,mean,standard_dev,cumulative)。 x是需要计算其分布的数值; mean是分布的算术平均值: standard_dev表示分布的标准偏差; cumulative是一逻辑值,指明函数
7、的形式。如果cumulative为TRUE,NORMDIST函数返回累积分布函数,否则返回概率密度函数。此函数在统计方面应用范围广泛。 NORMINV函数 功能:返回指定平均值和标准偏差的正态累积分布函数的反函数。 表达式:NORMINV(probability,mean,standard_dev) probability是正态分布的概率; mean是分布的算术平均值; standard_dev表示分布的标准偏差。 某地120名7岁男童的身高,已知身高均数为119.41cm,标准差为4.38cm, 如下图所示。试估计该地7岁男童身高在110cm以下者的概率,身高在110cm120cm之间的概率
8、。如果要制定一个健康标准使得90的7岁男童符合健康标准,那么健康标准应该定多少? 在单元格C5中输入公式“=NORMDIST(110,B2,B3,TRUE)”,计算身高在110cm以下者的概率为0.015841; 在单元格C6中输入公式“=NORMDIST(120,B2,B3,TRUE)-C5”,计算成功身高在110cm120cm之间的概率为0.537736; 在单元格C7中输入公式“=NORMINV(0.9,B2,B3)”,计算使90的7岁男童身高达标的健康标准为125.0232cm。=NORMDIST(110,B1,B2,TRUE)=NORMDIST(120,B1,B2,TRUE)-C5=
9、NORMINV(0.9,B2,B3)概念:工作表数据的图形化表概念:工作表数据的图形化表示、清晰易懂、形象直观。示、清晰易懂、形象直观。 种类:种类:1414种图表类型,包含了种图表类型,包含了若干种不同的图表子类型。在若干种不同的图表子类型。在处理医药数据中常用的几类图处理医药数据中常用的几类图表:表: 1、折线图、折线图 2、柱形图、柱形图 3、饼图、饼图 4、XY散点图散点图 5、条形图、条形图 6、雷达图、雷达图 柱形图是Excel 的默认图表类型,也是用来处理医药数据常用的图表类型之一。通常把每个数据点显示为一个垂直柱体,其高度对应于数值,用来显示一段时期内数据的变化或描述各项之间的
10、比较关系。分类项水平组织,数值垂直组织,即强调数据随时间的变化。 柱形图共有7 种子图表类型:簇状柱形图、堆积簇状柱形图、堆积柱形图、百分比堆积柱形图、三维簇状柱形图、柱形图、百分比堆积柱形图、三维簇状柱形图、三维堆积柱形图、三维百分比堆积柱形图和三维三维堆积柱形图、三维百分比堆积柱形图和三维柱形图。柱形图。 在药物实验中的应用,现有药物止血效果实验采集的数据表,A列为实验对照组和七种不同的止血药物,分别做了六次药物止血实验,得到六组凝血时间实验数据(单位:秒)。通过柱形图可以形象地描绘了这七种不同药物止血功能的差异。 返回返回返回返回返回返回(1)选择图表类型,单击选择图表类型,单击“插入插
11、入”|“图表图表”。 (2)选择图表源数据。选择图表源数据。 (3)设置标题和图例。设置标题和图例。 (4)确定图表位置。确定图表位置。 (5)编辑图表区。用户需要编辑的内容包括颜编辑图表区。用户需要编辑的内容包括颜色、填充和边框等色、填充和边框等 。(6)编辑数据轴、分类轴。编辑数据轴、分类轴。 雷达图是由一个中心向四周射出多条数雷达图是由一个中心向四周射出多条数值坐标轴,每个指标都拥有自己的数值坐值坐标轴,每个指标都拥有自己的数值坐标轴,把同一数据序列的值用折线连接起标轴,把同一数据序列的值用折线连接起来而形成。雷达图用来比较若干个数据序来而形成。雷达图用来比较若干个数据序列指标的总体情况
展开阅读全文