3.3.1 数据分析 ppt课件(39张ppt)+教案+练习+任务单-2023新人教中图版《高中信息技术》必修第一册.rar
自主学习任务单学习指南1.课题名称:数据分析2.学习目标:了解数据分析的作用,掌握三种数据分析方法,根据需求选择恰当的方法进行数据分析。3.本节知识点思维导图:学习任务1.课前测验:李明老师是一名高一班主任。全班 45 个学生每次考试的成绩他都会细心保存下来。本学期末,李明老师打算对学生的 6 门成绩做数据分析。请帮他一起想一想该如何整理数据吧!需求 1:分析出全班每个同学的成绩概况,可以采用什么方法?需求 2:分析出每位同学学习是否有进步,可以采用什么方法?需求 3:分析出每位同学的成绩弱项科目,可以采用什么方法?金山银山不如绿水青山,最近这些年,国家落实严控环境污染、修复生态环境等政策。随着政策落实,你所在家乡的空气质量是否有所改善?上节课,我们对空气质量原始数据做了整理。下面,我们要对之前整理的数据进行数据分析。任务 1:【目标】计算一天中 24 小时的空气质量指数(AQI)的平均值。【实践】下载 课堂活动 1(每日 AQI 平均值).py,和上节课生成的补全数据.csv 放在同目录。根据自己选择的城市,修改代码中城市名和文件名。运行程序,观察生成的结果文件 北京_AQI 每日平均值.csv。【回顾】本任务中,用到的数据分析方法是 。任务 2:【目标】为对比空气质量为优的天数在过去几年间的变化趋势,统计出每年度空气质量指数(AQI)为优的天数。【实践】下载“课堂活动 2(统计 AQI 为优数据).py”文件,和活动 1 生成的 AQI 每日平均值文件放在同目录。(注意:根据自己选择的城市,修改代码中城市名和文件名。)【回顾】本任务中,用到的数据分析方法是 。任务 3:【目标】了解某一年某城市的空气质量整体情况。呈现一年中空气质量为优、良好、轻度污染、中度污染、重度污染的天数占比比例。【实践】请下载“课堂活动 3(统计 AQI 各类数据)-待补全.py”文件,和活动 1 生成的 AQI 每日平均值文件放在同目录。参考微课讲解、pandas 使用说明和以下代码,补全代码,统计出所有 5 种空气质量情况的天数。补全后,请运行,查看生成的结果文件,观察数据。【回顾】本任务中,用到的数据分析方法是 。评测反思1.知识小测:结合微课资源,完成以下题目:数据分析的作用有:、。数据分析的三种方法:、2.学习评价:评价指标评价等级及分值得分优秀9-10 分良好5-8 分一般3-4 分自评互评老师评任务1(30%)任务2(30%)任务3(30%)任 务 单(10%)3.学习反思:(1)通过本节课的学习,你最大的收获是什么?(2)在实践操作环节,遇到了哪些困难?你是如何解决的?(3)关于本节课的学习内容,列出你最想进一步研究的内容。课程基本信息课题数据分析教科书书名:信息技术必修 1 数据与计算 出版社:人民教育出版社&中国地图出版社 出版日期:2019 年 6 月教学目标教学目标:了解数据分析的作用,掌握三种数据分析方法,根据需求选择恰当的方法进行数据分析。教学重点:三种数据分析方法:对比分析法、平均分析法、结构分析法。教学难点:三种数据分析方法。教学过程时间教学环节主要师生活动1分钟课堂引入新知讲授1、课堂引入1、课堂引入教师:首先,让我们一起来回顾一下之前本单元学习的内容。通过之前的学习,我们已经了解到数据处理的一般过程包含数据采集、数据整理、数据分析和数据呈现四个过程。我们已经学习了数据采集,数据整理,并通过体验活动体验了数据采集和数据整理的过程。这节课我们来了解第三个步骤数据分析。2、数据分析的概念2、数据分析的概念教师:那么什么是数据分析?数据分析是为了获取有价值的信息,使用适当的计算方法与工具对收集来的数据进行处理,提取有用信息,形成结论从而支持决策。那么数据分析到底有哪些有哪些作用?教师:首先,我们来看这张图,这是一张新冠肺炎疫情当前的数据。通过对数据的分析,我们可以发现当前我国现有确诊人数较少,疫情控制良好,主要风险来自境外输入。而且境外的疫情数据可以展示出目前全球疫情的严峻现状。故,数据分析可以帮助我们了解事物的现状。这就是数据分析的第一个作用。教师:我们来看这张图,这是一张我国新冠肺炎疫情的数据图表。通过表中的病死率和治愈率,我们可以清晰观察到治愈率的变化过程,在疫情初期是有一段由高到低,到了拐点后快速攀升的过程。这也符合我国疫情初期的实际情况。而致死率基本在低位徘徊,也显示出疫情的总体控制情况良好。显然图中的数据可以帮助我们了解疫情发展和变化的过程。故,数据分析的第二个作用是了解事物的发展历程,从而进一步探究问题产生的原因。教师:我们来看这张图,这是一张 2020 到 2050 哈尔滨老年人口占比的预测图。通过已有数据,可以预测出未来哈尔滨老年人口的占比会高达 38%,也就是极度老龄化。这就是数据分析的第三个作用预测事物未来走向3、数据分析3、数据分析教师:在了解了数据分析的作用后,我们一起来通过课堂活动一起体验下数据分析的过程吧!金山银山不如绿水青山,最近这些年,国家落实严控环境污染、修复生态环境等政策。随着政策落实,你所在家乡的空气质量是否有所改善?上节课,我们对空气质量数据做了整理,本节课,我们要分析之前整理好的数据,从而做出判断。【三种数据分析方法】3.1 课堂任务 13.1 课堂任务 1(平均分析法)(平均分析法)教师:依据现有数据,我们怎样判断一天的空气质量情况如何呢?请大家想一想。或许你和我想的一样呢。现有的数据是每小时的空气质量数据,我们可以计算一天 24 小时的 AQI 平均值,从而判断这一天的基本空气质量。在这里通过计算平均值来分析就是平均分析法。教师:什么是平均分析法呢?平均分析法是指运用计算平均数的方法来反映总体在一定时间、地点条件下某一数量特征的一般水平。多用于比较同类现象在不同地区、不同行业、不同类型单位等之间的差异程度,分析现象之间的依存关系;也可以对某一现象在不同时间的水平进行比较,以说明现象的发展规律及趋势。比如我们平均工资反应整体薪酬水平、平均年龄、平均身高、平均分等。教师:我们的这个课堂任务需要我们计算一天中 24 小时的 AQI 平均值,所以我们需要计算出每一天的 AQI 平均值。【DataFrame 筛选方法】df.loc条件,列索引号筛选数据教师:要计算出每一天的数据平均值,首先需要我们筛选数据。我们今天依然使用 pandas 这个库来对数据进行处理和分析。Pandas 库中的 DataFrame 如何筛选数据呢?我们还可以使用 df.loc df北京50,北京 实现筛选,方括号内,第一个参数是条件,第二个参数是要筛选显示的列索引号。【DataFrame 按日期筛选数据】df.loc日期索引列索引号筛选教师:我们还需要按照日期来筛选。那么在把日期列作为索引后,我课堂小结课后练习们可以直接使用 df.loc2014-05-13北京筛选出满足日期的数据。教师:下面,请各位同学下载课堂活动 1(每日 AQI 平均值).py 文件,和上节课生成的补全数据 csv 文件放在同目录。打开代码后,可以根据自己所在城市,修改代码中的城市名和文件名。教师:下面,我们一起来看看代码是如何实现计算每日 AQI 平均值的吧!第一句代码,依然是导入了 pandas 库。紧接着三句代码,我们定义了要操作的数据列索引,也就是城市名称,处理的文件名、处理后数据保存文件名。第五句,还是读取文件,只是这里我们多写了一个参数 index_col 把 date 这列作为了默认行索引。最后一句,就是返回该表的行索引组成的列表。而且去除重复值后的唯一值。教师:下面,我们定义新数据表的第一行数据,也就是未来的列索引。分别是 date,type,和城市名称。接着,我们是用 for 循环对刚才得到的不重复的日期进行挨个筛选和计算平均值。这里需要注意这句语句是筛选出指定日期的 AQI 数据,然后通过 mean()这个方法计算平均值,使用 round 函数将结果数据的精度修改为一位小数,最后把计算出的平均值赋值给变量 meandata。接着,我们组成新的一行数据,存放到临时新表 data 这个列表里。然后,循环完后,我们将拼凑好的新数据转换成一个 DataFrame 结构。赋值给变量 newdf,最后将这个表另存即可。教师:下面,请暂停视频,请大家运行 课堂活动 1 的程序文件,看看生成的结果文件吧!学生:完成体验活动。3.2 课堂任务 23.2 课堂任务 2对比分析法对比分析法教师:通过现有数据,我们如何分析现在的空气质量和过去比是否有了改善?大家想一想?学生:思考回答教师:嗯,我想或许有人会这么想,可以对比下空气质量为优的天数在过去几年的变化趋势。这里我们通过对比的方法来分析问题,用到了对比分析法!教师:什么是对比分析法?对比分析法也叫比较分析法,通常用于从数量上展示 和说明研究对象规模大小,水平高低等。对比分析法分为横向和纵向对比两大类。教师:同类数据在地区之间或部门之间对比是横向对比。如图,老龄化也是这几年一个很热门的话题,这张图表呈现了不同省份同一时期的老龄人口抚养比。通过对比,可以分析出不同省份的养老压力是不同的。显然,这也是一种横向对比分析。教师:同类数据在不同时期的对比,就是纵向对比。如图,我国的平均预期寿命在不同年份是不同的,显然随着时间推移,人均预期寿命是逐步提高的。这就是纵向对比。教师:我们回顾下要做的课堂任务,我们需要对比空气质量为优的天数在过去几年间的变化趋势。那么我们需要什么数据呢?学生:思考教师:我们需要每一年空气质量为优的天数,也就是 AQI 小于等于 50的天数。教师:下面我们一起来体验下统计过程。请下载课堂活动 2(统计 AQI为优数据).py 文件,和活动 1 生成的 AQI 每日平均值文件放在同目录。注意:根据自己选择的城市,修改代码中城市名和文件名。教师:让我们看看代码是如何实现统计的。首先还是导入库,接着定义了城市、处理文件、结果文件名称。这里多了而两个变量表示开始统计的年份和结束的年份。为什么要定义?因为我们发现采集的 2014 年和 2020 年数据不完整,不是全年的数据。所以,我们只统计 2015-2019 的年度数据。接着,我们打开文件。将 date 这一列转换为时间日期格式,转换后重新存回 df 这个表中。接着,我们设置行索引为 date 这列的数据。我们就可以根据这列的日期来筛选数据了。最后,我们新建结果数据,先建立第一行,也就是新表的列索引,就是我们熟悉的列标题。教师:接着,我们使用 for 循环依次对每年的数据进行统计。注意,我们使用年份来筛选出行,存到变量 datas。然后,我们在这些行组成的表中筛选出值200)。【DataFrame 多条件筛选数据】df.loc(条件 1)&(条件 2),列索引号筛选数据教师:上个任务中,我们使用单个条件筛选数据,这种方法在这里显然不行了。这里我们需要同时多条件筛选数据。如图所示,在表格软件中,筛选空气良好的数据,可以筛选北京这列 AQI 值满足大于 50且小于等于 100 的数据。这里使用 python 编程筛选多个条件的数据,怎么实现呢?我们可以用圆括号括起每个条件,然后用&符号连接组成复合条件。比如 df.loc(df北京=50)&(df北京=100),北京,这样就可以筛选出北京这一列符合两个条件的数据。教师:让我们打开代码,一起看看,前面几部分和任务 2 相同需要注意的是我们依然需要将 date 这列数据转换为时间日期格式,并且这列的数据设置为行索引。接着,我们依然拼凑出新表格的第一行数据,也就是未来表格的列标题,存放到 data 这个列表里。教师:接着,我们依然使用 for 循环,对数据按日期进行筛选。接着对筛选出的数据表,进行统计。注意,这一行统计出了 AQI=50的数据,使用 count 方法统计出筛选出的数据,也就是 AQI 为优的天数。下面,请暂停视频,请大家参考已有代码,自行补全缺失代码,将 5 种空气质量类别都统计出来。教师:最后依然是新数据表的构建和保存过程。请大家完成代码后,暂停视频,运行程序,查看生成的结果文件。教师:我猜想,大家都顺利完成了吧!通过统计,我们发现北京市的优质天逐年递增,良好天也逐年递增。轻度污染、中度污染、重度污染天数逐年减少。显然,北京的空气质量的确是改善了!3.4 活动总结3.4 活动总结教师:刚才的活动中,我们完成了三个小任务。1、计算每天的 AQI 平均值,2、统计出每年 AQI 为优的天数,3、统计出每年 AQI 各类情况的天数。这个过程分别使用了数据分析的三种方法平均分析法(利用求平均值来分析)、对比分析法(对比同类数据不同年份的情况)、结构分析法(通过各部分在整体中的分布进行分析)。4、课堂总结4、课堂总结5、课后作业5、课后作业教师:最后,还是给大家留一个课后作业。之前,各位同学针对身边同学们的课余时间安排做了调查问卷,并且对调查来的原始数据做了基本的数据整理。请利用整理好的数据,做出 1-2 项具体的分析。这里,请参考学习资料来完成 Python 编程实现的数据分析。教师:今天我们的课就学习到这里,谢谢大家!数据分析(第二十四课时)高中信息技术 回顾 数据处理一般过程数据采集数据采集数据整理数据整理数据分析数据分析数据呈现数据呈现高中信息技术1.数据分析概念数据分析数据分析是为了获取有价值的信息,使用适当的计算方法与工具对收集来的数据进行处理,提取有用信息,形成结论从而支持决策。高中信息技术2.数据分析作用:了解事物的现状高中信息技术2.数据分析作用:剖析事物的发展历程高中信息技术2.数据分析作用:预测事物未来走向高中信息技术3.数据分析 金山银山不如绿水青山,最近这些年,国家落实严控环境污染、修复生态环境等政策。随着政策落实,你所在家乡的空气质量是否有所改善?我们需要数据来做出分析。上节课,我们对空气质量原始数据做了整理。本节课,上节课,我们对空气质量原始数据做了整理。本节课,我们要分析之前整理的数据,从而做出判断。我们要分析之前整理的数据,从而做出判断。高中信息技术课堂任务1:计算每日AQI平均值怎样判断一天的空气质量如何?计算一天中24小时的空气质量指数(AQI)的平均值。平均分析法平均分析法。高中信息技术平均分析法:平均分析法:是指运用计算平均数计算平均数的方法来反映总体在一定时间、地点条件下某一数量特征的一般水平。多用于比较同类现象同类现象在不同地区、不同行业、不同类型单位等之间的差异程度差异程度,分析现象之间的依存关系;也可以对某一现象某一现象在不同时间的水平不同时间的水平进行比较,以说明现象的发展规律及趋势。平均工资、平均年龄、平均身高、平均分平均工资、平均年龄、平均身高、平均分平均分析法高中信息技术课堂任务1:计算每日AQI平均值所需数据所需数据:每天空气质量指数的平均值计算一天中24小时的空气质量指数(AQI)的平均值高中信息技术DataFrame筛选用法DataFrameDataFrame筛选数据筛选数据df.locdf.loc条件,列索引号条件,列索引号 筛选数据筛选数据df.loc dfdf.loc df北京北京50,50,北京北京 筛选北京这一列值小于50的数据高中信息技术DataFrame按日期筛选DataFrameDataFrame按日期筛选数据按日期筛选数据df.locdf.loc日期索引日期索引列索引号列索引号 筛选筛选df.loc2014-05-13df.loc2014-05-13北京北京 筛选2014-05-13的行,显示出北京这列的数据高中信息技术课堂任务1:计算每日AQI平均值下载 课堂活动课堂活动1 1(每日(每日AQIAQI平均值)平均值).py.py 文件,和上节课生成的补全数据补全数据.csv.csv放在同目录。根据自己选择的城市,修改代码中代码中城市名和文件名。高中信息技术课堂任务1:计算每日AQI平均值高中信息技术课堂任务1:计算每日AQI平均值高中信息技术课堂任务1:计算每日AQI平均值暂停视频暂停视频运行 课堂活动课堂活动1 1(每日(每日AQIAQI平均值)平均值).py.py 文件观察同目录下的结果数据文件 高中信息技术课堂任务1:计算每日AQI平均值高中信息技术课堂任务2:统计每年AQI为优的天数怎样判断现在的空气质量和过去比是否有了改善?可以对比空气质量为优的天数在过去几年间的变化趋势这里用到了对比分析法对比分析法高中信息技术对比分析法:对比分析法:也叫比较分析法,通常用于从数量上展示从数量上展示 和说明研究对象规模大小,水平高低研究对象规模大小,水平高低等。对比分析法分为横向和纵向对比横向和纵向对比两大类。对比分析法高中信息技术对比分析法横向对比高中信息技术对比分析法纵向对比高中信息技术课堂任务2:统计每年AQI为优的天数所需数据:每年空气质量为优的天数(AQI200)的天数。需求:呈现一年中空气质量为优、良好、轻度污染、中度污染、呈现一年中空气质量为优、良好、轻度污染、中度污染、重度污染的天数占比比例重度污染的天数占比比例。高中信息技术DataFrame多条件筛选用法DataFrameDataFrame多条件筛选数据多条件筛选数据df.loc(df.loc(条件条件1)&(1)&(条件条件2 2),),列索引号列索引号 筛选数据筛选数据df.loc(dfdf.loc(df北京北京=50)&(df=50)&(df北京北京=100),=100),北京北京 筛选北京这一列值在50-100之间的数据高中信息技术课堂任务3:统计每年AQI各类情况的天数下载 课堂活动课堂活动3 3(统计统计AQIAQI各类数据各类数据)-待补全待补全.py.py 文件,和活动1生成的AQIAQI每日平均值文件每日平均值文件放在同目录。注意:可根据自己选择的城市,修改代码中城市名和文件名。高中信息技术课堂任务3:统计每年AQI各类情况的天数高中信息技术课堂任务3:统计每年AQI各类情况的天数请补全代码,将5种空气质量类别都统计出来。高中信息技术课堂任务3:统计每年AQI各类情况的天数请补全代码后,暂停视频暂停视频,运行程序,查看生成的结果文件。高中信息技术课堂任务3:统计每年AQI各类情况的天数同学们,你是否成功统计出了2015到2019年的各类空气质量天数?高中信息技术课堂活动总结1、计算每日AQI平均值2、统计每年AQI为优的天数3、统计每年AQI各类情况的天数平均分析法平均分析法对比分析法对比分析法结构分析法结构分析法高中信息技术4.课堂小结数据分析作用了解事物现状剖析事物发展历程预测事物未来走向方法对比分析法平均分析法结构分析法高中信息技术5.课后作业 各位同学针对身边同学们的课余时间安排做了调查问卷,并且对采集的原始数据做了数据整理。请利用整理好的数据,做出请利用整理好的数据,做出1-21-2项具体的分项具体的分析。析。(比如高中生的课余时间都在做什么?游戏娱乐的时间占比如何?比如高中生的课余时间都在做什么?游戏娱乐的时间占比如何?学业压力是否过大?运动方式有哪些?运动时间有多久?学业压力是否过大?运动方式有哪些?运动时间有多久?)请参考学习资料中的请参考学习资料中的PandasPandas使用说明和示例,完成利用使用说明和示例,完成利用PythonPython实现数据分析。实现数据分析。课程基本信息课题数据分析教科书书名:信息技术必修 1 数据与计算 出版社:人民教育出版社&中国地图出版社 出版日期:2019 年 6 月学生信息姓名学校班级学号课后练习各位同学针对身边同学们的课余时间安排做了调查问卷,并且对采集的原始数据做了数据整理。请利用整理好的数据,做出 1-2 项具体的分析。(比如高中生的课余时间都在做什么?游戏娱乐的时间占比如何?学业压力是否过大?运动方式有哪些?运动时间有多久?)请参考学习资料中的 Pandas 使用说明和示例,完成利用 Python 实现数据分析。
收藏
编号:4901626
类型:共享资源
大小:2.77MB
格式:RAR
上传时间:2023-01-23
2
文币
- 资源描述:
-
自主学习任务单学习指南1.课题名称:数据分析2.学习目标:了解数据分析的作用,掌握三种数据分析方法,根据需求选择恰当的方法进行数据分析。3.本节知识点思维导图:学习任务1.课前测验:李明老师是一名高一班主任。全班 45 个学生每次考试的成绩他都会细心保存下来。本学期末,李明老师打算对学生的 6 门成绩做数据分析。请帮他一起想一想该如何整理数据吧!需求 1:分析出全班每个同学的成绩概况,可以采用什么方法?需求 2:分析出每位同学学习是否有进步,可以采用什么方法?需求 3:分析出每位同学的成绩弱项科目,可以采用什么方法?金山银山不如绿水青山,最近这些年,国家落实严控环境污染、修复生态环境等政策。随着政策落实,你所在家乡的空气质量是否有所改善?上节课,我们对空气质量原始数据做了整理。下面,我们要对之前整理的数据进行数据分析。任务 1:【目标】计算一天中 24 小时的空气质量指数(AQI)的平均值。【实践】下载 课堂活动 1(每日 AQI 平均值).py,和上节课生成的补全数据.csv 放在同目录。根据自己选择的城市,修改代码中城市名和文件名。运行程序,观察生成的结果文件 北京_AQI 每日平均值.csv。【回顾】本任务中,用到的数据分析方法是 。任务 2:【目标】为对比空气质量为优的天数在过去几年间的变化趋势,统计出每年度空气质量指数(AQI)为优的天数。【实践】下载“课堂活动 2(统计 AQI 为优数据).py”文件,和活动 1 生成的 AQI 每日平均值文件放在同目录。(注意:根据自己选择的城市,修改代码中城市名和文件名。)【回顾】本任务中,用到的数据分析方法是 。任务 3:【目标】了解某一年某城市的空气质量整体情况。呈现一年中空气质量为优、良好、轻度污染、中度污染、重度污染的天数占比比例。【实践】请下载“课堂活动 3(统计 AQI 各类数据)-待补全.py”文件,和活动 1 生成的 AQI 每日平均值文件放在同目录。参考微课讲解、pandas 使用说明和以下代码,补全代码,统计出所有 5 种空气质量情况的天数。补全后,请运行,查看生成的结果文件,观察数据。【回顾】本任务中,用到的数据分析方法是 。评测反思1.知识小测:结合微课资源,完成以下题目:数据分析的作用有:、。数据分析的三种方法:、2.学习评价:评价指标评价等级及分值得分优秀9-10 分良好5-8 分一般3-4 分自评互评老师评任务1(30%)任务2(30%)任务3(30%)任 务 单(10%)3.学习反思:(1)通过本节课的学习,你最大的收获是什么?(2)在实践操作环节,遇到了哪些困难?你是如何解决的?(3)关于本节课的学习内容,列出你最想进一步研究的内容。课程基本信息课题数据分析教科书书名:信息技术必修 1 数据与计算 出版社:人民教育出版社&中国地图出版社 出版日期:2019 年 6 月教学目标教学目标:了解数据分析的作用,掌握三种数据分析方法,根据需求选择恰当的方法进行数据分析。教学重点:三种数据分析方法:对比分析法、平均分析法、结构分析法。教学难点:三种数据分析方法。教学过程时间教学环节主要师生活动1分钟课堂引入新知讲授1、课堂引入1、课堂引入教师:首先,让我们一起来回顾一下之前本单元学习的内容。通过之前的学习,我们已经了解到数据处理的一般过程包含数据采集、数据整理、数据分析和数据呈现四个过程。我们已经学习了数据采集,数据整理,并通过体验活动体验了数据采集和数据整理的过程。这节课我们来了解第三个步骤数据分析。2、数据分析的概念2、数据分析的概念教师:那么什么是数据分析?数据分析是为了获取有价值的信息,使用适当的计算方法与工具对收集来的数据进行处理,提取有用信息,形成结论从而支持决策。那么数据分析到底有哪些有哪些作用?教师:首先,我们来看这张图,这是一张新冠肺炎疫情当前的数据。通过对数据的分析,我们可以发现当前我国现有确诊人数较少,疫情控制良好,主要风险来自境外输入。而且境外的疫情数据可以展示出目前全球疫情的严峻现状。故,数据分析可以帮助我们了解事物的现状。这就是数据分析的第一个作用。教师:我们来看这张图,这是一张我国新冠肺炎疫情的数据图表。通过表中的病死率和治愈率,我们可以清晰观察到治愈率的变化过程,在疫情初期是有一段由高到低,到了拐点后快速攀升的过程。这也符合我国疫情初期的实际情况。而致死率基本在低位徘徊,也显示出疫情的总体控制情况良好。显然图中的数据可以帮助我们了解疫情发展和变化的过程。故,数据分析的第二个作用是了解事物的发展历程,从而进一步探究问题产生的原因。教师:我们来看这张图,这是一张 2020 到 2050 哈尔滨老年人口占比的预测图。通过已有数据,可以预测出未来哈尔滨老年人口的占比会高达 38%,也就是极度老龄化。这就是数据分析的第三个作用预测事物未来走向3、数据分析3、数据分析教师:在了解了数据分析的作用后,我们一起来通过课堂活动一起体验下数据分析的过程吧!金山银山不如绿水青山,最近这些年,国家落实严控环境污染、修复生态环境等政策。随着政策落实,你所在家乡的空气质量是否有所改善?上节课,我们对空气质量数据做了整理,本节课,我们要分析之前整理好的数据,从而做出判断。【三种数据分析方法】3.1 课堂任务 13.1 课堂任务 1(平均分析法)(平均分析法)教师:依据现有数据,我们怎样判断一天的空气质量情况如何呢?请大家想一想。或许你和我想的一样呢。现有的数据是每小时的空气质量数据,我们可以计算一天 24 小时的 AQI 平均值,从而判断这一天的基本空气质量。在这里通过计算平均值来分析就是平均分析法。教师:什么是平均分析法呢?平均分析法是指运用计算平均数的方法来反映总体在一定时间、地点条件下某一数量特征的一般水平。多用于比较同类现象在不同地区、不同行业、不同类型单位等之间的差异程度,分析现象之间的依存关系;也可以对某一现象在不同时间的水平进行比较,以说明现象的发展规律及趋势。比如我们平均工资反应整体薪酬水平、平均年龄、平均身高、平均分等。教师:我们的这个课堂任务需要我们计算一天中 24 小时的 AQI 平均值,所以我们需要计算出每一天的 AQI 平均值。【DataFrame 筛选方法】df.loc条件,列索引号筛选数据教师:要计算出每一天的数据平均值,首先需要我们筛选数据。我们今天依然使用 pandas 这个库来对数据进行处理和分析。Pandas 库中的 DataFrame 如何筛选数据呢?我们还可以使用 df.loc df北京50,北京 实现筛选,方括号内,第一个参数是条件,第二个参数是要筛选显示的列索引号。【DataFrame 按日期筛选数据】df.loc日期索引列索引号筛选教师:我们还需要按照日期来筛选。那么在把日期列作为索引后,我课堂小结课后练习们可以直接使用 df.loc2014-05-13北京筛选出满足日期的数据。教师:下面,请各位同学下载课堂活动 1(每日 AQI 平均值).py 文件,和上节课生成的补全数据 csv 文件放在同目录。打开代码后,可以根据自己所在城市,修改代码中的城市名和文件名。教师:下面,我们一起来看看代码是如何实现计算每日 AQI 平均值的吧!第一句代码,依然是导入了 pandas 库。紧接着三句代码,我们定义了要操作的数据列索引,也就是城市名称,处理的文件名、处理后数据保存文件名。第五句,还是读取文件,只是这里我们多写了一个参数 index_col 把 date 这列作为了默认行索引。最后一句,就是返回该表的行索引组成的列表。而且去除重复值后的唯一值。教师:下面,我们定义新数据表的第一行数据,也就是未来的列索引。分别是 date,type,和城市名称。接着,我们是用 for 循环对刚才得到的不重复的日期进行挨个筛选和计算平均值。这里需要注意这句语句是筛选出指定日期的 AQI 数据,然后通过 mean()这个方法计算平均值,使用 round 函数将结果数据的精度修改为一位小数,最后把计算出的平均值赋值给变量 meandata。接着,我们组成新的一行数据,存放到临时新表 data 这个列表里。然后,循环完后,我们将拼凑好的新数据转换成一个 DataFrame 结构。赋值给变量 newdf,最后将这个表另存即可。教师:下面,请暂停视频,请大家运行 课堂活动 1 的程序文件,看看生成的结果文件吧!学生:完成体验活动。3.2 课堂任务 23.2 课堂任务 2对比分析法对比分析法教师:通过现有数据,我们如何分析现在的空气质量和过去比是否有了改善?大家想一想?学生:思考回答教师:嗯,我想或许有人会这么想,可以对比下空气质量为优的天数在过去几年的变化趋势。这里我们通过对比的方法来分析问题,用到了对比分析法!教师:什么是对比分析法?对比分析法也叫比较分析法,通常用于从数量上展示 和说明研究对象规模大小,水平高低等。对比分析法分为横向和纵向对比两大类。教师:同类数据在地区之间或部门之间对比是横向对比。如图,老龄化也是这几年一个很热门的话题,这张图表呈现了不同省份同一时期的老龄人口抚养比。通过对比,可以分析出不同省份的养老压力是不同的。显然,这也是一种横向对比分析。教师:同类数据在不同时期的对比,就是纵向对比。如图,我国的平均预期寿命在不同年份是不同的,显然随着时间推移,人均预期寿命是逐步提高的。这就是纵向对比。教师:我们回顾下要做的课堂任务,我们需要对比空气质量为优的天数在过去几年间的变化趋势。那么我们需要什么数据呢?学生:思考教师:我们需要每一年空气质量为优的天数,也就是 AQI 小于等于 50的天数。教师:下面我们一起来体验下统计过程。请下载课堂活动 2(统计 AQI为优数据).py 文件,和活动 1 生成的 AQI 每日平均值文件放在同目录。注意:根据自己选择的城市,修改代码中城市名和文件名。教师:让我们看看代码是如何实现统计的。首先还是导入库,接着定义了城市、处理文件、结果文件名称。这里多了而两个变量表示开始统计的年份和结束的年份。为什么要定义?因为我们发现采集的 2014 年和 2020 年数据不完整,不是全年的数据。所以,我们只统计 2015-2019 的年度数据。接着,我们打开文件。将 date 这一列转换为时间日期格式,转换后重新存回 df 这个表中。接着,我们设置行索引为 date 这列的数据。我们就可以根据这列的日期来筛选数据了。最后,我们新建结果数据,先建立第一行,也就是新表的列索引,就是我们熟悉的列标题。教师:接着,我们使用 for 循环依次对每年的数据进行统计。注意,我们使用年份来筛选出行,存到变量 datas。然后,我们在这些行组成的表中筛选出值200)。【DataFrame 多条件筛选数据】df.loc(条件 1)&(条件 2),列索引号筛选数据教师:上个任务中,我们使用单个条件筛选数据,这种方法在这里显然不行了。这里我们需要同时多条件筛选数据。如图所示,在表格软件中,筛选空气良好的数据,可以筛选北京这列 AQI 值满足大于 50且小于等于 100 的数据。这里使用 python 编程筛选多个条件的数据,怎么实现呢?我们可以用圆括号括起每个条件,然后用&符号连接组成复合条件。比如 df.loc(df北京=50)&(df北京=100),北京,这样就可以筛选出北京这一列符合两个条件的数据。教师:让我们打开代码,一起看看,前面几部分和任务 2 相同需要注意的是我们依然需要将 date 这列数据转换为时间日期格式,并且这列的数据设置为行索引。接着,我们依然拼凑出新表格的第一行数据,也就是未来表格的列标题,存放到 data 这个列表里。教师:接着,我们依然使用 for 循环,对数据按日期进行筛选。接着对筛选出的数据表,进行统计。注意,这一行统计出了 AQI=50的数据,使用 count 方法统计出筛选出的数据,也就是 AQI 为优的天数。下面,请暂停视频,请大家参考已有代码,自行补全缺失代码,将 5 种空气质量类别都统计出来。教师:最后依然是新数据表的构建和保存过程。请大家完成代码后,暂停视频,运行程序,查看生成的结果文件。教师:我猜想,大家都顺利完成了吧!通过统计,我们发现北京市的优质天逐年递增,良好天也逐年递增。轻度污染、中度污染、重度污染天数逐年减少。显然,北京的空气质量的确是改善了!3.4 活动总结3.4 活动总结教师:刚才的活动中,我们完成了三个小任务。1、计算每天的 AQI 平均值,2、统计出每年 AQI 为优的天数,3、统计出每年 AQI 各类情况的天数。这个过程分别使用了数据分析的三种方法平均分析法(利用求平均值来分析)、对比分析法(对比同类数据不同年份的情况)、结构分析法(通过各部分在整体中的分布进行分析)。4、课堂总结4、课堂总结5、课后作业5、课后作业教师:最后,还是给大家留一个课后作业。之前,各位同学针对身边同学们的课余时间安排做了调查问卷,并且对调查来的原始数据做了基本的数据整理。请利用整理好的数据,做出 1-2 项具体的分析。这里,请参考学习资料来完成 Python 编程实现的数据分析。教师:今天我们的课就学习到这里,谢谢大家!数据分析(第二十四课时)高中信息技术 回顾 数据处理一般过程数据采集数据采集数据整理数据整理数据分析数据分析数据呈现数据呈现高中信息技术1.数据分析概念数据分析数据分析是为了获取有价值的信息,使用适当的计算方法与工具对收集来的数据进行处理,提取有用信息,形成结论从而支持决策。高中信息技术2.数据分析作用:了解事物的现状高中信息技术2.数据分析作用:剖析事物的发展历程高中信息技术2.数据分析作用:预测事物未来走向高中信息技术3.数据分析 金山银山不如绿水青山,最近这些年,国家落实严控环境污染、修复生态环境等政策。随着政策落实,你所在家乡的空气质量是否有所改善?我们需要数据来做出分析。上节课,我们对空气质量原始数据做了整理。本节课,上节课,我们对空气质量原始数据做了整理。本节课,我们要分析之前整理的数据,从而做出判断。我们要分析之前整理的数据,从而做出判断。高中信息技术课堂任务1:计算每日AQI平均值怎样判断一天的空气质量如何?计算一天中24小时的空气质量指数(AQI)的平均值。平均分析法平均分析法。高中信息技术平均分析法:平均分析法:是指运用计算平均数计算平均数的方法来反映总体在一定时间、地点条件下某一数量特征的一般水平。多用于比较同类现象同类现象在不同地区、不同行业、不同类型单位等之间的差异程度差异程度,分析现象之间的依存关系;也可以对某一现象某一现象在不同时间的水平不同时间的水平进行比较,以说明现象的发展规律及趋势。平均工资、平均年龄、平均身高、平均分平均工资、平均年龄、平均身高、平均分平均分析法高中信息技术课堂任务1:计算每日AQI平均值所需数据所需数据:每天空气质量指数的平均值计算一天中24小时的空气质量指数(AQI)的平均值高中信息技术DataFrame筛选用法DataFrameDataFrame筛选数据筛选数据df.locdf.loc条件,列索引号条件,列索引号 筛选数据筛选数据df.loc dfdf.loc df北京北京50,50,北京北京 筛选北京这一列值小于50的数据高中信息技术DataFrame按日期筛选DataFrameDataFrame按日期筛选数据按日期筛选数据df.locdf.loc日期索引日期索引列索引号列索引号 筛选筛选df.loc2014-05-13df.loc2014-05-13北京北京 筛选2014-05-13的行,显示出北京这列的数据高中信息技术课堂任务1:计算每日AQI平均值下载 课堂活动课堂活动1 1(每日(每日AQIAQI平均值)平均值).py.py 文件,和上节课生成的补全数据补全数据.csv.csv放在同目录。根据自己选择的城市,修改代码中代码中城市名和文件名。高中信息技术课堂任务1:计算每日AQI平均值高中信息技术课堂任务1:计算每日AQI平均值高中信息技术课堂任务1:计算每日AQI平均值暂停视频暂停视频运行 课堂活动课堂活动1 1(每日(每日AQIAQI平均值)平均值).py.py 文件观察同目录下的结果数据文件 高中信息技术课堂任务1:计算每日AQI平均值高中信息技术课堂任务2:统计每年AQI为优的天数怎样判断现在的空气质量和过去比是否有了改善?可以对比空气质量为优的天数在过去几年间的变化趋势这里用到了对比分析法对比分析法高中信息技术对比分析法:对比分析法:也叫比较分析法,通常用于从数量上展示从数量上展示 和说明研究对象规模大小,水平高低研究对象规模大小,水平高低等。对比分析法分为横向和纵向对比横向和纵向对比两大类。对比分析法高中信息技术对比分析法横向对比高中信息技术对比分析法纵向对比高中信息技术课堂任务2:统计每年AQI为优的天数所需数据:每年空气质量为优的天数(AQI200)的天数。需求:呈现一年中空气质量为优、良好、轻度污染、中度污染、呈现一年中空气质量为优、良好、轻度污染、中度污染、重度污染的天数占比比例重度污染的天数占比比例。高中信息技术DataFrame多条件筛选用法DataFrameDataFrame多条件筛选数据多条件筛选数据df.loc(df.loc(条件条件1)&(1)&(条件条件2 2),),列索引号列索引号 筛选数据筛选数据df.loc(dfdf.loc(df北京北京=50)&(df=50)&(df北京北京=100),=100),北京北京 筛选北京这一列值在50-100之间的数据高中信息技术课堂任务3:统计每年AQI各类情况的天数下载 课堂活动课堂活动3 3(统计统计AQIAQI各类数据各类数据)-待补全待补全.py.py 文件,和活动1生成的AQIAQI每日平均值文件每日平均值文件放在同目录。注意:可根据自己选择的城市,修改代码中城市名和文件名。高中信息技术课堂任务3:统计每年AQI各类情况的天数高中信息技术课堂任务3:统计每年AQI各类情况的天数请补全代码,将5种空气质量类别都统计出来。高中信息技术课堂任务3:统计每年AQI各类情况的天数请补全代码后,暂停视频暂停视频,运行程序,查看生成的结果文件。高中信息技术课堂任务3:统计每年AQI各类情况的天数同学们,你是否成功统计出了2015到2019年的各类空气质量天数?高中信息技术课堂活动总结1、计算每日AQI平均值2、统计每年AQI为优的天数3、统计每年AQI各类情况的天数平均分析法平均分析法对比分析法对比分析法结构分析法结构分析法高中信息技术4.课堂小结数据分析作用了解事物现状剖析事物发展历程预测事物未来走向方法对比分析法平均分析法结构分析法高中信息技术5.课后作业 各位同学针对身边同学们的课余时间安排做了调查问卷,并且对采集的原始数据做了数据整理。请利用整理好的数据,做出请利用整理好的数据,做出1-21-2项具体的分项具体的分析。析。(比如高中生的课余时间都在做什么?游戏娱乐的时间占比如何?比如高中生的课余时间都在做什么?游戏娱乐的时间占比如何?学业压力是否过大?运动方式有哪些?运动时间有多久?学业压力是否过大?运动方式有哪些?运动时间有多久?)请参考学习资料中的请参考学习资料中的PandasPandas使用说明和示例,完成利用使用说明和示例,完成利用PythonPython实现数据分析。实现数据分析。课程基本信息课题数据分析教科书书名:信息技术必修 1 数据与计算 出版社:人民教育出版社&中国地图出版社 出版日期:2019 年 6 月学生信息姓名学校班级学号课后练习各位同学针对身边同学们的课余时间安排做了调查问卷,并且对采集的原始数据做了数据整理。请利用整理好的数据,做出 1-2 项具体的分析。(比如高中生的课余时间都在做什么?游戏娱乐的时间占比如何?学业压力是否过大?运动方式有哪些?运动时间有多久?)请参考学习资料中的 Pandas 使用说明和示例,完成利用 Python 实现数据分析。
展开阅读全文
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《3.3.1 数据分析 ppt课件(39张ppt)+教案+练习+任务单-2023新人教中图版《高中信息技术》必修第一册.rar》由用户(Q123)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 关 键 词:
-
高中信息技术
3.3.1
数据分析
ppt课件(39张ppt)+教案+练习+任务单_2023新人教中图版《高中信息技术》必修第一册
数据
分析
ppt
课件
39
教案
练习
任务
_2023
新人
图版
163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。