(2021新粤教版)高中信息技术必修一5.3数据的分析ppt课件.zip
第五章 数据处理和可视化表达 信息技术必修1数据与计算 5.3 数据的采集 上机课要求 上课前课代表同学提前与老师联系,确定上课事宜。 上课不能携带水、零食等进入机房。 进入机房按照编排机号入座,不得随意串座。 学习目标 1、能够体验多种数据分析技术; 2、能够掌握选用恰当的工具处理数据; 3、能够掌握总结和归纳数据分析的方法和步骤; 思考问题 生活中大数据时代的我们,前面我们学习了数据的采 集与保护,那么我们获取的数据可以直接拿过来用吗 ? 任务一:体验特征探索 特征探索的定义 以小组为单位,通过查找资料、学习和交流,填写下 表。 任务一:体验特征探索 特征探索的定义 以小组为单位,通过查找资料、学习和交流,填写下 表。 对数据进行预处理,发现和处理缺失 值,异常数据、绘制直方图,观察数 据分布的特征,求最大值、最小值、 极差等描述性统计量。 任务一:体验特征探索 小程序体验:数据预处理.py 修改“数据预处理.py”代码,对采集到的商品销售数据进行 预处理,包括发现和处理缺失值、处理异常数据、求最大 值、最小值、极差、组距、绘制直方图,观察数据的分布特 征,以小组为单位,通过学习、交流,探究(课本112-113页内 容) 任务一:体验特征探索 #异常值处理、画散点图(横轴:价格,纵轴:评论 数)找到异常值 data2=data.Tprice=data2.values2comt=data2.values3 plt.xlabel(price) #显示X坐标标签 plt.ylabel(paynum) #显示Y坐标标签 pyl.plot(price,comt,o)pyl.show() 任务一:体验特征探索 #求最值 pricemax=da22.max() pricemin=da22.min() paynummax=da23.max() paynummin=da23.min() #极差 pricerg=pricemax-pricemin paynumrg=paynummax-paynummin 任务一:体验特征探索 #极差pricerg=pricemax- priceminpaynumrg=paynummax-paynummin# 组距 pricedst=pricerg/13paynumdst=paynumrg/13 任务一:体验特征探索 #绘制价格直方图 #npy.arrange(最小,最大,组距) pricesty=npy.arange(pricemin,pricemax+1,pricedst) plt.xlabel(price) #显示X坐标标签 plt.ylabel(number) #显示Y坐标标签 pyl.hist(da22,pricesty) pyl.show() 任务二:体验关联分析 要求:以小组为单位,通过网上查找资料、学习和交流。 关联分析的 定义 分析发现存在于大量数据 之间的关联性和相关性, 从而描述一个事物的共同 规律和模式。 任务二:体验关联分析 要求:以小组为单位,通过网上查找资料、学习和交流。 小程序体验: 运行关联分析.py”体验关联分析。 修改 关联分析.py”代码,对采集到的店铺销售 订单数据进行关联分析,寻找商品之间的关联 性,观察关联分析结果,以小组为单位,通过 学习、交流,探究和实践, 任务三:体验聚类分析 以小组为单位,通过学习和交流,填写下表。 import numpy as np import numpy as np import matplotlib.pyplot as plt import matplotlib.pyplot as plt from pylab import * from pylab import * x = np.arange(-5.0, 5.0, 0.02) x = np.arange(-5.0, 5.0, 0.02) y = np.sin(x) y = np.sin(x) plt.plot(x, y) plt.plot(x, y) plt.show() plt.show() 任务三:体验聚类分析 以小组为单位,通过学习和交流,填写下表。 聚类分析的定义 是一种探索性的分析。不必事先给 出一个分类标准,而是让其自动分 类。 任务三:体验聚类分析 体验小程序: 修改 聚类分析.py”代码,对采集到的商品销售数据“data_sample.csv”进行聚 类分析,观察数据分析结果,以小组为单位,通过学习、交流,探究和实践。 from sklearn.cluster import KMeans #导入商品样本数据 fname=data_sample.csv dataf=pda.read_csv(fname,encoding=gbk) x=dataf.as_matrix() #聚类分析 kms=KMeans(n_clusters=3) y=kms.fit_predict(x) print(y) 任务四:数据分类 以小组为单位,通过查找资料、学习和交流,填写下表。 数据分类 是数据分析中最基本的方法。先基 于样本数据构建分类器。然后进行 预测。 任务四:数据分类 以小组为单位,通过查找资料、学习和交流。 运行数据分类.py”,体验数据分类。 通过修改或优化数据分类py”代码,对特征值A为 128.8,特征值B为158,特征值C为4.7的商品进行分类, 观察该商品分类结果,以小组为单位,通过学习、交 流,探究和实践, 课堂练习 1、数据分析最基本的方法( ) A.特征探索 B.数据分类 C.聚类分析 D. 关联分析 B 课堂练习 2、下列有关数据分析说法错误的是( ) A.特征探索的主要任务是发现大量数据间的关联性 。 B.关联分析的主要任务是发现大量数据间的关联性 c.聚类分析无需事先给出分类标准 D.数据分类是数据分析处理中最基本的方法。 A 课堂总结 下课! 完成测试题,下节课前由小组长批阅,课代表汇总。 作业布置
收藏
编号:1690282
类型:共享资源
大小:80.95KB
格式:ZIP
上传时间:2021-08-28
2
文币
- 资源描述:
-
第五章 数据处理和可视化表达 信息技术必修1数据与计算 5.3 数据的采集 上机课要求 上课前课代表同学提前与老师联系,确定上课事宜。 上课不能携带水、零食等进入机房。 进入机房按照编排机号入座,不得随意串座。 学习目标 1、能够体验多种数据分析技术; 2、能够掌握选用恰当的工具处理数据; 3、能够掌握总结和归纳数据分析的方法和步骤; 思考问题 生活中大数据时代的我们,前面我们学习了数据的采 集与保护,那么我们获取的数据可以直接拿过来用吗 ? 任务一:体验特征探索 特征探索的定义 以小组为单位,通过查找资料、学习和交流,填写下 表。 任务一:体验特征探索 特征探索的定义 以小组为单位,通过查找资料、学习和交流,填写下 表。 对数据进行预处理,发现和处理缺失 值,异常数据、绘制直方图,观察数 据分布的特征,求最大值、最小值、 极差等描述性统计量。 任务一:体验特征探索 小程序体验:数据预处理.py 修改“数据预处理.py”代码,对采集到的商品销售数据进行 预处理,包括发现和处理缺失值、处理异常数据、求最大 值、最小值、极差、组距、绘制直方图,观察数据的分布特 征,以小组为单位,通过学习、交流,探究(课本112-113页内 容) 任务一:体验特征探索 #异常值处理、画散点图(横轴:价格,纵轴:评论 数)找到异常值 data2=data.Tprice=data2.values2comt=data2.values3 plt.xlabel(price) #显示X坐标标签 plt.ylabel(paynum) #显示Y坐标标签 pyl.plot(price,comt,o)pyl.show() 任务一:体验特征探索 #求最值 pricemax=da22.max() pricemin=da22.min() paynummax=da23.max() paynummin=da23.min() #极差 pricerg=pricemax-pricemin paynumrg=paynummax-paynummin 任务一:体验特征探索 #极差pricerg=pricemax- priceminpaynumrg=paynummax-paynummin# 组距 pricedst=pricerg/13paynumdst=paynumrg/13 任务一:体验特征探索 #绘制价格直方图 #npy.arrange(最小,最大,组距) pricesty=npy.arange(pricemin,pricemax+1,pricedst) plt.xlabel(price) #显示X坐标标签 plt.ylabel(number) #显示Y坐标标签 pyl.hist(da22,pricesty) pyl.show() 任务二:体验关联分析 要求:以小组为单位,通过网上查找资料、学习和交流。 关联分析的 定义 分析发现存在于大量数据 之间的关联性和相关性, 从而描述一个事物的共同 规律和模式。 任务二:体验关联分析 要求:以小组为单位,通过网上查找资料、学习和交流。 小程序体验: 运行关联分析.py”体验关联分析。 修改 关联分析.py”代码,对采集到的店铺销售 订单数据进行关联分析,寻找商品之间的关联 性,观察关联分析结果,以小组为单位,通过 学习、交流,探究和实践, 任务三:体验聚类分析 以小组为单位,通过学习和交流,填写下表。 import numpy as np import numpy as np import matplotlib.pyplot as plt import matplotlib.pyplot as plt from pylab import * from pylab import * x = np.arange(-5.0, 5.0, 0.02) x = np.arange(-5.0, 5.0, 0.02) y = np.sin(x) y = np.sin(x) plt.plot(x, y) plt.plot(x, y) plt.show() plt.show() 任务三:体验聚类分析 以小组为单位,通过学习和交流,填写下表。 聚类分析的定义 是一种探索性的分析。不必事先给 出一个分类标准,而是让其自动分 类。 任务三:体验聚类分析 体验小程序: 修改 聚类分析.py”代码,对采集到的商品销售数据“data_sample.csv”进行聚 类分析,观察数据分析结果,以小组为单位,通过学习、交流,探究和实践。 from sklearn.cluster import KMeans #导入商品样本数据 fname=data_sample.csv dataf=pda.read_csv(fname,encoding=gbk) x=dataf.as_matrix() #聚类分析 kms=KMeans(n_clusters=3) y=kms.fit_predict(x) print(y) 任务四:数据分类 以小组为单位,通过查找资料、学习和交流,填写下表。 数据分类 是数据分析中最基本的方法。先基 于样本数据构建分类器。然后进行 预测。 任务四:数据分类 以小组为单位,通过查找资料、学习和交流。 运行数据分类.py”,体验数据分类。 通过修改或优化数据分类py”代码,对特征值A为 128.8,特征值B为158,特征值C为4.7的商品进行分类, 观察该商品分类结果,以小组为单位,通过学习、交 流,探究和实践, 课堂练习 1、数据分析最基本的方法( ) A.特征探索 B.数据分类 C.聚类分析 D. 关联分析 B 课堂练习 2、下列有关数据分析说法错误的是( ) A.特征探索的主要任务是发现大量数据间的关联性 。 B.关联分析的主要任务是发现大量数据间的关联性 c.聚类分析无需事先给出分类标准 D.数据分类是数据分析处理中最基本的方法。 A 课堂总结 下课! 完成测试题,下节课前由小组长批阅,课代表汇总。 作业布置
展开阅读全文
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《(2021新粤教版)高中信息技术必修一5.3数据的分析ppt课件.zip》由用户(大布丁)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 关 键 词:
-
2021新粤教版
新粤教版
高中
信息技术
必修
数据
分析
ppt
课件
163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。