第五章 数据处理和可视化表达 & 第六章 人工智能及其应用 合格考复习-ppt课件-2023新粤教版(2019)《高中信息技术》必修第一册.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第五章 数据处理和可视化表达 & 第六章 人工智能及其应用 合格考复习-ppt课件-2023新粤教版(2019)《高中信息技术》必修第一册.pptx》由用户(Q123)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高中信息技术 第五章 数据处理和可视化表达 第六章 人工智能及其应用 合格考复习 -ppt课件_2023新粤教版2019高中信息技术必修第一册 第五 数据处理 可视化 表达 第六 人工智能 及其 下载 _必修1 数据与计算_粤教版(2019)_信息_高中
- 资源描述:
-
1、制作人:XXX第五章 数据处理和可视化表达必修一 数据与计算目录CONTENTSPARTONE认识大数据PARTTWO数据的采集PARTTHREE数据的分析PARTFOUR数据的可视化表达01PARTONE认识大数据大数据1.大数据:指无法在可承受的时间范围内用常规软件工具进行高效捕捉、管理和处理的数据集合。2.大数据的特征(1)从互联网产生大数据的角度(2)从互联网思维的角度(3)从大数据存储与计算的角度大数据2.大数据的特征(1)从互联网产生大数据的角度 大量(数据体量大)多样(数据类型繁多)低价值密度(价值密度低)【例:在连续不间断的监控过程中,有用的数据可能仅仅一两秒】高速(变化速度快
2、)大数据2.大数据的特征(2)从互联网思维的角度 样本渐趋于总体(数据全量而不是抽样)精确让位于模糊(掌握大体发展方向,适当忽略微观精确度)相关性让位于因果(寻找事物之间的相关关系)大数据2.大数据的特征(3)从大数据存储与计算的角度 分布式存储 分布式并行计算大数据3.大数据对日常生活的影响(1)正面影响 方便支付:移动支付 方便出行:交通系统、网约车、智能导航、智能地图 方便购物与产品推介:网络购物、个性化产品推荐 方便看病与诊病:网络预约挂号、分析患者病史数据(2)负面影响 个人信息泄露;数据时刻存在泄露的风险。信息伤害与诈骗:电信诈骗。练习1.(多选)2021年,某网约车公司在中国拥有
3、3.77亿用户,其用户出行数据具有大数据特征。下列哪些属于大数据的特征?()A.数据体量巨大B.数据类型繁多C.价值密度低D.变化速度快A、B、C、D练习2.某品牌智能手环收集了大量用户运动、健康的数据。以下相关描述错误的是()。A.在大数据时代,我们的个人信息时刻存在泄露的风险B.大数据时代的海量数据,使信息、机密、财富之间产生紧密关联,从而构成信息安全的重要因素C.数据因素是造成信息安全的风险之一D.隐私泄露的问题是大数据时代特有的DD.隐私泄露的问题是大数据时代特有的练习3.分析疫情大数据使用的是抽样数据,不是全体数据,但抽取的样本量要大。()4.当校内发生盗窃时,办案民警从学校24小时
4、连续不间断的监控视频中提取出案发前后几分钟的视频数据。这体现了大数据价值密度高的特征。()02PARTTWO数据的采集数据采集方法1.数据采集方法:系统日志采集法 网络数据采集法 其他数据采集法2.网络数据采集法:指通过网络爬虫或网站公开API等方式从网站上获取数据信息。网络爬虫通过获得网页的URL(网址),从网络上获取数据。数据存储和保护1.数据的存储:把数据存在本地内部;把数据放在第三方公共或私有的“云端”存储。2.数据的保护:数据安全保护技术;数据的隐私保护(技术手段、自身意识、道德法律)。练习1.通过爬虫程序可以采集某音乐平台上歌曲的评论内容。关于爬虫程序,以下说法错误的是()。A.爬
5、虫程序,可以采集网络数据B.只要是你想要的网络数据,都可以用爬虫程序去采集 C.爬虫程序开始执行时,需要一个URL列表作为起始位置D.爬虫程序采集到的数据,可以保存为多种格式,如xls、csv等BB.只要是你想要的网络数据,都可以用爬虫程序去采集 练习2.微信公众号中有大量的文章、数据信息,采集公众号中的数据资源应该通过()实现。A.系统日志 B问卷调查 C公众号官方API D传感器CC公众号官方API 练习3.通过网络爬虫采集各地卫健委公布的数据并进行可视化处理后,可形成疫情大数据报告。网络爬虫是网络数据采集的基本方法。()4.如果要爬取第1至5页的疫情数据,可以用循环结构来实现遍历这5个页
6、面。用变量i表示页面数,则循环语句可编写为:for i in range(1,5)。()03PARTTHREE数据的分析数据分析1.数据分析一般包括:特征探索 关联分析 聚类与分类 建立模型 模型评价数据分析2.特征探索:对数据进行预处理,发现和处理缺失值、异常数据。即:补全缺失数据、处理异常数据、校正错误数据数据分析3.关联分析:分析并发现存在于大量数据之间的关联性或相关性,从而描述一个事物中某些属性同时出现的规律和模式。例:啤酒和尿不湿的故事应用:指导商品位置摆放、促销策略(捆绑销售、买a送b)、精准推荐等。数据分析4.聚类分析:人们不必事先给出一个分类的标准,聚类分析能够从样本数据出发,
7、自动进行分类。【物以类聚、人以群分】K-平均(K-means)算法:经典的聚类分析方法。5.数据分类:数据分析处理中最基本的方法。做法:基于样本数据先训练构建分类函数或分类模型(分类器),该分类器具有将待分类数据项映射到某一特点类别的功能。练习1.对疫情数据分析之前,一般要先对数据进行预处理,以下不属于预处理的是()。A补全缺失数据 B处理异常数据 C校正错误数据 D处理数据关系 DD处理数据关系 练习2.K-平均算法是一种经典的()算法。A.关联分析 B.数据分类 C.聚类分析 D.数据可视化CC.聚类分析3.某超市曾经研究销售数据,发现买商品A的人购买商品B的概率很大,这种属于数据的()A
展开阅读全文
链接地址:https://www.163wenku.com/p-6635071.html