1、第一章 数据与信息 1 1、感知数据、感知数据 2 2、数据、信息和知识数据、信息和知识 3 3、数据采集与编码、数据采集与编码 4 4、数据管理与安全、数据管理与安全 5 5、数据与大数据、数据与大数据 1.11.1感知数据感知数据 信息技术必修1数据与计算 学习目标 认识数据对人们生活的影响。 能辨别数据的多种记录形式。 我们在生活中在利用数据的同时,自身 也在产生数据。 数据与科学(科学研究离不开数据)。 数据及其演变 人类对于数据的利用在一定程度上依 赖于载体,造纸术与印刷术的发明,使得 数据的记录与传输变得便捷高效,直至今 日,这些技术还在发挥着作用。 讨论 通过熟悉教材内容数据及其
2、演变,请同学们两两讨论,记录数据 的载体都有哪些?以及数据的表现形式有哪些? 提示:不同的数据类型与载体 数据表现形式可以是文字、图形、图像、音频、视频等。 我们的生活与数据 数据化生活具体数据化生活具体 从哪些方面体现从哪些方面体现 ?阅读课本回答问题阅读课本回答问题 理解 思考:如何理解书本上,人们利用数据的同时,自身的 行为也在产生数据? 互联网+ 互联网加速了数据的传递,通过与传统行业的深度融合 ,发展成了一种新的社会经济形态“互联网+”。 阅读书本案例:互联网+农业 这些同学们了解吗? 互联网+批发零售=淘宝、天猫、京东; 互联网+通信=腾讯QQ、微信; 互联网+KTV=全民K歌、唱
3、吧; 互联网+电视=小米、乐视; 互联网+美食=大众点评、美团; 互联网+银行=网银; 互联网+房地产=房多多、丁丁租房; 互联网+交易=支付宝、小米金融; 互联网+出行=滴滴等。 互联网+充分发挥互联网在社会资源配置中的优化和集成作用,提升了全社 会的创新力和生产力。 农历的由来? 阅读课本了解农历的由来? 根据月相变化和季节更替的规律逐渐形成了我国特有的传统 历法农历。(早期的数据处理) 科学与数据的关系 思考科学研究与数据 的关系? 知识拓展 世界上最大的粒子物理学实验室欧洲核子研究组织(CERN) 它还是世界上第一个网站,第一个 网络服务器,第一个浏览器的诞生地。 万维网(www)是欧
4、洲核子研究组织的 询问计划(ENQUIRE)的产物,是由蒂 姆伯纳斯-李在1989年发起的。根据超 文本的概念,计划目的是为了研究人员 更好地分享资讯。第一个网站建於1991 年。1993年4月30日,欧洲核子研究组 织宣布开放万维网给所有人使用。由蒂 姆伯纳斯-李所制作的第一个网页仍然 被保存起来。 1.下列关于数据的说法,不正确的是( ) A.手机音乐播放器中的音乐是数据 B.远古时代石器或骨器上的图案是数据 C.古人“结绳记事”中的绳结数量是数据 D.在网上预定车票时,余票的数量不是数据,是数字 D 课堂练 习 课堂练习 2.下列关于数据的说法,正确的是( ) A.技术可以让数据记录与传
5、输变得更慢了 B.互联网成为数据产生的唯一方式,数据量也在不断增长 C.手工处理数据的方式已经无法满足数据处理的需求,已经过时了 D.文本、图像、声音、视频等都是数据的载体,数据形式越来越丰 富 D 课堂练习 15 3.支付宝中的( )是数据 支付宝好友的聊天语音 付钱码 支付宝头像图 片 账户余额数字 每天的运动步数 A. B. C. D. D 课堂练习 课堂小结及思考 在成长的道路上,我们已经留下了很多痕迹,这些痕迹大都可 用数据来记录。哪些数据可以大致描述你的成长轨迹呢? 除了数字,在日常生活中还有哪些形式的数据? Thanks 第一章 数据与信息 1 1、感知数据、感知数据 2 2、数
6、据、信息和知识数据、信息和知识 3 3、数据采集与编码、数据采集与编码 4 4、数据管理与安全、数据管理与安全 5 5、数据与大数据、数据与大数据 1.21.2数据、信息及知识数据、信息及知识 信息技术必修1数据与计算 复习数据的含义 在计算机科学中,数据是指所有能输入到计算机并被计算机程序处理的 符号总称,是用于输入到计算机中进行处理,具有一定意义的数字、字母、 符号和模拟量等的通称。 其表现形式可以是文字、图形、图像、音频、视频等。 数据到信息 加工、处理、赋予意义 从数据到信息(数据是信息的载体,信息是数据所表示的意义) 数据信息 什么是信息? 什么是信息 ? 列举现实生活中的信息。 什
7、么是信息 ? 现代人用来存储、传递、利用信息的方法 问题:21世纪是信息时代,所 以信息是21世纪才出现的,对 吗? 什么是信息? 信息的定义 定义:到目前为止,信息还未有统一的定义, 处于研究目的、观察角度的不同,不同的学科 往往有自己的定义。 信息论的奠基者克劳德埃尔伍德香农在通 信的数学理论中提出:“ “信息是用来消除随信息是用来消除随 机不确定性的东西。机不确定性的东西。” ”这一定义常被人们看做 是经典并加以引用。 信息的定义 什么是信息 ? 物质、能源、信息是人类社会的三大 要素,信息是人类生存和发展的是人类生存和发展的基本基本 条件条件与与基本需求基本需求。 思考?什么是信息?什
8、么是载体 文字,声音,图像,视频等是信息吗? 练习:下列事例中信息和它的载体分别是什么下列事例中信息和它的载体分别是什么 ? 信息和信息的载体信息和信息的载体 事例事例信息 载体 听收音机里的新闻听收音机里的新闻 看书看书 上网查找资料上网查找资料 新闻内容新闻内容电波、收音机、声音等电波、收音机、声音等 书的内容书的内容纸张、文字等纸张、文字等 资料的内容资料的内容网络、计算机、文字、声音等网络、计算机、文字、声音等 信息的特征 信息不能独立存在,需要依附于一定的载体。 同一个信息可以依附于不同的载体。如教案可以 手写到纸上,也可以用电脑来写。 载体形式多样。如印刷型、声像型、网络型的。 信
9、息的载体依附性也同时使信息具有可存储、可 传递、可转换等特点。 信息的特征信息的特征 载体依附性载体依附性 在刚刚的游戏过程中,每个人都在传递信息,为什 么最后接收信息的同学获得的信息不是最初的那个 ?并且每一位同学表演的时候肯定加了自己的理解 ,这体现了信息的什么特征? 信息的特征信息的特征 可加工性可加工性 信息的特征 每个人都在传递信息,这足以证明信息是可以传递 的。 所以体现了信息的? 信息的特征信息的特征 传递性传递性 信息的特征 萧伯纳说:“你有一个苹果,我有一个苹果, 彼此交换,仍然是各有一个苹果;你有一种思 想,我有一种思想,彼此交换,就会得到两种 思想,甚至更多 信息的特征信
10、息的特征 共享性共享性 信息的特征 早晨出门看了报纸上说今天晴天,但是不久后 就下大雨,后来才发现看的是昨天的报纸。 喝饮料时发现中了再来一瓶,去商店兑换的时 候,老板指着瓶身的广告说已经结束了。 信息的特征信息的特征 时效性时效性 信息的特征 三国演义诸葛亮的空城计 盲人摸象的故事 三人成虎 信息的特征信息的特征 真伪性真伪性 信息的特征 信息的特征信息的特征 中石化汽油价格优惠很大,开车的和没开车 的都获知了这一信息,关注度及所起作用一 样吗? 说明信息具有什么特征? 价值相对性价值相对性 信息的特征 载体依附性 可加工性 传递性 共享性 时效性 真伪性 价值相对性 信息的特征信息的特征
11、信息的特征 学以致用 讨论:下列选题体现了信息的哪些特征? 一人计短,二人计长 真假难辨 老黄历看不得 一传十,十传百 玉不琢,不成器 一千个读者,一千个“哈姆雷特” 共享性共享性 真伪性真伪性 时效性时效性 传播性传播性 可加工性可加工性 价值相对性价值相对性 数据、信息与知识 数据、信息与知识 从数据到信息到知识 从数据到信息到知识 知识的定义 定义:知识是人类在社会实践中所获得的认识和经验 的总和,也是人类在时间中认识客观世界(包括人类 自身)的成果,它包括对事实、信息的描述以及在教 育和实践中获得的技能。 小结 本节课总结本节课总结 小结 数据、信息、知识与智慧的关系 本节课总结本节课
12、总结 课堂练习 模拟题练习 1.下列描述正确的是() A.信息是数据的载体 B.信息是事物运动的状态和方式 C.数据是一种被加工过的信息 D.数据是信息的内涵 B B 模拟题练习 2.下列有关信息的描述,正确的是( ) A.书籍大数据时代是信息 B.广告图片是信息 C.最新的区块链新闻是信息 D.微信中的语音是信息 C C 课堂练习 模拟题练习 3.圆的面积计算方法是(),是经过研究、总 结归纳出来的科学方法。 A.信息 B.知识 C.数据 D.信息技术 B B 课堂练习 模拟题练习 4、小张是个球迷,因为工作原因没能收看到世界 杯冠亚军决赛的电视直播。从报纸上获悉了比赛结 果,再看比赛录像时
13、已经没有了以往看现场直播时 的那种紧张激动的心情。这个事例主要体现了信息 的() A.依附性B.共享性C.时效性D.存储性 C C 课堂练习 模拟题练习 5、“我有一种思想,你也有一种思想,大家彼此交 换,我们就有两种思想甚至更多”这体现了什么? () A物物交换 B信息的时效性 C信息的价值性 D信息的共享性 D D 课堂练习 模拟题练习 6.关于数据、信息和知识,下列说法正确的有( )。 A.信息和知识里不包含数据 B.信息经过提炼可以得到知识 C.数据+背景=信息 D.数据就是知识,知识就是数据 B B 课堂练习 模拟题练习 7.“智者从别人失败经验中吸取教训,聪明的人从 自己失败经验中
14、吸取教训。”这句话中主要说明了 () A.信息不可以脱离它所反映的事物被保存和传播 B.信息的载体性 C.信息的时效性 D.信息经过人的分析、提炼后具有更高的使用价值 8.对于信息,下列说法错误的是( )。 A.信息是可以处理的 B.信息是可以传递的 C.信息是可以共享的 D.信息可以不依附于某种载体而存在 9.“掩耳盗铃”的寓言故事中,由于盗铃人忽视了 信息的( )而导致被他人发现。 A、载体依附性B、价值性C、时效性D、共享性 D D D 课堂练习 课堂练习 模拟题练习 小明在网上得知2016年6月6日是第十七个全国“爱 眼日”,就在班上向同学们进行了关于保护眼睛的 宣传。() 一种名叫枯
15、叶蛱的蝴蝶,在停息时,翅膀的色彩和 形态会随着季节的不同,变得与一片树叶无异,以 此来保护自己不受到侵害。() 共享性 真伪性 开放题 8.(开放题)以“饿了么”APP为例,请列举一种数据形式,分 析数据的相关性,举一个例子,阐述数据、信息、知识、智慧 的关系。 传统快餐业送餐业务流程:根据客户区域和路线将订单分类、 打包并陈列于指定位置,送餐员送餐回来直接到指定位置取订 单、装车、走人。 饿了么、达达、百度外卖等O2O平台优势就在于对送餐物流进 行整合。O2O平台的送餐业务流程:商户编辑并发出送餐需求 ;送餐员接到订单抢单成功并赶往餐厅;订单交接;路线规划 ;送餐。 饿了么累计已经为中国近十
16、分之二的人口提供过自家的外卖服 务,日交易额突破2亿元,夜宵订单量环比上涨5.8%,蜂鸟配 送的骑手数量增长迅猛,服务增强,如果骑手送来的外卖餐盒 安全扣已经断裂,用户有权拒绝收货,并向平台进行投诉。 课后作业课后作业 Thanks 第一章 数据与信息 1 1、感知数据、感知数据 2 2、数据、信息和知识数据、信息和知识 3 3、数据采集与编码、数据采集与编码 4 4、数据管理与安全、数据管理与安全 5 5、数据与大数据、数据与大数据 1.31.3数据采集与编码数据采集与编码 信息技术必修1数据与计算 CONTENTSCONTENTS 01数据采集 data acquisition 02数字化
17、 Digitization 03数制 Number system 04编码 Code CONTENTSCONTENTS 01数据采集 data acquisition 获取方法 观察、实验 互联网、物联网 人工方式获得 网络或器件 数据采集传感器 动动脑,手机里有多少传感器? 手机有多少的传感器 互联网采集数据 CONTENTS 02数字化 Digitization 什么是数字化? 将模拟信号转换成数字信号的过 程称为数字化 定义 采样是将信号从连续j时间(空间 )域上的模拟信号转换到离散时 间(空间)域上的离散信号的过 程,通过采样器实现 采样 量化是指将信号的连续取值近似 为有限个离散值的
18、过程 量化 数字化的过程 声音信号采样量化 CONTENTS 03数制 Number system 了解数制的基本概念 进位制二进制八进制十进制十六进制 规则逢二进一逢八进一逢十进一逢十六进一 基数R=2R=8R=10R=16 基本符号0,10,1,2,70,1,2,90,1,.,9,A,.,F 权2i8i10i16i 形式表示BODH 计算机常用的各种进制数的表示 进制数标识 实例 课堂练习 十六进制 十六进制 十六进制与二进制互转 总结规律 CONTENTS 04编码 Code 字符编码条形码二维码 声音编码图像编码视频编码 ASCII、Unicode 汉字编码 我国普遍采用EAN13条形
19、码, 由13位数字组成,前3位数字 表示国家代码,最后一位叫校 验码 是用某种特定的几何图形按一定 规律在平面上(二维方向)分布 的黑白相间的图形记录数据符号 信息 Wave格式音频文件的存储容量 可以通过下面的公式进行计算 存储容量=采样频率(Hz)*量化 位数(bit)*声道数*时长(s)/8B 数字图像包括矢量图形与位图图 像,图像存储容量计算 存储容量=总像素数*颜色位深度 /8B PAL制式的视频每秒播放25帧 ,NTSC制式每秒播放30帧。 常见的视频编码方式有MPEG1 、MPEG2、MPEG4等 信息编码 基本的共有128个,用1个字节中的低7位编码。 二进制范围为000000
20、0001111111,即十六进制 的007F ASCIIASCII码码 汉字编码分为外码、交换码、机内码和字形码。汉字编码分为外码、交换码、机内码和字形码。 一个字符一个字节一个字符一个字节 ,一个汉字两个字节,一个汉字两个字节 字符编码字符编码 1KB=1024B 1MB=1024KB 1GB=1024MB 1TB=1024GB 1PB=1024TB 1EB=1024PB 1ZB=1024EB (1B=8bit) 汉字编码 条形码实例 二维码 声音编码 音频存储容量计算 图像编码 数字图像包括矢量图形与位图图像。 存储容量=总像素*颜色位深度(单位:位) 常见的图片格式:.jpeg;.bmp
21、;.gif;png. 数据采集 数字化 人工方式 网络、器件 数模转换 数制 编码 进制转换 存储容量计算 本节小结 1.计算机中的数据是用()表示的 A.字母B.ASCII码C.二进制代码D. 英文 2.下列工具中不能把模拟图像转换成数字 图像的是() A.扫描仪B.数码相机C.智能手机D. 打印机 C D 课堂练习 3.()3.()不是将模拟音频数字化需要经过的步不是将模拟音频数字化需要经过的步 骤骤 A.A.采样采样B.B.量化量化C.C.编码编码D.D.输入输入 4.4.关于信息数字化的描述,错误的是关于信息数字化的描述,错误的是()() A.A.可以利用扫描仪、照相机、手机等采集设备
22、可以利用扫描仪、照相机、手机等采集设备 B.B.非数字化信息转化成数字信息,只需要经过采非数字化信息转化成数字信息,只需要经过采 样、编码两个过程样、编码两个过程 C.C.非数字化信息要转化成二进制数字非数字化信息要转化成二进制数字 D.需进入数字设备存储和加工 D B 课堂练习 5.5.计算机编码是指计算机编码是指()() A.A.仅仅指对输入到计算机中的文字用二进制数进行编仅仅指对输入到计算机中的文字用二进制数进行编 码的方式码的方式 B.B.对输入到计算机中的各种数据用二进制数进行编码对输入到计算机中的各种数据用二进制数进行编码 的方式的方式 C.C.仅仅指对输入到计算机中的图像和声音用
23、二进制数仅仅指对输入到计算机中的图像和声音用二进制数 进行编码的方式进行编码的方式 D.D.仅仅指对输入到计算机中的十进制数用二进制数进仅仅指对输入到计算机中的十进制数用二进制数进 行编码的方式行编码的方式 B 课堂练习 6.6.关于数据编码的说法,错误的是关于数据编码的说法,错误的是()() A.A.便于存储、加工便于存储、加工 B.B.是一种形式上的转换是一种形式上的转换 C.C.是计算机处理信息的关键是计算机处理信息的关键 D.D.就是十进制数转化成二进制数就是十进制数转化成二进制数 D 课堂练习 7.7.二进制数码在不同的数位上,二进制数码在不同的数位上, 对应不同对应不同 的权值,有
24、二进制数的权值,有二进制数(11011)(11011),其中虚线框,其中虚线框 中红色的中红色的11对应的权值为(对应的权值为() A.2A.2 0 0 B.2B.2 11 C.2C.2 2 2 D.D.22 3 3 8.8.二进制数二进制数1110111101转换成十进制数是转换成十进制数是 () A.29B.68C.17D.35A.29B.68C.17D.35 B A 课堂练习 9.十进制数71转换成二进制数是() A.1000111B.1110001 C.1001100D.1000011 10.二进制数1111010换成十六进制数是( ) A.6BB.7BC.7AD.710 A C 课堂
25、练习 11.11.十六进制数十六进制数4B4B用二进制数来表示,下列选用二进制数来表示,下列选 项中正确的是(项中正确的是() A.1001001B.1001011C.1010101D.A.1001001B.1001011C.1010101D. 10110111011011 12.12.以下四个数中以下四个数中, ,最大的数是最大的数是 ( (注意:注意:B B表示二表示二 进制,进制,DD表示十进制,表示十进制,HH表示十六进制表示十六进制) )( ) A.11101BB.10111BC.103HA.11101BB.10111BC.103H D.170DD.170D B C 课堂练习 13.
26、汉字在计算机内的表示方法一定是( ) A.国标码 B.机内码 C.最左位置为1的2字节代码 D.ASCII 码 14. 7位二进制编码的ASCII码可表示的字符个数为( ) A.128 B.130 C.127 D.64 15.已知英文字母m的ASCII码值为109,那英文字母p的 ASCII码值为( ) A.111 B.112 C.113 D.114 C B A 课堂练习 有一段WAV格式的音频文件,采用 44.1KHz的采样频率,量化位数为16位,双声 道,时长为10秒,此音频文件的数据量大小 为 B 44.1*1000*16*2*10/8 1KB=1024B 1MB=1024KB 1GB=
27、1024MB 1TB=1024GB 1PB=1024TB 1EB=1024PB 1ZB=1024EB (1B=8bit) 课堂练习 图像素材中有一张“接力比赛.bmp”文件, 它是分辨率1024*768的32位真彩色位图图像 ,该图像占用的存储空间大小是 B 1024*768*32/8 课堂练习 一段时长为10秒钟,分辨率为800600的16位色的 PAL制式视频所需的存储空间为_MB (画面尺寸*彩色位数(bit)*帧数) 数据量*时间(位) 800*600*16*10*25/8/1024/1024 课后思考题 Thanks 第一章 数据与信息 1 1、感知数据、感知数据 2 2、数据、信息
28、和知识数据、信息和知识 3 3、数据采集与编码、数据采集与编码 4 4、数据管理与安全、数据管理与安全 5 5、数据与大数据、数据与大数据 1.41.4数据管理与安全数据管理与安全 信息技术必修1数据与计算 数据管理 什么是数据管理? 如何进行数据管理? 如何有效管理数据 ? 数据管理 是利用计算机硬件和软件技术对数据进行有效收 集、存储、处理和应用的过程。 数据管理 数据管理的三阶段: 人工管理、文件管理和数据库管理。 数据管理 数据管理的三阶段 数据管理的分类 数据管理分类 1.文件存放路径 2.文件存放格式 文件存放的路径 文件路径 常见文件类型 如何管理生活中的数据? 如何理解书本中关
29、于结构化、半结构化、非结构化数据? 结构化数据 结构化数据,也称作行数据。 是由二维表结构来进行逻辑表达和实现的数据,严格地遵 据格式与长度规范,主要通过关系型数据库进行存储和管 理。 非结构及半结构化数据 非结构化数据是数据结构不规则或不完整,没有预定义的数据模型 ,是不方便用数据库维逻辑表来表现的数据。包括各类格式的办公 文档、文本、图片、XML、HTML、各类报图像、音频、视频等。 半结构化数据就是介于结构化数据和非结构化数据之间的数据,具 有一定的结构性,但包含相关标记,用来分隔语义元素以及对记录 和字段进行分层。因此,也被称为自描述的结构。 常见的半结构数据有HTML、XML和JSO
30、N。 数据安全 数据本身的安全 主要是指采用现代密码算法对数据进行主动保护, 如数据保密、数据完整性、双向强身份认证等, 数据本身的安全必须基于可靠的加密算法与安全体系,主 要是有对称算法与公开密钥密码体系两种。 数据防护的安全 主要是采用现代信息存储手段对数据进行主动防护, 如通过磁盘阵列、数据备份、异地容灾等手段保证数据的 安全,数据安全是一种主动的包含措施。 介质的保护 容灾系统 容灾系统是指在相隔较远的异地,建立两套或多套 功能相同的系统,互相之间可以进行健康状态监视 和功能切换,当处系统因意外(如火灾、地震等)停 止工作时,整个应用系统可以切换到另一处,使得 该系统可以继续正常工作。
31、 数据本身的保护 文件的MD5校验 文件的MD5校验是将整个文件当作个大文本信息, 通过其不可逆的字符串变换算法,产生唯一的MD5 信息摘要并提供给用户。用户下载完文件以后,通 过专用程序计算下载文件的MD5校验码,比对前后 的校验数据,判断下载文件是否完整。常见的数据 校验方法有MD5、CRC、SHA-1. 本章小结: 1、数据管理 2、计算机数据管理的三个阶段 3、威胁数据安全的因素 4、如何保护我们的数据?(介质的保护、数据本身的保护MD5) 课堂练习 1. 脱去数据的保护层,把密文变成明文的过程称为( ) A.加密 B.解密算法 C.加密算法 D.解密 2.半结构化数据包括( ) A.
32、Excel表格 B.银行账户上的消费记录 C.检查身体后得到的体检报告 D.HTML文档 D D 3.下列属于可执行文件的是( ) A.小飞象.jpg B. 小飞象.exe C. 小飞象.doc D. 小飞象.mpg 4.下列措施不能提高手机安全的是( ) A.设置开机密码 B. 短信的链接不要点 C. 不随意安装软件 D. 经常恢复出厂设置 B D 课堂练习 5.关于密码,下列说法不正确的是( ) A. 密码强度要高 B. 重要网站、邮箱、银行卡密码要独立 C. 不要在陌生的电脑上输入密码 D. 经常使用电话或生日做密码 D 课堂练习 6.(开放题)由于相关部门的规定,绝大多数学校对考试成绩
33、和排名都不 予公布,家长们对考试成绩望眼欲穿却始终得不到答案。有些人认为:“ 既然考试了,为什么不公布成绩,这不是“掩耳盗铃”吗;有些人认为:公 布与否无所谓,自己尽最大努力就好;有些人认为把成绩排名只告知家长 ,不告知学生,你这么看待考试成绩等数据? 课堂练习 讨论 1.经常接到卖房电话、贷款电话,他们怎么知道我们的号码 ? 2.当你的手机丢了,如何将损失降到最低? 3.密码的设置要求有哪些?P25 Thanks 第一章 数据与信息 1 1、感知数据、感知数据 2 2、数据、信息和知识数据、信息和知识 3 3、数据采集与编码、数据采集与编码 4 4、数据管理与安全、数据管理与安全 5 5、数
34、据与大数据、数据与大数据 1.51.5数据与大数据数据与大数据 信息技术必修1数据与计算 大数据的由来 中国网民数量:7.51亿 半年增长率:2.7% 中国注册网站数量 :344.3万个 手机网民:7.236亿 占网民总数:96.3% 月均网络交易: 16亿笔 每日新发微 博数量: 1亿+条 注册微博用户数 : 2.9071亿 发布的网页数量:866亿页 年增速:40% 网络直播用户:3.43亿 占网民总数:47.1% 大数据概念 大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流 程优化能力的海量、高增长率和多样化的信息资产。大数据就是“未 来的新石油”。 全球信息咨询机构国际数据公
35、司(IDC)对大数据的技术定义是: 通过高速捕捉、发现或分析,从大容量数据中获取价值的一种新的技 术架构。全球知名咨询公司麦肯锡最早提出“大数据”时代到来的。 大数据的特点-4V理论 n 数据类型多 越来越多非结构化数据;音频、 食品,地理位置信息等 多类型数 据对数据处理能力提出更高要求。 n 数据价值高 海量数据带来了巨大的商业价值。数据之间关联性支 持深层的数据挖掘。 n 数据处理速度快 对数据实时处理有着极高的要求, 通过传统数据库查询方式得到的 “当前结果”很可 能已经没有价值。 n 数据规模大 从TB跃升到PB甚至EB。 一组公式:1024GB=1TB; 1024TB=1PB;10
36、24PB=1EB。 实例 你能从中分析出 来什么呢? 专业篮球队会通过搜集大量数据来分析赛事情况,然而他们还在为这些数 据的整理和实际意义而发愁。通过分析这些数据,可否找到两三个制胜法 宝,或者至少能保证球队获得高分? Krossover公司正致力于此。 在每场比赛过后,教练只需要上传比赛视频。接下来,来自 Krossover团队的大学生将会对其分解。等到第二天教练再看昨晚的比赛 时,他只需检查任何他想要的数据统计、比赛中的个人表现、比赛反 应等等。通过分析比赛视频,毫不夸张地分析所有的可量化的数据。 明确区分大数据思维与传统的思维方式。例如: 方式传统思维方式大数据思维方式 上课方式黑板、粉
37、笔多媒体、PPT 出行方式人工取票APP购买、身份证一卡通 销售方式传统商铺网上购物商城、淘宝 大数据思维 1)样本趋于总体 2)精确让位于模糊 3)大数据时代不是因果关系,而是相关关系。 大数据给我们带来的好处 1 1、节约时间,更有效率、节约时间,更有效率 大数据运用到我们的日常生活中,比如我们经常用到的快递、外卖和共享 单车,这些APP的后台都有一张“大数据”。快递后台会根据数百亿历史记录去 做预测,用大数据算法来做智能分单取代了原来的人工分单,可以最大程度地 优化路线,降低人工配单时间,还能减少错误操作,节省人力成本。 另外,根据消费者习惯偏好,大数据可提前预测消费者需求。将商品物流
38、环境和客户的需求同步,提前计算出运输路线和配送路线,缓解物流压力,提 高用户满意度。再比如淘宝,如果你在最近一直在搜索关于钱包的商品,那么 淘宝页面一栏猜你喜欢会优先推送你最近搜索的相关商品,方便用户进行优中 择优。 大数据给我们带来的好处 2 2、大数据让人更加聪明更智慧、大数据让人更加聪明更智慧 人的智慧是无穷的,但是人的计算能力和记忆力是有上限的。 在王者荣耀中,你知道哪个英雄的胜率最高吗?大家肯定都有自己 的看法,十个人就会有十种不同的回答, 但是通过后台统计分析了广大玩家数以万计的数据来看,2017 年6月的最新数据,王者荣耀胜率最高的前3英雄分别为牛魔、 蔡文姬和宫本武藏。根据官方
39、提供的这份数据,用户可以做出最优 的选择,更有效率的上王者。 3 3、大数据思维可以帮你省钱、大数据思维可以帮你省钱 都说会花钱的人才会赚钱。事实上,会大数据思维的人,首先学 会的是省钱。同样的商品,在互联网不同的电商平台有着不同的价格 ;同样是回家,选择高铁、火车、动车还是汽车,最终花费的时间与 金钱也会不一样。我们常常能够看到的“比价网”背后运用的就是大 数据原理。 大数据渗透于各行各业,它在广告行业、制造行业、旅游行业、 体育行业、农业、新能源、汽车行业都有不俗的表现,相信大数据在 未来会更好的服务于社会。 大数据给我们带来的好处 大数据的弊端 1 1、个人数据隐私与安全、个人数据隐私与
40、安全 大数据会记录你的浏览习惯,购买习惯,常用淘宝支付宝 这些软件的人,你的消费能力、购物习惯、活动产所、收 入情况、生活质量、年龄、身高、体重、鞋码、三围、口 味等,都是可以分析出来的 这些基本囊括了我们的生活。 个人数据安全就成了一个大问题,一旦数据泄露(或被买 卖),可能会对用户人身财产、国家和公司的安全造成威 胁。 大数据的弊端 2 2、大数据杀熟、大数据杀熟 杀熟,即同样的商品或服务,老客户看到的价格反而比新客 户要贵出许多。 近两年来包括滴滴出行、携程、飞猪、京东、美团、淘票票 等多家互联网平台均被曝疑似存在“杀熟”情况,涵盖在线 差旅、在线票务、网络购物、交通出行等多个领域,特别
41、是 OTA(Online Travel Agent)在线差旅平台较为突出。 大数据技能自身不只能够迅速衍生为新兴信息产业,还能够 同云计算、物联网和才智工程技能联动,支撑一个信息技能 的新时代。加米谷大数据培训。 本章小结: 1、数据、信息、知识和智慧 2、进制及存储容量 3、数据管理与安全 4、数据与大数据 5、P30练习题 课堂练习 1. 大数据的特征可以用被总结为4V特征,以下哪个不属于大数据的4V特征 ( ) A.种类多(Variety) B.体量大(Volume) C.Venture(风险大) D.速度快(Velocity) 2.最早提出“大数据”时代到来的是哪家公司? A.IBM
42、B.谷歌 C.麦肯锡 D.微软 C C 3.1TB=( )GB。 A.256 B.512 C.1024 D.2048 4.大数据的容量不断增长,也就要求有更加复杂的数据管理方法,为 此,如下哪项不是大数据存储面临的挑战( ) A.简单的数据模型 B.低成本 C.易扩展 D.易于使用 C A 课堂练习 5.(多选)大数据的来源途径有许多,如下哪些属于大数据来源( ) A.网络爬虫得到的数据 B.计算机网络运行产生的日志 C.人在微博上发表的记录 D.传感器设备采集的数据 ABCD 课堂练习 6.(开放题)请根据你的认识谈谈大数据与传统数据有什么关系? 传统数据主要来源于业务运营支撑系统,企业管理
43、系统等;大数据主 要来源于互联网、移动互联网等。所以传统数据涉及的范围往往是较 为有限的,而大数据是对整个数据全集直接进行存储和管理分析,因 此大数据是能够涵盖传统数据的关系。 课堂练习 1.学生学籍系统中存放着大量的学生数据,这些数据是否属于 大数据?为什么? 教育系统每年逐级上报的教育事业统计报表是大数据,各学段学 籍管理系统是大数据,各种专项统计也是大数据。 2.在处理数据时,往往会选择“抽样数据”或“全样本数据” 进行分析,请比较这两种分析方式的特点,并举例说明。P27 动动脑 Thanks 第二章 算法与问题解决 1 1、算法的概念及描述、算法的概念及描述 2 2、算法的控制结构算法
44、的控制结构 3 3、用算法解决问题的过程、用算法解决问题的过程 1.11.1算法的概念及描述算法的概念及描述 信息技术必修1数据与计算 游戏:狼、菜、羊过河 有一个牧羊人带着一头羊,一只狼和一颗大白 菜准备过河,他找到一只很小的船,每次只能带一样 东西过去,可是如果让狼与羊单独在一起,狼会吃 羊,让羊与白菜单独在一起,羊会吃白菜,请你说说 牧羊人应如何过河? Answer: 过河的方案: 第一步:人和羊过河,人返回,留下羊; 第二步:人和狼过河,人和羊返回,留下狼; 第三步:人和菜过河,人返回,留下菜; 第四步:人和羊过河 算法的概念和特征 算法是解决问题的方法和有限步骤 算法的特征: (1)
45、有穷性:一个算法在执行有限步之后必须结束 (2)确定性:算法的每一个步骤必须要有确切地定义 (3)有输入:一个算法有零个或多个输入 (4)有输出:算法有一个或多个输出 (5)可行性:算法中的运算和操作必须能精确地执行 算法的要素 (1)数据(原始输入数据、产生的数据 ) (2)运算 (3)控制转移(达到某个点有选项) 算法的三种描述方法 某商场为了对苹果进行促销,规定苹果原价 1.5元,购买2千克以上的,超过2千克的部分 可以在原价的基础上打8折。请同学们用语言 描述付款的算法。 算法的描述方法自然语言 使用自然语言描述算法。 (1)输入苹果的重量x (2)判断苹果的重量是否大于2千克 (3)
46、如果苹果的重量不大于2千克,应付款y=x*1.5 (4)如果苹果的重量大于2千克,应付款y=2*1.5+(x- 2)*1.5*0.8 (5)输出应付款的金额 使用自然语言描述算法的优缺点 优点:容易理解 缺点:书写烦琐,不确定性,对复杂的问题难以 表达准确,不能被计算机识别和执行。 算法的描述方法自然语言 算法的描述方法流程图 开始 输入苹果的重量x X2? Y=x*1.5Y=2*1.5+(x-2)*1.5*0.8 输出应付款y 结束 YN (1)输入苹果的重量x (2)判断苹果的重量是 否大于2千克 (3)如果苹果的重量不 大于2千克,应付款 y=x*1.5 (4)如果苹果的重量大 于2千克
47、,应付款 y=2*1.5+(x- 2)*1.5*0.8 (5)输出应付款的金额 常用的流程图所用的基本符号 程序框名称功能 开始/结束算法的开始和结束 输入/输出输入和输出信息 处理计算与赋值 判断条件判断 流程线算法中的流向 算法的描述方法流程图 使用流程图描述算法的优缺点 优点:直观、形象 缺点:不能被计算机识别和执行。 算法的描述方法程序 Private Sub Command1_Click() Dim x As Single, y As Single x = Val(Text1.Text) If x 2? Y=x*1.5Y=2*1.5+(x-2)*1.5*0.8 输出应付款y 结束 Y
48、N 算法的择优 解决同一个问题可能有不同的算法 著名数学家华罗庚“烧水泡茶”的两个算法。 算法一 第一步:烧水; 第二步:水烧开后,洗刷茶具; 第三步:沏茶。 算法二 第一步:烧水; 第二步:烧水过程中,洗刷茶具; 第三步:水烧开后沏茶。 第二个算法的科学性在于应用了“统筹方法” 区别? 哪个更高效? 一个好算法必须用到科学的方法 总结 算法的概念:解决问题的方法和步骤 算法的特征:有输入、确定性、有穷性、有输出、可行性 算法的三种描述方法:用自然语言描述算法、用流程图描述算法、用程 序实现算法 解决同一个问题,可能有多种算法,这就需要我们对可能的算法择优。 课堂练习 1.求矩形面积s的部分流
49、程图如下图所示,矩形的长、宽分别用 变量a、b表示,对于框和框的作用,下列说法正确的是( ) A.框用于输入a和b的值,框用于输出s的值 B.框用于输出a和b的值,框用于输出s的值 C.框用于输入a和b的值,框用于输入s的值 D.框用于输出a和b的值,框用于输入s的值 A 2.有流程图如下图所示,其功能是将键盘输入的数进行相加, 当输入的数为0时输出它们的和,则图中虚线部分的内容是() A.B.C.D. D 课堂练习 如下图所示的流程图: 算法执行时,若输入n的值为3,则输出s的值是() A.6B.8C.9D.15 3、如下图所示的流程图: C 课堂练习 4下面关于算法的描述,正确的是() A
50、.一个算法只能有一个输入 B.算法只能用框图来表示 C.一个算法的执行步骤可以是无限的 D.一个完整的算法,不管用什么方法来表示,都至少有一个输 出结果 D 课堂练习 3有部分流程图结构如下,其算法结构属于() A.顺序结构B.重复结构C.分支结构D.循环结构 D 课堂练习 6.(开放题)思考高楼的自动电梯在运行时需要 考虑哪些方面(例如方便乘客,节约能源等) ,请为自动电梯设计一个适宜的算法。 动动脑筋: Thanks 算法的三种基本逻辑结构 常用的流程图所用的基本符号 程序框名称功能 开始/结束算法的开始和结束 输入/输出输入和输出信息 处理计算与赋值 判断条件判断 流程线算法中的流向 一