1、第一章 数据与信息Data and informationData and Information内容总览This is a subtitle for your presentation目录CONTENTS1.1 感知数据1.2 数据、信息与知识1.3 数据采集与编码1.4 数据管理与安全1.5 数据与大数据这位同学的身高是这位同学的身高是170170cm这瓶矿泉水的价格是这瓶矿泉水的价格是2 2元元明天的气温是明天的气温是2626数据的概念请思考:请思考:数据只是数值吗?数据只是数值吗?数据可以表现为数字。数据可以表现为数字。数据的概念数据可以表数据可以表现为数值现为数值无法用数无法用数值直
2、接表值直接表示示使用文字使用文字“红红”、“蓝蓝”描述汽车颜色。描述汽车颜色。数据可以表现为文字。数据可以表现为文字。数据的概念请思考:请思考:如何描述一个地方的景色?如何描述一个地方的景色?数值?数值?文字?文字?绘绘 画画照照 片片 山高山高80008000米,水深米,水深2020米米 蓝天、绿地、高山蓝天、绿地、高山数据可以表现为图片。数据可以表现为图片。数据的定义This is a subtitle for your presentation关于数据关于数据定义定义数据数据是对客观事物的是对客观事物的符号表示。符号表示。表现形式表现形式文字、符号、图形、文字、符号、图形、图像、声音、视
3、频等。图像、声音、视频等。数字数字是最简单的一是最简单的一种数据,是对数据种数据,是对数据的一种狭义理解。的一种狭义理解。数据的定义This is a subtitle for your presentation计算机计算机的数据的数据在计算机科学中,在计算机科学中,数据数据是是指所有能被输入到计算机指所有能被输入到计算机并被计算机程序所处理的并被计算机程序所处理的符号总称。符号总称。文字、图形、图像、音频、文字、图形、图像、音频、视频等。视频等。结绳记事结绳记事:“事大,大结其绳,事小,小结其绳,结之多少,随物众寡。”易九家言数据不是现代社会所特有的。数据不是现代社会所特有的。数据及其演变T
4、his is a subtitle for your presentation锲形文字锲形文字电子计算机:数据处理的主要工具。电子计算机:数据处理的主要工具。购物小票购物小票线上购物线上购物数据与生活This is a subtitle for your presentation纸质车票纸质车票纸质车票纸质车票出租汽车出租汽车滴滴出行滴滴出行百度地图百度地图纸质地图纸质地图欧洲核子研究组织是世欧洲核子研究组织是世界上最大的物理学实验界上最大的物理学实验室万维网的发源地。室万维网的发源地。科学研究离不开数据。科学研究离不开数据。数据的客观性为科学研数据的客观性为科学研究提供可靠的依据。究提供可靠
5、的依据。欧洲核子研究组织(欧洲核子研究组织(CERNCERN)数据与科学This is a subtitle for your presentation目录CONTENTS1.1 感知数据1.2 数据、信息与知识1.3 数据采集与编码1.4 数据管理与安全1.5 数据与大数据系列 1,Jan,4.3系列 1,Feb,2.5系列 1,Mar,3.5系列 1,Apr,4.5系列 1,May,2.3系列 1,Jun,1.8系列 1,Jul,3.6系列 1,Aug,4.5系列 1,Sep,3.8系列 1,Oct,5.3系列 1,Nov,6.2系列 1,Dec,2.9JanFebMarAprMayJun
6、JulAugSepOctNovDecn单纯的数据是没有意义的。单纯的数据是没有意义的。数据的表现形式还不能完全数据的表现形式还不能完全表达其内容,经过解释,数表达其内容,经过解释,数据才变得有意义。据才变得有意义。n数据的种类与表现形式越来越多数据的种类与表现形式越来越多样化,数据在采集的方式、处理样化,数据在采集的方式、处理的速度等方面都有了质的飞跃,的速度等方面都有了质的飞跃,数据的含义也得到了扩展。数据的含义也得到了扩展。数据的定义This is a subtitle for your presentation从数据到信息202008212020082131245125031245125
7、0加工、处理加工、处理数数 据据信信 息息加工、处理、加工、处理、赋予含义赋予含义信息定义This is a subtitle for your presentation信息论奠基人香农-信息是用来消除随机不确定性的东西信息是用来消除随机不确定性的东西到目前为止,信息还未有统一的定义,出于研究目的、观察角度的不同,不同的学科往往有自己的定义。信息自古就有,人类的生活一直与信息密切相关信息自古就有,人类的生活一直与信息密切相关,人类通过了解信息来认识自然,利用信息进行发明创造。尽管不同的人对信息的定义可能有所不同,但所指向的都是同一对象,尽管不同的人对信息的定义可能有所不同,但所指向的都是同一对
8、象,这些对象有些能被直观感受,有些需要借助设备或其他事物才能被感受。这些对象有些能被直观感受,有些需要借助设备或其他事物才能被感受。课堂习题This is a subtitle for your presentation1.下面关于信息的叙述,不正确的是(下面关于信息的叙述,不正确的是()。)。A.信息是人类社会的重要资源。B.信息无处不在。C.计算机可以处理信息。D.只能在计算机中存储信息。答案:答案:D信息的特征1.1.信息的表示和传播需要依附于某种载体。信息的表示和传播需要依附于某种载体。文文字字声声音音图像图像视视频频信息的特征 信息可以在多人间进行共享,不会因为使用信息可以在多人间进
9、行共享,不会因为使用人数和次数的增加而损耗其内容。人数和次数的增加而损耗其内容。2.2.信息可以传递和共享。信息可以传递和共享。信息的特征3.3.信息的产生和利用具有时效性。信息的产生和利用具有时效性。可惜已经可惜已经1111月月1515号号了了信息的特征4.4.信息蕴含价值,但价值因人而异。信息蕴含价值,但价值因人而异。购物时以评价信息作为参考购物时以评价信息作为参考信息特征This is a subtitle for your presentation信息的价值包括显性价值和隐信息的价值包括显性价值和隐性价值。信息的价值是相对的。性价值。信息的价值是相对的。价值性价值性信息是可以共享的,同
10、一种信信息是可以共享的,同一种信息可以被不同接收者获取。息可以被不同接收者获取。共享性共享性信息不能独立存在,必须依附信息不能独立存在,必须依附于一定的载体。于一定的载体。体现信息的可存储性和传递性。体现信息的可存储性和传递性。载体依附性载体依附性信息反映事物某一特定时间内信息反映事物某一特定时间内的状态,它会随着时间的推移的状态,它会随着时间的推移而变化。而变化。时效性时效性信息是可以加工处理的。信息是可以加工处理的。可加工处理性使信息具有可加工处理性使信息具有真伪性。真伪性。可加工处理性、真伪性可加工处理性、真伪性课堂习题This is a subtitle for your presen
11、tation3.下面选项对信息特征的理解,错误的是(下面选项对信息特征的理解,错误的是()。)。A.“增兵减灶”引出信息具有传递性和真伪性特征B.天气预报、情报等引出信息有时效性C.信息都是一成不变的D.盲人摸象引出信息具有不完整性答案:答案:C知识的概念 根据树的年轮来推测树龄及每年的根据树的年轮来推测树龄及每年的平均降水量和气温情况。平均降水量和气温情况。知识是人们在社会实践中所获得的认识和经验的总和,知识是人们在社会实践中所获得的认识和经验的总和,是人类在实践中认识世界的成果。是人类在实践中认识世界的成果。四者关系This is a subtitle for your presentat
12、ion数据数据数字、文字、图像、数字、文字、图像、符号等,本身没有符号等,本身没有明确的意义。明确的意义。信息信息信息是数据经过储信息是数据经过储存、分析、解释后存、分析、解释后所产生的意义。所产生的意义。知识知识知识人们通过归纳、演绎,知识人们通过归纳、演绎,比较等手段对信息进行挖比较等手段对信息进行挖掘,将其中又价值的部分掘,将其中又价值的部分深层下来,形成知识。深层下来,形成知识。智慧智慧智慧是一种更高层次的综智慧是一种更高层次的综合能力,主要表现为收集、合能力,主要表现为收集、加工、应用、传播知识的加工、应用、传播知识的能力,以及对事物发展的能力,以及对事物发展的前瞻性看法前瞻性看法。
13、01030204四者关系This is a subtitle for your presentation四者关系This is a subtitle for your presentation四者关系This is a subtitle for your presentation1、数据本身没有意义,将数据放在某个语境中,或放在某个、数据本身没有意义,将数据放在某个语境中,或放在某个真实的场景中,数据就有了意义,这就是信息。人们通过归纳、真实的场景中,数据就有了意义,这就是信息。人们通过归纳、演绎、比较等手段对信息进行挖掘,形成知识。智慧是一种更演绎、比较等手段对信息进行挖掘,形成知识。智慧是
14、一种更高层次的综合能力,表现为收集、加工、应用、传播知识的能高层次的综合能力,表现为收集、加工、应用、传播知识的能力,以及对事物发展的前瞻性看法。力,以及对事物发展的前瞻性看法。2、受利益的驱使,有一些人会故意制造一些假数据。想保证数、受利益的驱使,有一些人会故意制造一些假数据。想保证数据的真实性,还需要从道德和法律层面来保证数据的真实。据的真实性,还需要从道德和法律层面来保证数据的真实。数据、信息与知识的关系单独的单独的3.14只是一个数据只是一个数据放到圆里的放到圆里的3.14圆周率的近似值,圆周率的近似值,就成了信息就成了信息3.14乘半径的平方乘半径的平方圆的面积,就变圆的面积,就变成了知识成了知识 在未来如果把在未来如果把3.14与其他知与其他知识进行整合并运用到实际中去,识进行整合并运用到实际中去,就演变成了智慧。就演变成了智慧。小 结数据、信息与知识数据、信息与知识数数 据据信信 息息知知 识识数据、信息与数据、信息与知知 识的关系识的关系描述事物的符号记录。描述事物的符号记录。经过加工、处理的数据。经过加工、处理的数据。经过提炼、归纳、转化后的信息。经过提炼、归纳、转化后的信息。数据处理为信息,信息转化为知识。数据处理为信息,信息转化为知识。