信息的编码存储与管理北京大学计算机科学技术研究所课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《信息的编码存储与管理北京大学计算机科学技术研究所课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息 编码 存储 管理 北京大学 计算机科学 技术研究所 课件
- 资源描述:
-
1、2023-1-17北京大学1注意事项注意事项n注意事项注意事项n助教分配已完成,注意看课程网站;助教分配已完成,注意看课程网站;nEmail,电话发给助教;,电话发给助教;n上交作业的格式:标题、学号、姓名;上交作业的格式:标题、学号、姓名;2023-1-17北京大学2内容回顾内容回顾n前讲问题前讲问题n计算机是什么?计算机是什么?n冯诺依曼体系结构是怎样?冯诺依曼体系结构是怎样?n操作系统的基本功能是什么?操作系统的基本功能是什么?第三讲第三讲 信息的编码、存储与管理信息的编码、存储与管理北京大学北京大学 信息科学技术学院信息科学技术学院20232023年年1 1月月1717日日2023-1
2、-17北京大学4本讲内容本讲内容n数制转换及二进制运算数制转换及二进制运算n数制及数制转换、二进制数的运算n数字化原理数字化原理n声音、图像、视频等信息的编码n信息的输入与输出信息的输入与输出n键盘/鼠标输入、显示打印输出等等n信息存储的原理及设备信息存储的原理及设备n存储介质、存储器及其工作原理n信息的管理信息的管理n文件系统、数据库数制转换及二进制运算数制转换及二进制运算2023-1-17北京大学6数制及数制转换数制及数制转换n数制也称计数制,是指用一组固定的符号和统一的规则来表示数值的方法。按进位的方法进行计数,称为进位计数制。计算机系统中几种常用进位计数制:n 十位制十位制(Decim
3、al notation)n 二进制二进制(Binary notation)n 八进制八进制(Octal notation)n 十六进制数十六进制数(Hexdecimal notation)计算能力等价计算能力等价2023-1-17北京大学7数制及数制转换数制及数制转换n十进制数的特点是用十个数码(09)表示所有的数,基数是10,采用逢十进一的记数方法。n二进制数的特点是用两个数码(01)表示所有的数,基数是2,采用逢二进一的记数方法,n八进制数的特点是用八个数码(07)表示所有的数,基数是8,采用逢八进一的记数方法。n十六进制数的特点是用十六个数码(0F)表示所有的数,基数是16,采用逢十六进
4、一的记数方法。2023-1-17北京大学8数制及数制转换数制及数制转换2023-1-17北京大学9例例:十进制数十进制数253在不同数制下的表示在不同数制下的表示253=2102+5101+3100=An2n+A(n-1)2(n-1)+A121+A020=Bm8m+B(m-1)8(m-1)+B181+B080=Ck16k+C(k-1)16(k-1)+C1 161+C0 160AnA(n-1)A1A0:二进制数BmB(m-1)B1B0:十进制数CkC(k-1)C1C0:十六进制数数制及数制转换数制及数制转换2023-1-17北京大学10 不同数制之间的转换,实质是基数间的转换。一般转换的原则是:
5、如果两个有理数如果两个有理数相等,则两数的整数部分和小数部分一定相等,则两数的整数部分和小数部分一定分别相等。分别相等。因此,各数制之间进行转换时,通常对整数部分和小数部分分别进行转换。数制及数制转换数制及数制转换2023-1-17北京大学11整数的转换整数的转换数制及数制转换数制及数制转换十进制数转换成二进制数十进制数转换成二进制数 把十进制数转换为二进制数的方法是:整数转换用“除2取余法”;小数转换用“乘2取整法”。111111012023-1-17北京大学12十进制数转换成二进制数十进制数转换成二进制数 将(0.745)10转换成四位二进制小数,转换过程如下:0.7452 1.490 取
6、出整数取出整数10.4902 0.980 取出整数取出整数00.9802 1.960 取出整数取出整数10.9602 1.920 取出整数取出整数10.920 转换结束转换结束 这里,第四次乘积的小数部分不为0,但已满足题目所要求的精度,所以,(0.745)10 (0.1011)2。显然,在转换过程中,做的乘法次数越多,结果就越精确。小数的转换小数的转换数制及数制转换数制及数制转换2023-1-17北京大学13十进制数转换成八进制数和十六进制数十进制数转换成八进制数和十六进制数 十进制数转换成八进制数的方法是:整数部分转换采用“除8取余法”;小数部分转换采用“乘8取整法”。十进制数转换成十六进
7、制数的方法是:整数部分转换采用“除16取余法”;小数部分转换采用“乘16取整法”。数制及数制转换数制及数制转换2023-1-17北京大学14二进制与八进制及十六进制之间的转换二进制与八进制及十六进制之间的转换数制及数制转换数制及数制转换2023-1-17北京大学15非十进制数转换成十进制数非十进制数转换成十进制数 非十进制数转换成十进制数的方法是,把各个非十进制数按权展开求和即可。即把二进制数(或八进制数,或十六进制数)写成2(或8或者16)的各次幂之和的形式,然后计算其结果。11111101.1011=127+126+125+124+123+122+021+120+12-1+02-2+12-
8、3+12-4=253.6875(375)8 =382+781+580=253(FD)16=D161+F160=253.745精度原因数制及数制转换数制及数制转换2023-1-17北京大学16数制及数制转换数制及数制转换n问题:任意2个数制之间的转换方法?n如15进制数转换为12进制,该如何进行?2023-1-17北京大学17二进制数的运算n在计算机内部,最基本的数制表示是二进制。其运算包括:n算术运算:加、减、乘、除n逻辑运算:与、或、非、异或2023-1-17北京大学18二进制数的算术运算二进制数的算术运算 加法加法减法减法二进制数的运算二进制数的运算2023-1-17北京大学19二进制数的
9、算术运算二进制数的算术运算 乘法乘法除法除法二进制数的运算二进制数的运算(10001111)2(6)10(38)10(6)10(2)102023-1-17北京大学20二进制数的逻辑运算:没有进位,按位运算二进制数的逻辑运算:没有进位,按位运算逻辑非逻辑非 单操作数运算:1 0;0 1逻辑或逻辑或|双操作数运算:0|0=0;0|1=1 1|0=1;1|1=1逻辑与逻辑与&双操作数运算:0&0=0;0&1=0 1&0=0;1&1=1逻辑异或逻辑异或 双操作数运算:0 0=0;0 1=1 1 0=1;1 1=0!11010=00101 11001|01101 11101 11001&01101 01
10、001 11001 01101 10100二进制数的运算二进制数的运算数字化原理数字化原理2023-1-17北京大学22“冯.偌依曼体系结构”的基本思路:q 由运算器、存储器、控制器、I/O设备五大部分组成。q 程序与数据预先存入主存,工作时连续自动高速顺序执行。即“存储程序”思想。q 采用二进制形式表示数据和指令。虽然现实生活中的数据其表现形式多种多样,但在现在虽然现实生活中的数据其表现形式多种多样,但在现在的计算机内部,一律采用二进制表示数据和指令。的计算机内部,一律采用二进制表示数据和指令。数字化原理数字化原理常见的数据类型常见的数据类型计算机内的数据n计算机内的数据采用统一的数据表示法
11、n位(bit):存储在计算机中的最小数据单位,0 或1n位模式:表示数据的位序列,或位流n字节(byte):长度为8的位模式称为字节2023-1-17北京大学25q 指令编码q 数值表示q 字符编码q声音编码q 图像编码q 影像编码q 基本编码规则数字化原理数字化原理2023-1-17北京大学26 将计算机内部所能进行的各种基本操作用二进制数表示出来,以便于计算机的识别于运行。如:q 加法加法 00000001q 减法减法 00000010q 乘法乘法 00000011q 除法除法 00000100q 跳转跳转 00000101q 则:1+3 可以表示为 00000001 00000001 0
12、00000112*4 可以表示为 00000010 00000011 00000100每条指令,都用固定每条指令,都用固定长度的二进制数表示长度的二进制数表示数字化原理数字化原理指令的编码指令的编码2023-1-17北京大学27 在计算机内部,由于要运算等因素,并不是直接以原始的二进制数本身来存储的,而是要经过一定的编码,包括:原码、原码、反码和补码反码和补码。有关这三种码的含义及其所表示的数据的方式(整数和浮点数),有兴趣的同学可以在课后阅读有关文献。此外,计算机内用来表示数据的二进制位数也不是无限的,往往用固定位数固定位数来表示数据,因此,其表达的数据范围是有限有限的的(在“程序设计程序设
13、计”中会涉及):p 8位:0255(28-1)字节p 16位:065535(216-1)p 32位:040亿(232-1)p 64位:天文数字(264)数字化原理数字化原理数值的表示数值的表示2023-1-17北京大学28字符的编码字符的编码 ASCII码是美国国家标准信息交换码(American National Standard Code for Information Interchange)的简称,是目前国际上使用最广泛的字符编码。ASCII码的编码规则为:每个字符用7位二进制数位二进制数(d6d5d4d3d2d1d0)来表示,7位二进制共有128种状态(27=128),可表示128个
14、字符,7位编码的取值范围为00000001111111。在计算机内,每个字符的ASCII码用1个字节(8位)来存放,字节的最高位(d7)为校验位校验位,通常用“0”来填充,后7位(d6d5d4d3d2d1d0)为编码值。7位编码的ASCII码字符集包括了128个字符,称为标准的ASCII码字符集。字符编码:字符编码:ASCII码码2023-1-17北京大学29ASCII码码字符编码:字符编码:ASCII码码A:010000012023-1-17北京大学301、常用汉字有30005000个,无法用一个字节编码无法用一个字节编码。2、我国公布的通用汉字字符集(基本集)及其交换码标准GB2312-8
15、0共收集了7445个字符,用两个字节两个字节编码表示一个字符,每个字节最高位为0。GB2312-80编码简称国标码国标码。3、汉字内码内码是汉字在计算机内部存储、处理和传输用的信息编码。它必须与ASCII码兼容但又不能冲突。内码是把国标码两个字节的最高位置“1”得到的。字符编码:汉字编码字符编码:汉字编码2023-1-17北京大学31 声音是随时间变化的声波波形。与颜色类似,对声音波形需要进行离散化采样。声波的离散化采样是在两个维度上独立进行的。从时间维上进行时间的离散化(按一定的均匀时间间隔采样),同时,每一个采样点的高度值(声音波形的振幅)也是经过离散化,纪录为n个bit的整数编码。两者合
16、在一起表示了声音波形的编码文件。这种记录声音的方式称为声音的波形编码波形编码。声音的编码声音的编码2023-1-17北京大学32 采样点的时间间隔越小,就与原始波形函数越符合。声音编码中的“采样频率”,指得就是单位时间对声音波形的采样次数。采样频率用Hz(赫兹)为单位,每秒钟采样500次即为500Hz。显然,采样频率高的声音记录质量会更好一些,为此所用的存储空间也大一些。音乐CD的采样频率为44.1KHz。为了存储一首4分钟长的歌曲,假定它是双声道,每声道2字节的采样值,一次采样需要占用32bit。这样每1秒钟的音乐就需要441004160K字节,总计需要460160K36MB。需要的存储容量
17、是非常大的。声音的编码声音的编码2023-1-17北京大学33以颜色码以颜色码为基础,为基础,将原始连续信息离散化为网格点,记录每个网格点的颜色值。2色色分辨率分辨率图像的编码:点阵表示图像的编码:点阵表示2023-1-17北京大学34图像的编码:点阵表示图像的编码:点阵表示2023-1-17北京大学35 数字化电影(影像)主要是由时间上连续序列的数字化图片再加上数字化声音的合成体。影像是在时间和空间上对活动场景的离散采样。影像中的一张图片是对某一时刻场景的空间离散采样,称为影像的一帧。每秒约每秒约25帧的连续帧采样就形成影像,这是和人眼的视觉效果有关。帧的连续帧采样就形成影像,这是和人眼的视
18、觉效果有关。通常一秒钟需要采样24帧左右,才能在视觉上感知为连续影像。当每秒钟采集的影像帧再减少,视觉上会有断续感,效果变差。如果多于30帧/秒,视觉基本上没有区别了,因为人眼的分辩能力有限。影像所需要的存储空间非常大。存储10分钟的640480的真彩色连续影像,按照每秒钟25帧计算,不包括声音信息,需要(6404803 byte25帧帧10分钟分钟60秒)秒)个字节,大约14GB(13824M)字节。与影像相比,动画通常是将矢量图形作为每一帧来存储,数据量比之影像要小很多。影像的编码影像的编码2023-1-17北京大学36目标数据集合大小目标数据集合大小 C C 2k则最小则最小K为编码位数
19、为编码位数(例)大写字母A,B,C,D,X,Y,Z共26个(32=25)大写字母集合 5 bit的编码集合(0000011001)映射规则:不多不少映射规则:不多不少,一一对应一一对应映射的不变量:映射的不变量:序(大小)保持不变序(大小)保持不变数字化原理数字化原理基本编码规则基本编码规则二进制位数是关键!二进制位数是关键!2023-1-17北京大学37编码的关键是:编码的关键是:离散对象类离散对象类 的集合分析的集合分析键盘编码:分析 构成文字 的基本元素集1.大小写字母 集合大小 522.数字和标点符号(可打印标点符号)集合 42A B C D E X Y Z a b c d e x y
20、 z ,!“#$%&()*+-./0.9 :;?_|一共包括了 94 种不同的可打印符号,二进制编码需要 7 位。数字化原理数字化原理基本编码规则基本编码规则信息的输入与输出信息的输入与输出2023-1-17北京大学39 信息输入工作的实质就是把形式纷繁、丰富多彩的信息形式统统转化为计算机内部二进制数字形式。计算机系统信息处理的二值特性以及信息的编码方式,决定了硬件的输入设备的基本原理。不同的输入设备,根据其输入信息的编码特点,利用其自身的物理电路特性物理电路特性,完成需采集信息的二进制编码采集二进制编码采集,并通过缆线传输到计算机内部。信息的输入信息的输入2023-1-17北京大学40输入设
21、备将采集的信息转换成二进制(根据信息的编码规则)信息以二进制形式输入计算机信息的输入信息的输入2023-1-17北京大学41q 输入设备产生信号q 通过连接线路进入计算机q 操作系统与输入设备驱动程序协作,接收输入信号q 应用软件或操作系统本身对输入信号进行解释处理、编码q 应用软件或操作系统将编码后的数据存储到存储设备中q 必要的时候,应用软件或操作系统从存储设备中读取出来,进行解码,并通过相关输出设备显示出来通信线路二进制流输入设备计算机内部硬件的作用软件的作用每种设备都能产生每种设备都能产生自己的二进制信号自己的二进制信号信息的输入信息的输入2023-1-17北京大学42信息的输入信息的
展开阅读全文