1、3.1 数 据 编 码第二课时学习目标学习目标了解各类数据采集的基本方法理解数据编码的意义和作用能够解释文本、音频等数据的编码原理01020304二进制与其他进制的转换。声音的数字化过程声音的数字化过程编码编码量化量化对采样数据进行量化将量化后的数据用二进制数值表示对模拟声音信号按给定的时间间隔进行采样采样采样复十进制数十进制数 100,101,102,103:1935(10)=5*100+3*101+9*102+1*103二进制数二进制数1001(2)=1*20+0*21+0*22+1*23=9(10)20,21,22,230和和12逢二进一逢二进一 即即1+1=10:09逢十进一逢十进一
2、即即9+1=1010=51+310+9100+21000一、进制转换一、进制转换学按权展开求和十六进制数十六进制数 一、进制转换一、进制转换点基数:16逢十六进一逢十六进一ABCDEF(abcdef)分别相当于十进制数的分别相当于十进制数的1015基本计数规则:权值:160,161,162,163,例:十六进制整数3D(16)所用数字:=D(13)*160+3*161=61(10)0.9,一、进制转换一、进制转换测十进制R进制二进制八进制十六进制按权展开求和1011(2)2C(16)231(8)=1*20+1*21+0*22+1*23=11(10)=C*160+2*161=44(10)=1*8
3、0+3*81+2*82=153(10)Binary Octal Hexadecimal Decimal 把十进制数除以2,所得余数做为二进制的最低位数;再把商除以2,所得余数作为次低位数;如此反复,直到商等于0为止;从下往上读出二进制数字。一、进制转换一、进制转换学十进制转二进制自学课本P60将55(10)转换为二进制数除2取余法把十进制数除以2,所得余数做为二进制的最低位数;再把商除以2,所得余数作为次低位数;如此反复,直到商等于0为止;从下往上读出二进制数字。55222712131 61 3022 112 011 1 0 1 1 1 B202122232425*32+16+0+4+2+1=
4、55 D 一、进制转换一、进制转换点十进制转二进制自学课本P60将55(10)转换为二进制数除8取余法一、进制转换一、进制转换练十进制转十六进制十进制转八进制除16取余法558867066 7 O8081*48+7=55 D55161637033 7 H160161*48+7=55 D同一个数值用任何数制同一个数值用任何数制表示都是一样的。表示都是一样的。以55为例一、进制转换一、进制转换结十进制R进制除R取余法二进制八进制十六进制按权展开求和Binary Octal Decimal Hexadecimal int(num,R)#R进制的整数num转换为十进制,num需是字符串类型bin(nu
5、m)#十进制整数num转换为二进制oct(num)#十进制整数num转换为八进制hex(num)#十进制整数num转换十六进制一、进制转换一、进制转换拓二进制转八进制1 0 1 1 0 1 1 1 B01.取3合1,不足3位时,补02.从右到左按权展开求和得到八进制数十进制十进制二进制二进制01234567二进制转十六进制?一、进制转换一、进制转换测110100(2)=()(10)3D(16)=()(10)255(10)=()(16)56 D=()B5261FF111000数制转换字母、特殊字符、汉字如何编码?多媒体信息编码字符编码值编码值字符十进制二进制二、文本数据的编码二、文本数据的编码学
6、课本P60活动2,用python进行编码1.ord()函数:查看自己名字中每个字符对应的存储编码值2.chr()函数:查看整数编码值(0-1114111)对应的字符3.bin()函数:将十进制转换为相应的二进制字母、数字、字母、数字、标点符号、汉字标点符号、汉字ASCII码Unicode码二、文本数据的编码二、文本数据的编码学二进制二进制标准ASCII码(用7位二进制数表示一个字符)扩展ASCII码(用8位二进制数表示一个字符)计算机内部用一个字节(1B=8bit)来存放一个ASCII码字符,最高位用0表示。ASCII码码位数表示位数表示表示字符表示字符大小写英文字母、标点符号、数字等,共12
7、8个二、文本数据的编码二、文本数据的编码学二、文本数据的编码二、文本数据的编码学产生原因Unicode字符集ASCII码与unicode码的关系解决传统字符编码方案的局限性,用2个字节表示一个符号。是全球可以共享的编码字符集,涵盖了世界上主要文字的字符,其中包括简繁体汉字,共计74686个汉字。后者兼容前者,原来用ASCII码能表示的字符,其对应的unicode码只是在原来的ASCII码前加上8个0。比如“a”的ASCII码是01100001,其unicode码是00000000 01100001二、文本数据的编码二、文本数据的编码学Unicode码 共收录6763个汉字兼容GB 23121980标准,收入21003个汉字包含GBK字符集和CJK统一汉字扩充A的汉字,共计27533个汉字在GB180302000的基础上,增加了CJK统一汉字扩充B的汉字及其他汉字,共计70244个汉字二、文本数据的编码二、文本数据的编码学 GB 23121980字符集字符集GBKGBK字符集字符集GB 180302000GB 180302000字符集字符集GB 180302005GB 180302005字符集字符集课堂小结课堂小结结感 谢 观 看