1、第三单元 认识数据学习重点:学习重点:1.二进制与数制转换2.文本数据的编码二进制基本结构:1、有两个基本数字:2、采用逢 的进位规则3、采用位权表示法,即一个数码在不同位置上所代表的值不同 0,1 二进一(数码)(基数)(位权)把十进制非负整数转换为二进制数,可使用短除法,把十进制非负整数转换为二进制数,可使用短除法,即即。例如,把十进制整数例如,把十进制整数1818转换为二进制数的过程如下图:转换为二进制数的过程如下图:所得的余数倒排,即从高位到低位排列就是所得数。1818(1010)=1001010010(110101)2=12512402312202120=32160401=(53)1
2、0(8)10 =(?)2(66)D=(?)BR X 余数 低位 高位一般地,十进制非负整数转换成R进制数(R2)采用“除除R取余法取余法”,把R进制非负整数转换成十进制数采用“按权展开求和法按权展开求和法。例:17(10)=(8)17(10)=(16)23(10)=(8)30(10)=(16)Homework:将下列二进制转换成十进制,写出步骤。1101 101101 110001 110110 将下列十进制转换成二进制,写出步骤。10 36 320 1101 101101 110001 11011013 32 254 练习时刻练习时刻在Python中,可使用函数bin(x),oct(x),h
3、ex(x),将十进制整数num分别转换为二、八、十六进制,这里x为整数#将十进制整数100转换为二进制0b1100100#返回结果为字符串,前缀0b表示二进制#将十进制整数100转换为八进制0o144#返回结果为字符串,前缀0o表示八进制#将十进制整数100转换为十六进制0 x64#返回结果为字符串,前缀0 x表示十六进制体验体验用于文本数据字符编码的方案有多种类型,其中ASCII码和unicode是典型的2种方案。u ASCII码标准ASCII码(用7位二进制数表示一个字符):集中定义了等字符和符号,。ASCIIASCII码(十进制)码(十进制)字符字符031控制字符或通信专用字符(不可见)
4、32空格4857数字096590大写英文字母AZ97122小写英文字母az其他英文标点符号、运算符号、括号ASCIIASCII码码扩展ASCII码(用8位二进制数表示一个字符):计算机内部用一个字节来存放一个ASCII码字符,最高位用0表示。例如,“A”的ASCII码为01000001,即65。ASCII码用7位或8位二进制数表示一个字符,一般英文状态下一个字符占一个字节。计算机要处理汉字,每个汉字至少需要2个字节,必须对每个汉字进行编码,为了解决传统字符编码方案的局限性,用2个字节表示一个符号,这样就有216(65536)中不同的二进制编码,即用16位二进制数表示。u unicode 码Un
5、icodeUnicode码码 汉字编码之国家标准:(1)GB 23121980字符集共收录6763个汉字 (2)GBK字符集,兼容GB 23121980标准,收入21003个汉字 (3)GB 180302000字符集,包含GBK字符集和CJK统一汉字扩充A的汉字,共计27533个汉字;(4)GB 180302005字符集,在GB 180302000的基础上,增加了CJK统一汉字扩充B的汉字及其他汉字,共计70244个汉字。UnicodeUnicode码码 Unicode字符集,是全球可以共享的编码字符集,涵盖了世界上主要文字的字符,其中包括简繁体汉字,共计74686个汉字。如汉字“男”的Uni
6、code编码为30007(十进制),用十六进制表示为7537,用二进制表示为0111010100110111。ASCII码与unicode码的关系:后者兼容前者。原来用ASCII码能表示的字符,其对应的unicode码只是在原来的ASCII码前加上8个0,比如“a”的ASCII码是01100001,其unicode码是00000000 01100001。UnicodeUnicode码码 在Python中,函数ord()返回的是字符的Unicode码值,函数chr()返回Unicode码对应的字符。#显示字符”男”的编码值30007#字符“1”的编码值为4949#字符”A”的编码值为6565#将
7、编码值转换为对应的字符A chr(24352)+chr(39134)张飞#返回“张飞”str(ord(枣)+str(ord(庄)26531 24196体验体验信息的基本容量单位是:字节(Byte)最小的存储单位:位(bit),比特 1 Byte=8 bit千字节(KB)1KB=210B=1024B兆字节(MB)1MB=210KB=1024KB吉字节(GB)1GB=210MB=1024MB练习时刻练习时刻2.某数据文件压缩后的数据是512KB,已知其压缩比20:1,原文件数据是()。A.2560KBB.10MBC.56KBD.4MB3.汉字点阵是一种用黑白两色点阵来表示汉字字形的编码,一个8*8点阵字模的存储容量为()A.16字节B.1字节C.8字节D.64字节1.十进制非负整数转换成R进制数方法:()R进制非负整数转换成十进制数方法:()练习时刻练习时刻Thanks