《信息论与编码》课件第2章 信源与信源.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《《信息论与编码》课件第2章 信源与信源.ppt》由用户(momomo)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息论与编码 信息论与编码课件第2章 信源与信源 信息论 编码 课件 信源
- 资源描述:
-
1、目录l2.2 信源的数学模型和分类信源的数学模型和分类l2.3 离散信源的熵与互信息离散信源的熵与互信息 l2.4 熵的性质熵的性质 l2.5 离散信源序列的熵离散信源序列的熵 l2.6 连续信源的熵与互信息量连续信源的熵与互信息量 l2.7信源相关性与冗余度信源相关性与冗余度2.1背景知识背景知识v信源需要发出的消息数量不是一个,在任何信源需要发出的消息数量不是一个,在任何指定的时刻,信源到底发出哪个消息是不能指定的时刻,信源到底发出哪个消息是不能够事先确定的,即具有随机性;够事先确定的,即具有随机性;v如果信源每次发出的消息是已知的或者事先如果信源每次发出的消息是已知的或者事先确定的,则该
2、消息不能够提供任何信息。由确定的,则该消息不能够提供任何信息。由于符号出现是随机,给观察者提供了一定的于符号出现是随机,给观察者提供了一定的信息。信息。v不能够使用确定函数进行描述,应当使用统不能够使用确定函数进行描述,应当使用统计方法对其规律进行研究。计方法对其规律进行研究。背景知识背景知识 1.概率概率基础基础知识知识1212.()().()()rraaaXp ap ap ap x概率空间rirrapaEX1)(rirrrirrXEapaapEXaDX12212)()()(是随机变量围绕均值分布离散程是随机变量围绕均值分布离散程度的测度,或者说是随机变量混度的测度,或者说是随机变量混乱程度
3、的一种测度。乱程度的一种测度。(,)()()Cov X YE XEX YEY(,)()()XYCov X YEXEX YEYDXDYDXDY协方差协方差互相关互相关反应变量相关程度的指标反应变量相关程度的指标统统计计量量联合概率矩阵表联合概率矩阵表示形式示形式样本空间算术平均代替统计算术平均代替统计 平均平均Lxxx,.,21LllxLX112211()1LllSxXL样本样本方差方差EXEX未知未知22111()LllSxEXLEXEX已知已知大数定理大数定理1XEXP1SDXP)()()(YPXPXYP相互独立相互独立)|()(XYPYP)()()()()()()()()(21222121
4、2111srrrssXYbapbapbapbapbapbapbapbapbapPsjjiibapap1)()(rijijbapbp1)()(1121112222|12(|)(|)(|)(|)(|)(|)(|)(|)(|)ssY Xrrsrp bap bap bap bap bap baPp bap bap aa条件转移条件转移概率矩阵概率矩阵riabpsjij,.,2,11)|(1完备性完备性riijirijijabpapbapbp11)|()()()(riijiijijjijiabpapabpapbpbapbap1)|()()|()()()()|(贝叶斯贝叶斯公式公式2平稳随机过程平稳随机过
5、程随机过程随机过程12(),(),.,()nX tX tX t12(),(),.,()nX tX tX t具有相同联合概率具有相同联合概率分布分布12,.,nt ttT注意参数注意参数1n 任意整数任意实数严格平稳条件过于严格宽(弱、广义)随机过程宽(弱、广义)随机过程()E X t与时间与时间t t无关无关如果如果(,)()XXR s tR t s仅与时间间隔(仅与时间间隔(t-s)有关)有关mLiimLimiixxxm121)(自相关自相关12211()LmiimiXYLmLmiimiix ymxy互相关互相关1 1由样本直接得到由样本直接得到2 2算术平均形式算术平均形式反映数据关联程度
6、反映数据关联程度2.2 信源的数学模型和分类信源的数学模型和分类 产生消息的信源符号在产生消息的信源符号在幅度和时间幅度和时间上都是上都是离散的离散的(与与信号与系统中的概念不同信号与系统中的概念不同),即符号数量是,即符号数量是可数的或可数的或者是有限的者是有限的,这样的信源是离散信源。,这样的信源是离散信源。骰子只有骰子只有1,2,3,4,5,6共共6种点数,种点数,将掷一个骰子得到的点数看作是信源取值,那么这将掷一个骰子得到的点数看作是信源取值,那么这种信源就是离散信源种信源就是离散信源 幅度和幅度和时间时间离散信源离散信源 连续信源连续信源幅度和时间上都是离散的幅度和时间上都是离散的时
7、间上或者在幅度上是连续的时间上或者在幅度上是连续的如果信源的符号在如果信源的符号在时间时间上或者在上或者在幅度幅度上是连续的,上是连续的,这类信源就是这类信源就是连续信源连续信源。如表示声音变化的电信号,。如表示声音变化的电信号,不仅在时间上是连续取值,而且在幅度也是连续变不仅在时间上是连续取值,而且在幅度也是连续变化的,这样的信源就是连续信源。化的,这样的信源就是连续信源。可以对信号进行取样,将之转换为时间上离散的信可以对信号进行取样,将之转换为时间上离散的信号序列,但是由于该信号序列的号序列,但是由于该信号序列的幅度取值是连续的幅度取值是连续的,所以这样的信源仍然是所以这样的信源仍然是连续
8、信源连续信源;如果对序列进行如果对序列进行量化编码量化编码,就得到数字信号序列,就得到数字信号序列,时间和幅度都是离散的信号,这样的信源就是离散时间和幅度都是离散的信号,这样的信源就是离散信源。信源。取样、量化会造成信息损失,将在后面章节取样、量化会造成信息损失,将在后面章节中进行分析、讨论。中进行分析、讨论。模拟信号模拟信号取样取样离散信号离散信号量化编码量化编码数字信号数字信号信号信号信息论信息论连续连续信源信源连续连续信源信源离散离散信源信源消息消息符号符号之间之间是否是否关联关联有记忆信源有记忆信源无记忆信源无记忆信源符号序列或者矢量符号序列或者矢量描述描述方式方式单个符号单个符号也可
9、以使用符号序列也可以使用符号序列2.1.1信源输出的消息由随机变量描述信源输出的消息由随机变量描述 v离散无记忆信源离散无记忆信源可以用一个概率空间完全描述出来,可以用一个概率空间完全描述出来,即各个符号出现的概率一定,那么信源就确定了;即各个符号出现的概率一定,那么信源就确定了;v信源一定,那么各个符号出现的信源一定,那么各个符号出现的概率概率就确定了,所就确定了,所以以信源的消息符号及其概率分布信源的消息符号及其概率分布完整地描述了信源完整地描述了信源的特性。的特性。v定义定义2.1 如果信源输出的消息数量是如果信源输出的消息数量是有限或有限或者可数的者可数的,而且每次只输出符号集中的一个
10、,而且每次只输出符号集中的一个消息,这样的信源称为消息,这样的信源称为简单简单离散信源。离散信源。1212.()().()()rraaaXp ap ap ap x且满足且满足 1()1riip a简单离散信源而言,概率空间描述了信源的统计特性简单离散信源而言,概率空间描述了信源的统计特性 v投掷骰子问题 123456111111()666666aaaaaaXp x定义定义2.2 如果信源的输出是单个符号消息,但是消如果信源的输出是单个符号消息,但是消息的数量是息的数量是不可数的不可数的,即输出消息的取值是连续,即输出消息的取值是连续的,这样的信源称为简单的的,这样的信源称为简单的连续信源连续信
11、源。如使用如使用模拟器件模拟器件万用表、示波器观测的电压、电万用表、示波器观测的电压、电流信号都是连续数据,其取值幅度都是连续的。流信号都是连续数据,其取值幅度都是连续的。6,5,4,3,2,1,1)(61iiiaapvR表示实数(,)()()Xa bp xp x()()XRp xp x取值范围取值范围badxxp1)(R1)(dxxp2.1.2 信源输出的消息由随机矢量描信源输出的消息由随机矢量描述述 信号很多情况下信号很多情况下信源输出的消息符号之间具有一定的相关性;信源输出的消息符号之间具有一定的相关性;简单信源模型不能够描述;简单信源模型不能够描述;或者或者消息是由一系列符号组成的消息
12、是由一系列符号组成的简单信源模型也不能够描述这种由符号简单信源模型也不能够描述这种由符号矢量构成的消息。矢量构成的消息。v比如有一个布袋,内放比如有一个布袋,内放100个球,其中白球个球,其中白球80个,个,黑球黑球20个,如果除了颜色不同之外,其它方面如手个,如果除了颜色不同之外,其它方面如手感、大小等都相同。现在从布袋中随机摸取一个球,感、大小等都相同。现在从布袋中随机摸取一个球,观察球的颜色,摸到的球要么是白色,要么是黑色。观察球的颜色,摸到的球要么是白色,要么是黑色。v如果将这样一个实验视为一个信源,这样的信源可如果将这样一个实验视为一个信源,这样的信源可以使用简单的离散信源加以描述,
13、即以使用简单的离散信源加以描述,即12()0.80.2Xaap x一维形式一维形式v改变实验方法,进行两次取球实验,改变实验方法,进行两次取球实验,v首先取出一个球,记录球的颜色,首先取出一个球,记录球的颜色,v取出的球不放回去,然后再取一个球,记录球的颜取出的球不放回去,然后再取一个球,记录球的颜色。色。v现在考察取出的两个球的颜色,只有现在考察取出的两个球的颜色,只有4种可能:白种可能:白色白色、白色黑色、黑色白色、黑色黑色色白色、白色黑色、黑色白色、黑色黑色 。va1,a2分别表示白色球和黑色球分别表示白色球和黑色球 211122122(,)(,)(,)(,)80 7980 2020 8
14、020 19()100 99100 99100 99100 99a aa aa aa aXp x二维适量二维适量v定义定义2.3 如果离散信源输出的消息是由如果离散信源输出的消息是由一系列符一系列符号号组成的,这样的信源称为组成的,这样的信源称为多维离散信源多维离散信源。使用使用N N维随机矢量描述,维随机矢量描述,N N维随机矢量也称为维随机矢量也称为N N维随维随 机序列。机序列。一般说来,随机序列的统计特性比较复杂,一般说来,随机序列的统计特性比较复杂,分析起来比较困难。分析起来比较困难。如果信源输出的随机序列的统计特性与时间的推移如果信源输出的随机序列的统计特性与时间的推移 无关,那么
15、该序列是平稳的。无关,那么该序列是平稳的。平稳随机序列分析相对简单,在实际中,为了分析问平稳随机序列分析相对简单,在实际中,为了分析问 题方便起见,假设分析的序列是平稳的。题方便起见,假设分析的序列是平稳的。11121112(,.,)(,.,).(,.,)(,.,)(,.,).(,.,)()NrrNrraaaaaaXp aap aap aap xv如果信源输出的随机序列中,如果信源输出的随机序列中,每个随机变量都是离散的;每个随机变量都是离散的;随机矢量的各维概率分布都与时间无关,即任何时刻随随机矢量的各维概率分布都与时间无关,即任何时刻随机矢量的各维概率分布相同,机矢量的各维概率分布相同,那
16、么这样的信源称为离散平稳信源;那么这样的信源称为离散平稳信源;u用用N维概率空间描述。维概率空间描述。11121112(,.,)(,.,).(,.,)(,.,)(,.,).(,.,)()NrrNrraaaaaaXp aap aap aap x1离散无记忆信源离散无记忆信源 vN维联合概率分布表示为维联合概率分布表示为 11()()()iNNNikiiP Xp Xp a特点特点消息的符号之间彼此相互独立消息的符号之间彼此相互独立服从同一分布服从同一分布独立同一分布独立同一分布不仅具有相同分布类型分布类型,而且参数也相同参数也相同e.Ge.G都是正态分布,且均都是正态分布,且均值、方差相等值、方差
17、相等此时此时v例如例如:取球方式取球方式,每次从袋中取出一个球,只记录每次从袋中取出一个球,只记录球的颜色(用变量球的颜色(用变量x1表示),将球放回袋中,然后表示),将球放回袋中,然后再次取出一球,记录球的颜色(用变量表示再次取出一球,记录球的颜色(用变量表示x2),),如果将这样两次取球实验视为信源输出符号,显然如果将这样两次取球实验视为信源输出符号,显然信源输出消息构成二维随机序列,而构成消息的两信源输出消息构成二维随机序列,而构成消息的两个随机变量相互独立,所以可以用随机变量的乘积个随机变量相互独立,所以可以用随机变量的乘积加以描述。加以描述。1 212()()()p x xp x p
18、 x比如比如12xa21xa2 121()()()0.2 0.80.16p a ap a p aK:编码器输入二进制数据长度编码器输入二进制数据长度N:输出二进制数据长度输出二进制数据长度。由于输送到信道编码器的数据是先经过信源编码由于输送到信道编码器的数据是先经过信源编码器编码,所以相关性很弱器编码,所以相关性很弱;分组编码器将这些比特流数据划分为长度为分组编码器将这些比特流数据划分为长度为k的的一个个码组,并对每个码组进行信道编码一个个码组,并对每个码组进行信道编码;比特数据取值只有比特数据取值只有0,1两种符号,服从独立两种符号,服从独立同一分布同一分布。(n,k)分组码分组码线性分组码
19、线性分组码:无记忆信源无记忆信源通常情况下,信源在不同时刻发出的符号之通常情况下,信源在不同时刻发出的符号之间是相互关联的。间是相互关联的。如前文所述的布袋取球实验中,如前文所述的布袋取球实验中,u先取一球不放回,然后再取一球,第二个球的颜先取一球不放回,然后再取一球,第二个球的颜色概率分布与第一个球的颜色有关。;色概率分布与第一个球的颜色有关。;u如果摸出第一球为白色,则摸取第二个球颜色的如果摸出第一球为白色,则摸取第二个球颜色的概率为概率为 1121(|)79/99,(|)20/99p a ap aau若第一个球为黑色,则取第二个球颜色的概率若第一个球为黑色,则取第二个球颜色的概率 122
20、2(|)80/99,(|)19/99p aap aa组成消息的两个球的颜色之间存在关联,这种信组成消息的两个球的颜色之间存在关联,这种信源是有记忆的源是有记忆的 v离散有记忆信源用N维联合概率分布加以描述 12121121(,.)(|,.,)(,.)NNNNp x xxp xx xxp x xx1211122122(|,.)(|,.,)(,.,).NNNNNp xx xxp xx xxp x xx特点特点1 1表述的复杂程度将随序列长度表述的复杂程度将随序列长度N N的增加而增加的增加而增加 ;2 2符号之间的相关性随着符号间隔的增加而减弱符号之间的相关性随着符号间隔的增加而减弱;处理处理方法
21、方法1 1 根据实际研究的需要限制随机序列的长度根据实际研究的需要限制随机序列的长度2 2 需要考虑系统复杂程度来建立更为简单的模型需要考虑系统复杂程度来建立更为简单的模型,以达到相应的研究目的。,以达到相应的研究目的。v当记忆长度为m+1时,即信源每次发出符号只与前m个符号相关,与更前面的符号无关,称这种信源为m阶马尔可夫信源。1212(|,.,.)(|,.)iiii miiii mp x xxxp x xxx如果条件概率与时间起点无关,这样的信源称如果条件概率与时间起点无关,这样的信源称为齐次马尔可夫信源为齐次马尔可夫信源。12121(|,.,.)(|,.)iiii mmmmpx x xx
22、pxx xx定义定义2.4 如果连续信源输出消息时由一系列符如果连续信源输出消息时由一系列符号组成,这样的信源称为号组成,这样的信源称为多维连续信源多维连续信源,也可,也可以用以用N维随机矢量来描述。维随机矢量来描述。2.2 离散信源的熵与互信息离散信源的熵与互信息 信源的随机性信源的随机性1.1.某时刻输出符号是随机的某时刻输出符号是随机的,接收者事先不能确定,接收者事先不能确定2.2.收到信息后可以消除或者减小这种不确定性收到信息后可以消除或者减小这种不确定性噪声,干扰存在,噪声,干扰存在,不能完全消除不能完全消除信源的概率分信源的概率分布是确定的布是确定的前文已知:信源前文已知:信源可以
23、用概率分布可以用概率分布来描述来描述信息量大小应该信息量大小应该与概率有关与概率有关2.2.1 非平均信息量非平均信息量 v给定信源给定信源X,对应的概率空间为,对应的概率空间为 1212.()().()()rraaaXp ap ap ap x1.1.给定时刻,信源到底会发出什么符号,接收者事先不能确定给定时刻,信源到底会发出什么符号,接收者事先不能确定;2.2.符号出现的概率不同,它的不确定性也不同符号出现的概率不同,它的不确定性也不同;3.3.信息量定义应该遵循日常生活准则信息量定义应该遵循日常生活准则基本规则基本规则(1)确定性事件,即确定性事件,即P=1时,信息量应当为时,信息量应当为
24、0;(2)事件出现的概率事件出现的概率越小越小,信息量应当,信息量应当越大越大;反之亦反之亦 然;然;(3)自信息量为自信息量为非负的非负的(4)两个相互独立事件联合自信息量应等于它们两个相互独立事件联合自信息量应等于它们各自两个信息量各自两个信息量之之和和按照上述准则,在函数空间寻找满足要求的函数来按照上述准则,在函数空间寻找满足要求的函数来定义信息量定义信息量v定义定义2.5 给定信源的概率空间给定信源的概率空间 1212.()().()()rraaaXp ap ap ap x事件事件iaX的的自信息量自信息量定义为:定义为:1()log()log()iiiI ap ap a 取底为取底为
25、2,单位为比特,单位为比特;取自然对数,单位为奈特取自然对数,单位为奈特(nat);以);以10为底,则单位为笛特(为底,则单位为笛特(det)。)。1nat=e=1.433lb1det=10=3.322lbbitbit对数的底大于1v例例2.1 某二元信源发出符号0,1的概率分别为,p(0)=1/4,p(1)=3/4,求I(0),I(1)。v解:解:根据定义知:1(0)(0)24IlbPlb 3(1)(1)0.14564IlbPlb 比特比特比特比特分析:分析:符号符号1出现概率大,它的出现给观察者提供的信出现概率大,它的出现给观察者提供的信息量就小。息量就小。符号符号0出现的概率较小,因此
展开阅读全文