第三章连续信源的信息熵课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《第三章连续信源的信息熵课件.ppt》由用户(ziliao2023)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第三 连续 信源 信息 课件
- 资源描述:
-
1、第三章第三章.连续信源的信息熵连续信源的信息熵 3.1 连续信源的离散化连续信源的离散化 (Discretization of Continuous Source)我们前面所介绍的信源均指离散信源,即信源所发的消息都是由符号或符号序列所组成;而且每一个符号的取值都属于一个有限元素组成的集合之中。1212,nna aaxAp ppfinite symbol or sequence 而连续信源是指信源所发出的消息都是由一个个随机过程(stochastic process)所形成。如:语音信号 它不仅幅度上,而且在时间上也都是 连续的,即分别属于一个无限的集合之中。(,)X t3.1 连续信源的离散
2、化连续信源的离散化 因此,我们所研究的问题就复杂了,然而任何复杂的问题都可以分解成比较简单的问题分步解决。故通常我们有一些处理连续变量的方法。()xH p(,)X tXX()()cxH X TimediscretizationStochastic processRandom vectorRandomvariableMemorylessMarkovianAmplitude discretizationAmplitudecontinuous正交变换正交变换Orthogonal Transformation 所谓正交变换是一种数学处理手段,将在T时间内的受限于最高频率为F的随机过程,无失真地变换成2
3、FT个随机变量。最理想的正交变换是:KL expansion。3.1 连续信源的离散化连续信源的离散化 因此任何复杂的统计对象,经多种处理后就可由浅入深地逐步解决问题。正如我们在离散信源中:110(,)()()()()(,)()logiLimaXXX tH XHXHI aH XHX tHHH XHn 任何处理过程总要丢失信息,任何处理过程总要丢失信息,最多保持不变。所以简化处理就最多保持不变。所以简化处理就得付出代价即:容忍信息的丢失,得付出代价即:容忍信息的丢失,除非正交变换和极限处理。除非正交变换和极限处理。消息消息事件事件随机随机变量变量随机随机序列序列随机随机过程过程自信息自信息信息熵
4、信息熵序列熵的表达类型序列熵的表达类型随机过程的熵随机过程的熵第三章.连续信源的信息熵 3.2 连续变量的相对熵连续变量的相对熵(The differential entropy of Continuous random Variable)一个连续变量总可以采用数字量化的方式简化成一个离散变量来近似,而且量化单位越小则所得的离散变量就越接近那个连续变量。因此我们针对连续变量的概率统计规律概率分布密度函数概率分布密度函数(probability density function)也可采用上述近似方法。()()()()()()()()()()()1:xxdefdefdefbbaF xf t dtP
5、 xp t dtF xP xf xp xP xwherbf x dxp xedx,为为概概率率分分布布函函数数。,为为概概率率分分布布密密度度。x()()p xf x0ab3.2 连续变量的相对熵连续变量的相对熵 如果把xa,b 的定义域划分成n个小区间,且每个小区间宽度相等。那么处于第i个区间的概率就等于:(1)()(1)()()();1,2,(1),definia iiaiipP xP aixaip x dxp xbainnxaiai where:Then:按按积积分分中中值值定定理理上上式式一一定定成成立立。x0ab()()p xf xix11111()log()log()()log()
6、(log)()()log()(log)nnnniininininiiiinnnininiiiHXpppxpxpxpxpxpxpx 13.2 连续变量的相对熵连续变量的相对熵 以上我们将一个连续变量的概率空间量化成一个离散空间,从而得到连续信源的近似信息熵。如果将此近似手段在取极限的方式下就可逼近这个连续变量的熵。00100lim()lim()log()(log)()log()lim(log)()()()()log()()lim(log)nnniniinnbandefcbdefcadefnHXpxpxp xp x dxHXHHXp xp x dxH where:and即即:称为相对熵Differ
7、ential entropy 称为绝对熵absolute entropy信息散度信息散度 D(p/q)(relative entropy)3.2 连续变量的相对熵连续变量的相对熵 在取极限的过程中由于n 相当于 0,此时这个离散变量越来越逼近一个连续变量;而离散集合中的信息熵Hn(X)就分解为两项,其中一项与划分精度 无关,趋于一个常量Hc(X)。而另一项,随着 0最终趋于一个无穷大的量。很显然这与取极限之前的离散熵差别很大,那么这种极限形式能否表达出信源平均不定度的概念吗?由于表达形式的不同,则它的物理意义也应有所不同。所以我们不能以离散熵的概念来理解上述表达式,特别是当某些离散熵的数学性质
8、不在继续保持的情况下,如:非负性、对称性、扩展性等。但值得庆幸,上式中将熵函数中最能反映信源的固有属性的数学性质如可加性、极值性和上凸性仍旧依然保持着。因此有可能上述表达式的某些部分仍能代表连续信源的某些物理属性。(但我们要深入讨论离散向连续逼近时,物理属性的变化。)3.2 连续变量的相对熵连续变量的相对熵 因为对于一个连续变量,它的取值有无穷多个,无论它取任何值,其随机事件所对应的不定度一定是无穷大量。而对熵来说,应是这个随机事件集合的平均值,既然每一个事件的自信息都是无穷大,则它的集合平均值也应是无穷大才对。又因为从绝对的观点来看,每一个连续信源的平均不定度都是无穷大,那么这个熵的价值也就
9、无意义了。但是再仔细分析一下,上式中只有H()项才与划分精度 有关,这说明只有此项能反映人为地利用离散模式向连续型逼近的近似程度。换句话说,这仅是强加上的人为因素,并不代表事物原有的客观属性。比如,对于同样概率分布的随机变量x,如果仅划分精度 不同时,可取 1,2代表两种划分精度,则我们所得到的熵的表达式:1212()()log()()()()log()()nRnRHXp xp x dxHHXp xp x dxH 3.2 连续变量的相对熵连续变量的相对熵 为什么说相对熵反映连续变量的客观存在的平均不定度?首先一个随机变量,当它的概率分布一旦确定,则它的不定性就该给定,而不能随划分精度的变化而变
10、化。第二,由于信息量的概念是不定度的解除量,如果在相同划分精度下,再讨论两者之差时,H()将会消失。所以我们可看到仅从Hc(X)上就可真正反映出信息的全部属性(包括非负性)。因此,我们只要相对熵的定义就足够了。同时我们也能给出两个连续变量的互信息问题:可见只有H()不同,因此我们说:能真正反映连续信源的客观属性的应该是第一项,而不是第二项。对于后者我们称之为绝对熵绝对熵(absolute entropy);而对于前者我们称之为相对熵相对熵(differential entropy)。()()log()defcRHXp xp x dx where,R is the domain ofx.3.2
11、连续变量的相对熵连续变量的相对熵00()()1;()1;()1;()()()log()()()log()loglim()()()log()limlogxyxxycRRRnjjjjijjjjinnnR RdefHX Yp x dxq y dyp x y dxHX Yq yp x yp x yq yp x yp x yHX Yq y p x yp x y dxdy then:先先定定义义连连续续变变量量的的条条件件熵熵:()()cHX YH00(;)()()lim()lim()()()nnccI X YH XH X YHXHX YH XH X Ythen:3.2 连续变量的相对熵连续变量的相对熵
12、可见当两个连续变量之间的互信息,实际上就是两熵之差,经绝对熵的相互抵消后,就剩下相对熵之差了。所以相对熵则完全反映出信息的基本属性。所谓“相对”一词也是由此而来。注:相对熵的定义与离散信源的信息熵有着明显的差别,即这种相对熵仅代表连续变量的相对平均不定度。同理,也有如下的相对熵的定义:()()log()()()()log()xyxycRRcRRHXYp xyp xy dxdyHY Xp x p y xp y x dxdy ()(;)()log()()()()()()()()()xyR Rcccccccp xyI X Yp xydxdyp x p yHXHX YH YH Y XHXH YHXYa
13、nd 第三章第三章.连续信源的信息熵连续信源的信息熵 3.3 相对熵的性质相对熵的性质(The Properties of Differential Entropy)1.可加性可加性()()()()()()();()()cccccccccH XYH XH Y XH YH X YaH Y XH YH XnHdYX()()()()()()()log()()()log()()()()log()()()log()()()xyxyyxxycR RR RRRR Rccletp xyp x p y xp y p x yH XYp xyp xy dxdyp x p y xp x p y x dxdyp y x
14、 dyp xp x dxp x p y xp y x dxdyH XH Y X prooh:enft 13.3 相对熵的性质相对熵的性质()()()log()()()log()()()log()()()log()()()()()log()()log()()()()1xxyxyxyxyxyccRR RR RR RR RR RH XH X Yp xp x dxp y p x yp x y dxdyp x p y xp x dxdyp y p x yp x y dxdyp xp yp x p y xdxdyp x p y xdxdyp x yp y xp yp x p y x and)()()()(
15、)()()()()1 10 xyxyxyxyxyR RR RR RR RRRdxdyp y xp x p y x dxdyp x p y dxdyp xy dxdyp x dxp y dy ()()ccHXHX Y()()()()()()()()()()p xp xp yp xyp xyP x yp yp xp yP y xlog1log10 xxxxx where,3.3 相对熵的性质相对熵的性质2.()(;0.)cHXI X Y can be a negative;but,(;)()()()()()()()();(;)0(;)()()()()()()(;)ccccccccccccccI X
16、 YHXHX YHYHY XHX YHXHY XHYI X YI X YHXHYHXYHXYHXHYI X YandandThen:3.()()()cccHXYHXH Y4.()().cHXp xis a convexfunctionfor有此上凸性,则导致相对熵有最大熵定理。5.6.()()ccHxCHx()()logccHaxHxa证证明明略略,参参见见概概率率论论中中有有关关随随机机变变量量函函数数的的概概率率分分布布。第三章第三章.连续信源的信息熵连续信源的信息熵 3.4 几种常见随机变量的相对熵几种常见随机变量的相对熵(The Differential Entropy of some
17、 Random Variables)1.均匀分布下的相对熵:(The Differential Entropy of Random Variable and Vector with Uniform Distribution)1()0;11()loglog()1()0bcacaxbp xbaxaxbHXdxbabababaHX 1则,.Iftheprobability density isthen显显然然,当当即即相相对对熵熵不不具具备备非非负负性性。12,1()Nrrrxx xxp xbaIf且且每每个个分分量量间间相相互互独独立立,分分别别为为均均匀匀分分布布:2 2.3.4 几种常见随机变
18、量的相对熵几种常见随机变量的相对熵1111111121111()()011()log()()log()NNNNNrrNrrrrNrrrbbbcNNNaaarrrrrrNrrrxbabap xxbaH Xdxdxdxbababa Then:3.4 几种常见随机变量的相对熵几种常见随机变量的相对熵2.高斯分布下的相对熵:(The Differential Entropy of Random Variable and Vector with Normal Distribution)222221()()exp(,)22defxmp xxN mm normal or Gaussian distribut
19、ion density:where,is the mean andis variance.222222()()log()1()1()explogexp2222cH Xp xp x dxxmxmdxRandom Variable:1 1.2221()()log(log)()22xmp xdxep xdx 3.4 几种常见随机变量的相对熵几种常见随机变量的相对熵2222221()1()()explogexp2222cxmxmHXdx loglnlogloglogyyyeeyyeee22()1()()p x dxxmp xand又又则则 2222211log2(log)21log(2)log22ee
20、e 由此可见正态分布的相对熵仅与它的方差有关,而与它的均值m无关。这也是最简单的相对熵,是干扰最严重的随机变量高斯噪声源的数学特性。高斯信源不仅因为其数学描述简单,而且由于它的干扰最强,所以经常用它来作我们通信系统中干扰源的数学模型。3.4 几种常见随机变量的相对熵几种常见随机变量的相对熵 如果L维的正态随机变量组成一个随机矢量 ,设每一个变量的均值为mi,则如果能知道任何变量间的协方差;(covariance)我们就能唯一地确定这个随机矢量。12Lxx xx()(),1,2,defijiijjRExmxmi jLij1112121222111212R LRiLLijLLLLLLLLijijj
21、imRRRRRRRRRRRRRR where:and即即,给给定定和和的的条条件件下下,我我们们可可以以唯唯一一地地确确定定出出这这个个 维维的的正正态态矢矢量量。其其中中,协协方方差差矩矩阵阵为为:3.4 几种常见随机变量的相对熵几种常见随机变量的相对熵112211011()exp()()2(2)ijijijijdefijijijijLLLijiijjLijijRRRRrRrRp xr xmxmR 设设:为为对对称称矩矩阵阵的的行行列列式式,而而且且,则则有有的的可可逆逆矩矩阵阵存存在在,记记为为:;其其中中 为为元元素素的的代代数数余余因因子子。则则,正正态态矢矢量量的的概概率率密密度度就
22、就为为:按相对熵的定义就可推出L维正态矢量的相对熵:1()log(2)log22cLijLHXeR 如果各个分量之间相互独立,则R形成一对角线矩阵:2112222000000ijLLR 21:LllllRand3.4 几种常见随机变量的相对熵几种常见随机变量的相对熵122212()log 2()2LcLLLHXe 例31.求二维正态矢量的相对熵和两变量间的互信息。122222111222211221222,0()()cos.1cos1:ijLmmExmExmR is correlationlet:then:whereancoeffidcient22221121221221ijR 3.4 几种常
23、见随机变量的相对熵几种常见随机变量的相对熵根据根据1()log(2)log22cLijLHXeR 22212122221222212122221()log(2)log122111log(2)logloglog 1222111log(2)log(2)log 1222()()()1()log 1log 12ccdefH X XeeeeHXHXHH :where121212212()()()(;)(;)()log 1cccH X XH XH XI X XI X XH又又3.4 几种常见随机变量的相对熵几种常见随机变量的相对熵 可见二维正态矢量的相对熵,等于两个分量的相对熵之和与它们之间相关程度对熵的
24、损失量之差。现在进一步分析I(X1;X2)的物理意义:2x2x 1x121201,3,5,2(;(.)0kkxxI XXHwhenthenandare linear independenti.e.121200,1,22(;)()0kkxxI XXH这这说说明明相相关关性性引引起起熵熵的的减减少少,互互信信息息就就是是从从一一个个分分量量得得到到另另一一个个分分量量的的信信息息。wheni.e.thenandare linear dependent.3.4 几种常见随机变量的相对熵几种常见随机变量的相对熵 如果两个分量一一对应,则实际上是两个变量变成一个变量了。此刻硬要将一个连续量看成两个连续量
25、,必然要引入一个无穷大量才对。所以此时的互信息就是无穷大量。还因为互信息的定义式为:121210,2,4,().2;)(kkxxI XXH i.e.andare one-to-one mwhenthenapping0ijR 12112112(;)()()()()ccI XXH XH XXHXHXX可见互信息不仅是相对熵之差,而且也是连续熵之差。第三章第三章.连续信源的信息熵连续信源的信息熵 3.5 连续信源的最大熵定理连续信源的最大熵定理(Maximum Entropy Theorem of Continuous Source)在离散信源中也有最大熵问题,目的就是希望在离散信源中也有最大熵问题
展开阅读全文