chp2信息论与数学基础课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《chp2信息论与数学基础课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- chp2 信息论 数学 基础 课件
- 资源描述:
-
1、统计机器学习与数据挖掘技术与方法研讨班讲义第2章 信息论与数学基础信息论信息论nShannon 与20世纪40年代提出n信息是个很抽象的概念。我们常常说信息很多,或者信息较少,但却很难说清楚信息到底有多少。比如一本五十万字的中文书到底有多少信息量。直到 1948 年,香农提出了“信息熵”的概念,才解决了对信息的量化问题。n信息量与不确定性信息量与不确定性 一条信息的信息量大小和它的不确定性有直接的关系。比如说,要搞清楚一件非常不确定的事,或是我们一无所知的事情,就需要了解大量的信息。相反,如果我们对某件事已经有了较多的了解,则不需要太多的信息就能把它搞清楚。从这个角度可认为,信息量的度量就等于
2、不确定性的多少。n例子:冠军队预测n熵(熵(Entropy)的定义:的定义:设随机变量设随机变量X X,取值空间,取值空间,为有限集合。为有限集合。X X的分的分布密度为布密度为p p(x x),p p(x x)=P=P(X=xX=x)x xX X,则该随机变量,则该随机变量的取值不确定程度,即其熵为:的取值不确定程度,即其熵为:当使用当使用log2log2时,熵的单位为比特时,熵的单位为比特反映一个信源发出不同信号,具有的平均信息量。反映一个信源发出不同信号,具有的平均信息量。2()()()log()0log0 0,loglogxH XH pp xp xall possible values
3、Definen熵率(语言信息率)熵率(语言信息率):r=H(M)/N 语言绝对信息率:语言绝对信息率:R=logR=log2 2L L 语言多余度:语言多余度:D=R-rD=R-r密码体制的安全性唯一解距离n唯一解距离是指,当进行强力攻击时,可能接触唯一有意义的明文所需要的最少密文量。一般而言,唯一解距越长,密码体制越好。混乱和散布n混乱用于掩盖明文和密文之间的关系,如凯撒移位密码。n散布是通过将明文多余度分散到密文中使之分散开来的方法,如置换密码。复杂性理论1、算法的复杂性、算法的复杂性 一个密码体制的强度是通过破译它所需的计算能力来确定的,所需的计算能力越大,表明密码体制的安全强度越大。一
4、个算法的计算复杂性由两个角度来度量:T(时间复杂性)、(时间复杂性)、S(空间复杂性)(空间复杂性)。通常,一个算法的计算复杂性的数量级用“O”表示表表2.1 当当n=106不同算法族运行时间不同算法族运行时间与与n的关系的关系复杂度复杂度所需运算所需运算所需时间(所需时间(106运算运算/s)常数线性二次方三次方指数O(1)O(n)O(n2)O(n3)O(2n)110610121018103010301us1s11.6d32000年宇宙年龄的10301006倍2、问题的复杂性、问题的复杂性 复杂性理论也将各种问题,按照解决问题时所需最少的时间及最小的空间将之归纳为不同类别的复杂度。能够用多项
5、式时间算法解决(输入与n成多项式关系)的问题称之为易处理的。不能在多项式时间内解决的问题称之为难处理的,难处理的问题有时也称之为难解问题。复杂度与输入值成指数关系的问题属于难解问题。复杂度与输入值成指数关系的问题属于难解问题。依照求解问题所需的时间,复杂性理论也将各种依照求解问题所需的时间,复杂性理论也将各种问题区分成下面各类:问题区分成下面各类:(1)P问题:代表那些能够在多项式时间内可解的代表那些能够在多项式时间内可解的问题问题 易处理的,在确定性图灵机上多项式时间内可易处理的,在确定性图灵机上多项式时间内可计算计算(2)NP问题:多项式时间内可验证的问题多项式时间内可验证的问题 在不确定
6、性在不确定性Turing machineTuring machine上多项式时间内上多项式时间内可计算可计算,不确定性不确定性Turing machineTuring machine能进行猜测能进行猜测,即不确定性即不确定性Turing machineTuring machine如能猜出一个解的话如能猜出一个解的话,则确定性则确定性Turing machineTuring machine在多项式时间内可校验在多项式时间内可校验解的正确性解的正确性.(3)NP完全问题完全问题:是是NPNP问题中的一些问题中的一些特殊问题,特殊问题,NPNP中的所有问题都可以转换成中的所有问题都可以转换成NPNP
7、完全问题。换句话说,只要完全问题。换句话说,只要NPNP完全问题完全问题解决了,其他问题都可以解决。解决了,其他问题都可以解决。NPNP完全问完全问题是题是NPNP问题中最困难的问题。问题中最困难的问题。3、NP完全问题完全问题 (一)旅行商问题:旅行商问题:一名旅行商必须旅行到一名旅行商必须旅行到n n个不同个不同的城市,而他只有一箱汽油(即有一个他能旅行的最的城市,而他只有一箱汽油(即有一个他能旅行的最远距离)。有方法使他仅用一箱汽油而旅行到每个城远距离)。有方法使他仅用一箱汽油而旅行到每个城市恰好一次吗?(这是一般的汉密尔顿问题)市恰好一次吗?(这是一般的汉密尔顿问题)(二)三方匹配问题
8、:三方匹配问题:有一屋子的人,包括有一屋子的人,包括n n个男人,个男人,n n个女人和个女人和n n个牧师(祖父,犹太教士等等)。正常的个牧师(祖父,犹太教士等等)。正常的婚礼将包括一个男人、一个女人和一个愿主持仪式的婚礼将包括一个男人、一个女人和一个愿主持仪式的牧师。有了这样一张可能的三人一组的表,是否可能牧师。有了这样一张可能的三人一组的表,是否可能安排安排n n个婚礼,使每一个人要么和一个人结婚,要么个婚礼,使每一个人要么和一个人结婚,要么主持一个婚礼?主持一个婚礼?(三)整数分解问题(三)整数分解问题(四)背包问题(四)背包问题(五)离散对数问题(五)离散对数问题数论n数论是研究数性
展开阅读全文