1、5.1 数据结构与算法效率一个人想要喝茶,但当时的情况是:开水没有,水壶要洗,茶壶和茶一个人想要喝茶,但当时的情况是:开水没有,水壶要洗,茶壶和茶杯要洗;火已经生了,茶叶也有了怎么办?杯要洗;火已经生了,茶叶也有了怎么办?泡茶泡茶洗开洗开水壶水壶灌凉水灌凉水洗茶壶洗茶壶洗茶杯洗茶杯拿茶叶拿茶叶泡茶喝泡茶喝烧开水烧开水洗开洗开水壶水壶洗茶壶洗茶壶洗茶杯洗茶杯拿茶叶拿茶叶灌凉水灌凉水烧开水烧开水泡茶喝泡茶喝洗开洗开水壶水壶灌凉水灌凉水烧开水烧开水拿茶叶拿茶叶洗茶壶洗茶壶洗茶杯洗茶杯泡茶喝泡茶喝在计算机科学中,数据结构与算法有着密不可分的关系。解决实际问题时,数据总是以一定的组织结构关系体现并存储,
2、数据结构的设计和选择关注的是数据的逻辑结构、存储结构以及基本操作;算法的设计和选择更多的是关注如何在数据结构的基础上综合运用各种基本数据操作来解决实际问题。因此,算法的设计和选择总是依赖于数据结构,算法设计的同时也伴随着数据结构的设计,两者都是为最终解决问题服务。同时,数据结构的设计和选择会对算法效率产生一定的影响。算法效率同一个问题可能会有不同的解决方法,也就是说可能有不同的算法。有的算法效率高一些,有的算法效率低一些。通常,算法效率的高低可由算法复杂度来度量。算法复杂度又分为算法的时间复杂度和空间复杂度,其中时间复杂度反映了算法执行所需要的时间,而空间复杂度反映了算法执行所需要占用的存储空
3、间。算法运行需要的时间,一般将算法中语句的执行次数作为时间复杂度的度量标准。语句总的执行次数T(n)是关于问题规模n的函数。所谓问题规模(也称为输入的大小)是指处理问题的大小,即用来衡量输入数据量的整数。12345678910n在约瑟夫问题中,用数组或链表中元素的个数作为问题规模。用O()来体现算法时间复杂度,称之为大O记法。通常,随着问题规模n的增大,函数值增长较慢的算法较优。例如,求1+2+n的和可以用以下两种算法来实现:算法一:n=int(input()#执行1次s=(1+n)*n/2#执行1次print(s)#执行1次算法二:n=int(input()#执行1次s=0#执行1次for
4、i in range(1,n+1):#执行n次 s=s+i#执行n次print(s)#执行1次时间复杂度为O(1),常量阶时间复杂度为O(n)线性阶再来看下面的例子:n=int(input()s=0 x=0for i in range(1,n+1):for j in range(1,n+1):x=x+1#执行n*n次 s=s+xprint(s)时间复杂度是O(n2),称为平方阶。算法的时间复杂度反映了程序执行时间随问题规模增长而增长的量级,在很大程度上能很好地反映出算法的优劣。举例说明空间复杂度是如何度量的。程序运行过程中,一般将所占用的辅助存储空间大小作为度量算法空间复杂度的标准。一个算法在
5、计算机存储器上占用的存储空间,主要包括程序代码占用的空间,输入或输出数据占用的空间,以及额外辅助程序运行占用的存储空间这三个方面。输入或输出数据占用的空间是必须的,程序代码占用的空间可以通过精简代码来实现,但非常有限。由于算法设计的差异,算法运行过程中的辅助空间相差较大,因此是衡量算法空间复杂度的关键因素。例如,算法中需要处理一个数据规模为n的连续整数数组,则其空间复杂度至少为O(n)。数据结构对算法效率的影响数据组织成不同的结构,是为了满足不同问题的需求,便于算法对数据的操作,提高算法处理数据的效率。例1:要显示10000种商品中某个商品的价格在设计数据结构时,可以将这10000中商品的价格
6、数据采用数组或链表来组织。但从算法效率的角度考虑,此时数据结构采用数组比链表更方便,这是因为数组中的元素可以按其下标方便地被随机访问,时间复杂度为O(1);而在链表中访问任何节点都必须从首节点(或尾节点)开始按序访问到指定节点,时间复杂度为O(n)。例2:要在10000种商品中添加或删除某个商品信息算法需要对元素做插入、删除操作,那么数据结构采用链表比较合适,这是因为在数组中插入或删除一个元素都可能引起大量元素的移动操作,时间复杂度为O(n);而在链表中插入或删除一个节点只需要对个别节点的链域进行修改,时间复杂度为O(1)。因此,数据结构的不同选择会影响算法的运行效率。练一练1.某算法的部分流程图如下:输入aa10?NYb Sqr(a)/2 Nb a/2输出b其算法的时间复杂度是()A.常量阶 B.线性阶C.指数阶 D.对数阶A A2.分析如下Python程序段,其算法时间复杂度是()s=input()Slen=len(s)Number=0:0,1:0,2:0,3:0,4:0,5:0,6:0,7:0,8:0,9:0for i in range(slen):if(si=0 and si=9):numbersi=numbersi+1B B3.下列四个常见的时间复杂度之间的大小关系正确的是()C谢 谢