共享-农业大学生物信息学课后练习题及答案汇总(DOC 9页).doc
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《共享-农业大学生物信息学课后练习题及答案汇总(DOC 9页).doc》由用户(2023DOC)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 共享农业大学生物信息学课后练习题及答案汇总DOC 9页 共享 农业大学 生物 信息学 课后 练习题 答案 汇总 DOC
- 资源描述:
-
1、 2014级山东农业大学大二下学期期末生物信息学课后练习题及答案第一章 绪论 1、什么是生物信息学?答:广义的生物信息学:生命科学与数学、计算机科学和信息科学交汇融合形成的一门交叉学科应用先进的数据管理技术、数学分析模型和计算软件对各种生物信息进行提取、储存处理和分析,旨在掌握复杂生命现象的形成模式与演化规律。 狭义的生物信息学:应用信息技术储存和分析基因组测序所产生的分子序列及其相关数据,也被称为分子生物信息学。2、列举5个在生物信息学发展史上有重要意义的事件(技术发明或软件创新)答:1953年,由沃森和克里克提出DNA双螺旋结构模型,并发表于NATURE杂志。(Nature, 1953)。
2、 1955年,桑格采用二硝基氟苯(FDNB)法,首次成功地完成了第一个蛋白质-牛胰岛素的序列分析。1965年,祖卡坎德尔和鲍林提出的“分子钟”理论。(Evolving genes and proteins, 1965) 1977年,桑格等发表双脱氧链末端终止法,测定X174序列。(PNAS, 1977)1988年,人类基因组计划提出。(Science, 1986)1995年,H. influenza genome第一个测序成功的基因组。(Science, 1995)2001年,人类基因组草图公布。(Nature, 2001; Science, 2001) 2005年, 新一代测序技术出现。(N
3、ature, 2005)3、生物信息学的研究内容都有哪些?答:1.获取人和各种生物的完整基因组 2.发现新基因和新的单核苷酸多态性 3.基因组中非编码区信息结构分析 4.完整基因组的比较研究 5.功能基因组研究 6.生物大分子结构模拟与药物设计 7.生物信息学的发展与应用研究 第二章 生物信息学资源1、什么是一级数据库,什么是二级数据库答:1.数据都直接来源于实验获得的原始数据,只经过简单的归类整理和注释。 一级核酸数据库有Genbank数据库、EMBL核酸库和DDBJ库等;蛋白质序列数据库有SWISS-PROT、PIR等;蛋白质结构库有PDB等。 2. 在一级数据库、实验数据和理论分析的基础
4、上针对特定目标衍生而来,是对生物学知识和信息的进一步整理。 人类基因组图谱库GDB、转录因子和结合位点库TRANSFAC、蛋白质结构家族分类库SCOP等等。2、世界上三大核酸数据库分别叫什么,由什么机构进行维护,两个重要的蛋白质数据库分别是什么,蛋白质三维结构数据库是什么,他们分别由什么机构进行维护。答:1.美国核酸数据库GenBank从1979年开始建设,1982年正式运行(NCBI); http:/www.ncbi.nlm.nih.gov/ 欧洲分子生物学实验室的EMBL数据库也于1982年开始服务(EBI); http:/www.ebi.ac.uk/ 日本于1984年开始建立国家级的核酸
5、数据库DDBJ,并于1987年正式服务(NIG)。 http:/www.ddbj.nig.ac.jp/ 2. SWISS-PROT是一种经校阅过的蛋白质序列数据库,首先于1978年在瑞士日内瓦大学医学生化系建立,随后与欧洲分子生物学实验室(EMBL)合作,目前同EMBL和新成立的瑞士生物信息学研究所(SIB)共同维护。 PIR-PSD是由NBRF蛋白质序列数据库、Munich蛋白质序列信息中心(MIPS)和日本国际蛋白质序列数据库(JIPID)共同维护的国际上最大的公共蛋白质序列数据库。这是一个全面的、经过注释的、非冗余的蛋白质序列数据库。 3.蛋白质空间结构数据库是生物大分子结构数据库的主要
6、组成部分,结构数据库用图像直观表示蛋白质的空间结构。4.PDB(Protein Data Bank)是国际上唯一的生物大分子结构数据档案库,1971年由美国Brookhaven国家实验室建立。PDB蛋白质数据库所收集的生物大分子三维结构数据主要通过X-射线衍射和核磁共振(NMR)实验测定,包括结构数据,文献,一级二级结构信息。3、详细说明blast软件包含几种比对程序,每种程序针对什么样的待搜索序列和数据库。第三章 序列比对1、什么是序列比对,双序列比对,多序列比对答:1. 序列比对又叫序列联配,其意义在于从核酸、氨基酸的层次分析序列的相似性,推测其结构功能及进化上的联系,是基因识别、分子进化
7、、生命起源研究的基础。基本问题是比较两个或两个以上符号序列的相似性或不相似性。 序列比对是生物信息学的基础,非常重要。 2. 双序列比对(pairwise alignment):是指通过一定算法对两条核酸或蛋白质序列进行比较,找出两者之间最大相似性匹配。双序列比对是序列分析常用的方法之一,是多序列比对和数据库搜索的基础。3. 把多序列比对看做一张二维表,表中每一行代表一个序列,每一列代表一个残基位置。将序列依照下列规则填入表中: 1、一个序列所有残基的相对位置保持不变; 2、将不同序列间相同或相似的残基放入同一列,即尽可能将序列间相同或相似残基上下对齐。 2、什么是同源性(homology)、
8、直系同源(ortholog)和旁系同源(paralog)?举例说明它们的关系?答:1.如果两条序列有一个共同的进化祖先,那么它们具有同源性(homology)。2. 同源性中存在两个子类。当同源是基因复制的结果,两份拷贝在一个物种的历史上是平行演化的(如血红素和血红素),这样的基因应被称做旁系同源基因paralogous。 当同源是物种形成的结果,基因的历史反映了物种的历史(人和鼠的血红素),这样的基因应被称做直系同源基因orthologous。3. 在物种I和物种II中,基因a通过基因复制产生基因a1和基因a2。物种I和物种II中的a1或a2被称作直系同源,因为它们来自同一祖先,而物种I或物
9、种II中的a1和a2被称作旁系同源,因为它们是由基因复制得到的。3、 什么是相似性(similarity)、同一性(identity)?他们的关系?答:4、什么是点阵图(dot matrix)?作用与优点。答:1.点阵图分析(Dot matrix analysis):是双序列比对的基本方法,通常用图示方法表示,非常直观。两条相似的序列通过点阵图可以直观的显示其插入或缺失的残基,以及一些重复片段。 2. 一、直观性,整体性; 二、点阵分析不依赖空位(gap)参数,可寻找两序列间所有可能的残基匹配; 三、不依赖任何先决条件,是一种可用于初步分析的理想工具; 四、点阵分析允许随时动态地改变最高和最低
10、界限值,可以用来摸索区分信号和背景标准的严格程度; 五、不能很好地兼容打分矩阵; 六、不适合进行高通量的数据分析。 5、什么是全局比对、局部比对?如何通过动态规划算法,填写动态规划矩阵,分别对两条序列进行全局比对和局部比对。答:1. 全局比对算法,也叫Needleman和Wunsch算法。全局比对方法中,两条蛋白质序列具有最多匹配残基定义为最佳匹配,其中允许进行必要的插入或缺失。为控制无限的空位插入,我们引进了罚分概念。2. 1981年,Smith和Waterman提出了一种用来寻找并比较局部相似区域的方法,即Smith-Waterman算法,也叫局部比对算法。3.6、blast用什么样的思想
11、和方法提高了序列搜索的效率?答:Blast是通过比对(alignment)在数据库中寻找和你的查询序列(query)相似度很高的序列,通俗地说就是在已知的序列数据库中找和你的序列差不多的序列。序列类似性检索就是将新测定的核酸或蛋白质序列对核酸或蛋白质序列数据库进行检索,找出与之相似的序列,从而评判新测定的序列是重复别人的工作,还是在前人的基础上有所创新,或是发现了新的序列。7、什么是多序列比对,其生物学意义是什么?答:把多序列比对看做一张二维表,表中每一行代表一个序列,每一列代表一个残基位置。将序列依照下列规则填入表中: 1、一个序列所有残基的相对位置保持不变; 2、将不同序列间相同或相似的残
展开阅读全文