关键词或词组为基础的数据库检索(I)课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《关键词或词组为基础的数据库检索(I)课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 关键词 词组 基础 数据库 检索 课件
- 资源描述:
-
1、第三章第三章 关键词或词组为基础的关键词或词组为基础的数据库检索数据库检索(I)生物信息学检索数据库的方法检索数据库的方法 u 用关键词或词组进行数据库检索用关键词或词组进行数据库检索 (Text-based database searching)u 用核苷酸或蛋白质序列进行数据库检索用核苷酸或蛋白质序列进行数据库检索 (Sequence-based database searching)Gene nameAuthorAccession numberDatabase关键词或词组为基础的数据库检索关键词或词组为基础的数据库检索关键词关键词名词、描述性词、词组名词、描述性词、词组序列注册号序列注册
2、号 (Accession number)检索体系检索体系NCBI EntrezSequence Retrieval System(SRS)Integrated database retrieval system(DBGET)Trends in Biotechnology 1998,16(supplement 1):3-5.最准确可靠检索须知(检索须知(1)u 连接词连接词 AND,OR,NOT(Boolean operators)rice AND enzyme (AND为缺省值,可略去为缺省值,可略去)rice AND enzyme NOT kinaseretrotransposon OR r
3、etroelement注意事项:注意事项:1、AND,OR,NOT must be entered in UPPERCASE2、Boolean operators are processed in a left-to-right sequencerice AND(microarray OR expression profile)rice AND microarray OR expression profile3、The order can be changed by enclosing individual concepts in parentheses(processed first)Pub
4、Med27000 records 504 records u 用引号将两个单词组成一个词组用引号将两个单词组成一个词组16S rRNA=16S AND rRNA“16S rRNA”pseudopod*=pseudopod OR pseudopodia OR pseudopodium 检索须知(检索须知(2)Nucleotide 16S rRNA“16S rRNA”380000 sequences 3300000 sequences exact matchu wild card,*,放在单词后使检索范围扩大,但放在单词后使检索范围扩大,但专一性降低专一性降低u 表示范围表示范围,:,连接前后关键
5、词,限定范围连接前后关键词,限定范围110:500Sequence Length 2009/3/1:2009/9/30Publication Date 1.Entrezhttp:/www.ncbi.nlm.nih.gov/gquery/NCBI 的检索体系的检索体系优点优点:三种检索体系中最容易操作的体系:三种检索体系中最容易操作的体系,帮助,帮助文档完备文档完备Entrez HelpEntrez可对可对6大类大类40个个数据库数据库进行检索进行检索Nucleic Acids Research 2013,41:D8-D20Entrez可对可对6大类大类40个个数据库数据库进行检索进行检索针对基
6、因组已测序完成的物种针对GenBank中具有大于7万条EST的物种Prokaryotic,chloroplast,mitochondrial,virus,protist,plant针对17个广泛研究的模式生物Entrez系统中系统中数据库之间的连接数据库之间的连接NCBI主页主页选择选择“All Databases”或或Entrez主主页页,输入关键词,输入关键词各个数据库中检索到的各个数据库中检索到的信息数量信息数量点击相应数据库点击相应数据库查看信息目录查看信息目录,每一条信息与其它数据库的,每一条信息与其它数据库的相关信息链接相关信息链接检索方法(检索方法(1):跨库检索):跨库检索(c
7、ross-database search)检索方法(检索方法(2):选择数据库检索):选择数据库检索NCBI主页主页选择数据库,输入关键词选择数据库,输入关键词检索到的检索到的信息目录信息目录,每一条信息,每一条信息与其它数据库的相关信息链接与其它数据库的相关信息链接查看查看信息内容信息内容序列数据库的搜索序列数据库的搜索精简搜索结果精简搜索结果查询查询insulin基因的序列基因的序列不是想要的结果!如何精简?不是想要的结果!如何精简?精简搜索结果的方法精简搜索结果的方法1:使用:使用Limits查询人(查询人(human)的)的insulin基因的序列基因的序列关键词 查询范围:insul
8、in title human organism 精简搜索结果的方法精简搜索结果的方法2:使用:使用Advanced search如何定义查询范围?如何定义查询范围?LOCUS DQ176424 1980 bp DNA linear PLN 12-MAR-2006DEFINITION Oryza sativa(indica cultivar-group)pathogen-induced defense-responsive protein 8(DR8)gene,complete cds.ACCESSION DQ176424VERSION DQ176424.1 GI:73918052KEYWORD
9、S HTG.SOURCE Oryza sativa Indica Group ORGANISM Oryza sativa Indica Group Eukaryota;Viridiplantae;Streptophyta;Embryophyta;Tracheophyta;Spermatophyta;Magnoliophyta;Liliopsida;Poales;Poaceae;BEP clade;Ehrhartoideae;Oryzeae;Oryza.REFERENCE 1 (bases 1 to 1980)AUTHORS Wang,G.,Ding,X.,Yuan,M.,Qiu,D.,Li,X
10、.,Xu,C.and Wang,S.TITLE Dual function of rice OsDR8 gene in disease resistance and thiamine accumulation JOURNAL Plant Mol.Biol.60(3),437-449(2006)PUBMED 16514565gbdiv_plnPropertiesTitleModification Date1000:2000Sequence LengthAccessionGI任意搜索范围:任意搜索范围:Xa21All Fieldsbiomol_genomicProperties biomol_mr
11、na:mRNAbiomol crna:cRNAPublication Date:记录公开日期记录公开日期Keyword:EST GSS HTG HTC TPA TSAOrganismAuthorJournal注意:关键词和字段名(field)均不区分大小写ORIGIN 1 ggtacattat atattctgtt tggaatatga tcaggcctag tgggaactgc tttaagttta 61 cttattcgag ctgagttagg acaacctggg gccctattag gggatgatca attatataat 121 gttattgtta cagcacacgc tt
12、ttgtaata atttttttct tagttatacc tataatgatcFEATURES Location/Qualifiers source 1.646 /organism=Dicathais orbita /organelle=mitochondrion /mol_type=mRNA /db_xref=taxon:69583 /clone=20006E09 /note=mitochondrial and ribosomal sequences produced by suppressive subtractive hybridization CDS 646 /gene=COXI
13、/codon_start=1 /transl_table=5 /product=cytochrome oxidase subunit I /protein_id=ACT34372.1 /db_xref=GI:253740054 /translation=GTLYILFGMWSGLVGTALSLLIRAELGQPGALLGDDQLYNVIVT AHAFVMIFFLVMPMMIGGFGNWLVPLMLGAPDMAFPRLNNMSFWLLPPALLLLLSSAA 第四章讲述使用序列进行检索第四章讲述使用序列进行检索Feature Key:promoter,mRNA,CDS,exon,intron,p
14、olyA_signalCOXIGene Namegene_in_mitochondrionProperties如何定义查询范围?如何定义查询范围?humanORGN AND 50SLEN:60SLEN AND 1999MDAT 精简搜索结果精简搜索结果Aim:Find all human nucleotide sequences with the poly(A)signal.不同数据库的不同数据库的Search fields不同,详见不同,详见Limits/Advanced选项!选项!j mol evolJOUR AND drosophilaORGN polyA_signal“FKEY AND
15、 humanORGN Aim:Find all human protein sequences with lengths between 50 and 60 amino acids that were entered into the database during 1999.Aim:Find Drosophila population studies published in the Journal of Molecular EvolutionSearch Field Descriptions for Sequence Database查询人查询人insulin基因的基因的RefSeq序列序
16、列精简搜索结果的方法精简搜索结果的方法3:直接输入搜索字段:直接输入搜索字段自动将俗名转换为学名查询人查询人insulin基因的基因的RefSeq序列序列精简搜索结果的方法精简搜索结果的方法4:组合多次搜索结果:组合多次搜索结果使用使用Clipboard临时收集多条序列临时收集多条序列永久保存收集的序列需要注册,然后Send to Collections第三章第三章 关键词或词组为基础的关键词或词组为基础的数据库检索数据库检索(II)生物信息学文献数据库文献数据库Pubmed的搜索的搜索 http:/www.ncbi.nlm.nih.gov/PubMed/u美国国家医学图书馆的数据库美国国家医
展开阅读全文