生物医学文献数据库第二章检索基本知识.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《生物医学文献数据库第二章检索基本知识.pptx》由用户(现有分享)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物医学 文献 数据库 第二 检索 基本知识
- 资源描述:
-
1、第二章第二章 检索基本知识检索基本知识一、发展历史一、发展历史二、检索系统二、检索系统三、检索语言三、检索语言四、检索技术四、检索技术五、检索步骤五、检索步骤 手工检索手工检索 计算机检索计算机检索检索发展历史检索发展历史 脱机检索脱机检索(批式检索)(批式检索)联机检索联机检索 光盘检索光盘检索 网络检索网络检索概念:光盘是一种用激光技术在特别的圆盘上记录和再生光盘是一种用激光技术在特别的圆盘上记录和再生信息的介质,是一种不同于磁性载体的信息的介质,是一种不同于磁性载体的光学存贮器光学存贮器,是,是“高密度光盘高密度光盘”(Compact-DiscCompact-Disc)的简称。)的简称。
2、类型:只读光盘只读光盘:即:即CD-ROMCD-ROM(CD-Read Only MemoryCD-Read Only Memory),又又称称“高密度光盘只读存贮器高密度光盘只读存贮器”,是第一代光盘。,是第一代光盘。写读光盘写读光盘:也叫写一次光盘,即:也叫写一次光盘,即WORMWORM(Write Once Write Once Read MemoryRead Memory),是第二代光盘。是第二代光盘。可擦写光盘可擦写光盘:也叫读写式光盘,即:也叫读写式光盘,即ORAMORAM(Optical Optical Random Access MemoryRandom Access Memo
3、ry),是第三代光盘。),是第三代光盘。特点:1.存储容量大;2.读取速度快;3.稳定性好;4.库存寿命长;5.使用方便;6.性能价格比高光盘检索系统 单用户光盘检索系统 (光盘工作站)光盘网络检索系统网络检索经历了这样几个发展阶段:联机互联计算机网络网络互联信息高速公路 所谓网络检索是指处于不同地域的信息用户,经通讯网与信息检索系统联通,以人机对话方式查找所需信息的过程。网络检索是作为网络功能的一种形式存在。第二章第二章 检索基本知识检索基本知识一、发展历史一、发展历史二、检索系统二、检索系统三、检索语言三、检索语言四、检索技术四、检索技术五、检索步骤五、检索步骤文献的文献的主题内容主题内容
4、主题主题概念概念检索者的检索者的信息需求信息需求情情报报检检索索语语言言 标识标识检索检索系统系统检索检索结果结果主题主题分析分析主题主题分析分析标引标引标引标引输入输入检索检索输出输出文献文献存储存储文献文献检索检索主题主题概念概念 标识标识检检 索索 系系 统统概念:(Information Retrieval System,IRS)是根据一定社会需要和为达到特定的信息交流目的而是根据一定社会需要和为达到特定的信息交流目的而建立的一种有序化的信息资源集合体。建立的一种有序化的信息资源集合体。通常拥有选择、整理、加工、存储、检索信息的设备与方法,并能向用户提供信息服务。IRS是信息源与用户的
5、媒介与接口。构成 硬件硬件(检索机具、设备,如:计算机、卡片设备、阅读机等)软件软件(检索方法、技术,计算机系统软件和应用软件,检索软件;标引方法、检索策略、检索专家等);检索工具检索工具(经加工、标引等处理后的信息集合,有:印刷型、机读型)。检检 索索 工工 具具概念 用以报道、存储和查找相关信息的工具与设备用以报道、存储和查找相关信息的工具与设备。职能 报道 存储 检索 数据库数据库 数据库的定义数据库的定义 数据库的类型数据库的类型 数据库的结构数据库的结构 数据库的检索途径数据库的检索途径根据根据ISO/DIS 5127号标准(文献与情报工作术语),号标准(文献与情报工作术语),数据库
6、(数据库(database,databank)被定义为:)被定义为:“至少由至少由一种文档组成,并能满足某一特定目的或某一特定一种文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合。数据处理系统需要的一种数据集合。”数据库数据库 数据库的定义数据库的定义 数据库的类型数据库的类型 数据库的结构数据库的结构 数据库的检索途径数据库的检索途径(Multimedia Database)(Knowledge Base)1 1书目型数据库(书目型数据库(Bibliographic Database)主要是指二次文献数据库,包括各种机读版的题录型、主要是指二次文献数据库,包括各种机读版
7、的题录型、文摘型的数据库。如文摘型的数据库。如CBM等。等。它提供了可满足用户多种情报检索需求的有关文献的它提供了可满足用户多种情报检索需求的有关文献的各种特征,如文献的篇名、著者、出处(包括刊名、年、各种特征,如文献的篇名、著者、出处(包括刊名、年、卷、期、页码)、摘要、收藏单位等。卷、期、页码)、摘要、收藏单位等。不仅可以告知用户其所需文献的线索不仅可以告知用户其所需文献的线索题录(包括题录(包括篇名、著者、出处),更可以提供整篇文献内容浓缩的替篇名、著者、出处),更可以提供整篇文献内容浓缩的替代点代点文摘。文摘。因此,是文献检索中最常用的一种数据库。因此,是文献检索中最常用的一种数据库。
8、2事实型数据库(事实型数据库(Fact Database)这类数据库中存贮的数据一般用来描述人物、事物、这类数据库中存贮的数据一般用来描述人物、事物、机构等非文献信息源的情况、过程、现象、特性等方面机构等非文献信息源的情况、过程、现象、特性等方面的事实性信息。的事实性信息。例如:美国例如:美国MEDLARS系统的医生咨询数据库系统的医生咨询数据库(Physician Data Query数据库),反映药物处方信息数据库),反映药物处方信息的的PDR(Physicians Desk Reference)等。)等。电子化的参考工具书,如词典、百科全书、指南等电子化的参考工具书,如词典、百科全书、指
9、南等也属于事实性数据库的范畴。也属于事实性数据库的范畴。3数据型数据库(数据型数据库(Numeric Database)主要为用户提供数值性数据类信息,包括各种统主要为用户提供数值性数据类信息,包括各种统计数据、科学实验数据、各种测量数据等。计数据、科学实验数据、各种测量数据等。例如:美国国立医学图书馆编制的化学物质毒性例如:美国国立医学图书馆编制的化学物质毒性数据库(数据库(RTECS),美国疾病控制与预防中心(),美国疾病控制与预防中心(CDC)的的Data and Statistics,世界卫生组织的世界卫生组织,世界卫生组织的世界卫生组织统计信息系统(统计信息系统(WHOSIS)等。)
10、等。4全文型数据库(全文型数据库(Full-text Database)随着计算机存贮能力和信息处理能力的不断提高,随着计算机存贮能力和信息处理能力的不断提高,以文献的全文而非单纯的题录或文摘为检索对象的全以文献的全文而非单纯的题录或文摘为检索对象的全文检索已成为现实。全文检索以全文数据库存贮为基文检索已成为现实。全文检索以全文数据库存贮为基础,将一篇完整的文献,作为一个信息源单位,将其础,将一篇完整的文献,作为一个信息源单位,将其全部内容转化为计算机可以识别、处理的信息单元而全部内容转化为计算机可以识别、处理的信息单元而形成的数据集合。形成的数据集合。全文检索不仅将以往首先检索文献的线索,然
11、后全文检索不仅将以往首先检索文献的线索,然后依据线索进一步查找、复制文献全文的多步程序毕其依据线索进一步查找、复制文献全文的多步程序毕其功于一役,而且免去了常常遇到的手握文献线索而苦功于一役,而且免去了常常遇到的手握文献线索而苦于找不到原文的烦恼。因而成为未来最具发展前景的于找不到原文的烦恼。因而成为未来最具发展前景的一种数据库类型。一种数据库类型。5.多媒体数据库(多媒体数据库(Multimedia Database)多媒体数据库技术和多媒体技术相结合的产物,多媒体数据库技术和多媒体技术相结合的产物,是文本、图像、视频、音频、动画等多媒体信息的是文本、图像、视频、音频、动画等多媒体信息的结合
12、体。结合体。网上医学多媒体数据库有:网上医学多媒体数据库有:NLM的的The Visible Human Project(可视人计划),(可视人计划),Tox Town(用图像、(用图像、文字、声音、动画等形式传授化合物、环境与人体文字、声音、动画等形式传授化合物、环境与人体健康关系知识的科普数据库),健康关系知识的科普数据库),NIH Senior Health(兼有文字和声音朗读功能的老年卫生知识库)等。(兼有文字和声音朗读功能的老年卫生知识库)等。6.知识库(知识库(Knowledge Base)知识库是按一定要求存贮在计算机中的相互关联知识库是按一定要求存贮在计算机中的相互关联的某些事
13、实或知识的集合,它经过分类、组织和有序的某些事实或知识的集合,它经过分类、组织和有序化,成为构造专家系统(化,成为构造专家系统(ES)的核心和基础。)的核心和基础。知识库是在普通数据库的基础上,有针对性地从知识库是在普通数据库的基础上,有针对性地从中抽取知识点,按一定的知识体系进行整序和分析而中抽取知识点,按一定的知识体系进行整序和分析而组织起来的数据库。组织起来的数据库。例如,北京中医药大学等研制开发的中医药知识例如,北京中医药大学等研制开发的中医药知识库、称为基因百科全书的库、称为基因百科全书的GenCard等。等。数据库数据库 数据库的定义数据库的定义 数据库的类型数据库的类型 数据库的
14、结构数据库的结构 数据库的检索途径数据库的检索途径 记录(Record)是构成数据库的信息单元,每条记录都描述了一原始信息的外表和内容特征。字段(Field)是记录的下级数据单位,用来描述实体的某一属性一条记录一条记录字段字段一条记录一条记录CA SEARCH(1967-present)399CA SEARCH(1967-1971)308CA SEARCH(1972-1976)309CA SEARCH(1977-1981)310CA SEARCH(1982-1986)311CA SEARCH(1987-1991)312CA SEARCH(1992-1996)313 数据库数据库 数据库的定义数
15、据库的定义 数据库的类型数据库的类型 数据库的结构数据库的结构 数据库的检索途径数据库的检索途径自由词检索自由词检索:又称为:又称为“文本词文本词”,自然语言检索。,自然语言检索。主题词检索主题词检索:规范化语言检索,词与概念一一对应。:规范化语言检索,词与概念一一对应。分类检索分类检索:以科学分类为基础,结合文献特征的概念逻:以科学分类为基础,结合文献特征的概念逻 辑等级体系。辑等级体系。著者检索著者检索:用文献上署名的作者或编者的姓名为检索词。著者检:用文献上署名的作者或编者的姓名为检索词。著者检索的规则是:姓(索的规则是:姓(Last Name,Surname,Family NameLa
16、st Name,Surname,Family Name)在前,)在前,名(名(First Name,Given NameFirst Name,Given Name)在后,一般的情况是姓在前)在后,一般的情况是姓在前用全称,名在后只用首字母。用全称,名在后只用首字母。例如:例如:Christine WadeChristine WadeWade cWade c William Henry Smith William Henry SmithSmith whSmith wh 著者姓名中若出现逗号,表明逗号前是姓。著者姓名中若出现逗号,表明逗号前是姓。例如:例如:Smith,William HenryS
17、mith,William HenrySmith whSmith wh 在西文数据库中查中国学者发表的文献,也是姓在前,全拼,在西文数据库中查中国学者发表的文献,也是姓在前,全拼,名在后,首字母。名在后,首字母。例如:顾玉东例如:顾玉东gu ydgu yd引文检索引文检索:以被引文献为检索起点来查找引用文献的过程。:以被引文献为检索起点来查找引用文献的过程。机构(地址)检索机构(地址)检索:以机构名称为检索词,来查该机构学者发:以机构名称为检索词,来查该机构学者发 表的文献。表的文献。期刊检索期刊检索:检索特定期刊上发表的文献。可通过期刊主题、:检索特定期刊上发表的文献。可通过期刊主题、ISSN
18、 ISSN、出版地、出版机构等进行检索、出版地、出版机构等进行检索默认检索默认检索:缺省检索,指在检索系统预先设定的多个字段中进:缺省检索,指在检索系统预先设定的多个字段中进 行检索。行检索。其他检索:其他检索:如分子式、特征词等检索。如分子式、特征词等检索。第二章第二章 检索基本知识检索基本知识一、检索的发展历史一、检索的发展历史二、检索系统二、检索系统三、检索语言三、检索语言四、检索技术四、检索技术五、检索步骤五、检索步骤文献的文献的主题内容主题内容主题主题概念概念检索者的检索者的信息需求信息需求情情报报检检索索语语言言 标识标识检索检索系统系统检索检索结果结果主题主题分析分析主题主题分析
19、分析标引标引标引标引输入输入检索检索输出输出文献文献存储存储文献文献检索检索主题主题概念概念 标识标识什么是情报检索语言?什么是情报检索语言?情报检索语言是根据情报检索的需情报检索语言是根据情报检索的需要而创制的要而创制的人工语言人工语言。又称为情报语言、又称为情报语言、检索语言、情报存贮与检索语言、文献检索语言、情报存贮与检索语言、文献语言、文献工作语言、索引语言、标引语言、文献工作语言、索引语言、标引语言、标引符号、标识系统,等等。语言、标引符号、标识系统,等等。自然语言直接用于检索存在着根本缺点,主要由以下原因造成:词汇量巨大 词汇的同义现象 词汇的多义现象 词汇的模糊性和不确定性 词间
20、关系不明确,无法清楚显示概念之间的关系自然语言直接用于检索存在着根本缺点,主要由以下原因造成:词汇量巨大 词汇的同义现象 词汇的多义现象 词汇的模糊性和不确定性 词间关系不明确,无法清楚显示概念之间的关系多义词:1 一词多义:这种多义词有几项意义,其中有一项是本意,其它的意义是转义。如:苹果 渔鼓 大本营 防御2 同形异义:它所具有的多种意义各不相关 如:词 杜鹃自然语言直接用于检索存在着根本缺点,主要由以下原因造成:词汇量巨大 词汇的同义现象 词汇的多义现象 词汇的模糊性和不确定性 词间关系不明确,无法清楚显示概念之间的关系香港脚蘑菇战术地毯轰炸自然语言直接用于检索存在着根本缺点,主要由以下
21、原因造成:词汇量巨大 词汇的同义现象 词汇的多义现象 词汇的模糊性和不确定性 词间关系不明确,无法清楚显示概念之间的复杂关系 利用中国生物医学文献数据库(CBM)查找“肝肿瘤的肺转移”的有关文献#1 肝肿瘤肝肿瘤/病理学病理学#2 肺肿瘤肺肿瘤/继发性继发性#3#1 and#2主题词主题词副主题词副主题词用户的检索要求往往是以概念为依据的 用户的检索要求尽管形式多样,要求不同,但有一点是共同的,即首先是符合这一课题的概念。例如:检索“心脏的功能”是指检索心脏在循环系统中作为正常机能泵的生理功能而言,不是仅仅指在文献中出现“心脏”、“功能”或“心脏功能”这种字样的文献。生长、繁殖、死亡(生命现象
22、)生物 概念是一种思维形式,反映客观事物的一般的、本质的特征,也就是本质的属性。什么是概念什么是概念?马:一种动物,有脊椎、哺乳、奇蹄,几乎整个尾部有长毛什么是概念什么是概念?科学认识的成果,都是通过形成各种概念来加以总结和概括的。文献的情报内容只有用概念才能加以科学的揭示,即通过主题分析将其概括为某个或某些主题概念。什么是概念什么是概念?自然语言自然语言情报检索语言情报检索语言语词语词=语义语义=事物概念事物概念 词汇控制词汇控制(数量、结构)(数量、结构)情报检索语言情报检索语言分类法分类法主题法主题法分类主题法分类主题法叙词法叙词法标题法标题法 单元词法单元词法关键词法关键词法自然语言自
23、然语言分 类 法A 马列主义、毛泽东思马列主义、毛泽东思想想B 哲学哲学C 社会科学总论社会科学总论 Q 生物科学生物科学R 医药卫生医药卫生 R1 预防医学、卫生学预防医学、卫生学R2 中国医学中国医学 R3 基础医学基础医学 R4 临床医学临床医学 R5 内科学内科学 R6 外科学外科学 R51 传染病传染病R52 结核病结核病R53 寄生虫病寄生虫病R531原虫病原虫病R532蠕虫病蠕虫病.叙词法叙词法 也叫主题词法。是多种情报检索语言的原理和方法的综合。它采用概念组配原理,并适当采用先组式的词组,对语词进行严格规范化,通过参照系统揭示词间关系。叙词的规范形式的规定形式的规定 汉字不同形
24、体的优选:简体与繁体汉语词不同写法的优选:渔具(叙词)鱼具(非叙词)外语词不同拼写形式的优选:catalogue(叙词)catalog(非叙词)外语名词数的形态的规定:chemical compounds(化合物)stars(星)opacity(不透明性)chemistry(化学)wood(木、木材)woods(森林)外文字母、数字用法的规定:COBOL 语言 射线 铀235 Element 105 标点符号用法的规定:一般只用,()和-叙词的规范同义词和准同义词的优选同义词和准同义词的优选 一般同义词:交际舞交际舞(叙词)交谊舞(非叙词)学名和俗名:马铃薯马铃薯(叙词)土豆(非叙词)新称和旧
25、称:索引索引(叙词)通检(非叙词)全称和简称:中学中学(叙词)中等学校(非叙词)东南亚国家联盟东南亚国家联盟(叙词)东盟(非叙词)同一产品的正式命名、绰号和型号:F-14飞机飞机(叙词)“熊猫”飞机(非叙词)不同译名:激光器激光器(叙词)莱塞(非叙词)近义词:半工半读半工半读(叙词)半农半读(非叙词)某些反义词和否定词:稳定性稳定性(叙词)不稳定性(非叙词)叙词的规范多义词的规范多义词的规范 不用同一个词来表达:指军事上的防御用:防御 指运动竞赛的防御用:防守(运动竞赛)指军队的大本营用:统帅部 指登山队的大本营用:登山营地 加限义词:词(语言学)词(文学)渔鼓(曲艺)渔鼓(乐器)关键词法关键
展开阅读全文