最新计算机信息检索基础知识课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《最新计算机信息检索基础知识课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 最新 计算机信息 检索 基础知识 课件
- 资源描述:
-
1、计算机信息检索的定义 计算机信息检索是利用计算机对信息进行存储与检索。存储过程:大量的数据按一定的格式输入到计算机中,经过计算机的加工处理,以一定的结构有序地存储在计算机的存储介质上。查找过程:用户的需求输入到计算机中,由计算机对其进行处理,并与已存储在计算机中的信息进行查询与匹配,最后按要求的格式输出检索结果。标引举例2 尼莫地平治疗高血压 分类标引:R544.105 高血压治疗学 主题标引:尼莫地平/治疗应用 高血压/药物疗法 支气管扩张剂对肺的作用 分类标引:R974 呼吸系统药物 主题标引:肺/药物作用 支气管扩张剂/药理学计算机信息检索系统组成硬件:运算器、控制器、存储器、输入输出装
2、置等软件:系统操作程序、数据库管理程序、联机控制程序、应用程序等。通讯线路:电话通讯网、数据通讯网、卫星通讯网等。检索终端:信息用户与检索系统主机进行人机对话,实现联机检索的设备。包括上网设备、调制解调器等。数据库:是计算机检索的对象。是由一个或数个文档构成,并能够满足某一特定目的或某一特定数据处理系统需要的一种数据集合。数据库(Database)一定专业范围内的信息记录及其索引的集合体,是计算机信息检索系统的重要组成部分,是信息资源,是检索对象.数据库的类型 书目数据库(Bibliographic Database)存储的是二次文献,包括文献的外部特征、题录、文摘和主题词等,检索结果是所需文
3、献的线索而非原文。许多书目数据库是印刷型文献检索工具的机度版,如MEDLINE、CBMDISC等数值数据库(Numeric Database)主要包含的是数字数据,如各种统计数据、科学实验数据、科学测量数据等。例如医学上使用的化学制剂、药物的各种理化参数、人体生理上的各种数值,人口统计数据都可收入数值数据库。美国国立医学图书馆编制的化学物质毒性数据库RTECS,包含10万多种化学物质的急、慢性毒理实验数据。事实数据库(Fact Database)存储的是用来描述人物、机构、事物等信息的情况、过程、现象的事实数据。如名人录、机构指南、大事记等,均可归入事实数据库。美国MEDLARS系统的医生咨询
4、数据库(PDQ),能提供有关癌症治疗和临床实验的相关病因、诊断标准、治疗方案以及最新研究进展等信息。全文数据库(Full Text Database)存储的是原始文献的全文,如杂志论文、报纸新闻、法院案例等。全文检索可直接获取原始资料,而不是书目检索时的线索,提高了用户的检索效率。在DIALOG中有48种医药期刊全文数据库,我国有中国学术期刊数据库、万方数据库、维普数据库等全文数据库。数据库的构成 记录(Record)是构成数据库的一个完整的信息单元,每条记录描述了原始信息的外部和内部特征。书目数据库中的一条记录通常代表一篇文献,其它类型数据库中的记录则是某种信息单元,如一种治疗方案、一组理化
5、指数等。字段(Field)比记录更小的单位是字段,是组成记录的数据项目。例如在书目数据库Medline中一条极力代表一篇文献,在这条记录中有题名(TI)、著者(AU)、来源(SO)、主题词(MH)等字段。文档(File)数据库中一部分记录的集合。许多大型数据库为了方便用户,常常把数据库分割成若干文档,如Medline数据库分为现期文档和若干个回溯文档。文档是数据库的结构。数据库是由一个顺排文档和若干个倒排文档所构成。顺排文档以记录为单位,按记录的入藏顺序号从小到大排列。倒排档是从顺排档中抽取有检索意义的检索标识,如主题词、著者姓名、化学物质名等,并按某种顺序排列,同时在检索标识后注明入藏顺序号
6、。顺排文档按文献记录的存取号从小到大排列。218653(AN)Nonverbal Communication in TeachingTI1 TI2 TI3 TI4Smith,Howard AAUReviews of Educational Research.V49 n49 p631-72 Wtr1983JN PYLanguage:English LASchool related research is reviewed underAB1 AB2 AB3 AB4 AB5 AB6218654218655倒排文档 关键词索引文档表索引词 记录号 字段号Article 195895 AB2Artifa
7、cts 218653 AB22Behavior 218653 AB17Body 195895 TH2 195895 AB10倒排文档:从数据库全部记录的基本字段中,按照著者、主题、分类等提取出所有的检索词,分别按字顺排列而重新形成的索引文档。如下图:计算机信息检索的分类根据计算机检索服务方式:(1)定题检索(2)回溯检索(3)日常检索计算机信息检索的分类根据检索方式分:(1)脱机检索(2)联机检索(3)国际联机检索(4)光盘检索(5)网络检索国外计算机信息检索发展阶段脱机检索阶段(1954-1964)联机检索阶段(1965-1971)国际联机检索阶段(1972-1994)网络信息检索阶段(19
8、95-)国内计算机信息检索发展阶段1975年,从国外引进数据库开展机检服务;1980年,建立国际联机终端开展检索服务;20世纪80年代中后期,自建数据库;90年代初,发展光盘检索;90年代中期,Internet网络化检索阶段。脱机检索(off-line retrieval)是六十年代发展起来的批次检索,用户不与检索系统发生直接联系,只需把检索要求送往检索中心,由检索人员在计算机主机旁进行文献检索的一种方式。优点:价格便宜,无网络通讯费,检索费用由用户平摊,随机存储。缺点:一次机会检索,检索结果延误,委托性检索。联机检索(on-line retrieval)联机检索是用户利用终端设备,通过通信网
展开阅读全文