信息检索方法与工具 课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《信息检索方法与工具 课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息检索方法与工具 课件 信息 检索 方法 工具
- 资源描述:
-
1、信息检索的方法与工具云南农业大学图书馆黄体杨广义的理解是指将信息按照一定的方式组织和存储起来,并能根据用户的需求检索出其中相关信息的过程,其全称叫做“信息存储与检索”、“信息组织与检索”等。信息检索狭义的理解就是用户根据其需要,选择一定的信息检索工具,从中获取所需信息资源的过程。一、信息检索语言信息检索语言是用来描述信息资源特征和进行检索的人工语言,可分为规范化语言和非规范化语言(自然语言)两类。简单地说,就是用来对信息资源进行组织、整理和有序化的标准、规范。介绍三类信息检索语言:分类语言、主题语言和自然语言。一、信息检索语言分类语言分类是指依据事物的属性和特征进行区分和类聚,并将区分的结果按
2、照一定的次序予以阻止的活动,而信息资源分类是指根据信息资源的内容属性和其他特征,将信息资源分门别类地、系统地组织和揭示的方法。分类语言是一种按学科范畴和体系来划分事物的语言,它是以数字、字母符号对类目进行标识的一种语言体系,也称分类法。主要包括体系分类语言和组配分类语言。基本部类基本大类马克思主义、列宁主义、毛泽东思想、邓小平理论A马克思主义、列宁主义、毛泽东思想、邓小平理论哲学B哲学、宗教社会科学C社会科学总论D政治、法律E军事F经济G文化、科学、教育、体育H语言、文字I文学J艺术K历史、地理中国图书分类法自然科学N自然科学总论O数理科学和化学P天文学、地球科学Q生物科学R医药、卫生S农业科
3、学T工业技术U交通运输V航空、航天X环境科学、安全科学综合性图书Z综合性图书中国图书分类法一、信息检索语言分类语言索书号:分类号+书次号中国彝族医学基础理论,云农索书号为:R291.7/2;云南省图索书号为:R291.7/1042/01 生物多样性信息管理概论云农索书号 Q16/5;云南省图索书号Q16/4403;昆工索书号为:Q16/6。如:知识交流与交流的科学,索书号为:G250-53/20种群动力学,索书号为:Q145/3一、信息检索语言主题语言主题语言又称主题法,是指直接以表达主题内容的词语作检索标识、以字顺为主要检索途径的标引和检索信息资源,并用参照系统显示概念之间相互关系的信息处理
4、方法和信息检索方法。国内外著名的主题表:美国国会标题表医学标题表汉语主题词表化工汉语主题词表中国分类主题词表机械工业主题词表国防科学技术叙词表工程索引叙词表中国档案主题词表一、信息检索语言主题语言在信息检索领域所指的自然语言,是指直接使用不经过控制的自然语言中的词语作标识,进行信息资源的标引和检索。其实质就是使用信息资源作者原来所用的词语,或文摘编写者原来所用的词语,或标引人员自拟的而不是取自词表的词语作为信息资源的检索标识。如期刊论文的“关键词”、“主题”检索;我们发布博客时候需要填写关键词等。二、信息检索技术布尔检索(1)逻辑与(AND)算符可用“*”代替,其含义是:检索出的记录必须同时含
5、有所有的检索词。例如,“A AND B”或“A*B”的含义是检索出的记录中必须同时含有“A”和“B”。AB二、信息检索技术布尔检索(1)逻辑或(OR)算符可用“+”代替,其含义是:检索出的记录中至少含有两个检索词中的一个。例如,“A OR B”或“A+B”的含义是检索出的记录中至少含有“A”和“B”。AB二、信息检索技术布尔检索(1)逻辑非(NOT)算符可用“-”代替,其含义是:检索出的记录只能含有NOR算符前的检索词,但不能同时含有其后的词。例如,“A NOT B”或“A-B”的含义是检索出的记录中必须含有“A”但不能含有“B”。AB二、信息检索技术截词检索(2)截词检索主要是利用检索词的词
6、干或者不完整的词形进行检索。也就是把检索词截断,取其中一部分片段检索,用截词符“?”或“*”代替。它可以起到扩大检索范围,提高检准率,减少检索词的输入量等作用。尤其是使用英文检索系统进行检索时,若遇到名词的单复数形式、词的不同拼写方法、词的后缀变化等情况,均可采用此方法。二、信息检索技术截词检索(2)按截词数量可划分为有限截词和无限截词。有限截词有限截词。主要用于词的单、复数,动词的词尾变化等。将n个截词符放在检索词的词干或词尾可能变化的位置上,检索词的词干后加一个或多个(最多4个)“?”,空格后再加上一个“?”,则空格前的“?”个数表示词干后允许有的最多字符数。如“apple?”,只能替代a
7、pple、apples、applet,而不能替代applejack。二、信息检索技术截词检索(2)无限截词。无限截词。检索词的词干后(前)加一个“?”(有的系统加“*”),表示词干后(前)可以有任意个字符。当通配符在词干后方时,称为前方一致或右截断,如“apple?”可替代“apple+apples+apple-pie+applesauce”等。通配符在词干前方时,称为后方一致或左截断。如“?economics”可替代“economics+micro economics+macroeconomics”等。二、信息检索技术截词检索(2)同时采用以上两种方式称为复合截断,如“?count?”可替代
展开阅读全文