书签 分享 收藏 举报 版权申诉 / 53
上传文档赚钱

类型计算机检索技术概述课件.ppt

  • 上传人(卖家):晟晟文业
  • 文档编号:4853867
  • 上传时间:2023-01-18
  • 格式:PPT
  • 页数:53
  • 大小:1.55MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《计算机检索技术概述课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    计算机 检索 技术 概述 课件
    资源描述:

    1、字段(字段(field)field):如在数据库中题名、作者、作者单位、期刊名、摘要、全文等等均是字段;一条记录由多个字段值组成;对计算机检索来说字段相当于检索入口。常用字段缩写:常用字段缩写:TITITitle Title 文章题目文章题目ABABAbstract Abstract 文章摘要文章摘要KWKWKey Word Key Word 关键词关键词AUAUAuthor Author 作者作者AFAFAffiliation Affiliation 作者单位作者单位SOSOSource Source 文章来源(刊名信息等)文章来源(刊名信息等)ISSN(ISBN)ISSN(ISBN)Int

    2、ernational standard Serial(book)Number International standard Serial(book)Number PYPYPublication year Publication year 出版年出版年LALALanguage Language 语种语种记录记录(Record)(Record)由若干字段组成的文献单元,在全文数据库中,一条记录相当于一篇完整的文献,在书目数据库中,一条记录相当于一条文摘或题录。文档文档(File)(File)由若干个逻辑记录构成的信息集合,是数据库的基本内容,分为顺排文档和倒排文档。顺排文挡是数据库的主体内容,倒排

    3、文档是将记录中的一切可检字段或属性值提取出来,按某种顺序重新加以组织所得到的文档。数据库的类型数据库的类型书目数据库全文数据库文摘数据库按信息处理层次划分期刊论文数据库书目及图书全文数据库专利数据库学位论文数据库产品数据库按收录的文献类型划分图像数据库 文本数据库数值数据库 声音数据库 视频数据库多媒体数据库按媒体信息划分综合性数据库专业性数据库按收录文献信息的范围划分单机数据库联机数据库网络数据库按服务模式划分精确与模糊检索精确与模糊检索 基本技术基本技术词间位置检索词间位置检索 加权检索加权检索 布尔逻辑检索布尔逻辑检索 限定字段检索限定字段检索 限定范围检索限定范围检索 截词检索截词检索

    4、 1.1.逻辑逻辑“与与”(AND)(AND),表示为,表示为 A and B A and B 或或 A A*B B 2.2.逻辑逻辑“或或”(OR)(OR),表示为,表示为 A or B A or B 或或 A+B A+B 3.3.逻辑逻辑“非非”(NOT)(NOT),表示为,表示为 A not B A not B 或或 A-BA-B 逻辑逻辑“与与”用“and”、“*”或者空格表示。在网络搜索引擎中习惯用空格代替“and”。表示检出的记录必须同时包含所有的检索词,可以缩小检索范围,减少命中文献量,提高查准率。ABA and B例:检索例:检索“太阳能太阳能”文献文献太阳太阳能源能源 逻辑逻

    5、辑“或或”用“or”、“”或逗号表示。在网络搜索引擎中习惯用逗号代替“OR”。表示检出的记录中至少含有多个检索词中的任何一个,可以扩大检索范围,增加命中文献量,防止漏检。常用于连接同义词,相关词等。ABA or B例:检索例:检索“光盘和磁盘光盘和磁盘”文献文献光盘光盘磁盘磁盘 逻辑逻辑“非非”(NOT)(NOT)表示检索结果中排除含有某些词的记录,可以缩小检索范围,减少文献输出量,但并不一定能提高查准率。ABA not B例:检索例:检索“除核能以外有关能源除核能以外有关能源”文献文献能源能源核能核能 也叫也叫邻接检索邻接检索”,表示两个或多个检索词之间的关表示两个或多个检索词之间的关系检索

    6、方式,常用的位置算符有系检索方式,常用的位置算符有:1.w(with)1.w(with)表示两个检索词前后次序固定,二者之间只能间隔连表示两个检索词前后次序固定,二者之间只能间隔连字符、空格或者是逗号。字符、空格或者是逗号。【实例】【实例】在在OCLCOCLC中输入中输入communication w satellitecommunication w satellite;2 2.wN wN(with N)(with N)表示两个检索词前后次序固定,二者之间最多间隔表示两个检索词前后次序固定,二者之间最多间隔N N个个字符。字符。【实例】【实例】在在EBSCOEBSCO中输入中输入communi

    7、cation w3 satellitecommunication w3 satellite;3.n(Near)3.n(Near)表示两个检索词可以互换顺,表示两个检索词可以互换顺,二者之间只能间隔连字符、空格或者是逗二者之间只能间隔连字符、空格或者是逗号。号。【实例】【实例】在在OCLCOCLC中输入中输入communication n communication n satellitesatellite;4.nN4.nN(Near N)(Near N)表示两个检索词可以互换表示两个检索词可以互换顺,二者之间最多间隔顺,二者之间最多间隔N N个字符。个字符。【实例】【实例】在在EBSCOEBS

    8、CO中输入中输入communication n3 communication n3 satellite;satellite;比较:在比较:在EBSCOEBSCO中输入中输入source and lawsource and law、source w2 lawsource w2 law 截词符(通配符)截词符(通配符)提高查全率,防止漏提高查全率,防止漏检的有力手段,也可以简化输入,包括有限截词检的有力手段,也可以简化输入,包括有限截词和无限截词,常用的截词符有:和无限截词,常用的截词符有:*,?,#,!,?,#,!,$有限截词有限截词一个符号表示一个字符,一般使用一个符号表示一个字符,一般使用“

    9、?”(英文半角问号)代表(英文半角问号)代表0-10-1个字符。个字符。比如比如:chip?:chip?可检索出:可检索出:chipschips(右截断)(右截断)无限截词无限截词一个符号表示任意多个字符,标准符号一个符号表示任意多个字符,标准符号是是“*”,代表,代表0-n0-n个字符,也称为通配符。个字符,也称为通配符。比如比如:comput:comput*可检出:可检出:compute,Computer,compute,Computer,computers,computing,Computerizecomputers,computing,Computerize等等.注:不同的数据库所用的

    10、截词符不一样,使用应先查注:不同的数据库所用的截词符不一样,使用应先查一下各数据库的帮助加以确认一下各数据库的帮助加以确认后截断无限截断无限截断如:physic?截词检索与截词检索算符PhysicphysicsphysicstphysicalismPhysicphysicsphysicst如:physic*有限截断有限截断中截断中截断前截断前截断m?nmanmeninformation retrieval information retrieval information AND retrieval information AND retrieval“information retrieval

    11、”information retrieval”4.4.英语或汉语中都有许多虚词,不能作为检索词。英语或汉语中都有许多虚词,不能作为检索词。如:汉语中如:汉语中“的、地、得、了的、地、得、了”等助词等助词;英语中的英语中的a about also and any as at be a about also and any as at be between by both for some so not this withbetween by both for some so not this with等等介词或冠词等介词或冠词等 检索策略是对检索的全面策划,在操作上检索策略是对检索的全面策划,在

    12、操作上主要指检索式的编制和数据库的选择。主要指检索式的编制和数据库的选择。检索策略在计算机检索中直接决定检索结检索策略在计算机检索中直接决定检索结果的准与全。果的准与全。例:神经网络在旋转机械故障诊断中的应用研究例:神经网络在旋转机械故障诊断中的应用研究 1.1.本课题包含本课题包含“神经网络神经网络”“旋转机械旋转机械”“故障诊断故障诊断”三个概念三个概念,“,“应用应用”和和“研究研究”属于意义过于宽泛的词,不属于意义过于宽泛的词,不应该作为检索词。应该作为检索词。2.2.扩展扩展 神经网络:相关的上位词有人工智能神经网络:相关的上位词有人工智能旋转机械旋转机械故障诊断:相关词有故障定位、

    13、故障检测,上位词有故障诊断:相关词有故障定位、故障检测,上位词有容错技术容错技术 3.3.检索式:检索式:(神经网络(神经网络 OR OR 人工智能)人工智能)ANDAND(旋转机械)(旋转机械)AND(AND(故障诊断故障诊断 OR OR 故障定位故障定位 OR OR 故障检测故障检测 OR OR 容错技术)容错技术).要从概念入手,而不是从字面意思入手;要从概念入手,而不是从字面意思入手;.概念扩展时要考虑同义词、相关词、上位词概念扩展时要考虑同义词、相关词、上位词/下位词等下位词等(既词表中提到的用、代、分、属、参、族),还要注意中英文既词表中提到的用、代、分、属、参、族),还要注意中英

    14、文混用的现象混用的现象 ;3.3.当课题比较生疏时,应当首先利用百科全书、图书等弄清当课题比较生疏时,应当首先利用百科全书、图书等弄清楚概念,了解课题的有关专业知识,弄清楚课楚概念,了解课题的有关专业知识,弄清楚课 题的内容和要解题的内容和要解决的问题以及解决该问题的初步设想等,进而确定检索的主题范决的问题以及解决该问题的初步设想等,进而确定检索的主题范围。围。4.4.人文社会科学的检索,如果是回溯检索,应该熟悉不同年人文社会科学的检索,如果是回溯检索,应该熟悉不同年代所使用的概念和术语代所使用的概念和术语 5.5.忽略那些意义过于宽泛、通用的词,比如忽略那些意义过于宽泛、通用的词,比如:“:

    15、“研究研究”、“应用应用”“”“探讨探讨”等。等。分析课题时须注意的问题分析课题时须注意的问题 明确检索要求,选择数据库明确检索要求,选择数据库选择数据库要考虑以下因素:选择数据库要考虑以下因素:1.1.检索目的:检索的时间范围、文献类型、检索深度为检索目的:检索的时间范围、文献类型、检索深度为题录、文摘还是全文等等题录、文摘还是全文等等2.2.检索结果:对于研究生做学位论文来说,做课题前应检索结果:对于研究生做学位论文来说,做课题前应充分了解一下本课题国内外的研究现状(即论文的综述充分了解一下本课题国内外的研究现状(即论文的综述部分),这时应对该课题进行较全面的检索,包括综述部分),这时应对

    16、该课题进行较全面的检索,包括综述性的文章,要求全面;对于该课题的核心部分,即该课性的文章,要求全面;对于该课题的核心部分,即该课题所要解决的具体问题,创新的地方,则需要准,技术题所要解决的具体问题,创新的地方,则需要准,技术细节越细越好。细节越细越好。3.3.检索内容所属学科检索内容所属学科,对与自己相关的数据库要有一个对与自己相关的数据库要有一个全面的了解全面的了解.检索效率检索效率 查全率和查准率是判定检索效果的主要指查全率和查准率是判定检索效果的主要指标。标。查全率查全率:(Recall RatioRecall Ratio)指系统在进行某一检索指系统在进行某一检索时,检索出的相关文献量与

    17、系统文献库中相关文时,检索出的相关文献量与系统文献库中相关文献总量的比率。用公式表示为:献总量的比率。用公式表示为:检出的相关文献量检出的相关文献量 系统数据库中的相关文献总量系统数据库中的相关文献总量 R=X100%扩大检索范围扩大检索范围,提高查全率的方法提高查全率的方法1 1、跨库检索、跨库检索2 2、选择较大检索范围的字段如摘要、选择较大检索范围的字段如摘要3 3、外文单词使用截词符、外文单词使用截词符4 4、使用上位词(如飞行器、使用上位词(如飞行器 _航天飞机航天飞机 _载载人航天飞机)人航天飞机)5 5、考虑同义词或近义词(使用布尔逻辑符、考虑同义词或近义词(使用布尔逻辑符oro

    18、r连接)连接)6 6、逐步扩大算符的检索范围,逐步提高查全率的算、逐步扩大算符的检索范围,逐步提高查全率的算符依次是:位置算符符依次是:位置算符w w wn wnnearnear 逻辑算符逻辑算符and and or or 查准率查准率:(Precision RatioPrecision Ratio)指系统在进行某)指系统在进行某一检索时,检出的相关文献量与检出文献总一检索时,检出的相关文献量与检出文献总量的比率。用公式表示为:量的比率。用公式表示为:检出的相关文献量检出的相关文献量 检出的文献总量检出的文献总量 P=X100%缩小检索范围,提高查准率的方法缩小检索范围,提高查准率的方法1 1、选择专业性检索工具如使用产品数据库、特种搜、选择专业性检索工具如使用产品数据库、特种搜索引擎。索引擎。2 2、选择检索范围较小的字段、选择检索范围较小的字段3 3、逐步缩小算符的检索范围,逐步提高查准率的算、逐步缩小算符的检索范围,逐步提高查准率的算符依次是:符依次是:逻辑算符逻辑算符or or and and 位置算符位置算符nearnear wn wn w w;使用算符;使用算符notnot排除干扰信息。排除干扰信息。4 4、使用二次检索、使用二次检索5 5、使用下位词、使用下位词

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:计算机检索技术概述课件.ppt
    链接地址:https://www.163wenku.com/p-4853867.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库