书签 分享 收藏 举报 版权申诉 / 81
上传文档赚钱

类型中文数据库跟信息检索技术资料课件.ppt

  • 上传人(卖家):三亚风情
  • 文档编号:3044957
  • 上传时间:2022-06-25
  • 格式:PPT
  • 页数:81
  • 大小:5.36MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《中文数据库跟信息检索技术资料课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    中文 数据库 信息 检索 技术资料 课件
    资源描述:

    1、黄艳娟黄艳娟Huangyanjuan Huangyanjuan 中文数据库检索 信息检索技术与过程信息检索技术与策略CNKI检索维普检索万方检索 CNKI检索CNKICNKI资源资源总体介绍总体介绍1数据库检数据库检索与使用索与使用方法方法2CNKICNKI资源资源总体介绍总体介绍1我校购买的资源包括:我校购买的资源包括:CNKICNKI资源资源总体介绍总体介绍1该库收录该库收录19151915年至今国内出版的年至今国内出版的近近7000 7000 种学术期刊,其中核心种学术期刊,其中核心期刊、重要评价性数据库来源期期刊、重要评价性数据库来源期刊近刊近 2600 2600 种。内容覆盖自然科种

    2、。内容覆盖自然科学、工程技术、农业、哲学、医学、工程技术、农业、哲学、医学、人文社会科学等各个领域学、人文社会科学等各个领域 ,全文文献总量全文文献总量 2200 2200 多万篇。多万篇。该库收录该库收录19991999年至今全国年至今全国 420 420 家博士培养单位的博士学位论文。家博士培养单位的博士学位论文。累积出版博士学位论文全文文献累积出版博士学位论文全文文献 6 6万多篇。万多篇。该库收录该库收录19991999年至今全国年至今全国652 652 家家硕士培养单位的优秀硕士学位论硕士培养单位的优秀硕士学位论文。累积出版硕士学位论文全文文。累积出版硕士学位论文全文文献文献 444

    3、4万多篇。万多篇。收录收录20002000年以来国家二级以上学年以来国家二级以上学会、协会、高等院校、科研院所、会、协会、高等院校、科研院所、学术机构等单位的论文集,年更学术机构等单位的论文集,年更新约新约 10 10 万篇论文。累积出版会万篇论文。累积出版会议论文全文文献议论文全文文献 7373万篇。万篇。CNKI数据库登录CNKI使用指南数据库检数据库检索与使用索与使用方法方法2CNKI数据库登录需要注意的是:偶尔会提示输入用户名和密码。请记住:用户名:DX0437密码:hrbgcCNKI数据库登录CNKI使用指南数据库检数据库检索与使用索与使用方法方法2CNKI使用指南:认识CNKI检索

    4、平台利用CNKI查找有关“机械手自由度”的文献A 通用菜单在各个总库平台首页和检索结果页都提供了通用菜单B 统一检索平台可进行跨库检索C 总库文献出版报表D 文献资源统一导航利用CNKI查找有关“机械手自由度”的文献CNKI的检索方式:跨库检索还是进入单库检索?如何选择,这就需要分析检索人的需求跨库:可以同时检索多个子库,获取更多更全面的结果,而且省时省力单库:一次只检索一个类型的文献,避免结果过多造成的困扰检索人的需求是什么? 是为了获取关于某一内容的系统的全面的信息,还是只是想搜索特定类型的文献信息?跨库检索检索字段检索词机械手布尔逻辑算符自由度检索结果检索字段信息检索途径检索途径是用户根

    5、据需要,以文献信息的外部特征和内容特征来确定的检索入口。根据信息的根据信息的外部外部特征特征:题名途径、著者途径、序号途径题名途径、著者途径、序号途径根据信息的根据信息的内容内容特征特征:分类途径、主题途径分类途径、主题途径 信息检索途径(检索字段)l责任者途径l题名途径l分类途径l主题途径l序号途径l引文途径信息检索途径1 题名(题目、标题等)途径题名(题目、标题等)途径2 责任者(作者、编者等)途径责任者(作者、编者等)途径3 序号(序号(ISBN号等)途径号等)途径4 分类途径分类途径5 主题途径(主题词)主题途径(主题词)6 关键词途径关键词途径ISBN是国际标准书号(是国际标准书号(

    6、International Standard Book Number)的)的简称,是国际通用的图书或独立的出版物(除定期出版的期刊)代码。出版社可以通过国际标准书号清晰的辨认所有非期刊书籍。一个国际标准书号只有一个或一份相应的出版物与之对应。 ISSN(国际标准连续出版物国际标准连续出版物编号编号,International Standard Serial Number)是根据国际标准ISO3297制定的连续出版物国际标准编码,其目的是使世界上每一种不同题名、不同版本的连续出版物都有一个国际性的唯一代码标识。 信息检索技术 布尔逻辑检索 位置算符检索 截词检索与词根检索 精确检索与模糊检索布尔

    7、逻辑检索最常用的信息检索技术布尔逻辑检索(Boolean logical)就是利用布尔逻辑算符进行检索项的逻辑组配,用以表达检索者的提问概念。 布尔逻辑布尔逻辑(台湾台湾译布林逻辑)得名于乔治布尔,他是爱尔兰科克的皇后学院的英国数学家,他在十九世纪十九世纪中叶首次定义了逻辑的代数系统。现在,布尔逻辑在电子学、计算机硬件和软件中有很多应用。使用集合代数作为介绍布尔逻辑的一种方式。还使用文氏图来展示各种布尔逻辑陈述所描述的集合联系。布尔逻辑检索 逻辑“与” 逻辑“或” 逻辑“非”逻辑“与”:用“AND”或“ *”表示。 用于连接概念交叉和限定关系的检索词。 功能:以缩小检索范围,有利于提高查准率。

    8、 逻辑“或”:用“OR”或“+”表示。 用于连接并列关系的检索词,功能:以扩大检索范围,防止漏检,有利于提高查全率。 逻辑“非”用“NOT”或“-”号表示,用于连接排除关系的检索词,功能:即排除不需要的和影响检索结果的概念,以提高查准率。逻辑与检索式构造举例如:查找“胰岛素治疗糖尿病”的检索式为: insulin (胰岛素) and diabetes(糖尿病)逻辑或检索式构造举例如:查找“肿瘤”的检索式为: cancer(癌) oror tumor(瘤)oror carcinoma(癌) oror neoplasm(新生物)逻辑非检索式构造举例如:查找“动物的乙肝病毒(不要人的)”的文献的检索

    9、式为:hepatitis B virus(乙肝病毒) not human(人类)。 2 位置算符检索位置检索位置检索也叫邻近检索邻近检索。位置算符检索是用一些特定的算符(位置算符)来表达检索词与检索词之间的邻近关系。表示两词之间的位置邻近关系,常用到的位置算符有(W)(nW)(N)nN)等。W算符 W算符是word或with的缩写,表示在此算符两侧的检索词必须按输入时的前后顺序排列,而且所连接的词之间除了有一个空格或一个标点外不得夹有其他的单词或字母。 information 2W management 可包括 Information technologies and management和

    10、Information management N 算符N 算符是near的缩写,表示在此算符两侧的检索词必须紧密相连,词序可颠倒。nN表示两检索词之间最多可以插入n个单词,且词序可颠倒。 information N retrieval information 2N retrieval3 截词检索截词检索就是用截断的词的一个局部进行的检索,并认为凡满足这个词局部中的所有字符(串)的文献,都为命中的文献。按截断的位置来分,截词可有后截断、前截断、中截断三种类型。不同的系统所用的截词符也不同,常用的有?、$、*等。分为有限截词(即一个截词符只代表一个字符)和无限截词(一个截词符可代表多个字符)。 (

    11、1)后截断,前方一致。如:comput?表示computer,computers,computing等。(2)前截断,后方一致。如:?computer表示minicomputer,microcomputers等。(3)中截断, bas?s= basis bases colo?r 包含 colour(英)和color (美)模糊检索与精确检索模糊检索与精确检索模糊检索(fuzzy search)是与“精准检索”相对应的一个概念,是指搜索系统自动按照用户输入关键词的同义词进行模糊检索,从而得出较多的检索结果。同义词由系统的管理界面配置。如配置了“电脑”与“computer”为同义词后,检索“电脑”

    12、,则包含“computer”的网页也会出现在检索结果中。模糊检索也就是同义词检索,用户在检索页面中输入同义词中任何一个词检索时,只要选中“模糊检索”复选框,则该关键词的所有同义词信息也都被检索出来。 精确检索精确检索是指检索词与检索字符串完全相等。如检索作者马智,仅检索出作者为马智的文献 ,作者为“马智勇”的就不会被检索出来。模糊模糊检索检索模糊检模糊检索结果索结果精确检索进入单库检索请看检索举例视频期刊导航使用CAJ阅读器和PDF阅读器2022-6-2339同方知网(北京)技术有限公司浏览器下载点击文章篇名,进入知网节页面:CAJCAJ下载的优势:下载的优势:占用空间小下载速度快内嵌专业词典

    13、即时工具书释义个性化编辑文献文档定位功能打开大部分PDF文档并进行个性化编辑 2022-6-232022-6-23机械手以“学术趋势”为例:2022-6-232022-6-23信息检索过程信息检索过程分析需求分析需求确定检索词确定检索词选选 择择 信信 息息 源源确定检索途径确定检索途径和方法和方法1234实施检索获取实施检索获取原始文献原始文献信息检索过程是从确立检索需求到信息检索过程是从确立检索需求到信息需求得到满足的全过程。信息需求得到满足的全过程。过程一 :分析需求,确定检索词1 明确检索目的 * 需要关于某方面的系统详尽的信息 * 需要关于某方面的最新信息 * 了解一些片段信息,解决

    14、一些具体问题2 明确课题的主题或主要内容 要形成若干个既能代表信息需求又具有检 索意义的关键词(检索词),关键词(检索词),确定检索词之间的关系3 涉及的学科范围4 所需信息的数量、语种、年代范围等需求分析:课题一: “赟”这个字的读音课题二:中西关系发展综述课题三:机械手的定义课题四:近2年气动机械手的新技术研究课题五:新中国60年城镇化发展综述北大政府管理学院老师燕继荣的联系方式及近北大政府管理学院老师燕继荣的联系方式及近3年发文情况年发文情况过程一:检索词的确定信息检索语言分析课题的概念隐含概念的分析核心概念的选取选取检索词应注意问题主题检索语言常用的就是关键词关键词:从文献的题目、正文

    15、或摘要中抽出的能表达文献主题内容的具有实质意义的语词。确定关键词的步骤: a.分析课题,提取概念 b.整理概念,扩充同义词汇 c.运用分析所得词汇试查,确定课题适用的关 键词主题检索语言叙词:又称主题词语言,是指从自然语言中优选出来并经过规范化处理的名词术语。“沪产脚踏车” “上海”、“自行车”自然语言主题词 确定检索词分析课题的概念隐含概念的分析核心概念的选取选取检索词应注意问题分析课题的概念选择所涉及的主要概念,并找出能代表这些概念的若干个词或词组,进而分析各概念之间的上、下、左、右关系,以便制定检索策略。如课题“政策与行政学的关系”可选“政策”、“行政学”作为关键词。隐含概念的分析有些课

    16、题的实质性内容很难从课题的名称上反映出来,其隐含的概念和相关内容需从专业的角度做深入的分析,才能提炼出确切反映课题内容的检索概念。如“知识产权保护”概念中的“知识产权”一词隐含着“著作权”和“版权”、“工业产权”等概念。 核心概念的选取有些检索词概念已体现在所使用的数据库中,这些概念应予以排除。如World Textiles中“世界”一词应排除。另外有些比较泛指、检索意义不大的检索概念,如“发展”“现状”“趋势”等在不是专门检索综述类信息时也应予以排除。检索词选取时应注意的几个问题。检索词的选取应适当,具有专指性,涵盖主要主题概念,意义明确。一般应优先选择规范化主题词做检索词,但为了检索的专指

    17、性也可选用关键词配合检索。尽可能地考虑其相关的同义词、近义词作为检索词,以保证查全率。如同一概念的几种表达方式,同一名词的单、复数,动名词、过去分词形式,上位概念词与下位概念词,化学物质的名称、元素符号,植物和动物名的英文、拉丁名等。过程二:选择信息源明确了信息需求之后,信息源的选择尤为重要,它直接影响着检索的效率。工欲善其事,必先“选”其器,信息源选择得当,就会给人以愉悦的搜索体验,能够收到事半功倍的效果。一 北京大学政府管理学院硕士招生信息二 该院导师三某一导师的姓名、联系方式四 该导师的发文情况,近3年第一项可以选择搜索引擎查找二三项可以进入北大政府学院网站查找第四项需要使用CNKI等数

    18、据库过程三:选择检索途径和方法检索途径信息检索技术检索式的构造与调整 信息检索途径(检索字段)l责任者途径l题名途径l分类途径l主题途径l序号途径l引文途径检索式的构造与调整检索式:是检索策略的逻辑表达式,是用来表达用户检索提问的,由基于检索概念产生的检索词和各种组配算符构成。 (篇名篇名= =聚氯乙烯聚氯乙烯 or PVCor PVC) and and 年代年代=2005-2009=2005-2009过程四:实施检索获取原始文献过程四:实施检索获取原始文献问题:北大政府管理学院老师燕继荣的联系方式及北大政府管理学院老师燕继荣的联系方式及近近3 3年发文情况年发文情况可分为可分为2 2个问题:

    19、个问题:A A北大政府管理学院老师燕继荣的联系方式北大政府管理学院老师燕继荣的联系方式B B北大政府管理学院燕继荣近北大政府管理学院燕继荣近3 3年发文情况年发文情况A A北大政府管理学院老师燕继荣的联系北大政府管理学院老师燕继荣的联系方式方式利用搜索引擎找到北大政府管理学院网页浏览找到燕继荣的联系方式北大政府管理学院燕继荣近北大政府管理学院燕继荣近3 3年发文情年发文情况况检索式: 作者=燕继荣 AND 单位=北京大学政府管理学院 AND (时间=2007-2009)检索结果的评价查全率:从数据库中检出的相关文献量与数据库中总文献量的比率。查准率:指数据库中检出的相关文献量与检出的文献总量的

    20、比率。查全率a/a+c100查准率a/a+b1000查全率检出的相关文献数系统中的相关文献总数查准率检出的相关文献数 检出的文献总数:如CNKI数据库中共有 “企业管理”方面的相关文献280篇,而小李同学在CNKI数据库中只检索出160篇,而且其检索出的结果中还有28篇是不相关的,那么小李这次检索的查全率和查准率各是多少?KEY查全率 47.1%查准率 82.5%超星电子图书数据库中的图书可以下载吗?答案:是方正电子图书在线浏览的时间是15分钟吗? 答案:否 是20分钟三个中文电子图书数据库包括超星、金图和方正吗?答案:否 超星、方正和书生之家三个中文电子图书数据库中阅读效果最清晰的是书生之家吗?答案:是三个中文电子图书数据库的阅读需要专门的阅读器吗?是超星电子图书下载之后可以换机器阅读吗?是 超星图书安装了阅读器就一定能正常阅读吗?否超星电子图书在不打开阅读器的情况下也可以下载否

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:中文数据库跟信息检索技术资料课件.ppt
    链接地址:https://www.163wenku.com/p-3044957.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库