书签 分享 收藏 举报 版权申诉 / 395
上传文档赚钱

类型信息检索(研究生)全册配套课件.ppt

  • 上传人(卖家):罗嗣辉
  • 文档编号:2038241
  • 上传时间:2022-01-17
  • 格式:PPT
  • 页数:395
  • 大小:16.16MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《信息检索(研究生)全册配套课件.ppt》由用户(罗嗣辉)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    信息 检索 研究生 配套 课件
    资源描述:

    1、信息检索信息检索(研究生研究生)全册配套课件全册配套课件信 息 检 索 本课程学习的内容n学术信息检索的作用n学术信息的分类n学术信息检索语言n各种学术信息的表现形式n各种学术信息源的检索技巧n结合学术信息检索的论文写作绪 论一、我们日常接触的信息有哪些?一、我们日常接触的信息有哪些? 观观 察察交交 流流检检 索索阅阅 读读生活信息生活信息学术信息学术信息军事信息军事信息经济信息经济信息 生活信息:天气、车票、购物生活信息:天气、车票、购物. .经济信息经济信息: GDPGDP、利率、贸易利率、贸易 学术信息学术信息: :期刊、学位论文、会议投稿期刊、学位论文、会议投稿 军事信息军事信息二、

    2、学术信息检索对我们做研究有哪些帮助?二、学术信息检索对我们做研究有哪些帮助?检索是获取学术信息的主要途径三、检索学术信息需要做哪些准备工作?三、检索学术信息需要做哪些准备工作?1、多渠道地了解学术信息源是是高效检索并获取信息的前提。2、熟练掌握学术信息的分类与特征是筛选有用信息的必要手段。3、扎实的专业基础和广泛地阅读是充分利用学术信息的根本保证。学术信息源学术信息源搜索引擎搜索引擎专业数据库专业数据库开放式资源开放式资源 传统检索所用的数据库在资源存储形式、学科范围、检索传统检索所用的数据库在资源存储形式、学科范围、检索方式上都有一定的限定。而搜索引擎则是全方位方式上都有一定的限定。而搜索引

    3、擎则是全方位, ,多角度搜索,多角度搜索,能搜索各种格式的文件,没有学科的限制,边界很广,这正好能搜索各种格式的文件,没有学科的限制,边界很广,这正好弥补了对检全率的需求。对于某些特殊的检索弥补了对检全率的需求。对于某些特殊的检索, ,如要求查某种如要求查某种产品的参数产品的参数, ,要求比较产品的外形要求比较产品的外形, , 搜索引擎的图片查询功能搜索引擎的图片查询功能就有用武之地了。有些搜索引擎不但能搜到图片就有用武之地了。有些搜索引擎不但能搜到图片, ,甚至连多媒甚至连多媒体、网站链接都可以搜索体、网站链接都可以搜索, ,这将会对某些特殊的检索起到关键这将会对某些特殊的检索起到关键作用。

    4、作用。 随着新产品、新技术更新速度加快随着新产品、新技术更新速度加快, , 传统数据库更新传统数据库更新速度已显得相对滞后,检索期刊的滞后期少则一个月速度已显得相对滞后,检索期刊的滞后期少则一个月, ,多达多达半年。半年。 搜索引擎以其更新及时的特点正好弥补了传统数据库搜索引擎以其更新及时的特点正好弥补了传统数据库的不足。在检索传统数据库的基础上的不足。在检索传统数据库的基础上, ,利用利用InternetInternet搜索引搜索引擎进行检索擎进行检索, ,可以弥补传统数据库的时差问题,尤其是在新可以弥补传统数据库的时差问题,尤其是在新产品查询时产品查询时, ,更应该进行传统数据库之外的更应

    5、该进行传统数据库之外的InternetInternet上的信上的信息查询。息查询。 搜索引擎基于互联网上的免费资源,在检索方法中有搜索引擎基于互联网上的免费资源,在检索方法中有效运用搜索引擎,能够大大降低成本,提高效率效运用搜索引擎,能够大大降低成本,提高效率。1 1 谷歌谷歌GoogleGoogle典型的网络搜索引擎介绍典型的网络搜索引擎介绍用Google辅助举例: 有时项目查新要对技术指标进行新颖性分析,若仅使用传统的数据库检索方式,往往会出现检索结果为“零”的尴尬结果。从科技发展的继承性上看,任何一项科技活动,都是在前人研究基础上的发展,这个结果是有悖现实的。此时,可另辟蹊径,使用搜索引

    6、擎进行检索往往会收到良好的效果。参考:杜津萍,王磊.搜索引擎在科技查新中的应用J.图书馆工作与研究,2007,3项项 目目: BDQ10/24便携式液压多功能钳便携式液压多功能钳客户给出的技术特征客户给出的技术特征:“高强韧性高强韧性”、“高强度高强度”和和“防止剪料崩溅防止剪料崩溅” 由于这些特征均不明显,若按照该技术特征查找文献,符合要求的文献会很多,但真正密切相关的文献却几乎没有。查新员通过客户交流,得到了该多功能钳的具体技术指标,包括工作压力、扩张力、扩张距离和剪切能力等,然而根据这些指标进入各大数据库查询,结果仍不理想。 通过Google搜索引擎,输入检索词检索词“BDQ10/24”

    7、及及“多功能钳多功能钳”,搜索到某某他公司主页他公司主页,通过参数比较,对该产品研究水平有了直观了解。进而输入关键词“hydraulic”(液压液压)和和“cutter”(钳钳),找出了相关英文网页相关英文网页,对检索到的相关产品进行对比,发现符合条件的文献还是很多。返回检索页面,仍用这两个检索词,利用Google的图片搜索功能的图片搜索功能,搜索到相关图片两千多张,再根据检索结果调整检索策略和检索词,不断缩小范围,最终找到几个液压多功能钳的专业网站液压多功能钳的专业网站,从而实现了和国外新产品技术指标的对比。利用搜索引擎的特殊的图片搜索功能,解决了传统数据库搜索结果“全”而不“准”的问题。经

    8、客户检查,发现Google搜索到的这几个专业网站是他们以前所不知道的。通过搜索引擎的检索,既解决了产品技术参数的分析比较,也拓宽了客户的视野,收到了良好的效果。运用运用Google Scholar辅助举例辅助举例项目:碎裂玄武岩夹凝灰岩型铁路单线隧道综合技术研究碎裂玄武岩夹凝灰岩型铁路单线隧道综合技术研究关键词: 玄武岩玄武岩; ;夹凝灰岩夹凝灰岩; ;隧道隧道结果:学术谷歌5条;维普1条、CNKI1条这是因为专业数据库的索引库只有:文摘、标题、关键词、著者、机构等文摘型内容,所以会漏检。学术谷歌是扫描全文, 有效地保证了查全率。引自徐勇.学术搜索引擎在科技查新中的应用J.浙江高校图书情报工作

    9、.2009,1由由Elsevier ScienceElsevier Science公司公司于于20012001年年4 4月月1 1日推出,是专日推出,是专为搜索高度相关的科学信息为搜索高度相关的科学信息而设计的搜索引擎。而设计的搜索引擎。 ScirusScirus是一位古希腊的先知,是一位古希腊的先知,ElsevierElsevier命以此名喻意命以此名喻意ScirusScirus将会帮助人们成为科将会帮助人们成为科学先知。学先知。 ScirusScirus能够精确地找到普能够精确地找到普通搜索引擎所找不到的免费通搜索引擎所找不到的免费或者访问受限的科学信息资或者访问受限的科学信息资源源Sci

    10、rusScirus索引每月更新,可以将检索结果按照相关索引每月更新,可以将检索结果按照相关度进行排序,也可按照日期排序。提供的期刊资度进行排序,也可按照日期排序。提供的期刊资源可以免费查看题录和文摘,获取全文需要预先源可以免费查看题录和文摘,获取全文需要预先注册并支付费用。注册并支付费用。运用Scirus辅助举例项目:真空碳热还原氧化镁矿提取金属镁真空碳热还原氧化镁矿提取金属镁据查新点据查新点, ,用用scirusscirus检索到的专利文献如表所示检索到的专利文献如表所示引自徐勇引自徐勇. .学术搜索引擎在科技查新中的应用学术搜索引擎在科技查新中的应用J.J.浙江高校图书情报工作浙江高校图书

    11、情报工作.2009,1.2009,1结果:Scirus查找了8条文献,但Dialog无法查到。wiki利用网络搜索引擎的注意事项利用网络搜索引擎的注意事项 由于网络搜索引擎涵盖的内容过于宽泛、发布信息的由于网络搜索引擎涵盖的内容过于宽泛、发布信息的方式过于随意、信息量过于庞杂,因此,搜索引擎只能方式过于随意、信息量过于庞杂,因此,搜索引擎只能作为检索的辅助手段作为检索的辅助手段, ,不能替代传统检索方式。只是在不能替代传统检索方式。只是在某些特殊的查新课题上某些特殊的查新课题上, ,可以借助搜索引擎了解与查询可以借助搜索引擎了解与查询课题有关信息课题有关信息, ,增加对课题把握度增加对课题把握

    12、度, ,辅助解决辅助解决 “查全率查全率”和和“查准率查准率”问题。问题。 在运用搜索引擎进行辅助查询时,必须要对检索到的在运用搜索引擎进行辅助查询时,必须要对检索到的信息进行可信度分析,了解信息发布人、发布时间、发布信息进行可信度分析,了解信息发布人、发布时间、发布地点、发布原因等情况,对信息的引证素材、论证方法、地点、发布原因等情况,对信息的引证素材、论证方法、观点结论等进行评价,从信息源、信息传播渠道、信息时观点结论等进行评价,从信息源、信息传播渠道、信息时效性等方面来检验信息的可信度。效性等方面来检验信息的可信度。 各种搜索引擎在覆盖范围、排序方法、检索途径等各种搜索引擎在覆盖范围、排

    13、序方法、检索途径等方面各不相同,在使用搜索引擎进行查询之前,应该对方面各不相同,在使用搜索引擎进行查询之前,应该对搜索引擎的特点进行了解,把握其优势、劣势,将不同搜索引擎的特点进行了解,把握其优势、劣势,将不同的搜索引擎配合使用,使其的搜索引擎配合使用,使其“扬长避短扬长避短”,优势互补。,优势互补。 当前,网络上的免费全文信息资源不计其数,但真正符合科技查新要求的,必须是正规出版机构提供的数据库资源,这种资源即为所谓的“开放资源”。开放资源是针对传统的基于订阅的出版模式而言的,是利用网络条件为科研人员提供免费的全文文献,实现科研成果的广泛共享。北京大学信息管理系的李武将开放资源归纳为两种形式

    14、:和。 参考:李武.开放存取出版的两种主要实现途径J.大学图书馆学报,2005,4 1网络免费期刊文献网络免费期刊文献MEDLINE是美国国家医学图书馆出版的产品,提供全球生物医学文献的题录与摘要以供免费检索;Elsevier Science建立了基于Web的数字化出版平台Science Direct将约2000种期刊全文数字化上网,提供免费的目次、文摘检索,同时提供全文检索,并可联网订购索取全文;类似的出版商还有Springer、John& Wiley、Blackwell、ACS等。MEDLINE2 网络免费专利文献网络免费专利文献 主要存在于专利数据库中,比如中国专利数据库,包括发明、实用

    15、新型和外观设计3种专利的著录项目及摘要,免费检索且数据更新及时;中国知识产权网与中国专利信息网也提供部分专利文献的免费检索服务;欧洲专利局提供的esp cenet提供50多个国家的专利信息,信息量大且免费检索。此外,美国、日本、俄罗斯、加拿大等国的专利管理机构也提供本国专利数据库的网上免费检索服务。3 网络免费会议文献网络免费会议文献 各种大型的学术团体或政府机构通常都会在网上提供文献服务。如 SPIE会议录通过“国际光学工程协会”的网站提供会议文献的免费检索服务;中国国家科技图书文献中心也通过网站提供题名、作者姓名、作者单位、会议录、文集名、关键词、语种、文摘内容等会议文献的免费检索信息;I

    16、EEE每年报道300多个生物医学技术和通讯技术、计算机工程、电力、宇航、电子及其他技术领域的会议信息,提供会议日期、关键词、国家、城市、登记号、主办者等项目的免费信息检索。4 网络免费标准文献网络免费标准文献 国际标准化组织通过网站提供ISO标准文献数据库的免费检索。美国国家标准协会也为用户免费提供检索工业标准、国际标准、美国政府标准、美国国家标准以及一些正在拟定的标准。中国标准服务网、日本标准协会等网站也提供标准文献免费检索。 中国科技论文在线(中国科技论文在线()是经教育部批准,)是经教育部批准,由教育部科技发展中心主办的科技论文网站。由教育部科技发展中心主办的科技论文网站。依托依托353

    17、5位中国科学院和中国工程院院士组成的顾问委员会为位中国科学院和中国工程院院士组成的顾问委员会为网站提供学术指导,是一个完全公益性的科技论文网站。网站提供学术指导,是一个完全公益性的科技论文网站。免费资源之一:中国科技论文在线免费资源之一:中国科技论文在线arXiv.org电子预印本档案是美国能源部资助美国高能物理研究所的一个项目。主要包括物理学,数学,生物工程,能源科学与技术,计算机科学与软件工程,电子信息工程等学科。免费资源之二:免费资源之二:arXiv.orgarXiv.orgarXiv.org免费资源之三:国家科技图书文献中心免费资源之三:国家科技图书文献中心 国家科技图书文献中心(Na

    18、tional Science and Technology, 简称NSTL)是经国务院领导批准, 于2000年6月12日成立的一个基于网络环境的科技信息资源服务机构。中心由中国科学院文献情报中心、国家工程技术图书馆(包括中国 科学技术信息研究所、机械工业信息研究院、冶金工业信息标准研究院和中国化工信息中心)、中国农业科学院农业信息研究所、中国医 学科学院医学信息研究所、中国标准化研究院标准馆和中国计量科学研究院文献馆组成。 DOAJ(Directory of OAJ)是由瑞典的隆德大学图书馆 Lund University Libraries为OA资源做的一个目录系统。它设立于2003年5月,

    19、最初仅收录 350 种期刊,截至2006年3月收录的开放存取期刊超过2000种、文章9万多篇。该系统收录的均为学术性、研究性期刊,一般都是经过同行评审,或者有编辑作质量控制的期刊,具有免费、全文、高质量的特点,对学术研究有很高的参考价值。该目录及其收录期刊、论文可自由存取,任何人可以使用,不反对商业用途。该目录的目标是包含各种语言、各个主题的期刊。 学科范围:生命科学、农业、食品、经济、化学、环境科学、历史、艺术、学科范围:生命科学、农业、食品、经济、化学、环境科学、历史、艺术、 法律、工程、社会科学法律、工程、社会科学 www.doaj.org是斯坦福大学图书馆的分支机构,出版777种自然科

    20、学方面的网络版期刊,提供2000多种高影响力期刊(包括Journal of BiologicalChemistry、Science、PNAS)的免费访问。免费资源之五:免费资源之五: 免费资源之六:免费资源之六:http:/ AD报告也产生较早,1951年开始出版。现由美国国防技术情报中心(DTIC:Defence Technical Information Center)负责收集整理和出版。报告内容以国防部各个合同户的研究报告为主,其报告号冠以AD,A原先为Armed、D则为Document之意,现在则可理解为入藏报告(Accession Document)。 PB报告产生于二战(WORLD

    21、 WAR II)结束之后,当时美国政府为了整理和利用从战败国获得的数以千吨计的秘密科技资料,于1945年6月成立了一个专门的出版局,即美国商务部出版局(Publication Board),负责收集、整理、报导利用这些资料。 免费资源之七:免费资源之七:STAR是美国国家航空航天局NASA (National Aeronautics and Space Administration)科技情报处编辑、出版的专业性检索刊物,它是检索航空航天科技报告的重要工具。 Energy Research Abstracts,简称ERA,是美国能源部DOE(Department Of Energy)技术情报中心

    22、编辑出版的半月刊。ERA收录能源部部属科研机构和各大学等一切与能源有关的科技文献,但以科技报告为主。 1、NTIS: http:/ www.ntis.gov/ 2、DTIC: http:/www.dtic.mil/3、DOE: http:/www.doe.gov.my/4、NASA: http:/www.nasa.gov/国防技术情报中心(Defence Technical Informa- tion Centre,DTIC) 美国1945年建立。1979年改现称,是国防部科技和管理情报中心。向承担国防科研任务的单位提供研究报告,开展咨询、检索、定题、专利评审等项服务。收藏文献150余万件,建

    23、立数据库4种,出版物有 8种,并管理10个情报分析中心。工作人员约450人。地址:弗吉尼亚州。 NASA National Aeronautics and Space Administration美国国家航空航天局的缩写,NASA全称美国国家航空航天局,是世界上最大的民用航天机构。1958年10月1日NASA正式成立。总部位于华盛顿哥伦比亚特区。 兰利研究中心、刘易斯研究中心、艾姆斯研究中心飞行研究中心(爱德华空军基地实验室)海军研究实验室有关先锋计划的部分 马歇尔航天飞行中心 肯尼迪航天中心、约翰逊航天中心、太空飞行器中心 国家技术情报服务局(National Technical Infor

    24、- mation Service,NTIS) 美国1970年建立。负责搜集、加工、印发美国政府研究报告,馆藏资料150余万件,建有NTIS文献库、世界引文索引数据库、正在进行中的联邦研究项目数据库等。开展联机检索服务、出租磁带、提供缩微品、答复咨询等服务活动。工作人员370余人。年度预算约3000万美元。地址:弗吉尼亚州。 利用以上信息源我们可以做什么?例如,进行专利检索1、避免重复开发2、规避设计3、借鉴他人技术再开发4、及时发现竞争对手动向5、完善方案6、停止某些无效项目信息检索的学科属性是什么?发展历程 信息检索的学科基础情报学学科目的: 1、最佳标引 2、最少查找时间克劳德香农(Cla

    25、ude Elwood Shannon,1916-2001)1916年4月30日诞生于美国密西根州的Petoskey。香农理论的重要特征是熵(entropy)的概念,他证明熵与信息内容的不确定程度有等价关系。熵曾经是波尔兹曼在热力学第二定律引入的概念,我们可以把它理解为分子运动的混乱度,信息熵也有类似意义。 在20世纪中叶,人类终于对三个非常重要的概念:质量、能量、信息量都有了定量的计量办法。 H=-pi log piA Mathematical Theory of Communication 1948布拉德福(18781948)Bradford,Samuel Clement 他在1934年提出

    26、了布拉德福定律,指出“若将期刊按其刊载某专业论文数以递减顺序排列,再将期刊划分为载文量相等的三个区域,则可得出期刊数量比约为1:1:2的关系”。 即: 某一学科的大部分论文往往高度集中在少数期刊中,而其少数论文则分散于大量期刊上。1955年,在美国新泽西州一个鸡舍改造的工作间中,尤金加菲尔德(Eugene Garfield)博士首次提出“引文索引”概念,1961年试编成了科学引文索引,1963年,SCI 正式创刊。1925.9.25662022-1-16信息检索基本知识及技巧 The principles and skills on information retrieval主 讲 人 :施

    27、亮Lecturer :caesar, shi672022-1-16目录 outline1信息检索的定义、分类及其作用二 检索语言三 检索的效率、手段和方法682022-1-161信息检索的定义、分类及其作用1.1 信息检索的定义 信息检索(Information Retrieval):,是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关的信息过程,所以它的全称又叫“信息的存储与检索(Information Storage and Retrieval),这是广义的信息检索。 狭义的信息检索则仅指该过程的后半部分,即从信息集合中找出所需要的信息的过程,相当于人们通常所说的信息查寻(

    28、Information Search)。692022-1-161.2 信息检索的手段(1)手工检索 eg:美国工程索引(2)光盘检索 eg:medline (3)网络检索 eg:springerlink702022-1-161.3 信息检索的对象(1) 文献检索(Document Retrieval) : 是以文献(包括题录、文摘和全文) 为检索对象的检索。可分为全文检索 和书目检索两种。(2) 事实检索 (Fact Retrieval) :是以某一客观事实为检索对象,查找某一事物 发生的时间、地点及过程的检索。(3) 数据检索(Data Retrieval) :是以数值或数据(包括数据、图表

    29、、公式等) 为对象的检索。712022-1-161.4 信息检索的作用(1) 信息检索是获取知识的捷径 eg:princeton的学生 约翰菲利普 利用图书馆公开资料设计原子弹。 (2) 信息检索是科学研究的向导 eg:(美)阿波罗飞船的燃料箱的重复研究问题。 (3)信息检索是终身教育的基础 unesco:可以防止知识老化,不断更新知识722022-1-16二 信息检索的要素 (1)前提信息意识/信息素养 information literacy新闻阅读:武汉的士起步价调为两公里16元 12月1日起执行 看到标题,能联想到什么? 从信息认知、信息情感 和 信息行为 三个方面进行分析!73202

    30、2-1-16(2)基础信息源A、信息的载体: 印刷型 缩微型 机读型 声像型742022-1-16B、信息的内容和加工级次: 一次文献 二次文献 三次文献752022-1-16C、信息的出版形式:图书期刊会议资料学位论文专利标准报告百科全书、类书762022-1-16图书的检索途径主要用到: 书名 作者 出版社 ISBN 关键词 期刊的检索途径主要用到: 刊名 篇名 作者 关键词 ISSN772022-1-16 会议论文的检索途径主要用到: 会议名称 主办单位 会议地点 关键词 作者 会议文章篇名 学位论文的检索途径主要用到: 作者 学位授予单位 导师姓名 关键词 论文篇名782022-1-1

    31、6 专利资料的检索途径主要用到: 关键词 专利权人 发明人 国际专利分类号 公开号 标准资料的检索途径主要用到: 标准编号 标准名称 发布单位 发布日期 关键词792022-1-16 报告资料的检索途径主要用到: 报告号 关键词 作者 报告单位 合同户报告代码 百科全书、类书资料的检索途径主要用到: 音 形 义802022-1-16(3)核心信息利用能力掌握各种信息源掌握检索语言熟练使用检索工具对检索结果的评价,判断812022-1-16附:期刊的指数计算(1)影响因素=该年引用该刊前两年文章的总次数当年该刊所发表文章的总数即年指标前两年该刊所发表文章的总数=一特定年度对该刊当年发表文章的引用

    32、次数影响因素是一种期刊中论文的平均被引率特定年度的影响因素用于测度一种期刊被利用的速度,也是测度期刊重要性的依据即年指标822022-1-16自引率与被引率 自引率是指一种期刊中引用本刊的参考文献对全部参考文献之比;被自引率是一种期刊被本刊中文章引用的次数与该刊被引用的总次数之比。=自引率某刊自引的引文量该刊全部引文量被引率 =某刊自引的引文量某刊被引用的总次数832022-1-16二 检索语言2.1 按表现形式划分的检索语言 外表特征语言 内容特征语言842022-1-16外表特征:就是文献上记明的、显而易见的特征。 外表特征语言(书目引文语言)题名(书名、篇名)著者姓名文献序号(如:ISB

    33、N、ISSN、专利号、报告号等)书目引文出版事项文献类型852022-1-16 内容特征语言非句法语言句法语言等级制体系分类法标题词关键词叙 词单元词加标志的叙词组面词(如:组面分类法)短 语文献全文的自然语言862022-1-162. 2 按应用功能划分的检索语言 分类语言 主题语言872022-1-162.21 分类语言 是用分类号和相应的分类款目名称来表达信息内容的主题概念,并按学科体系的逻辑次序将信息资源系统地加以划分和组织的语言。 分类语言能反映事物的从属派生关系,便于按学科门类进行族检索。882022-1-16杜威十进分类法 Dewey Decimal Classification

    34、 ,DC/DDC美国M.杜威编制的综合性等级列举式分类法。分为详、简两种版本,详本于1876年问世,取名为图书馆图书小册子排架及编目适用的分类法和主题索引,1951年的第15版改名杜威十进分类法000总论 100哲学 200宗教 300社会科学 400语言 500自然科学和数学 600技术(应用科学) 700艺术、美术和装饰艺术 800文学 900地理、历史及辅助学科 第一层展开层630农业 631农业经营 631.5作物栽培 892022-1-16通用十进制图书分类法 Universal Decimal Classification UDC十进制图书分类法由两位比利时书目专家(Paul Ot

    35、let、Henri la Fontaine)19世纪末在杜威十进制图书分类法的基础上继续研发的分类方法。此种分类方法由数字和特殊符号组成,把涉及各种知识体系及学科的书籍予以分类。介于数字和符号无语言障碍的特性,该分类法在世界各地的图书馆中被广泛应用。 总分类 0 总汇 1 哲学,心理学 2 宗教,神学 3 社会学,政治,经济,法律,教育,人类学 4 暂无(由图书馆具体添加) 5 自然学科,数学 6 实用学科,医学,科技,企业经济学,计算机 7 艺术,手工艺品,音乐,竞技,体育 8 语言学,文学 9 地理,生物,历史 902022-1-16附加 + :并列符(例:178.1+33 酒精主义者 和

    36、 国民经济国民经济) :关系符(例:178.1:33 酒精主义对国民经济的影响) / :包含符(例:592/599 系统动物学,从592到599) = :语言符(例:=71 拉丁语) (0.) :书类符(例:(042)演讲,讲义) (.):地域符(例:(234.3) 阿尔卑司阿尔卑司) 912022-1-16美国国会图书馆图书分类法 Library of Congress Classification 922022-1-16第一层932022-1-16末层942022-1-16中国图书馆图书分类法Chinese Library Classification, CLC 中国图书馆分类法,简称中图

    37、法。包括“马列主义、毛泽东思想,哲学,社会科学,自然科学, 综合性图书五大部类,22个基本大类,具体如下:952022-1-16中国科学院图书馆图书分类法简称科图法。1958年由中国科学院图书馆编写,1974年、1979年、1994年分别进行了修订。分为25大类。中国科学院图书馆图书分类法962022-1-16国际专利分类法 International Patent Classification , IPC 关于国际专利分类斯特拉斯堡协定与1975年10月7日生效,它为发明专利,包括出版的专利申请书、发明证书说明书、实用新型说明书(一下简称为“专利文献”)提供了一种共同的分类。 分类表示使各国

    38、专利文献获得统一分类的一种工具。它的基本目的是作为各专利局以及其他使用者在确定专利申请的新颖性、创造性(包括对技术先进性和实用价值作出评价)而进行的专利文献检索是的一种有效检索工具。 972022-1-16982022-1-16992022-1-161002022-1-161012022-1-161022022-1-161032022-1-161042022-1-161052022-1-161062022-1-161072022-1-161082022-1-161092022-1-16技术主体的分析1102022-1-162.22 主题语言 1112022-1-161122022-1-16 I

    39、NSPEC 叙词表举例: Locomotive NT diesel-electric locomotive BT vehicles TT vehicles RT rail traffic railways traction CC B8520-n C3360D FC b8520-n c3360De DI January 19731、下位叙词2、上位叙词3、族首词4、相关词5、INSPEC数据库 使用的分类号6、输入到INSPEC 数据库使用的 分类号7、该叙词的启用日期英国电气工程学会(Institute of Electric Engineering 简称 IEE)下设的国际物理和工程信息服务

    40、部(International Information Services for the Physics and Engineering Communities,简称 INSPEC )1132022-1-16三 检索的效率、手段和方法3.1 检索效率评价1142022-1-163.2 索引语言中改善查全率的措施(1)同义词控制法 是指当一个概念具有多个同义词的时候,为了保证标引与检索的一致性,避免文献的分散和漏检,指引词汇的使用者从其他的同义词找到一个被专门选择作为正式主题词的词的用法。 例如: 用符号 USE、SEE、Y (用) 从正式词引见非正式的词,则用 USE FOR、D(代)1152

    41、022-1-16(2)词的关联法索引词的关联,最普通的形式是等级上的关联。例如:A、由专指词到较泛指的词,使用符号 BT (broader term),或者 S (属) B、由泛指词到较专指的词,使用符号 NT (narrower term),或者 F (分) C、由指向近义的词,使用符号 RT (related term),或者 C (参),或 see also (参见) 1162022-1-16汉语主题词表词的关联举列 交流发电机F 同步发电机 异步发电机S 发电机 交流换向电机D 交流整离子电机S 交流电机Z 电机C 调速电动机 异步电动机1172022-1-16(3)字形的控制法 即把

    42、具有同一词根的字组合在一起。当然这不是提供标引的措施,而是提供检索用的辅助手段。在计算机检索中,是采用截词实现的:例如: “反射”、“反射波”、“反射性”、“反射望远镜” 等。 都有 reflect,用 reflect 进行截词检索,就能检索出与“反射”有关的 所有文献。1182022-1-16(4)聚类法 在对检索词进行统计的基础上,将有关的索引次进行聚类,可以查出更多的文献,从而改善查全性。例如:“枯萎” 是与 “庄稼”、“植物生长” 联系在一起的,如果 “锈菌”也是常与 “植物生长”等词联系在一起的话,我们就可以推断 “枯萎” 与 “锈菌” 之 间存在某种联系。1192022-1-163

    43、.3 索引语言中改善查准率的措施组 配即两个或两个以上概念的组合,有两种组配形式,先组和后组。 先组式是指概念之间的组合是在词表编制阶段就已经定义好的,组配后的符合概念成为供标引的完整索引词。 心理声学(是心理学与声学的组配) 蒸发冷却(是蒸发与冷却的组配) 后组式是指在检索阶段把两个或两个以上的有关索引词进行组合。 “计算机” 与 “设计” 1202022-1-16 先组式有助于提高索引词的专指度,减少标引到每个词的文献数量,减少和避免假组配,从而有利于查准率。但是先组式的词在数量上是有限的,不能适应各种角度和深度的符合概念检索。 后组式便于各种角度和深度的检索,有利于查准率的提高,但是可能

    44、出现假组配,致使误检的增多。对于先组和后组式的评价1212022-1-163.4 计算机检索语言(1)布尔逻辑检索功能逻辑或(OR、+)检索项 A、B 若用 “逻辑或” 组配,则逻辑式为 “A OR B”,或者 “A + B”AB表示被检索的文献只要包含有其中的一个检索项,或者同时含有这两个检索项,那么它就会被命中。1222022-1-16逻辑与(AND、*)检索项 A、B 若用 “逻辑与” 组配,则逻辑式为 “A AND B”,或者 “A * B”AB表示被检索的文献必须同时含有两个检索项才能被命中1232022-1-16A逻辑非(NOT、)检索项 A、B 若用 “逻辑与” 组配,则逻辑式为

    45、 “A NOT B”,或者 “A B”B表示被检索的文献在含有A检索项而不含有B检索项是才能被命中。1242022-1-16(2)截词符截词符可以避免逐词输入带来的麻烦,还可以扩大查全率,截词可以 截前、截后、中间截断。例如:?S Comput ?结果为: computable computation compute computer?S con*t结果为: connect convert1252022-1-16六、计算机检索语言Optimization modelsGeraldine Heilporn European Journal of Operational ResearchANDAN

    46、D选择布尔逻辑符号输入检索主题词标题作者来源选择主题词的限定字段(3)布尔逻辑在数据库检索中的应用1262022-1-16test bed wn ALL AND atm networks wn TI(window wn TI AND sapphire wn TI) OR Sakamoto, K* wn AU美国工程索引的专家级检索方式第三章 检索系统的结构、评价指标及内容划分检索系统的结构检索系统的衡量指标检索内容的划分一、检索系统的构成(一) 结 构 图文献源被选文献概念分析将概念翻译成系统语言文献款目的集合(书目数据库)提问表达式将概念翻译成系统语言概念分析情报提问情报用户情报存储 输入情

    47、报检索 输出标引匹配检索策略系统词表一、检索系统的构成1、按文献选择子系统的特征来分,可分为: 书目检索系统 数据检索系统 文本检索系统 综合性检索系统 专科性检索系统 2、按照词表子系统的特征来分,可分为: 控制词汇的检索系统 非控制词汇的检索系统3、按照查询子系统的特征来分,可分为: 布尔逻辑检索系统 人工查询系统二、检索系统的衡量指标为了说明与衡量检索效率,目前在文献检索理论中流行着几个指标:即 检全率(recall factor) 检准率(pertinency factor) 漏检率(omission factor) 误检率(noise factor)N 收录的文献总量X 有关文献量M

    48、 检出的文献量W 检出的有关文献量二、检索系统的衡量指标检全率(recall factor) =W X=检出的有关文献量有关文献量检准率(pertinency factor) =W M=检出的有关文献量检出的文献量漏检率(omission factor) =1 W X误检率(noise factor) = 1 W M 查全率与查准率彼此有反变的关系。在同一个检索系统中,查全率提高,检准率就会降低,反之亦然。查全100507525255075100查准三、检索内容的划分 文献的类型是多种多样的,而人们检索文献的角度、深度和广度更是复杂多样。不同的检索需求,不可能由一种检索内容来解决。为适应人们的

    49、多种信息查询要求就产生了多种多样的检索内容。 一般来讲,分为以下几种类型:(一)目录(Bibliography) 目录是对图书或者其他出版的文献特征的记载和描述,其特点是:按种为单位进行记录与报道,对文献的描述比较简单,只记录其外部特征,按一定的方法组织排列成各种不同种类的目录。 比较重要的目录有: 国家书目 出版社与书店目录 馆藏目录 联合目录 专题文献目录1、国家书目 这是对一个国家出版的全部图书所作的登记统计性书目,可以反映一个国家文化、科学和出版事业的水平。2、馆藏书目 包括图书馆、情报部门的文献馆、资料室等等的藏书目录,它不仅包含从市场采购的公开发行的资料,也包括用交换等方式得到的非卖品资料不仅包括现在发行的新书刊,而且包括一定历史时期累积起来的全部资料,这对广泛地检索文献是很重要的3、联合书目 是汇总若干个图书馆或其他收藏单位所藏文献的目录,从检索角度来说,它可以免去分别查阅各个馆藏目录的麻烦,扩大文献的获取范围。(二)索引 (Index) 所谓索引,就是将书籍、期刊等文献中所刊载的论文题目、作者以及所讨论的或者涉及到的学科主题、人名、地名、名词术语、分子式、所引用的参考文献等等,根据一定的需要,经过分析,分别摘录出来,著名其所在书刊中的页码并按一定的原则排列起来的工具。索引大致可以分为两种:1、篇目索引:主要揭示的是期刊,报纸等文献中的文章, 并把文章的著者、篇名按

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:信息检索(研究生)全册配套课件.ppt
    链接地址:https://www.163wenku.com/p-2038241.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库