书签 分享 收藏 举报 版权申诉 / 38
上传文档赚钱

类型信息检索语言方法与技术课件.ppt

  • 上传人(卖家):三亚风情
  • 文档编号:2927268
  • 上传时间:2022-06-12
  • 格式:PPT
  • 页数:38
  • 大小:949.50KB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《信息检索语言方法与技术课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    信息 检索 语言 方法 技术 课件
    资源描述:

    1、第三讲第三讲 信息检索语言信息检索语言天津商学院图书馆天津商学院图书馆(一)检索语言的类型(一)检索语言的类型 1、什么是信息检索?、什么是信息检索? 广义:广义: 信息检索(Information Retrieval):将信息按一定 的方式组织和存储起来,并根据信息用户的需要 找出有关的信息的过程和技术。 狭义:狭义:从信息集合中找出所需要的信息(信息查询) 存取存取(一)检索语言的类型(一)检索语言的类型 2、什么是检索语言、什么是检索语言(Retrieval Language) ? 用来描述文献、组织文献记录,进行文献检索的标识系统,称为检索语言。检索语言是文献检索系统存储与检索信息所使

    2、用的共同语言,它是标引人员与检索人员之间沟通思想、取得一致理解的桥梁。所以,检索语言实质上是标引和检索之间的约定语言。3、检索语言的类型:、检索语言的类型:按描述文献的内容性质划分,可分为分类语言和主题语言。l 分类语言。分类语言。用分类号和相应的分类款目来表达各种概念,以学科体系为 基础将各种概念按学科性质和逻辑层次结构进行分类和系统排序,能反映事物的从属派生关系,便于按学科门类进行族性检索。按照分类方式的不同,分类语言又分为体系分类语言、组配分类语言和混合分类语言。l 主题语言。主题语言。主题语言就是对表达信息主题内容特征的主题词汇概念,经规范化处理所形成的检索语言。由于主题词汇表达概念准

    3、确,所以主题途径是检索信息的主要途径。主题语言按照主题性质的不同,它又可分为标题词语言、单元词语言、叙词语言、关键词语言和引文语言。4、检索系统按功能分类、检索系统按功能分类l 目录检索系统目录检索系统 馆藏目录、联机公共检索目录(OPAC)l 文献检索系统文献检索系统 目录检索和文献检索统称为书目检索(二次文献),提供的信息是文献线索l 事实检索系统事实检索系统 包括对事实、数据和全文的检索,是一种直接的确定性检索。词典、百科全书、年鉴、名录等。公共检索系统的使用公共检索系统的使用1.随书光盘系统:随书光盘系统:http:/202.113.82.9:8080/poweb/index.jsp

    4、2. 书刊检索系统书刊检索系统 :通过本系统可进行图书信息、本人借阅信息的检索,以及办理续借手续。3. 读者登录方式:读者登录方式: 、校园网用户:请登录http:/ http:/211.81.31.33/ 进入以下界面 第二步:单击天津商业大学图标进入以下界面 第三步:输入用户标识(即:本人借阅证号)及个人密码(初始密码为“0000”,若有改动,请本人务必记清楚)。登录后在“我的帐户”里可进行图书信息的检索,本人借阅信息的检索,以及办理续借手续。 l备注:备注:我校现已改用校园一卡通,校园卡上没有借阅证号码,在进行检索时借阅证号码的生成规则为: 1、教工:“R130TSJ000”加本人工作证

    5、号(4位),共14位; 2、研究生:“R130TSY”加本人学生证号后七位,共14位; 3、本科生:“R130TSB”加本人学生证号后七位,共14位; 4、院外读者仍使用原借阅证,详情请查看图书馆一卡通借阅证号码变更说明。 中国年鉴全文库 中国药典查询应用系统事实检索系统事实检索系统(二)分类语言(二)分类语言1、几个概念: (1)分类:以事物的本质属性或其他显著特征作为依据,把各种事物集合成类的过程。是人们认识事物、区分事物、组织事物的一种逻辑方法。 (2)分类法:对文献进行分类的工具。是一种重要的情报检索语言。2、分类法的历史、分类法的历史l 较早时的分类法:“四库分类法”l 20世纪以来

    6、,一些以现代学科分类为基础的图书分类法陆续出现。这些分类法考虑了知识的系统性,按照学科的性质归类。 最有影响的有四种: 1) 仿杜威书目十进制,沈祖荣、胡庆生,1917 2) 世界图书分类法,杜定友,1925 3) 中国图书分类法, 刘国钧 ,1929 4) 中国十进分类法及索引,皮高品, 1934l 建国后陆续编制出中国人民大学图书馆图书分类法、中国科学院图书馆分类法和中小型图书馆图书分类表草案,都被应用于编制馆藏目录、书目和索引。中国图书资料分类法也是常用的分类法。l 现在,我国用的最广泛的是中国图书馆分类法(第四版) 中图法的前身可追溯到中小型图书馆分类表草案(以下称中小型法)l 中小型

    7、法, 1957l 大型法, 1959l 中图法 中图法是一部综合性分类表,也就是说中图法是能够供所有学科专业文献标引和检索使用的标引语言。1975年10月科学技术文献出版社正式出版中图法第一版,1999年3月北京图书馆出版社出版第四版,全称也从中国图书馆图书分类法改为中国图书馆分类法。 2001年夏北京图书馆出版社出版了第四版的电子版,称为中国图书馆分类法(第四版)电子版1.0版。3、中图法五大部类序列、中图法五大部类序列 1)马克思主义、列宁主义、毛泽东思)马克思主义、列宁主义、毛泽东思想、邓小平理论想、邓小平理论 2)哲学、宗教)哲学、宗教 3)社会科学)社会科学 4)自然科学)自然科学

    8、5)综合性图书)综合性图书 4、中图法类目简介、中图法类目简介SS1 S2 S3 S4 S5 S6 S7 S8 S9S11 S12 S13 S14 S15 S16 S17 S18 S19 S21 S22 S23 S24 S25 S26 S27 S28 S29 S281 S282 S283 S284 S285 S286 S287 S288 S2895、中图法中图法的编制原则的编制原则 l 第一,以马列主义毛泽东思想为指导,以科学技术发展水平和文献出版的实际为基础,将科学性、实用性、思想性有机地统一。l 第二,以科学分类和知识分类为基础,依照从总到分、从一般到具体、从理论到应用的原则构建逻辑系统。

    9、分类体系与类目设置既要保持相对稳定性,又要考虑有一定的动态性,及时反映新学科、新主题的发展,并允许对其结构与类目作一定的调整,以满足不同的需要。l 第三,标记符号力求简明、易懂、易记、易用;标记制度力求灵活实用,有较好的结构性,以揭示体系分类法的本质特征。l 第四,兼顾作为编制分类检索工具的规范与作为文献分类排架的规范的双重职能。l 第五,兼顾不同类型、不同规模图书馆和文献信息机构类分不同类型文献的需要。6、中图法中图法的分类体系的分类体系 l 基本部类基本部类 基本大类基本大类l 马克思主义、列宁主义、毛泽东想、邓小平理论 A马克思主义、列宁主义、毛 泽东思想、邓小平理论l 哲学、宗教 B哲

    10、学、宗教l 社会科学 C社会科学总论 D政治、法律 E军事 F经济 G文化、科学、教育、体育 H语言、文字 I文学 J艺术 K历史、地理6、中图法中图法的分类体系的分类体系 l 自然科学 N自然科学总论l O数理科学和化学l P天文学、地球科学l Q生物科学l R医药、卫生l S农业科学l T工业技术(包括17种工业部门技术)l U交通运输l V航空、航天l X环境科学、安全科学l 综合性图书Z综合图书7、中图法中图法的标记符号的标记符号 中图法的标记符号分为基本符号与辅助符号两种 : (1) 基本符号基本符号 :以字母和阿拉伯数字混合作为其基本符号,如R511(医学/内科学/传染病/病毒传染

    11、病)。一般一个字母表示一个大类,但“法律”大类第二分类体系用“DF” 表示(以法的类型集中文献,主要供法学、法律单位选择使用。),“工业技术”的二级类采用双字母。7、中图法中图法的标记符号的标记符号 如:T(工业技术)、TB(一般工业技术)、TD9(矿业工程)、TE(石油、天然气工业)、TF(冶金工业)、TG(金属学与金属工艺)、TH(机械、仪表工业)、TJ(武器工业)、TK(能源与动力工程)、TL(原子能技术)、TM(电工技术)、TN(无线电电子学、电信技术)、TP(自动化技术、计算机技术)、TQ(化学工业)、TS(轻工业、手工业)、TU(建筑科学)、TV(水利工程)。 以字母顺序反映大类及

    12、工业技术所属二级类的序列,字母之后用数字表示下属各级类,数字依小数制升序排列。(以R511为例)(2)辅助符号辅助符号 :1)总论复分号)总论复分号“-”l 这是表示总论复分表中的类目号码,凡主表类目使用总论复分表复分组号时,须将“-”与总论复分表中的类号一起加在主类号后。 例如:物理学词典 类号:O4-61物理学/(总论复分表)名词术语、词典、百科全书2)组配符号组配符号“ ” 用于联结两个相关的主类号,合成一个组配类号。 例1:英美名诗汉译集 类号:H319.4 I561.2英语读物/组配编号法/文学/(世界地区表)英国文学/(专类复分表)诗歌 互见类号H319.4 I712.2 例2:汉

    13、语方言研究文献目录 类号:Z88 H17专科目录/组配编号法/汉语方言3)地区区分号地区区分号“()()” 当某类目需要依地区、国家区分,但类目无注释规定可依地区表复分时,则可将“世界地区表”或“中国地区表”中的有关类号用()括起,加在主类号之后。 例如:俄罗斯画家尼古拉费迅油画作品 类号:J233(512)=5(各国绘画作品)油画/(世界地区表)俄罗斯及苏联/(国际时代表)现代4)时代区分号时代区分号“=” 当某类目需要依时代区分,但类目无注释规定可依时代表复分时,则可将“国际时代表”或“中国时代表”中的有关类号加在主类号之后,中间用“=”联结。 例如:羽坛辣妹子自话(龚智超的自传) 类号:

    14、K825.47=76(中国人物传记)体育人物/(中国时代表)21世纪5)民族区分号民族区分号“”“” 如某类目需要依民族细分,但类目无注释依“世界种族与民族表”或“中国民族表”复分时,则可将种族或民族号码置于“”中,加在主类号之后。 例1:犹太人经商智慧或犹太人经商秘诀 类号:F715“382”商业企业组织与管理(类目注释:商业经营管理学入此。)/(世界种族与民族表)犹太人 例2:吉普赛舞蹈 类号:J732.2“510.5”(各国舞蹈、舞剧/各种舞蹈)民族、民间舞蹈/(世界种族与民族表)吉普赛人(茨冈人) 例3:吉普赛扑克牌游戏 (电影叶塞尼亚) 类号:G892“510.5”(文体活动)牌类(

    15、类目注释:扑克、桥牌、麻将等入此。)/(世界种族与民族表)吉普赛人(茨冈人)6)通用时间、地点区分号通用时间、地点区分号“” 若某类目需按通用时间、地区复分,则将“通用时间、地点区分表”的有关类号置于“”内,加在主类号之后。 例如:春季饮食养生或春季进补 类号:R247.1(中医学临床)食养、食疗/(通用时间、地点表)春7)其他符号其他符号l “/”(起止符号),例如:D73/77各国政治、R25/278中医各科及中医急症学;l “”(交替符号),例如:F418世界工人生活状况(宜入D411.7);l “”(停用符号),例如:D018消灭阶级剥削(停用;4版改入D011阶级的产生与消亡);l

    16、“+”(加号,资料分类的标记符号),例如:Q563维生素B、Q563+.1维生素B1等辅助符号,只出现在分类表中,不出现在标引中,可结合中图法实际类表了解与掌握。 注:注:类号数字中三位一点的小圆点,例如:TS142.221+.321定粒式自动缫丝机,只是为了使类号清晰易读,可以不归入辅助符号之列。8、标记符号的排列、标记符号的排列 中图法标记符号的排列采用:一般类号由左至右逐位对比的方法进行升序排列,先比较字母部分,再比较数字部分。字母部分按字母固有的次序排列,数字依小数制排列。分类号中如果涉及多种辅助符号的使用,一般按-、()、“”、=、的顺序排列。排列举例排列举例分类号款目排序次序:l

    17、总论复分区分符号:-l 国家地区区分符号:()l 民族区分符号:“”l 时代区分符号:=l 通用时间、地点区分符号:l 主类号组配复分区分符号: 例如:八十年代美国妇科学 类号:R711(712)=535妇科学/(仿世界地区表)美国/(仿国际时代表)20世纪80年代(三)主题语言(三)主题语言 主题语言是一种描述性语言。它用语词直接表达文献的主题,这些语词就是表达主题概念的标识。将这些作标识的语词按字顺排列并使用参照系统来间接表达各种概念之间的关系,这就是主题语言。根据词语的选词原则、组配方式、规范方法,主题词语言可以分为叙词语言、标题词语言和关键词语言 。1、叙词语言、叙词语言 叙词语言是主

    18、题语言的高级形式。叙词是从文献内容中抽取出来的、从概念上不可再分的基本概念单元词汇。检索时利用这些表达概念单元的叙词进行组配,以表达一个复杂的概念。叙词语言是近代用途较广、既适用于手工检索,又适用于计算机检索的后组式检索语言。举例:举例:lINSPEC Thesaurus是英国科学文摘使用的叙词表,表中全部词汇按字顺排列,正式主题词用黑体字表示,图例列出了主题词与其相关词的参照关系。Acoustic wave velocityUF acoustic velocityNT ultrasonic velocityBT velocityTT velocityRT acoustic dispersio

    19、n acoustic impedance acoustic wave propagation acoustic wave velocity measurement acoustic wave liquid helium sound propagation Mach number shock wavesCC A4300 A5140 A6260 A6265FC a4300-za5140+ga6260+ya6265+aDI January 1973说明:UF(Used for)表示主题词所替代的非规范词,UF后的词不能用作检索词。NT(Narrow Term),狭义词,表示主题词的下位词。BT(Br

    20、oad Term),广义词,指明主题词的上位词。TT(Top Term),族首词,指明主题词的最上位词。RT(Telated Term),相关词,表示与主题词有关联的词。CC(Classification Code),分类代码,由分类号和SA分辑号组成。FC(Full Form of Code),表示输入计算机的时间。DI(Date of Input),表示输入计算机的时间。2、标题词语言、标题词语言 标题词语言是以标题词作为文献内容标识和检索依据的一种主题语言。标题词是来自自然语言中比较定型事物的名称,并经规范化处理的能表达文献主题内容的词、词组或短语。在编制标题词表时,是先将一级标题词和二

    21、级标题词加以固定组配,所以,标题词语言属于先组式规范化的检索语言。美国工程索引使用的工程标题词表就是一种标题词。 以上两种语言均是受词表控制的规范化语言。3、关键词语言、关键词语言 在计算机检索中,大多数系统具有主题词检索功能,因为通过主题词检索可以缩小检索范围,提高准确度和检索速度。为了便于用户检索使用,一般在系统中预先将本数据库系统所定义的全部主题词存入系统,用户可以根据系统的主题词库直接检索,不必牢记各个主题词或翻查主题词表。很多情况下,我们并不十分了解自己要检索的文献归属于哪一个主题词下,或用一两个主题词很难代表要查找文献的全部含义,这时,可以使用自由词或关键词检索。计算机系统可以对所有的词进行检索,并对每个词在每篇文献中出现的频率进行统计,可以根据某一词出现的频率判断某篇文献与某一主题的相关程度。一般主题词的检索局限在题名、文摘、全文等字段中,而自由词或关键词的检索则不局限于字段,可以对所有字段进行自由检索。 (四四)主题词法与分类法的比较主题词法与分类法的比较主题词法分类法检索功能 侧重于特性检索侧 重 于 族 性检索检索标识 主题词文字符号分 类 号 数码符号排列方式 字顺排列等级排列作业:l1、检索语言有哪两类?有什么异同?、检索语言有哪两类?有什么异同?l2、我国现行的、我国现行的中图法中图法全称是什么?是全称是什么?是第几版的?第几版的? Bye bye !

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:信息检索语言方法与技术课件.ppt
    链接地址:https://www.163wenku.com/p-2927268.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库