书签 分享 收藏 举报 版权申诉 / 73
上传文档赚钱

类型信息资源组织方法课件.ppt

  • 上传人(卖家):三亚风情
  • 文档编号:2913368
  • 上传时间:2022-06-10
  • 格式:PPT
  • 页数:73
  • 大小:2.48MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《信息资源组织方法课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    信息资源 组织 方法 课件
    资源描述:

    1、江西财经大学信息管理学院 沈波1第6章 信息资源组织与存储2信息资源的组织与存储u信息描述u信息揭示u信息资源的组织方法u信息资源索引系统的建立3信息描述v信息描述(information description),是根据一定的描述规则和技术标准,对信息的外在特征和部分内容特征进行分析、选择和记录的过程。v一种初级的信息组形式4信息描述的程序查重描述复核并输入系统文献的著录文献的著录文献的著录8信息描述规范v 中文书刊名称汉语拼音拼写法(GB325982)v 检索期刊条目著录规则(GB380383)v 文献著录总则(GB3792.183)(GB/T 3792.1-2009)v 普通图书著录规则

    2、(GB3792.285)v 连续出版物著录规则(GB3792.385)v 非书资料著录规则(GB3792.485) v 档案著录规则(GB3792.585)v 地图资料著录规则(GB3792.686) v 古籍著录规则(GB3792.787) v 文后参考文献著录规则(GB771484) (GB77142005)9信息描述规范v 文本编码倡议(Text Encoded Initiative,简称TEI) v 都柏林核心集(Dublin Core,简称DC) v 政府信息定位服务(Government Information locator Service,简称GILS) v 联合地理数据委员会

    3、的数字地球空间元数据(Content standard Digital Geospatial Metadata,简称CSDGM) v 可视资源核心范畴(Core Categories for Visual Resources,简称CCVR) v 编码档案描述(Encoded Archival Description,简称EAD) v 博物馆信息的计算机交换(Computer Interchange of Museurn Information,简称 CIMI )10文献著录总则11传统文献的描述著录v著录:依据一定的规则,对文献外表形式、物质形态和内容特征进行分析、选择和记录的过程,其结果为款

    4、目。v著录项目 图书外表的文字记载:书名、责任者、出版发行情况 图书的物质形态:页数、图、尺寸、开本、装订、附件12著录项目v ISBD(International standard Bibliographic Description国际标准书目著录) ISBD(G)的八大著录项目 题名与责任者说明项 版本项 材料或出版类型特殊细节项 出版发行项 载体形态项 丛编项 附注项 文献标准号及获得方式项13ISBD文献描述格式v 正题名=并列题目:副题名及说明题名文字/第一责任者;其他责任者.版次及其他版本形式/与本版有关的责任者.文献特殊细节.出版发行地:出版发行者,出版发行年(印刷地:印刷者,印

    5、刷日期) v 页数或卷册数:图;尺寸或开本+附件.(丛编名/负责者,国际标准连续出版物编号;从编编号附属从编) v 附注v 国际标准书号;中国标准书号(装订):获得方式v 提要v .题目 .责任者 .主题词 .分类号14ISBD中文信息描述(专著)实例v乱世佳人=Gone with the wind/(美)米切尔(Mitchell,M.) 著;黄怀仁,朱攸若译.杭州:浙江文艺出版社,1991.4v1034页;20cmv本书另有译名:飘 vISBN 7-539-0367-6:¥10.70v.乱 .米Mitchell黄朱 .长篇小说 .I712.4515AACR2v1978:the Anglo-A

    6、merican Cataloguing Rules:2v组成 著录(书目描述):对各种文献的著录格式规定,依据ISBD 标目、统一书名和参照:对著录标目的选择、个人和团体标目、地理名称、统一书目作了规定数字信息资源的描述关于数据的数据,或关于数据的结构化的数据。早期主要指网络资源的描述数据,用于网络信息资源的组织;目前,实际用于各种类型信息资源的描述记录。元数据(Metadata)什么是元数据例如,在一个大型的医疗卫生机构,拥有一个专门的数据资料管理机构,来统一管理各类需要提交和归档的数据资料。这些要统一入库归档的数据各不相同:l 从数据内容来看,可能有管理类、业务类和科学研究类;l 从学科来

    7、看,可能有基础医学、临床医学、预防医学等等;l 从存储类型来看,可能有DBase、EXCEL、文本文件等等; 总之,内容、结构、数据量、介质各不相同。当我拿着自己的数据光盘去入库归档的时候,管理员要求我填写一张关于要入库数据的表格,以便于管理和查阅。填好这张关于要入库光盘的表格,就是这张光盘中数据的元数据!而这一张表格所规定的要填写的内容(以及填写规定),就可以看作是这个单位内部的“元数据标准”!这张表格每填写好一张,就可以录入成为元数据库中的一条元数据记录:我们把这张表格中所规定填写的项目,作为一个一个的属性字段,可以建立一个关于元数据的数据库就是元数据库:这时候,这张“表格”上规定的内容,

    8、以及关于填写的一些规定,就可以看作是医药卫生科学数据共享网元数据标准对医药卫生科学数据共享网来说,针对每一个共享数据集,都要以元数据著录的形式来“填写”一张这样的“表格”。网络信息资源描述的相关标准 文本编码倡议(Text Encoded Initiative,简称TEI) 都柏林核心集(Dublin Core,简称DC) 政府信息定位服务(Government Information Locator Service,简称GILS) 联合地理数据委员会的数字地球空间元数据(Content Standard Digital Geospatial Metadata,简称CSDGM) 可视资源核心范

    9、畴(Core Categories for Visual Resources,简称CCVR) 编码档案描述(Encoded Archival Description,简称EDA) 博物馆信息的计算机交换(Computer Interchange of Museum Information,简称CIMI) 22中文元数据标准v中国国家图书馆:中文核心元数据集v22个元素名称、主题、版本、内容摘要、内容类型、语种、内容覆盖范围、内容创建者、其他责任者、内容创建日期、出版、出版所有者、资源标识符、版权说明、数字资源制作者、数字资源制作日期、数字资源制作地、权限声明、公开对象、操作许可、许可行为、许可

    10、协议,其中包括了DC的大部分元素。v该方案的特点是数据元素由描述、结构、管理3种元数据类型组成,并支持数字资源的保持和检索利用。23MARCv机器可读目录:Machine Readable Cataloguev以编码形式和特定结构记录在计算机存储载体上的,由计算机程序自动控制、处理与编辑输出的目录。vCNMARC是中国机读目录(China Machine-Readable Catalogue),1992年2月正式出版中国机读目录通讯格式,即CN-MARC。24CNMARCv CNMARC基本字段介绍v 中文(普通)图书CN-MARC著录格式分类:默认栏目v 标识块 指示符 文字数据 v 头标区

    11、 无标识字段号、指示符、子字段标识符,定长24个字符 v 001 记录标识号 v 010 |aISBN号|b装订方式|d获得方式和/或定价|z错误的ISBN号 v 100 |a通用处理数据,定长36个字符 v 101 0 |a正文语种|b中间语种|c原作语种 v 102 |a出版或制作国|b出版地区 v 105 |a图书编码数据 v 106 |a文字资料代码物理形态标志 25CNMARCvCNMARC基本字段介绍v200 1 |a正题名|b一般资料标识|c另一作者的正题名|d并列题名|e副题名及其他说明题名的文字|f第一责任者|g其它责任者|h分册(辑)号|i分册(辑)名|v卷册号标识|z并列

    12、题名语种|9正题名汉语拼音205 |a版本说明 v210 |a出版、发行地|c出版、发行者名称|d出版、发行日期 v215 |a类型标识和文献的数量及单位|c其它形态细节|d尺寸或开本|e附件 v225 |a正丛编题名|d并列丛编题名|e丛编副题名及其它信息|f丛编责任者|h分册(辑)号|i分册(辑)题名 v300 |a一般附注内容 v327 |a内容附注内容 v461 用来连接本著录实体所从属的丛编的有关数据,设子字段|1 v606 |a主标目|x主题复分|y地区复分|z年代复分 v690 |a分类号|v版次 v701 0或1 |a人名等同责任者款目要素|b名称的其它部分(不包括款目要素)|

    13、4著作责任|9款目要素汉语拼音 v702 0或1 |a人名次要责任者款目要素|b名称的其它部分(不包括款目要素)|4著作责任|9款目要素汉语拼音 v711 0或1 |a团体名称等同责任者款目要素|4著作责任|9款目要素汉语拼音 v712 0或1 |a团体名称次要责任者款目要素|4著作责任|9款目要素汉语拼音 v801 |a国家代码|b机构名称代码|c处理日期 v905 |a收藏馆代码|b登录号|d分类号|e书次/种次号|f复本数|v入藏卷期|y年代范围 26CNMARC27MODSv 元数据描述对象模式:Metadata Object Description Schemav 2002.6 美国

    14、国会图书馆:采用XML描述书目数据v MODS 有20 个元素, 包括Title Info (题名信息) 、Name ( 名称) 、Type of Resource (资源类型) 、Genre (体裁形式) 、Origin Info (出版信息) 、Language (语种) 、Physical Description (载体形态描述) 、Abstract (文摘) 、Table of Contents ( 目次) 、Target Audience ( 目标读者) 、Note (附注) 、Subject (主题) 、Classification (分类) 、RelatedItem (相关文献)

    15、 、Identifier (标识符) 、Location (馆藏位置) 、AccessCondition ( 获取条件) 、Part ( 部) 、Extension ( 扩展) 、Record Info(记录信息)。每个元素又具有数量不等的子元素, 并采用W3C的XML Schema 语言来表达主元素、子元素以及它们的属性。v MODS优点:适合用于描述各种较复杂的数字化资源。28MODSRDF & XML* RDF(Resource Description Framework):RDF是第一个是第一个有关构建语义网络的推荐标准,它提供了一种技术标准来有关构建语义网络的推荐标准,它提供了一种技

    16、术标准来描述描述Web上的词汇、编码和元数据上的词汇、编码和元数据(Metadata),并建立这,并建立这些对象与些对象与Web上丰富资源之间的联系。上丰富资源之间的联系。RDF于于1999年年2月发月发布,至今仍是最重要的语义布,至今仍是最重要的语义Web方面的技术标准,也是其方面的技术标准,也是其他技术的基础之一。他技术的基础之一。RDF & XMLW3C(World Wide Web Consortium),W3C理事会或万维网联盟。W3C于1994年10月在麻省理工学院计算机科学实验室成立。创建者是万维网的发明者Tim Berners-Lee。是对网络标准制定的一个非赢利组织,像HTM

    17、L、XHTML、CSS、XML的标准就是由W3C来定制。基于W3C的组织原则和工作宗旨,以及Web的实际应用情况,W3C提出了其长远目标,包括3个方面的内容,分别是:* 建立一个普遍的、全社会易于使用的公共网络环境;* Web上的语义可管理和正确使用;* Web应该是安全可信的。31RDFv 万维网联盟W3C 1997.10 RDF资源描述框架:Resources Description on Frameworkv RDF 是一个用于描述 Web 上的资源的框架 v RDF 提供了针对数据的模型以及语法,这样独立的团体们就可以交换和使用它 v RDF 被设计为可被计算机阅读和理解 v RDF

    18、被设计的目的不是为了向人们显示出来 v RDF 使用 XML 编写 v RDF 是 W3C 语义网络活动的组成部分 v RDF 是一个 W3C 推荐标准 32RDF - 应用举例v描述购物项目的属性,比如价格以及可用性 v描述 Web 事件的时间表 v描述有关网页的信息,比如内容、作者以及被创建和修改的日期 v描述网络图片的内容和等级 v描述针对搜索引擎的内容 v描述电子图书馆 33RDF规则vRDF 使用 Web 标识符来标识事物,并通过属性和属性值来描述资源。v资源是可拥有 URI 的任何事物,比如 http:/ v属性是拥有名称的资源,比如 author 或 homepage v属性值是

    19、某个属性的值,比如 David 或 http:/ (请注意一个属性值可以是另外一个资源) 34RDF示例35RDF示例36XMLveXtensible Markup Language,简称XML,可扩展标记语言,通过此种标记,计算机之间可以处理包含各种信息的文章等。v组成 模式Schema 可扩展样式语言XSL 可扩展链接语言XLL37XML示例1simple.xml38XML示例2simple.xsl39XML示例3simplexsl.xml405.2 信息揭示v信息揭示是信息组织的中级形式,对信息的内容特征进行深层揭示并转换成主题标识,形成一个科学的逻辑概念标识系统。v5.2.1 信息主题

    20、v5.2.2 信息揭示的一般程序v5.2.3 信息标引415.2.1 信息主题v主题 文献主题标引规则(GB/T 3860-2009):文献所具体论述与研究的对象和问题 ISO 5963-1985(E):表达文献中心论题的一个概念或若干个概念的组合v主题:指一个具体信息实体所介绍、论述、研究、说明、表现的对象或问题。42信息主题结构v文献主题标引规则 构成主题的因素主体因素(研究对象)方面因素或限定因素(成分、材料、方法、过程、条件、状态、尺度、性质)空间因素时间因素文献类型43信息主题的类型分类依据类型信息主题的数量单主题信息、多主题信息主题概念的数量及其关系单元主题、复合主题、联结主题信息

    21、记录对主题论述的重要程度主要主题、次要主题信息记录主题与存取系统专业的相关程度专业主题、非专业主题信息记录论述形式显性主题、隐性主题主题概况的文献内容范围整体主题、局部主题445.2.2 信息揭示的一般程序v主题分析-主题概念转换 主题分析:通过审读文献而了解文献内容及其表现形式,选择内容单元而确定文献主题数量,概括单元内容形成主题概念,分析主题的结构和类型,并在必要时判断主题的学科专业属性的一种智力劳动。 主题概念转换:将主题分析的结果归入分类体系中相应的门类。455.2.3 信息标引也称文献标引,是信息揭示的最主要手段,是根据文献的特征,赋予文献检索标识文献检索标识的过程。信息标引?46t

    22、f.idf 加权示例47tf.idf 加权示例(续)信息组织方法1、信息组织:是让信息有序化、信息组织:是让信息有序化2、基本方法:、基本方法:按照文献的外部特征来组织信息引用法索引法目录法用按文献的内容特征来组织信息分类法主题法文摘法 495.3 信息资源的组织方法v 语法信息组织方法 字顺组织法 代码组织法 地序组织法 时序组织法v 语用信息组织方法 分类组织法 主题组织法v 语义信息组织方法 权值组织法 概率组织法50文献实体型信息资源的组织方法v 分类组织语言 体系分类法 组配分类法v 主题组织语言 标题法 单元词法 叙词法 关键词法等级列举式分类法 是将所有的类目组成一个等级系统。一

    23、般的是等级式树状结构,最终形成一个比较完整的等级链。 举例: I文学I0文学理论I0-02文学的哲学基础I0-03文学的方法论I0-05文学与其他科学的关系I01文艺美学I02文学理论的基本问题I021文学的民族化、大众化I022文学与现实生活I023文学的普及与提高I024内容与形式I025典型与形象I026文学遗产的批判继承I03文艺工作者C社会科学总论D政治、法律E军事G文教、科学、体育J艺术K历史、地理 自然科学总论N O数理化P天文学、地球科学医药、卫生工业技术U交通运输V航空、航天X环境科学Z综合性图书社会科学自然科学机械、仪表 马列主义、毛泽东思想A马列B哲学哲学综合TBTDTE

    24、 TF TG TH TJTLTKTMTNTP TQ Q TS TU TV一般工业技术 矿业工程无线电、电子学、电讯技术自动化计算化学工业轻工业、手工业金属学动力工程原子能技术电工技术水利工程中中中中中中 图图图图图图 法法法法法法 展展展展展展 开开开开开开 图图图图图图石油冶金工业武器工业建筑科学F经济H语言I文学Q生物科学R S农业科学T面分类法 面分类法的典型案例 某高校教师分类编码混合分类法1、混合分类法的基本思想 用形成的分类体系中有些部分需要采用面分类法; 用形成的分类体系中也存在部分用线分类法定义的类目。这种分类方法称为混合分类法。2、案例: 上述教师的面分类体系中的从事专业,又

    25、可以分为学科门类(如管理学、工学等),学科门类下设若干一级学科,每个一级学科一般设有若干二级学科。 这样,从事专业这一面可按线分类法分成学科门类、一级学科、二级学科三个层次,如表2.3所示。其中,一级学科用三位数字表示,二级学科用两位数字表示;一、二级学科之间用点隔开。 网络信息资源组织模式1.文件方式 文件方式常作为网络信息资源管理的辅助形式,作为其他信息组织方式的补充。FTP以文件目录的形式来组织信息资源。2.数据库方式 将所有已获得的网络信息资源以固定的记录格式存储,用户通过关键词及其主配查询,就可以找到所需要的信息线索,并通过信息线索直接连接到相应的网络信息资源。 数据库组织方式原理图

    26、服务器服务器结构化查询结构化查询检索结果检索结果输入检索式输入检索式数据库数据库检索结果检索结果启动相应的应用启动相应的应用程序,包括相应的程序,包括相应的ISAPI、CGI、ASP等应用程序等应用程序浏览浏览执行执行SQL查询查询 3.主题树方式 信息资源按照某种事先确定的概念体系结构,分门别类地逐层加以组织,用户通过浏览的方式逐层加以选择,层层遍历,直至找到所需要的信息线索,并通过信息线索直接找到相应的网络信息资源。 Yahoo!等门户网站、 http:/ 4.超媒体方式 用超媒体方式来组织网络信息资源,就是将网上所能获得的各种媒体的相关信息资源利用超文本技术有机地编织在一起。网络信息资源

    27、的组织方法语言组织方法分类组织方法主题组织方法元数据组织方法本体组织方法 自由分类法60/79Folksonomy & Tag?自由分类法的内涵与发展自由分类法是用户自发的用标签(Tag)对感兴趣的资料进行分类,并与他人共享标签的过程和结果。2005年初,自由分类法作为一种由用户参与和主导的信息组织方式,在Yahoo等门户网站迅速流行,成为与The Long Tail, RSS, blog, Ajax,Podcast一样众人关注的焦点,也预示元数据新的应用模式。自由分类法(Folksonomy)是由Folks和Taxonomy组合而来,Folks在英文中是比较口语化的词,表示一群人,一伙人的意

    28、思。Taxonomy则是指分类法,它是信息构架(Information Architecture)中一个重要部分。而Folksonomy是指“群众”自发性定义的平面非等级标签分类,称为“自由分类法”或“通俗分类法”,还有人称之为“大众分类法”、 “民俗分类法”。 FolksonomyFolksonomy 简单理解这个概念就是Tags(标签)。Folksonomy就是由网络信息用户自发为某类信息定义一组标签进行描述,并最终根据标签被使用的频次选用高频标签作为该类信息类名的一种为网络信息分类的方法。例子: 举一个简单例子,当我们在收藏S时,自定义了“门户”,“中国”,“新闻”这3个关键词作为标签,

    29、而其他人在收藏 S时也自定义了自己的关键词作为标签。而最后系统统计出来使用“门户”,“中国”,“新闻”这个3个关键词来定义S的频率最高,那么这3个词就是用户对S的自由分类FolksonomyFolksonomy示例1 1:FolksonomyFolksonomy示例2 2:自由分类法的应用(1 1)宽公众分类法(Broad FolksonomyBroad Folksonomy)特点: :面向大众,拥有大量异质用户。 这里的异质是指用户在认知能 力、知识结构和兴趣领域上具 有一定差异,每个用户都可能 用自己的语言对社区中现有或 尚未添加的内容提供与众不同 的标签,每一个内容都存在相 当多的标签来

    30、描述。它所构建 的是一个大众分类体系平台。 其原理如右图所示。(1 1)宽公众分类法(Broad FolksonomyBroad Folksonomy如右图的曲线所示:对于一个网络资源对象,可能存在5 种标签来描述它,其中使用最多的是tag2,说明这是被最广泛接受的词汇,而曲线的尾端可能会出现很多通用性较差、较不常用的tags,形成长尾(long-tail)。宽公众分类提供了一种工具,能够了解用户的用词习惯,抽取准确的受控词。(2 2)窄公众分类法(Narrow FolksonomyNarrow Folksonomy)特点:用户特质相似 因为用户在知识结构和兴趣领域上具有很大的同质性。所以窄公

    31、众分类的可以用于为某一领域或专业的信息或知识提供共享平台。 695.4 信息资源索引系统的建立v编制合理的索引是构建精确信息检索系统的关键。v5.4.1 索引系统概述v5.4.2 计算机索引系统的建立705.4.1 索引系统概述v 索引是检索信息资源的地址或出处的标识系统。v 索引款目结构 索引标题词 说明语 地址参照项715.4.2 计算机索引系统的建立v 主要索引类型 题名索引 人名索引 代码索引 引文索引 分类索引 主题索引 关键词索引 网络信息自动索引72索引系统的编制v机编索引v主要算法 轮排算法模型 截词索引算法模型孙琳. 国内外机编索引软件的比较研究J. 图书馆理论与实践,2008,(6). 73索引系统实例v KWIC索引系统 Key-Word-in-Context,题内关键词检索,又名上下文关键词索引侯汉清侯汉清,李华李华,白振田白振田,. 中国图书馆分类法中国图书馆分类法轮排索引的计算轮排索引的计算机编制机编制J. 图书馆杂志图书馆杂志,2002,(8).

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:信息资源组织方法课件.ppt
    链接地址:https://www.163wenku.com/p-2913368.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库