《数字信息保存》课件 第1章.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《《数字信息保存》课件 第1章.pptx》由用户(momomo)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数字信息保存 数字信息保存课件 第1章 数字 信息 保存 课件
- 资源描述:
-
1、第一章数字信息保存的发展第一章 数字信息保存的发展第一节 数字信息保存的概念第二节 数字信息保存目标及保存内容第三节 国际开展主要数字信息保存研究及项目第四节 我国数字信息保存基本状况第五节 数字信息保存责任体系第一节数字信息保存的概念1.数字信息 数字产品:一开始就是以数字形式产生的文献资料;由传统形式的文献转换而成的数字文献(数字再造资源)美国国家信息基础结构和保存项目(NDIIPP)将数字信息分为电子书、电子期刊、网站、数字电视等几大类第一节数字信息保存的概念2.数字信息保存“保存”一词对于数字信息的保护较为准确,包括行为、策略、方案和技术 数字信息保存是指将有价值的实体或非实体数据,利
2、用数字化科学技术保存在数字保存系统中,所有保存数据均以数字化形式存在 数字保存的特点:数字保存的对象范围广;数据格式范畴包括保存范围内的各种形式和数字化后的电子数据格式;数据的质量要高第一节数字信息保存的概念3.其他概念 掌管(curation):指从数据生产出来时就开始的管理和促进其被利用的行为,目标是使数据能够符合现实的需要,或能被用于发现和重用数据。存档(archiving):在掌管的基础上,确保数据是经过合理选择、得到良好保存的,并且这些数据可以被存取。随着时光的流逝,确保这些数据的逻辑和物理完整性得到维护,具有相应的安全和认证机构。第二节数字信息保存目标及保存内容数字信息的保存目标数
3、字信息长期保存的真实而具体的含义数字信息保存内容一、数字信息的保存目标 可持续发展是数字信息长期保存的目标 开放档案信息系统(OAIS)认为:数字信息保存系统的目标是确保被保存的信息对于目标团体而言是独立可理解的 保存元数据实施战略(PREMIS)认为:数字信息保存的目标是维持数字资源的长期可生存能力、可呈现能力和可理解能力 普里西拉卡普兰(Priscilla Caplan)认为,从下到上、从低到高,数字信息保存的目标分别为:可获得性;可识别性;可理解性;完整性;持久生存能力;可呈现能力;被保存对象的真实性 国内学者普遍认为数字信息的保存有四方面的含义:保证数字信息存储载体的稳定 保证信息内容
4、逻辑上的准确 保证数字信息的功能性 保证数字信息的存取性 概括而言,保存的目的即是要保存数字信息的内容、物理形式和功能 长期保存策略还应确保数字信息在未来可读一、数字信息的保存目标二、数字信息长期保存的真实而具体的含义1.数字信息的可读性 存储介质的损坏直接影响数字信息的可读性2.数字信息的可用性 指数字信息可以被人或电脑阅读和处理3.数字信息的可理解性 指数字信息的格式化内容可以被它的使用者理解4.数字信息的完整性 指数字信息是齐全的,并且未加删除、修正或改动5.数字信息的可检索性 抽象的信息对象(或部分)能有效、高效和准确地被检索与显示二、数字信息长期保存的真实而具体的含义6.数字信息的真
5、实性 数字信息与其用意相符 数字信息的形成和发送与其既定的形成者和发送者相吻合 数字信息的形成和发送与其既定时间一致 与它所代表的原件相一致(或记载不同之处)7.数字信息的安全性 指信息内容、用户使用和技术维护等多方面的安全性,包括现在和未来较长时间内信息的可获得性、准确性8.数字信息的通用性 指数字信息在保存过程中,要尽量用标准化的格式存储,必须考虑保存格式在相关行业中的认同度和现有软件的支持力度,应得到商业使用者和开放资源使用者的广泛支持,保证其在不同环境中都能被顺利读取使用三、数字信息保存内容1.信息内容(content)信息内容是数字信息中包括的大量内容2.信息结构(document-
6、based information structure)线性结构 非线性结构:树形结构、网状结构3.参考信息(reference)参考信息是一致持久的参考方法,是保证数字信息完整的基础,在引用、描述和分类体系中提供必要的参考方式,从而能发现、区分、确认与检索相关的信息对象三、数字信息保存内容4.信息环境(document-based information context)信息环境包括有关数字信息的产生、控制、使用、存储和管理的信息,以及与其相似材料的有关信息 数字信息的常用存储结构:数字信息类型存储结构(格式)应用范围格式化文本DOC、TXT、CAJ、PDF、HTML、SGML、XML各种出
7、版物、文本文件、网页等图像JPG、GIF、PNG、TIFF、BMP各类出版物、多媒体文件、网页音频MP3、WMA、RM语音处理、音乐、数字广播、音乐图书馆视频PMP、AVI、MPEG、RMVB、WMV、MP4数字录像或电视、影像图书馆、教育培训三、数字信息保存内容 AVI的英文全称为Audio Video Interleaved,即音频视频交错格式,是将语音和影像同步组合在一起的文件格式 这种视频格式的优点是图像质量好,可以跨多个平台使用;其缺点是体积过于庞大,而且压缩标准不统一,受到版本的影响较大三、数字信息保存内容 MPEG的全名为Moving Picture Expert Group,中
8、文译名是动态图像专家组 MPEG标准主要有五个:MPEG-1、MPEG-2、MPEG-4、MPEG-7及MPEG-21三、数字信息保存内容 ASF是Advanced Streaming Format(高级串流格式),是一种包含音频、视频、图像以及控制命令脚本的数据格式 ASF用于排列、组织、同步多媒体数据以利于通过网络传输;也可用于指定实况演示;最适于通过网络发送多媒体流三、数字信息保存内容 SGML(Standard Generalized Markup Language,标准通用标记语言)格式是一种定义电子文档结构和描述其内容的国际标准语言,是所有电子文档标记语言的起源,早在网络发明之前就
9、已存在 使用SGML将给多媒体的创作带来许多好处:由于其规范性,它可以使创作人员更集中于内容的创作,可提高作品的重复使用性能、可移植性能以及共享性能;其独立性使得它在许多场合都有用武之地 HTML和XML都是SGML HTML(Hyper Text Markup Language)格式即超文本标记语言或超文本链接标示语言 XML(Extensible Markup Language)格式即可扩展标记语言三、数字信息保存内容 PDF格式,全称Portable Document Format,是一种电子文档格式,这种文档格式与操作系统平台无关 PDF文件格式的目的是支持跨平台上的、多媒体集成的信息
10、出版和发布,尤其是提供对网络信息发布的支持 用PDF制作的电子书具有纸版书的质感和阅读效果,可以展现纸质书籍的原貌,而显示大小可任意调节,给读者提供了个性化的阅读方式三、数字信息保存内容5.元数据(metadata)元数据是关于数据的数据,由背景、处理和使用时产生的信息构成;有利于保证数字信息的真实性、检索和保存6.技术环境(technical environment)数字信息依赖于某种技术的支持,根据不同的情况,或多或少与某种特殊的配置、技术有联系,必须保存一定的技术处理的信息才能够利用和存储信息7.功能(function)数字信息的类型包括文本、图像、视频、音频等,可以多种类型存在。要完成
11、多种功能,必须提供不同类型的工具,保存数字信息既是保存这些功能,也是实现这些功能第三节国际开展主要数字信息保存研究及项目 研究图书馆组织(The Research Library Group)是一个有160 个会员单位参加的国际性的专业社团,其团体会员主要是国家图书馆、大专院校图书馆、公共图书馆、博物馆和独立研究收藏机构等单位 1991年,瑞典、挪威、丹麦、芬兰和冰岛的国家档案馆就电子文件的保护与存取问题进行了调研,并颁布电子文件的存取与保护研究报告;此后,欧、美等发达国家纷纷成立相应的机构专门研究数字信息的长期存取与保护问题 例如:1994年3月17日,在荷兰首都阿姆斯特丹就成立了欧洲保护与
12、存取委员会(ECPA)1994年12月美国组建美国保护与存取委员会 1993年12月澳大利亚成立保护澳大利亚数字信息调研组第三节国际开展主要数字信息保存研究及项目 数字信息长期保存系统基本构架:开放档案信息系统参考模型(OAIS)OAIS的五个主要功能模块:摄取模块(Ingest):从出版商或其他信息提供者处收集或接收按照一定格式组织的提交信息单元(Submission Information Package,SIP),信息单元经检验后建立相应元数据,交给数据管理模块,信息单元被转换为按照长期保护规定格式组织,包含专门的长期保护处理数据的存储信息单元(Archival Information
13、Package,AIP),然后交长期存储模块第三节国际开展主要数字信息保存研究及项目 OAIS的五个主要功能模块:长期存储模块(Archival Storage):实际存储按AIP 要求组织的数字信息,负责数据更新、技术仿真或数据迁移,负责建立具体存储与存取系统(如梯次存储系统),并在检索传递模块要求时将AIP提供给该模块。在技术仿真或数据迁移过程中,可能形成新的数字内容单元,可能需要与摄取模块协作重新建立有关元数据并送交数据管理模块 数据管理模块(Data Management):存储关于数字信息单元的元数据和关于长期保护处理政策、程序、技术及系统的元数据,并提供对这些元数据的基础检索与管理
14、第三节国际开展主要数字信息保存研究及项目 OAIS的五个主要功能模块:检索利用模块(Access):提供用户检索元数据和索取数字信息单元的界面,提供检索机制,并将AIP 转换为适合用户利用的传递信息单元(Dissemination Information Package,DIP),还可能承担身份认证和授权管理等。系统管理模块(Administration):通过有关政策、规范、程序、工作流程等来监测和控制整个长期保存系统的运行和各个模块的运行第三节国际开展主要数字信息保存研究及项目 目前国际上致力于数字信息长期保存措施研究颇具影响的项目:ERA(Electronic Records Archi
展开阅读全文