元数据与互操作课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《元数据与互操作课件.ppt》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 操作 课件
- 资源描述:
-
1、元数据与互操作元数据与互操作刘炜北京大学研究生课程进修班北京大学研究生课程进修班 2005 上海上海北京大学研究生课程进修班 2005 上海元数据的互操作协议和标准元数据的互操作协议和标准 元数据的互操作 元数据的映射 元数据的互操作机制标准的资源描述框架 OpenURL标准 Z39.50 协议标准 OAI元数据互操作协议北京大学研究生课程进修班 2005 上海整合检索模式 集中式集中式联合目录联合目录 联合编目系统联合编目系统 人工上传批处理人工上传批处理 采用协议,自动收割采用协议,自动收割(Harvesting)元数据元数据,如如OAI 分布式联合目录分布式联合目录 采用标准协议实时查询
2、各资源站点的元数据采用标准协议实时查询各资源站点的元数据,如如Z39.50,SDLIP,OpenURL 采用动态页面分析技术,采用动态页面分析技术,以以元搜索元搜索方式方式实时查询资源实时查询资源站点元数据。站点元数据。北京大学研究生课程进修班 2005 上海互操作的现实目标互操作的现实目标整合下述资源:Abstracting/Indexing Services Publishers(e.g.Elsevier ScienceDirect)important to be able to pull togther Aggregators Electronic reserves Local data
3、bases including digitization projects OAI resources Institutional repositories北京大学研究生课程进修班 2005 上海用户界面认证管理Session管理总控管理统一检索入口连接器引擎API统一格式结果反馈检索参数定制检索结果保存检索请求处理API检索结果处理API用户管理检索请求处理模块各协议连接器引擎检索结果处理模块HTTP连接器Z39.50连接器JDBC连接器OAI连接器Internet数据源Z39.50服务器本地数据库OAI服务器日志管理针对特定资源的元数据结果格式转换配置文件资源定制北京大学研究生课程进修班
4、2005 上海靜態連結靜態連結 是以批次的方式先行演算好 在查詢時便是以即時回應的方式呈現 而這種方式大都是一對一的形式 故使用者無法從此獲得更多的資訊需求。例:Silver Platters SilverLinker 因有執行維護與更新的工作,故不會出現Access Denied的訊息 北京大学研究生课程进修班 2005 上海靜態連結靜態連結北京大学研究生课程进修班 2005 上海動態連結動態連結 on the fly 電子期刊文章被查詢時,才產生其連結的URL 此動態的連結主要是和metadata相配合 Metadata的品質愈好則連結的效果愈好。link-to 缺乏標準的型式來演算動態連
5、結的URLs deeper link 北京大学研究生课程进修班 2005 上海How to interlinking 開放性的連結機制 OpenURL 建立聯合目錄 OAI開放檔案詮釋資料擷取協定 (Open Archives Initiative Protocol for Metadata Harvesting)數位資源的統一編碼(命名)是更基本的問題北京大学研究生课程进修班 2005 上海參考資料參考資料MetadataDOIDOIDOI-CrossRef北京大学研究生课程进修班 2005 上海參考資料參考資料MetadataDOIDOI linkURL toPublisherDOIhtt
6、p:/dx.doi.org/10.1093/toxsci/57.1.95DOI-CrossRef北京大学研究生课程进修班 2005 上海OpenURL 在Web間傳遞訊息的機制 定義 應用於Web上超連結的一種標準陳述語法。藉由已經定義好的標籤(Tag),增進Web超連結能力。規範 定義一個標準INTERNET資料連結的陳述語法。讓服務提供者(Target)可以輕易解析資料提供者(Source)所傳送的要求。而資料提供者(Source)輕易對服務提供者(Target)送出深度連結服務要求。北京大学研究生课程进修班 2005 上海OpenURL北京大学研究生课程进修班 2005 上海OpenUR
7、L 協定內容 基本語法是與一般Internet上CGI程式所用的HTTP GET與HTTP POST類似 完整的OPENURL語法有兩部分:BASE-URL就是用來接收OPENURL資料的啟始位置,如http:/www.sfx.co.il/sfxmenu。DESCRIPTION這部分就是要送給服務提供者的metadata物件細節。每個metadata物件間以&符號區隔。北京大学研究生课程进修班 2005 上海OpenURL=BASE URL+QUERY 透過Metadata(Value),如:ISSN、ISBN嵌入於URL http:/server.lanl.gov/menu?genre=ar
8、ticle&issn=12345678&volume=12&issue=3&spage=1&epage=8&date=1998&aulast=Smith&aufirst=Paul 還可以透過如該資訊資源的識別資料DOI http:/server.lanl.gov/menu?id=doi:10.1000/6382-1北京大学研究生课程进修班 2005 上海OpenURLOpenURLOpenURLOpenURL全文資料庫全文資料庫電子文件電子文件動態地將metadata 帶給 連結系統 可描述文件OPAC索摘資料庫索摘資料庫透過透過OpenURL查詢查詢 分散在各處的資料分散在各處的資料北京大学
9、研究生课程进修班 2005 上海OpenURLOpenURLOpenURLOpenURL全文資料庫全文資料庫電子文件電子文件serverOPAC索摘資料庫索摘資料庫以以SFX為為的做法的做法北京大学研究生课程进修班 2005 上海SFX 以OpenURL為效尤的開放性連結解決辦法 透過標準化的服務做跨系統查詢 可實現不同WEB學術資訊資源的動態連結:索摘資料庫、引文資料庫、OPAC及WEB資源 能提供各種统計報表 點選SFX按鈕的次数 透過SFX下載全文的次數 北京大学研究生课程进修班 2005 上海SFX Server 提供者(source):指資訊代理商的各種資源 如:Medline、We
10、b of science、OPAC 透過SFX的hooks機制,使各圖書館能連結各資源 服務提供者(service):用來接受OpenURL的輸入 分析和評估傳來的metadata,確定要連結目標 如:館藏、全文、目次、摘要服務 目標(targets):各種形式的電子資源 包括電子期刊、OPAC、ILL、索摘資料庫、百科全書等北京大学研究生课程进修班 2005 上海SourceServiceTargetSourse Service-Target北京大学研究生课程进修班 2005 上海參考資料參考資料MetadataDOIDOI linkDOIServerOpenURL awarehttp:/d
11、x.doi.org/10.1093/toxsci/57.1.95DOI CrossRef OpenURL-SFX北京大学研究生课程进修班 2005 上海獲得館藏資料獲得館藏資料北京大学研究生课程进修班 2005 上海取得取得WOS的資料的資料http:/sfxserver.uni.edu/sfxmenu?sid=Provider2:AI1&pid=987641北京大学研究生课程进修班 2005 上海Z39.50标准和标准和 协议协议 Z39.50标准的名称:信息检索-应用服务定义与协议规范 Z39.50协议是在分布式网络环境下,用以支持信息搜索和信息检索的计算机系统间的通信协议北京大学研究生课
12、程进修班 2005 上海标准所依据的相关技术基础标准所依据的相关技术基础 标准规定了数据库管理系统的客户端和服务器端对话的规则。这种规则建立在客户机/服务器的体系结构基础之上。数据库客户端和服务器端的通讯通过网络实现。北京大学研究生课程进修班 2005 上海Z39.50标准与协议的标准与协议的 对应关系对应关系标 准Z39.50-1988Z39.50-1992Z39.50-1995 标准规范的协议Z39.50第一版Z39.50第二版Z39.50第二版和第三版北京大学研究生课程进修班 2005 上海源端与目标端的概念源端与目标端的概念 Z39.50标准是按典型的客户机/服务器体系结构定义的。在Z
13、39.50标准术语中,客户端计算机和服务器在通讯过程中分别被称为“源端”(Origin)和“目标端”(Target)。使用“源端”和“目标端”代表客户机与服务器描述数据通讯过程,是为了概念上更准确。北京大学研究生课程进修班 2005 上海Z39.50信息检索模型信息检索模型用户界面转换客户端Z-server转换数据库数据集搜索检索结果检索检索结果数据库记录搜索北京大学研究生课程进修班 2005 上海标准数据格式及统一的检索逻辑Z39.50标准接口BER编码TCP/IP或其它协议北京大学研究生课程进修班 2005 上海设施、服务与操作设施、服务与操作 Z39.50标准规定了源端和目标端互操作的规
14、范。这些操作抽象为设施和服务,并对其过程作出各种约定。这些设施中的服务,需要通过特定的操作指令来表达。配合这些操作指令,还约定了属性集和记录语法,用代码来表示特定的操作属性和记录语法形态。北京大学研究生课程进修班 2005 上海Z39.50标准的主要内容标准的主要内容 设施名称设施名称服务名称服务名称 初始化初始化 搜索搜索 获取提交、分段 删除结果集删除 浏览扫描 排序排序 存取控制存取控制 帐务与资源管理资源管理、触发资源管理、资源报告 解释(使用搜索和获取设施中的服务)扩展服务扩展服务 终止关闭北京大学研究生课程进修班 2005 上海Z39.50协议协议的服务与机制的服务与机制机制记帐/
15、资源控制机制解释机制扩展服务群机制终止机制 机制中的服务 资源控制服务、触发资源控制服务、资源报告服务 扩展服务群服务 关闭服务北京大学研究生课程进修班 2005 上海Z39.50的操作的操作 Init(初始化)Search(检索)Present(提交)Delete(删除)Scan(扫描)Sort(排序)Resource-report(资源报告)Extended-services(扩展服务)。北京大学研究生课程进修班 2005 上海关于属性集关于属性集在Z39.50标准实施中,bib-1是最主要的属性集,包括6组属性或属性类型:使用属性:指定搜索过程将要访问的检索点。关系属性:指定用户输入的检
16、索词与数据库索引值的关系。截断属性:指定检索词在索引的哪一部分作为命中条件。完整性属性:指定检索词在索引中是唯一值或非唯一值。位置属性:指定在索引字段中与检索词相关的内容应出现在哪个位置。结构属性:指定搜索的格式。北京大学研究生课程进修班 2005 上海关于记录语法关于记录语法 简单无格式文本记录语法(Simple Unstructured Text Record Syntax,简称SUTRS)。通用记录语法(Generic Record Syntax,简称GRS-1)。公共目录记录语法(OPAC Record Syntax)。摘要记录语法(Summary Record Syntax,简称Su
17、mmary)。扩展置标语言(EXtensible Markup Language,简称XML)。北京大学研究生课程进修班 2005 上海机读目录的记录语法定义机读目录的记录语法定义 Z39.50对机读目录格式记录语法的定义,是为每一种机读目录格式分配一个对象标识号(object identifier number)。下面列出了Z39.50支持的机读目录格式类型:AusmarcCanmarcCCFDanmarcFinmarcIbermarcIntermarcLibrismarcMABNormarcPicamarcSBNUKmarcUnimarcUSmarc北京大学研究生课程进修班 2005 上海
18、关于关于Profile(描述文件)描述文件)由于Z39.50是一个非常灵活的标准,执行这个标准还需要通过制定相应的profile(描述文件)以保证系统的互操作性。图书馆界制定的Bath Profile,就是被图书馆界普遍接受的描述文件。使用描述文件的好处是:使多数据库检索过程更为容易。检索结果更为准确。检索结果更为精练。转下页北京大学研究生课程进修班 2005 上海(接上页)用户对支持这个描述文件的服务器进行检索时,可以保持同样的界面环境并得到更高质量的检索结果。图书馆不必为每个数据库资源逐一定义检索方式,而是利用国际上由专家在描述文件中设计的方式。提高多数据库检索的效率。借鉴Bath描述文件
19、建立本地的描述文件,可以减少另外设计描述文件的时间。用户只需要向软件供应商了解产品如何支持某个国际标准描述文件,而不是问软件供应商如何定义自己的标准。北京大学研究生课程进修班 2005 上海客户机与服务器之间通讯的一般原理客户机与服务器之间通讯的一般原理客户机信号传输方向服务器建立联接接受联接接收联接确认发出联接确认发出权限验证接受验证信息接受确认验证确认接受验证发出检索请求接受检索请求接受检索结果返回检索结果发出获取记录请求接受获取记录请求接受指定记录返回指定记录关闭联接关闭服务北京大学研究生课程进修班 2005 上海Z39.50的基本服务的基本服务Z39.50应用程序在实现其功能的过程中,
20、根据需要选择这些服务。有三种服务是最基本的服务:初始化(Initialization)搜索(Search)提交(Present)在各种现有的Z39.50应用中,通常都包括了上述三种服务功能。北京大学研究生课程进修班 2005 上海基本服务之一:初始化基本服务之一:初始化初始化是在任何查询过程中的第一步。在这个服务中,源端需要:向目标端表明自己的身份 与目标端约定某些后续查询处理过程中的基本规则 与目标端交换验证信息的具体内容北京大学研究生课程进修班 2005 上海 搜索功能包括了系统的主要工作 由源端向目标端提交查询请求这些查询请求可以是非常简单的请求,也可能是含有复杂逻辑检索式(与、或、非、
21、大于、小于等等)的请求。服务器端通常使用描述文件(Profiles)说明支持的服务类型和应用程序兼容性,很多描述文件还说明了哪些是本系统能够支持的检索属性。基本服务之二:搜索基本服务之二:搜索北京大学研究生课程进修班 2005 上海提交功能的作用是说明管理结果被返回用户端时的形态。在提交功能中,用户可以:指定提供记录的数量,例如:当命中记录较多时,只提交前十条命中的记录。指定提供记录的格式,例如:要求按英国机读格式标准提交,不要按美国机读格式标准提交。基本服务之三:提交基本服务之三:提交北京大学研究生课程进修班 2005 上海Z的下一代的下一代北京大学研究生课程进修班 2005 上海SRW/U
22、 SRW Search and Retrieve Web Service SRU Search and Retrieve URL Service SRW/U Search and Retrieve for the Web北京大学研究生课程进修班 2005 上海北京大学研究生课程进修班 2005 上海北京大学研究生课程进修班 2005 上海北京大学研究生课程进修班 2005 上海北京大学研究生课程进修班 2005 上海北京大学研究生课程进修班 2005 上海北京大学研究生课程进修班 2005 上海北京大学研究生课程进修班 2005 上海北京大学研究生课程进修班 2005 上海北京大学研究生课程进
23、修班 2005 上海北京大学研究生课程进修班 2005 上海北京大学研究生课程进修班 2005 上海北京大学研究生课程进修班 2005 上海SRW/U Features SOAP and URL-based access Common Query Language -CQL Retains several Z39.50 abstractions.And discards a few北京大学研究生课程进修班 2005 上海SRW/U Features SOAP and URL-based access Common Query Language -CQL Retains several Z39.
24、50 abstractions.And discards a few北京大学研究生课程进修班 2005 上海SRW/U Features SOAP and URL-based access Common Query Language -CQL Retains several Z39.50 abstractions.And discards a few北京大学研究生课程进修班 2005 上海SRW/U Features SOAP and URL-based access Common Query Language -CQL Retains several Z39.50 abstractions.
25、And discards a few北京大学研究生课程进修班 2005 上海SRW/U retains these Z39.50 concepts.result sets abstract access points abstract record schemas application level diagnostics “Explain”北京大学研究生课程进修班 2005 上海.But differs from Z39.50 in these respects:Web-based Connectionless XML:Protocol(no ASN.1)+records(no“record
展开阅读全文