网络信息分类发展史要点课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《网络信息分类发展史要点课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 网络 信息 分类 发展史 要点 课件
- 资源描述:
-
1、网络信息分类发展史 网络信息检索系统的信息组织主要体现在搜索引擎(包括网络目录)的索引数据库组织上。搜索引擎的主要功能是方便人们搜索互联网上的信息并提供获取所需信息的途径。被搜索引擎所组织的信息资源以万维网上的信息为主,有时也包括电子邮件地址、新闻论坛文章、FTP、Gopher等网络信息资源。一、 网络的信息、用户、技术环境特点 网络信息的特点 数量巨大而庞杂 内容范围广泛 信息类型众多 动态性高 超文本链接 有序和无序并存 网络信息用户的特点 用户范围极为广泛 受教育程度差别极大 利用网络信息的目的和类型有很大差异 用户使用的网络服务不同 网络信息技术环境的特点 计算机技术、网络技术、通信技
2、术使分布在全球的信息设备和各种信息资源跨越时空地联系在一起。 数字技术、多媒体技术使借助一台PC就可以浏览检索文本、图形、声音、图像等信息。 人工智能技术、自然语言理解技术、自动索引技术、数据库技术使快速地将浩如烟海的动态信息进行过滤、整序、建库成为可能。 虽然网络信息、用户、技术环境具有不同于以往的特点,但是,分类法仍然是网络信息组织所采用的一种重要方法。 目前,Internet主要以两种方式采用分类法进行信息组织:一是基本以人工标引方式采用现有的文献分类法二是以人工标引或自动标引方式采用自编的分类系统二、现有文献分类法在网络信息现有文献分类法在网络信息组织中的应用组织中的应用1、现有文献分
3、类法在网络信息组织中的应用现状 20世纪80年代,人们对文献分类法(主要是DDC、LCC、UDC) 应用于联机环境的大量研究,为文献分类法在网络信息组织中的应用作了必要的准备。 围绕文献分类法在Internet的应用,国外进行过不少实验研究,目前已进入实用阶段。现有一些大的万维网站点或搜索引擎采用现有文献分类法组织Internet信息资源。应用DDC的站点有: BUBL Link, Basalt Regional Library Homepage, Blue Webs Content Categories, Canadian Information by Subject , The Inter
4、net Resource, Subject List in Classification Order, NetFirst, CyberDewey:A Hotlist of Internet Sites Organized Using Dewey Decimal Classification Codes等30 多个。采用LCC 的站点有: CyberStacks Internet resources Arranged by the Library of Congress Classification System Scout Report Signpost The WWW Virtual Lib
5、rary 等20 多个。 利用UDC的站点有: Directory of Networked Resources Informazioni Classificate per Discipline WWW Subject Tree of WAIS Databases Worldwide Resources Organised by UDC 等10 余个。也有一些站点采用综合性分类法组织专业性的网络信息资源 如The Social Science Information Gateway 运用UDC的社会科学部分。 天文学的Expanding Universe采用LCC。 图书情报学的PICK(Qu
6、ality Internet Resources in Library and Information Science)采用LCC。此外,还有一些专业分类法用于组织专业性网络信息资源 如工程信息分类法用于Edinburgh Engineering Virtual Library和Engineering Electronic Library, Sweden的信息组织; 美国数学学会的Materials Organized by Mathematical Classification是采用数学主题分类法进行组织, Paths to Computer Science Subject Informat
7、ion采用计算评论分类法组织其信息。 另有一种与文献分类法的类号相联系的主题范畴系统,即在范畴之后标注特定分类法的分类号。如美国的Blue Webs Content Categories,就是在范畴后附有DDC的类号。 我国的中图法被“网络指南针”用作组织信息资源的三种分类体系之一。2、现有分类法对网络信息组织的适应性 这些站点对现有分类法在Internet的应用作了有益的尝试,它使人们认识到现有分类法在组织网络信息时具有以下优势: (1)由于限定了检索范围,可以提高检准率;(2)分类等级结构可以提供检索词的上下文;(3)等级结构便于用户在查找时进行浏览;(4)当检索目的不明确或检索词不确定时
8、,分类浏览方式更有效率; (5)以知识分类为基础,以符号为标识,具备成为不同语言转换中介的条件;(6) 非文本信息在网络信息资源中所占比例日渐增大,其内容特征难以用文字表达,分类法的聚类功能及号码标识为之提供了一条可能途径。 现有分类法在网络信息组织的实际应用,也反映出现有分类法用于网络信息组织时需要有所调整,主要包括:(1)将分类法的信息保证扩展到包括Internet信息资源,增加必要的新类目,尤其使非学术性信息的类目; (2)适当突出信息量大、利用率高的类目;(3)修订类名,增强其表达性和通用性;(4)不断增加新的术语作为索引词;(5)扩展分类法与其他受控词汇的联系; (6)控制使用类目的
9、深度,多数网络分类检索系统只使用分类法的1-3级类目。 (7)分解和标记类号的组成因素,以识别它所表达的特定主题和主题方面; (8)将类目的线性结构改造成网状结构,满足多途径浏览检索的需要。三、用于网络信息组织的自编分用于网络信息组织的自编分类系统类系统 有许多搜索引擎采用自编分类系统进行信息组织,具体表现为网站分类目录(索引)和网页分类索引。目前在中国内地、香港、台湾,以及国外的120个中文搜索引擎中,有90多个提供网站分类目录,有近10 个提供网页分类索引;著名的英文搜索引擎,也有不少提供网站或网页的分类目录(索引),如Yahoo, Infoseek, Excite, AltaVista等
10、。但是,这些搜索引擎的分类系统是各自建立,互不一致,缺少规范的。1、自编分类系统的种类 用于网络信息组织的自编分类系统主要有以下3种:等级式主题分类法系统分面组配分类法系统学科分类法系统(1)等级式主题分类法系统 所谓等级式主题分类法系统是指在分类体系中,基本上采用等级结构,一个主题充当一个类目,类目按字顺或人为次序排列,类目不采用标记符号(分类号)表示,一个类目可以细分为若干个细目,同位类的细目多按字顺排列。这种主题分类法形式的分类体系,依事物分类,而不是依学科分类。目前大多数网络分类检索采用这种分类系统。分类比较详细的雅虎中国(Yahoo!)分类系统。Yahoo首先将全部信息分为14大类,
11、分别为: 休闲与运动社会科学社会与文化政府与政治科学娱乐健康与医药 区域教育参考资料商业与经济新闻与媒体电脑与因特网艺术与人文大类之下,根据需要可以分出若干二级类。如“电脑与因特网”大类,进一步细分为: 安全与加密半导体便携电脑程序设计语言电脑合成音乐电子游戏电脑与资讯科学电子通讯多媒体高速计算与平行计算 个人电脑公司 公元2000年危机 会议与商展绘图竞赛历史软件通讯与网络新闻与媒体虚拟文化训练因特网硬件杂志 二级类目下分出若干三级类目,依次类推,可 根 据 需 要 细 分 出 4 、 5 级 类 目 。(2)分面组配分类法系统 分面组配分类法系统是由若干个分面组成,每一分面的类目可以与其他
12、分面的类目组配,表达专指的概念。 中文搜索引擎“中华网目”就是采用分面组配分类法建立其检索系统。它设计了两个分面:一个是地域分面,分省级行政区、城市两级类目;二是主题分面,一级类目为政府/组织、财经/工商、教育/科技、旅行/观光/旅馆、媒体/出版、文艺/体育/休闲、计算机/因特网、信息服务等,一级类下分出若干二级类。查询时,可以将两个分面的类目进行组配,输出相关的网页链接。(3)学科分类法系统 这是将科学、技术的各个学科、领域及其分支设为类目的分类法系统。 中文搜索引擎“网络指南针”就提供一个学科分类系统,设有表示学科的一级类目58个,如安全科学技术、材料科学、测绘科学技术、地球科学、法学、管
13、理学等,按类名字顺排列,下设若干二级、三级类目。2、自编分类系统的特点 就目前所见,网络中的自编分类系统具有以下特点: (1)大多依事物分类建立类目体系,列类以网络信息资源做保证,类目体系往往并不涵盖全部知识领域。 (2)类目大量采用多重列类法,经常采用多个标准对同一个类目进行划分;对多向成族的概念在多个类目下重复设类,并在标引时采用互见标引法,利用超文本技术进行链接,实现信息组织的多维化,提供多途径检索。 例如,雅虎中国的“因特网”的下位类有:电子卡片电子邮件公司会议与商展(2)连到网上的装置(6)企业网软件商业软件搜寻与检索(2)谈天室(6)通讯与网路 (3)类目体系不太严密、科学,主要表
14、现为:列类不完备,类目划分的规律性不强,从属关系不严格,概念之间关系的显示较为简单。 (4)都不采用类目标记符号。 (5)类目级别不多,往往采用层层链接的方法进行显示。 (6)界面显示形式多样,既有列表方式,又有图形方式。以列表方式显示时,有直接显示和分屏显示两种,这两种方式各有优缺点。 (7)分类系统往往与主题系统相结合,提供多种检索途径。有的检索系统还提供多个平行的分类系统。 (8)分类标引基本上是由人工进行,自动分类标引有待进一步试验和完善。对比搜狐和新浪分类体系 搜狐搜索引擎的分类体系ttp:/ 搜狐采用树型结构对站点进行层次性分类,将所有网站分为18个大类,各大类下又细分出若干二、三
15、、四级或更小的类目,类目总数达5万多。 搜狐的大类基本上是稳定的,但小类则处于不断变化之中,搜狐网站对每周新增类目和网站都进行报道。 新浪http:/ 新浪将网站分为17大类 ,另外有一个少儿搜索。各大类根据需要再细分出多级类目电子商务中的产品信息分类 电子商务网站中产品信息的分类 B2B电子交易市场中信息组织的基础是产品分类。 在每个电子交易市场中,都有产品分类目录,网站中利用产品与服务的分类组织商业信息、编制广告索引、编制产品、企业数据库等等;同时也作为企业通过产品与服务分类目录浏览、发布或查询所需产品与服务信息、交易、并寻找合作伙伴时的依据。(一)产品分类的功能 1 寻址: 检索者通过分
16、类能找到资源的位置。当买卖双方在寻找所需的产品及服务时,可以根据分类表找到其具体内容。并可以找到相关产品与服务提供者的网站链接或者联系途径。 2 浏览: 使检索者在同一类别中看到邻近的资源。比如买卖双方在熟悉网站中产品与服务类目及编排的情况下,都可以通过浏览其目录发现所需产品以及相关产品,从而得到所需产品与服务的供求信息内容。 3 阶层式移动: 电子商务环境的本质是网络环境,对网络信息资源组织的特点能为检索者提供阶层式移动,使检索者在阶层中上下浏览。检索者能够从中享受分类架构的好处。所以,对于电子交易市场中,供求双方可以通过分类目录了解具体产品及具从属关系的产品。 4 检索: 传统分类检索的方
17、式多为分类号查询。但在目前较少电子交易市场中提供分类号检索,大多都是产品与服务类名检索,同时辅以地域及企业特征等检索。 5 辨识: 如果检索者在所检索的产品与服务清单中看到一个分类号时,可以据此确认在分类表中所对应的主题内容。 分类号的辨识作用表现在类号的位数能够显示产品与服务相关类目上位、同位与下位关系,由类号的变化可以扩大或缩小范围。 目前,在交易市场中,较少提供分类号检索与查询,主要是通过产品与服务名称来辨识的。 6 限制/区分: 分类是根据产品与服务的某种属性来设置类目的,而属性可用来限制或区分检索集。 例如通过产品类名将检索集排序,然后借助于某个特殊的类别(比如以地域复分或以企业特性
展开阅读全文