网络信息检索精选课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《网络信息检索精选课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 网络 信息 检索 精选 课件
- 资源描述:
-
1、第四讲第四讲 网络信息检索网络信息检索导言:网络社会导言:网络社会l 在现在的网络信息环境下,网络信息资源是我们学习、工作、生活中利用率最高的信息资源之一。对网络信息资源和网络的利用是终身学习的需要,也是个人信息素质中的重要内容。相对与图书馆纸本文献信息资源和数字资源的检索利用,其对人的影响更为深远。l 今后的社会,网络是一个基本要素,它将对社会经济、科技教育、国防乃至政治产生决定性的影响。目录目录网络信息资源概述 1 2 4 3网络信息检索工具搜索引擎检索技术网络信息检索技巧 l网络信息资源概念 信息资源以电子数据的形式存放在非印刷型的介质中,并通过网络通信手段,在计算机等终端上再现的信息的
2、总和。1.网络信息资源概述网络信息资源概述l网络信息资源类型 l 按信息内容的表现形式和内容划分可分为:全文型信息:直接在网上发行的电子期刊,网上报纸,印刷型期刊的电子版,网络学院的各类教材,政府出版物,标准全文等;事实型信息 天气预报,节目预告,火车车次,飞机航班,城市或景点介绍,工程实况、IP地址等;数值型信息:主要是指各种统计数据;数据库类信息:如CNKI,万方等,是传统数据库的网络化;微信息(web2.0特征):如博客、播客,BBS,聊天,邮件讨论组,网络新闻组等;其它类型:投资行情和分析,图形图象,影视广告等。1.网络信息资源概述网络信息资源概述1.网络信息资源概述网络信息资源概述l
3、 按所采用的网络传输协议可分为:WWW网络资源:因特网信息资源的主流,它使用http协议,使用简单,功能强大,能方便迅速的浏览和传递分布于网络各处的文字、图象、声音和多媒体超文本信息。FTP信息资源:它使用ftp协议,该协议主要用语连网计算机之间传输文件。FTP相当于在网络上两个主机之间复制文件。目前仍是发布、传递软件和长文件的主要方法。TELNET信息资源:telnet是远程登陆协议。telnet信息资源包括硬件资源和软件资源。许多机构都提供远程登陆的信息系统,如图书馆的公共目录系统,信息服务机构的综合信息系统等。用户服务组资源:包括新闻组,电子邮件组等。1.网络信息资源概述网络信息资源概述
4、l网络信息资源特点 信息资源丰富、种类繁多 超文本、超媒体、集成式提供信息,图表、图形、图像、声音、动画等 信息来源分散、无序,没有统一的管理机构,没有统一的发布标准 价廉,但质量良莠不齐 正式出版物和非正式信息交流交织在一起 共享程度高 是信息资源的宝库1.网络信息资源概述网络信息资源概述l网络信息资源的评价与选择网络信息资源的评价与选择主要是针对信息源l 内容因素:内容是评价与选择的核心和重点,从中可以反映网络信息资源的本质。评价网络信息资源的内容因素主要有:权威性、完备性、可靠性、原创性、新颖性、稳定性等。l 形式因素:形式指标反映了外部特征以及操作使用等方面,是为提示内容服务的,主要包
5、括:美观性、条理性、查检性、帮助性、快捷性、低耗性等。l 定量的评价:Google的pagerank;星数评价等级。1.网络信息资源概述网络信息资源概述l网络检索的类型按搜索的目标分类,可分为l 站点搜索普通搜索引擎、新浪、搜狐、Yahoo等l 图书资料网上图书馆、电子图书、网上商店l 专业文献专业数据库(中外文期刊、专利、图书)1.网络信息资源概述网络信息资源概述 寻找因特网上的任何一寻找因特网上的任何一个网页个网页,其中的环节不其中的环节不会超过十九个页面会超过十九个页面六度空间理论?六度空间理论?搜索的六度空间理论?搜索的六度空间理论?寻找世界上任何一寻找世界上任何一个人其中的环节不个人
6、其中的环节不会超过六个人会超过六个人1.网络信息资源概述网络信息资源概述附:人肉搜索l 请通过百度百科中的“人肉搜索引擎”词条了解人肉搜索baike./view/860941.htm l 人肉搜索,其实是情报学中的信息分析和情报调研过程,是信息检索技能、信息分析方法和情报调研过程的集中应用。其最大的特点是应用web2.0的思路,网聚人力,虚拟与现实结合。2.网络信息检索工具网络信息检索工具l 当已经知道地址时,直接通过地址访问。l 当不知道地址时,需要借助检索工具。搜索引擎网络资源目录信息门户搜索软件2.网络信息检索工具网络信息检索工具l 当别人问你一个问题,而你10秒内无法想出答案时,你是否
7、会回答去网上搜索一下?l 当你需要编写一个格式报告(如毕业论文、年终总结)时,你是否会先搜索一些范例并参照编写?l 如果你马上要和别人就一个你不熟悉的领域进行讨论时,你是否会赶紧先搜索一把,储备足够的背景知识,然后出动?l 你是否经常有这样的感觉,凡是我想到的,别人都想到了;凡是我想知道的,一定有人知道答案?l 当你即将前往一个陌生的地方,你是否会先打开搜索引擎页面,查阅当地的地理人文、风俗习惯,然后再启程?2.网络信息检索工具网络信息检索工具l搜索引擎 自动从因特网搜集信息,自动从因特网搜集信息,经过一定整理以后,经过一定整理以后,提供给用户进行查询的系统提供给用户进行查询的系统 Googl
8、eyahoo除此之外,还有哪些?除此之外,还有哪些?2.网络信息检索工具网络信息检索工具中文常用搜索引擎国内搜索引擎百度(Baidu)国内唯一商业化的全文搜索引擎,提供搜狐、新浪、263、Tom等站点的网页搜索服务。国内目录索引 搜狐(Sohu)国内三大门户之一,最早在国内推出搜索引擎收费登录服务 新浪(Sina)最大的中文门户网站,同样也推出了搜索引擎收费索引项目 网易(Netease)网易旗下搜索引擎,主要提供网页、图片、热闻、视频、音乐、博客等传统搜索服务,同时推出海量词典、阅读、购物搜索等创新型产品。2.网络信息检索工具网络信息检索工具英文常用搜索引擎 Google 以搜索精度高、速度
9、快成为最受欢迎的搜索引擎,搜索界的领军人物。Yahoo 最著名的目录索引,搜索引擎开山鼻祖之一.2.网络信息检索工具网络信息检索工具l 搜索引擎只是一个索引数据库,一般没有自己的信息资源,信息的可获得性与搜索引擎无关。不过搜索引擎有时也会在数据库中存储某些信息的内容。google2.网络信息检索工具网络信息检索工具l 水平搜索引擎(综合搜索引擎)l 水平搜索引擎索引几乎所有可能内容,包括多种类型、大量领域。在 内容类型和领域方面表现出综合性。l 水平搜索引擎强调信息的宽广、面对的是广泛用户的信息需求。l 典型的水平搜索引擎有:n 百度百度中文搜索引擎:/n Google中文搜索引擎:googl
10、e.hk/2.网络信息检索工具网络信息检索工具l 垂直搜索引擎l 垂直搜索引擎 即专业或专用搜索引擎,它专门用来检索某一主题范围或某一类型信息,追求专业性与服务深度是它的特点。l 垂直搜索引擎不但可保证此领域信息的收录齐全与更新及时,而且检索深度和分类细化远远优于综合搜索引擎。l 垂直搜索引擎的检出结果虽可能较综合搜索引擎少,但检出结果重复率低、相关性强、查准率高,适合于满足较具体的、针对性强的检索要求。l 目前已经涉及到购物,旅游,汽车,工作,房产,交友等行业。2.网络信息检索工具网络信息检索工具 找工作的搜索引擎:deepdo/totojob/google学术搜索:学术搜索:scholar
11、.google/google图书搜索:book.google/比价购物搜索引擎:go.8848/论坛搜索引擎:teein/旅行TripAdvisor tripadvisor 图像搜索引擎:cn.gograph/2.网络信息检索工具网络信息检索工具l 综合搜索引擎的专门化趋势l 搜狗(Sogou)人物、音乐、购物、图片、地图 sogou/gengduo.htm l GOOGLE 学术搜索:scholar.google/l GOOGLE 图书搜索book.google/book.google/l AllTheWeb 能专门对图像、多媒体信息。alltheweb 2.网络信息检索工具网络信息检索工具
12、l 元搜索引擎l 元搜索引擎(matesearch)又称集合型搜索引擎,将多个单一搜索引擎集成在一起,提供统一的检索界面,将用户的检索提问一次搜索多个搜索引擎,并将结果返回给用户。优点:能同时搜索多个搜索引擎,能在一定程度上提高查询的广度。缺点:因为有时后并不能对一个搜索引擎全部查完,有时后也会漏掉一些重要信息。例如:搜魅网(someta)、马虎聚搜2.网络信息检索工具网络信息检索工具l网络资源目录l 由人工采集网上信息,然后按照一定分类标准,比如学科类型、主题等,建立网站分类目录,并将筛选后的信息分门别类放入各类目中供用户进行浏览。1.信息组织的专题性较强,满信息组织的专题性较强,满足族性检
13、索要求足族性检索要求2.使用简单,只要选择相关类使用简单,只要选择相关类目,依照页面之间的超链接指目,依照页面之间的超链接指引很快就能到达目的信息,适引很快就能到达目的信息,适于检索不熟悉的领域或建议不于检索不熟悉的领域或建议不熟悉网络的用户使用熟悉网络的用户使用.优点优点1.人工采集信息的收录人工采集信息的收录范围小,更新慢;范围小,更新慢;2.受主观因素影响,类受主观因素影响,类目设置不够科学,缺少目设置不够科学,缺少规范。规范。缺点缺点2.网络信息检索工具网络信息检索工具l 搜索引擎目录目录索引:新浪目录dir.iask/l 开放目录ODP dmoz.org/、odp.nit/中国艺术开
14、放目录 aod.org/china.ndodo/l 专题网址如搜索引擎的专题网址:daohang.google/?hl=zh-CN&tab=wA 2.网络信息检索工具网络信息检索工具l信息门户 学科信息门户 cpm.lknet.ac/34850481734924.htm 政府信息门户 beijing.gov/(首都之窗)商业信息门户 公司信息门户 导航库一些疑问?一些疑问?l 搜索引擎到底有什么搜索技术?l 搜索引擎技术都有哪些应用?l 是不是也有应用实例演示?l l 我们将进入本次课程下一个部分的学习3.搜索引擎检索技术搜索引擎检索技术一、一、GoogleGoogle二、二、BaiduBai
15、du三、其他三、其他3.搜索引擎检索技术搜索引擎检索技术3.搜索引擎检索技术搜索引擎检索技术3.搜索引擎检索技术搜索引擎检索技术l谷歌l 网址:google.hk l 谷歌宣传动画:lib.nit/google.swf l“Google”取自数学术语googol,意思是一个1后面有100个0。意在表现该引擎“搜集和驾御浩瀚无穷的网络信息”的宏图。3.搜索引擎检索技术搜索引擎检索技术l 谷歌一般搜索技术l默认模糊搜索、默认拆分语句和过长的短语l如何精确搜索(短语搜索)l通配符*用法l点号匹配任意字符:.l布尔逻辑n 与:空格、ANDn 或:OR、|n 非:-(减号)l约束条件:+l同义词:l数字
16、范围:.l括号:()3.搜索引擎检索技术搜索引擎检索技术l 默认模糊搜索、默认拆分语句和过长的短语3.搜索引擎检索技术搜索引擎检索技术l 如何精确搜索(短语搜索)3.搜索引擎检索技术搜索引擎检索技术l 通配符*用法l 如:检索【”市场*研究报告”】3.搜索引擎检索技术搜索引擎检索技术l 点号匹配任意字符(也可不用引号)l 与通配符星号“*”不一样的是,点号“.”匹配的是字符,不是字、短语等内容。保留的字符有、(、-等。如:【“大全.中国”】3.搜索引擎检索技术搜索引擎检索技术l 布尔逻辑 l 布尔逻辑是许多检索系统的基本检索技术,在搜索引擎中也一样适用,在谷歌网页搜索中需要注意的是:谷歌和许多
17、搜索引擎一样,多个词间的逻辑关系默认的是逻辑“与”(空格)。当用逻辑算符的时候,词与逻辑算符之间需要用空格分隔,包括后面讲的各种语法,均要有空格。l“或”OR必须大写,“非”是特例,即减号必须与对应的词连在一起。l 对于复杂的逻辑关系,可用括号分组。如:逻辑与:【电子行业 AND 研究报告】,用空格和AND 以及小写搜索结果差别不大。此例是搜索电子行业的研究报告。逻辑或:【电子行业 AND 研究报告 AND(人才|风险)】此例是搜索电子行业的人才或风险方面的研究报告。逻辑非:【电子行业 AND 研究报告 AND(人才|风险)-2019】此例是搜索电子行业的人才或风险方面的研究报告,但不要201
18、9年的。3.搜索引擎检索技术搜索引擎检索技术l 约束条件l 加号“+”用于强制搜索,即必须包含加号后的内容。一般与精确搜索符一起应用,如:【研究报告+学术信息资源开放目录】3.搜索引擎检索技术搜索引擎检索技术l 同义词l 仅限于英文搜索。一般来说,加符号会比不加搜索出来的多一些。总体来说效果不是很明显。如:搜索【PC】能搜索出Computer、windows等内容。3.搜索引擎检索技术搜索引擎检索技术l 数字范围l 用两个点号“.”表示一个数字范围。一般应用于日期、货币、尺寸、重量、高度等范围的搜索。用作范围时最好给一定的含义。如:【格力空调 2000.2800 元】搜索价格区间。本例仅仅搜索
展开阅读全文