搜索引擎精品PPT课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《搜索引擎精品PPT课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 搜索引擎 精品 PPT 课件
- 资源描述:
-
1、5/16/20221搜索引擎 邮箱: 5/16/20222概念以及原理 Seach engine:根据一定的策略,运用特定的计算机程序搜集互联网上的信息,在对信息进行组织和储存以及处理后,为用户提供检索服务的系统 是一种用于检索互联网的软件系统 表现形式:网站和网站的检索入口5/16/20223工作原理 构成:搜索器:承担网络数据的抓取功能,负责访问各种站点,在互联网中搜索发现和收集信息,取回web网络信息。 索引器:对搜索到的信息进行整理,在文档中建立一种便于检索的数据结构,即索引 检索器:一般是一个web应用程序,获取用户指定的搜索规则,查询索引库,提供排序的搜索结果返回 用户接口:提供可
2、视化查询输入和结果输出 原理:网页信息的储存和输出5/16/20224分 类 按照搜索引擎的内容组织分类全文搜索引擎(full text seach):用户能够对各网站的每个主页中的每个词进行搜索。1目录搜索引擎(index text seach):用人工方式将所收录的站点进行分类而建立数据库,以提供查询。5/16/20225 2 按照工作机理划分 独立搜索引擎:自建数据库,提供基于自身索引库的查询服务 集成搜索引擎(元搜索引擎):多个独立搜素引擎的组合,没有自建数据库,只有将多个搜索引擎集中在一起提供一个检索界面。5/16/20226 3 按照搜索引擎检索的网络资源不同而分类 Web搜索引擎
3、 web的含义:(World wide web) internet 因特网络资源中Web资源是主流 需要了解的几个web概念: HTTP(hypertext Transfer protocal)5/16/20227 HTML(hypertext makeup language) URL(uniform resource location) 利用web浏览器,通过超链接(hyperlink)和统一资源定位器,可以方便的从一个网页到另一个网页,简单快速的浏览查找获取遍布全球的所需的web资源 例::使用http协议,连接到因特网上地址为的计算机上获取index.htmp的信息。5/16/20228
4、 非WEB资源搜索引擎 网络论坛 电子邮件(e-mail) translate protocal)5/16/20229综合搜索引擎使用举例 谷歌(goole )Google首席执行官埃里克-施密特访华时正式宣布,Google全球中文品牌名为“谷歌”,这是Google在全球范围内唯一一个非英文的名字。施密特自曝中文品牌“谷歌”来得很“蹊跷”,他用七巧板的方式,排出了中文品牌“谷歌”。 “Google来到中国已有很多年,但却没有被中国人所熟悉的中文名称”,施密特在解释为什么要启动中文名称时讲到,“谷歌将更加贴近全球的中文语言用户,是播种与期待之歌,也是收获与欢愉之歌”,对于两个名称的关系,施密特称
5、中文名称“谷歌”不会代替英文名称,我们希望中、英文名称能互为支撑。 5/16/202210 20002000年年9 9月月1212日日,Google宣布在G增加简体及繁体两种中文版本,开始为全球中文用户提供搜索服务。 20042004年年9 9月月1010日日,G推出简体中文版Google新闻。 20052005年,Google中国部门从位于北京建国门外的新华保险大厦搬至清华东门边上的科建大厦;此外,Google在北京财富中心还有一个办公点。 20052005年年7 7月月1919日日,李开复加盟Google,正式出任Google中国区总裁。同日,Google宣布将在中国设立研发中心。 200
6、62006年年1 1月月,简体中文版Google新闻改名为“Google资讯”。 20062006年年1 1月月2626日日,Google正式启用中国大陆版Google专用域名“G”。 20062006年年2 2月月,路透社报道,Google在中国没有ICP牌照、涉嫌非法经营详细详细 2010年1月谷歌中国关闭5/16/202211常用搜索引擎 综合搜索引擎介绍5/16/202212典型全文搜索引擎1)国外:(1)Google Google是由两位斯坦福大学的博士生 Larry Page 和 Sergey Brin 在 1998 年创立的。可以说是目前世界上最大最全的搜索引擎,在搜索引擎市场上
7、居龙头宝座地位。 目前已经收集了超过30亿的网页,而且检索速度快,功能强大。现在,Google 每天需要提供 1.5 亿次查询服务,而且每条搜索所用时间通常不到半秒。 网易使用的是Google的网页搜索服务。5/16/2022135/16/202214 大多数的搜索引擎依靠少量大型服务器,这样,在访问高峰期速度就会减慢,而 Google 却利用相互链接的 PC 来快速查找每个搜索的答案。 这一创新技术成功地缩短了响应时间,提高了可扩展性,并降低了成本。这也是其他公司一直在效仿的技术。 5/16/202215网站排名 Google检索到的网站排名是按照网站的被链接数量由高到低排列,不存在人为的干
8、预因素。因此最先出现的往往都是质量较高的网站。 PageRank PageRank 技术:技术:通过对由超过 50,000 万个变量和 20 亿个词汇组成的方程进行计算,PageRank 能够对网页的重要性做出客观的评价。PageRank 并不计算直接链接的数量,而是将从网页 A 指向网页 B 的链接解释为由网页 A 对网页 B 所投的一票。这样,PageRank 会根据网页 B 所收到的投票数量来评估该页的重要性。此外,PageRank 还会评估每个投票网页的重要性,因为某些网页的投票被认为具有较高的价值,这样,它所链接的网页就能获得较高的价值。重要网页获得的 PageRank(网页排名)较
9、高,从而显示在搜索结果的顶部。Google 技术使用网上反馈的综合信息来确定某个网页的重要性。搜索结果没有人工干预或操纵,这也是为什么 Google 会成为一个广受用户信赖、不受付费排名影响且公正客观的信息来源。 5/16/202216主要功能 手气不错 按下“手气不错”按钮将自动进入 Google 查询到的第一个网页。您将完全看不到其它的搜索结果。如:输入中央电视台,会直接转到中央电视台的网站。 网页快照 Google 在访问网站时,会将看过的网页复制一份网页快照,以备在找不到原来的网页时使用。单击“网页快照”时,您将看到 Google 将该网页编入索引时的页面。Google 依据这些快照来
展开阅读全文