elastic-search(弹性搜索)课件.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《elastic-search(弹性搜索)课件.pptx》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- elastic search 弹性 搜索 课件
- 资源描述:
-
1、走近 elastic search分享人 林云霞概念解释Part 01系统原理Part 02分布式集群Part 03应用场景Part 04概念解释01概念解释RESTful APIfull text searchreal timesearch andanalytics engineElasticsearchJSONover HTTPdistributedLucenebasedmulti tenancyopen - sourcehign availabilityscales massivelyschema free 概念解释 Elastic Search 是一个基于 Lucene 构建的开源,分
2、布式,RESTful 搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。支持通过 HTTP 使用 JSON 进行数据索引,它能够快速搜索数十亿的文件以及 PB 级的数据,结构化或者非结构化的数据都可以。简介 概念解释节点一个节点就是集群中的一个服务器集群点多台Es服务器的结合的统称叫ES集群,一个集群包含多台服务器,多个节点。分片主分片和副本分片 主分片1 N 复制分片概念解释索引中的索引是组织数据的逻辑空间,一个索引就是一个拥有几分相似特征的文档的集合类型在一个索引中,你可以定义一种或多种类型文档一个文档是一个可被索引的基础信息单元数据库表行概念解释 索引 ( i
3、ndex ) 类型( type) 文档( doc )1 N1 N点此添加标题集群节点主分片副本分片索引概念解释文档概念解释主节点 控制集群,负责集群中的操作,协调创建索引、查询请求客户端节点负载 均衡,组装返回的数据给客户端节点类型节点类型对应节对应节点点相关配置相关配置主节点Node1node.master=true数据节点Node2node.date=true客户端节点Node3node.data=false;node.master=false集群中有很多结点,可以配置为3种不同的角色系统原理02系统原理 Elasticsearch使用了Apache Lucene,其内部使用的是被称为倒排
4、索引的数据结构。存储模型 倒排索引源于实际应用中需要根据属性的值来查找记录。这种索引表中的每一项都包括一个属性值和具有该属性值的各记录的地址。由于不是由记录来确定属性值,而是由属性值来确定记录的位置,因而称为倒排索引(inverted index)。倒排索引系统原理文档是Elasticsearch的数据单位,对文档中的词项进行分词,并创建去重词项的有序列表,将词项与其在文档中出现的位置列表关联,便形成了倒排索引。我们来看下如下2个文档是如何被倒排索引的: 文档1(Doc 1): 零售应用开发一室主题分享文档2(Doc 2): 数据仓库团队主题分享文档1(Doc 1): 零售/应用/开发/一室/
5、主题/分享文档2(Doc 2): 数据/仓库/团队/主题 分享系统原理倒排索引词项词项文档文档零售doc1应用doc1开发doc1一室doc1主题doc1、doc2分享doc1、doc2数据doc2仓库doc2团队doc2文档1(Doc 1): 零售/应用/开发/一室/主题/分享文档2(Doc 2): 数据/仓库/团队/主题 分享系统原理当我们查询“数据分享”这一个中文分词时,只需要知道他在哪个文档即可。Termsdoc1doc2数据X分享xXSCORE(相关度)12 两个文档都匹配,但是DOC2比其它的有更多的匹配项。相关度评分为2,如果我们加入简单的相似度算法(similarityAndl
6、gorithm),计算匹配单词的数目,这样我们就可以说DOC2这个 文档比其它的匹配度更高,这对于我们的查询结果具有更多相关性。系统原理 当我们发送索引一个新文档的请求到协调节点后,将发生如下一组操作: Elasticsearch集群中的每个节点都包含了改节点上分片的元数据信息。协调节点(默认)使用文档ID参与计算,以便为路由提供合适的分片。Elasticsearch使用MurMurHash3函数对文档ID进行哈希,其结果再对分片数量取模,得到的结果即是索引文档的分片。shard = hash(document_id) % (num_of_primary_shards)新建索引系统原理coor
7、dinatingnodeshardmemorybuildertranslogfilesystemcacheempotytranslogdiskwrite requestroute requestrefresh every 1 secflush every 30 min or when gets too bigcommit when every 5 sec with every write operation and when flushedcommit to dish with translog flushinside a shard添加标题posthttp:/localhost:9200/b
8、log/newarticle/1 author:林云霞, creatDate:20170729, content:elastic search 是一个非常优秀的搜索引擎, place:招银网络科技新建索引 _index: blog, _type: newarticle, _id: 1, _version: 1, result: created, _shards: total: 3, successful: 2, failed: 0 , created: true系统原理删除 磁盘上的每个段都有一个相应的.del文件。当删除请求发送后,文档并没有真的被删除,而是在.del文件中被标记为删除。该文
展开阅读全文