关注
Elasticsearch(ES)性能好的原因主要有以下几点:
一、分布式架构
1. 水平扩展:ES 可以轻松地通过增加节点来扩展存储容量和处理能力。当数据量增加或查询负载变大时,可以简单地添加更多的服务器节点,系统会自动平衡数据和查询负载,确保性能不会因为数据增长而下降。
2. 数据分片与副本:数据被分成多个分片存储在不同的节点上,每个分片可以独立处理查询请求,从而提高查询的并行度。同时,副本的存在不仅提高了数据的可靠性,还可以在主分片出现故障时自动切换到副本分片,保证系统的可用性,并且副本分片也可以用于分担查询负载。
二、高效的数据存储和索引结构
1. 倒排索引:ES 使用倒排索引来快速定位包含特定关键词的文档。倒排索引将每个词与包含该词的文档列表关联起来,这样在进行关键词搜索时,可以快速找到相关的文档,而不需要遍历整个文档集合。
2. 基于 Lucene 的存储引擎:ES 底层基于 Lucene 库,Lucene 提供了高效的索引和查询算法。它对数据进行压缩存储,减少磁盘空间占用,同时在查询时能够快速解压和检索数据。
三、缓存机制
1. 文件系统缓存:ES 充分利用操作系统的文件系统缓存来提高数据的读取速度。经常访问的数据会被缓存在内存中,下次访问时可以直接从内存中获取,大大减少了磁盘 I/O 操作,从而提高性能。
2. 查询缓存:ES 可以缓存查询结果,对于重复的查询请求,可以直接返回缓存中的结果,而不需要再次执行查询操作。
四、优化的查询执行策略
1. 分布式查询执行:查询请求被分发到各个相关的节点上并行执行,然后将结果汇总返回给客户端。这种分布式查询执行方式可以充分利用集群的计算资源,提高查询的速度。
2. 近似聚合:对于一些聚合查询,ES 可以使用近似算法来快速返回近似结果,而不需要进行精确计算。这种方式在处理大规模数据时可以大大提高聚合查询的性能。
五、实时性支持
1. 近实时搜索:ES 能够在数据写入后很短的时间内(通常是 1 秒以内)就可以对其进行搜索。这是通过定期刷新索引和使用 translog 来保证的,新写入的数据会先写入 translog,然后在刷新时被纳入可搜索的索引中。
2. 实时更新:ES 支持对索引的实时更新,即可以在不中断搜索服务的情况下对数据进行添加、修改和删除操作。
查看原帖
点赞 评论
相关推荐
点赞 评论 收藏
分享
点赞 评论 收藏
分享
点赞 评论 收藏
分享
牛客热帖
更多
正在热议
更多
# 什么是优秀的实习经历 #
7874次浏览 205人参与
# 担心入职之后被发现很菜怎么办 #
265953次浏览 1130人参与
# 被上班搭子“传染”了哪些习惯 #
5141次浏览 97人参与
# 投格力的你,拿到offer了吗? #
152127次浏览 813人参与
# 工作后,你落下了哪些病根 #
12689次浏览 182人参与
# 作业帮求职进展汇总 #
82517次浏览 543人参与
# 京东美团大战,你怎么看? #
157823次浏览 859人参与
# 实习简历求拷打 #
10368次浏览 137人参与
# 如果今天是你的last day,你会怎么度过? #
58830次浏览 324人参与
# 秋招被挂春招仍然能投的公司 #
6274次浏览 93人参与
# mt对你说过最有启发的一句话 #
34247次浏览 414人参与
# 为了找工作你花了哪些钱? #
74757次浏览 359人参与
# 机械人晒出你的简历 #
146380次浏览 874人参与
# 嵌入式岗知多少 #
62931次浏览 555人参与
# 摸鱼被leader发现了怎么办 #
100114次浏览 640人参与
# 考研失败就一定是坏事吗? #
200484次浏览 1368人参与
# 秋招特别不鸣谢 #
15135次浏览 174人参与
# 2023毕业生求职有问必答 #
218517次浏览 1662人参与
# 选实习,你更看重哪方面? #
13345次浏览 214人参与
# 牛客十周岁生日快乐 #
197700次浏览 1895人参与

