略微加速

略速 - 互联网笔记

elasticsearch慢日志

2020-12-14 leiting (6009阅读)

标签 Elasticsearch

日志记录

Elasticsearch 会输出很多日志,都放在 ES_HOME/logs 目录下。默认的日志记录等级是 INFO 。 它提供了适度的信息,但是又设计好了不至于让你的日志太过庞大。

当调试问题的时候,特别是节点发现相关的问题(因为这个经常依赖于各式过于繁琐的网络配置),提高日志记录等级到 DEBUG 是很有帮助的。

你 可以 修改 logging.yml 文件然后重启你的节点——但是这样做即繁琐还会导致不必要的宕机时间。作为替代,你可以通过 cluster-settings API 更新日志记录级别,就像我们前面刚学过的那样。

要实现这个更新,选择你感兴趣的日志器,然后在前面补上 logger. 。对根日志器你可以用 logger._root 来表示。

让我们调高节点发现的日志记录级别:

PUT /_cluster/settings
{
    "transient" : {
        "logger.discovery" : "DEBUG"
    }
}

设置生效,Elasticsearch 将开始输出 discovery 模块的 DEBUG 级别的日志。


避免使用 TRACE 。这个级别非常的详细,详细到日志反而不再有用了。

慢日志

还有另一个日志叫 慢日志 。这个日志的目的是捕获那些超过指定时间阈值的查询和索引请求。这个日志用来追踪由用户产生的很慢的请求很有用。

默认情况,慢日志是不开启的。要开启它,需要定义具体动作(query,fetch 还是 index),你期望的事件记录等级( WARN 、 DEBUG 等),以及时间阈值。

这是一个索引级别的设置,也就是说可以独立应用给单个索引:

PUT /my_index/_settings
{
    "index.search.slowlog.threshold.query.warn" : "10s", 
    "index.search.slowlog.threshold.fetch.debug": "500ms", 
    "index.indexing.slowlog.threshold.index.info": "5s"
}

查询慢于 10 秒输出一个 WARN 日志。

获取慢于 500 毫秒输出一个 DEBUG 日志。

索引慢于 5 秒输出一个 INFO 日志。

你也可以在 elasticsearch.yml 文件里定义这些阈值。没有阈值设置的索引会自动继承在静态配置文件里配置的参数。

一旦阈值设置过了,你可以和其他日志器一样切换日志记录等级:

PUT /_cluster/settings
{
    "transient" : {
        "logger.index.search.slowlog" : "DEBUG", 
        "logger.index.indexing.slowlog" : "WARN" 
    }
}

设置搜索慢日志为 DEBUG 级别。

设置索引慢日志为 WARN 级别。

https://www.elastic.co/guide/cn/elasticsearch/guide/current/logging.html


es里面的操作,主要分为两种,一种写入(增删改),另一种是查询(搜索)。我们分别要识别出来,哪些写入操作性能比较慢,哪些查询操作性能比较慢,先要识别出来有性能问题的这些慢查询,慢写入,然后才能去考虑如何优化写入的性能,如何优化搜索的性能。

搜索慢查询日志

无论是慢查询日志,还是慢写入日志,都是针对shard级别的,无论你是执行增删改,还是执行搜索,都是对某个数据执行写入或者是搜索,其实都是到某个shard上面去执行的。shard上面执行的慢的写入或者是搜索,都会记录在针对这个shard的日志中

阈值的意思,就是说,什么叫做慢?搜索,5s叫做慢?还是10s叫做慢?或者是1s叫做慢?比如说,你设置一个阈值,5s就是搜索的阈值,5s就叫做慢,那么一旦一个搜索请求超过了5s之后,就会记录一条慢搜索日志到日志文件中。

shard level的搜索慢查询日志,会将搜索性能较慢的查询写入一个专门的日志文件中。可以针对query phase和fetch phase单独设置慢查询的阈值,而具体的慢查询阈值设置如下所示:

 

在elasticsearch.yml中,设置

 

index.search.slowlog.threshold.query.warn:10s

index.search.slowlog.threshold.query.info:5s

index.search.slowlog.threshold.query.debug:2s

index.search.slowlog.threshold.query.trace:500ms

 

index.search.slowlog.threshold.fetch.warn:1s

index.search.slowlog.threshold.fetch.info:800ms

index.search.slowlog.threshold.fetch.debug:500ms

index.search.slowlog.threshold.fetch.trace:200ms

 

而慢查询日志具体的格式,都是在log4j2.properties中配置的,比如下面的配置:

 

appender.index_search_slowlog_rolling.type= RollingFile

appender.index_search_slowlog_rolling.name= index_search_slowlog_rolling

appender.index_search_slowlog_rolling.fileName= ${sys:es.logs}_index_search_slowlog.log

appender.index_search_slowlog_rolling.layout.type= PatternLayout

appender.index_search_slowlog_rolling.layout.pattern= [%d{ISO8601}][%-5p][%-25c] %.10000m%n

appender.index_search_slowlog_rolling.filePattern= ${sys:es.logs}_index_search_slowlog-%d{yyyy-MM-dd}.log

appender.index_search_slowlog_rolling.policies.type= Policies

appender.index_search_slowlog_rolling.policies.time.type= TimeBasedTriggeringPolicy

appender.index_search_slowlog_rolling.policies.time.interval= 1

appender.index_search_slowlog_rolling.policies.time.modulate= true

 

logger.index_search_slowlog_rolling.name =index.search.slowlog

logger.index_search_slowlog_rolling.level =trace

logger.index_search_slowlog_rolling.appenderRef.index_search_slowlog_rolling.ref= index_search_slowlog_rolling

logger.index_search_slowlog_rolling.additivity= false

 

索引慢写入日志

 

可以用如下的配置来设置索引写入慢日志的阈值:

 

index.indexing.slowlog.threshold.index.warn:10s

index.indexing.slowlog.threshold.index.info:5s

index.indexing.slowlog.threshold.index.debug:2s

index.indexing.slowlog.threshold.index.trace:500ms

index.indexing.slowlog.level:info

index.indexing.slowlog.source:1000

 

用下面的log4j2.properties配置就可以设置索引慢写入日志的格式:

 

appender.index_indexing_slowlog_rolling.type= RollingFile

appender.index_indexing_slowlog_rolling.name= index_indexing_slowlog_rolling

appender.index_indexing_slowlog_rolling.fileName= ${sys:es.logs}_index_indexing_slowlog.log

appender.index_indexing_slowlog_rolling.layout.type= PatternLayout

appender.index_indexing_slowlog_rolling.layout.pattern= [%d{ISO8601}][%-5p][%-25c] %marker%.10000m%n

appender.index_indexing_slowlog_rolling.filePattern= ${sys:es.logs}_index_indexing_slowlog-%d{yyyy-MM-dd}.log

appender.index_indexing_slowlog_rolling.policies.type= Policies

appender.index_indexing_slowlog_rolling.policies.time.type= TimeBasedTriggeringPolicy

appender.index_indexing_slowlog_rolling.policies.time.interval= 1

appender.index_indexing_slowlog_rolling.policies.time.modulate= true

 

logger.index_indexing_slowlog.name =index.indexing.slowlog.index

logger.index_indexing_slowlog.level = trace

logger.index_indexing_slowlog.appenderRef.index_indexing_slowlog_rolling.ref= index_indexing_slowlog_rolling

logger.index_indexing_slowlog.additivity =false

 

把这个东西记录好了以后,es集群运维管理员,就需要经常每天去看看,正常情况下,慢查询应该是比较少数的。所以比如你每天检查一次,如果发现某个查询特别慢,就要通知写这个查询的RD,开发人员,让他们去优化一下性能。


北京半月雨文化科技有限公司.版权所有 京ICP备12026184号-3