IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> 记录一次kibana无日志的问题排查过程 -> 正文阅读

[大数据]记录一次kibana无日志的问题排查过程

前言

此前对于ELK问题接触较少,所以在问题排查阶段的动作相对较慢。所以希望记录此日志给以后遇到同类型问题时,提供一定的参考作用。帮助自己以后快速定位问题打下基础。

也希望给大家遇到自己不一样的问题时,提供一定的排查思路。


问题描述:

背景:

? ? ? ? 生产环境部署了ELK。kibana开放给开发人员,方便排查生产问题,查看服务日志。但是最近开发人员总是反馈日志“延迟”时间过长。经常好几个小时都无法查看到日志。

? ? ? ? 根据开发人员反馈的“延迟”现象,进行问题复现时的排查。

确定排查问题:

? ? ? ? “日志收集延迟”


问题排查&分析:

Q1:开发反馈的“延迟”现象,是否确实属于日志收集延迟?

观察现象:由于是微服务,所以kibana收集了很多服务的。在问题复现时,通过观察其他服务的日志,没有发现日志有延迟的现象。

得出小结论1:开发反馈的日志“延迟”现象,只是出现在一个微服务上。其他服务并没有出现一样的问题。所以不一定是ELK组件出现性能问题导致延迟。ELK组件性能是否存在问题需要进一步验证。

Q2:验证ELK组件是否有性能问题?

1.同一时刻其他微服务没有日志延迟现象。所以ELK组件性能问题怀疑的可能性不高。

2.问题复现时。通过观察和业务反馈。日志有长达4小时的内容没有在kibana展示。如果只是的性能问题,日志消费延迟4小时时间太久,不太可能有这么严重的性能问题。

3.kibana监控限制elasticsearch、logstash、kibana的性能没有明显问题。

得出小结论2: ELK没有明显的性能瓶颈的现象,导致可能会出现的4小时日志延迟现象。所以有没有可能ELK组件中的elasticsearch和logstash在问题发生时出现不可写入的现象,kibana在问题发生时是否有不可展示日志现象。

Q3:ELK组件在问题发生时是否有不可写入或不可展示问题?

?1.验证是否是ES有数据但是kibana为展示?

可通过es插件或者kibana的dev tools进行es的查询

示例

GET deployment_2021.07.19/_search

{
    "query": {
        "bool": {
            "must": [
                {"match" : {"applicationName" : "csc-oim-service-imgovs"}},
                {"match" : {"@timestamp" : "2021-07-19T09:00:00.000Z"}}
            ]
        }   
    }
}

经排查,出现问题的时间段(kibana未有日志展示的时间段),elasticsearch也未插叙到有日志数据。所以不是es有数据,但kibana为展示的情况。

2.是否是elasticsearch不可写入数据?

POST请求格式: index_name/type?

POST deployment_2021.07.25/tcp

{
  "applicationName": "apptest",
  "message": "20210725test",
  "@timestamp": "2021-07-25T11:50:00.000Z"
}

通过kibana查询新插入的数据

关于时间戳的小提示:

1.时间戳结尾的Z是标识时区zero时区(UTC偏移0)

2.kibana的容器时区为东八区,所以展示的时候会自动+8

3.时间戳的T不代表什么。就只是一个默认的分隔符

ps:在问题复现时,通过POST给对应的微服务手动写入过日志信息。elasticsearch可以正常查询到文档。Kibana也能正常展示信息。

目前为止,排除了elasticsearch和kibana的问题

Q4:是否是logstash无法写入数据?

我们的logstash用法不是常规的去读取日志文件然后写入elasticsearch。而实通过input tcp组件,通过服务主动向logstash 9250端口推送日志,然后logstash 通过output elasticsearch写到es。

虽然所有服务都是发送到同一个logstash,且其他服务在问题复现时可以正常推送日志,基本可以排除logstash出现问题。但是为追求严谨,还是验证一下logstash的写入是否正常。

通过nc命令向logstash tcp端口写入数据。(由于是tcp端口,nc命令成功后不会断开,需要手动断开)

echo "\"applicationName\": \"apptest\",\"@timestamp\": \"2021-07-22T15:00:00.001Z\",\"message\": \"xxxxx\"" | nc 172.24.27.205 32529

?ps:32529端口映射了logstash的9250端口。

(logstash部分的实际问题排查,在等待问题复现从而进行验证。实际记录有待补充......)


解决方案:

待补充

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2021-07-26 12:08:54  更:2021-07-26 12:09:44 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年4日历 -2024/4/23 23:18:37-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码