首先说明一下,Prometheus是对服务器基础硬件指标进行采集以及程序指标进行采集,Grafana是对指标进行展示(Prometheus当然也可以进行监控指标的展示,但是界面不是很友好,Grafana是专门展示监控数据的一个软件平台)。这里没有讲解报警对接的逻辑,后续有在补充一下。
1、普米监控整体结构说明
2、普米监控系统采集的监控指标储存在tsdb数据库上,普米系统采集被监控服务器数据有两种方式: 第一种:被监控服务器上部署node-export节点探针,普米服务器通过被监控服务器9100端口进行主动拉取数据 第二种:被监控服务器上部署对应程序探针,对相应程序进行采集数据,推送到普米服务器上pushgateway组件的9091端口,普米服务器然后对此组件进行拉取数据到本身tsdb数据库上
?
?3、普米服务监控运维启动命令
普米服务启动命令
????????3.1、普米服务: nohup ./prometheus --config.file=prometheus.yml > ./prometheus.log 2>&1 & ????????3.2、pushgateway服务: nohup ./pushgateway --web.listen-address :9091 > ./pushgateway.log 2>&1 & ????????3.3、告警服务altermanager服务: nohup ./alertmanager --config.file=alertmanager.yml > ./alertmanager.log 2>&1 & ? ? ? ? 3.4、Grafana启动: nohup ./grafana-server web > ./grafana.log 2>&1 &
?4、普米查询语言promQL
1、查询总请求数: prometheus_http_requests_total{code=”302”}[5s] prometheus_http_requests_total{} offset 5m prometheus_http_requests_total{} offset 1d
?
|