**监控:**需要针对操作系统、中间件、数据库、应用等进行监控;每种类型的监控尽量指标全面 操作系统:CPU利用率、内存利用率、磁盘I/O、网络I/O,内核参数
一、CPU 主要关注CPU利用率和CPU负载 1.CPU利用率:显示的是程序在运行期间实际占用的CPU时间百分比 2.CPU负载:显示的是一段时间内正在使用和等待使用CPU的平均任务数
CPU利用率包括4种状态:User态、Sys态、Wait态、Idle态 us:用户进程执行时间百分比;us值比较高时,说明用户进程消耗的CPU时间多,但是如果长期超过50%的使用,就该考虑优化程序算法或进行加速 sys:内核系统进程执行时间百分比;sy的值越高,说明系统内核消耗的CPU资源多,需要及时排除原因 wa:IO等待时间百分比;wa的值高时,说明IO等待比较严重;这可能由于磁盘大量做随机访问造成,也可能是磁盘出现瓶颈
监控工具: 1.vmstat命令:只能查看整体CPU使用情况(命令:vmstat 1) 2.mpstat命令:查看所有CPU统计信息(命令:mpstat -p ALL 2)
五、内核参数 1.netstat命令:用来打印Linux中网络系统的状态信息, 2.ulimit命令:用于shell启动进程所占用的资源,可用于修改系统资源限制
二、内存 1.free命令:(命令:free -h) 参数说明: used:表示已使用多少 free:表示可用内存多少 shared:表示多个进程共享的内存总额 cached:表示程序实实在在吃掉的内存
三、磁盘I/O 1.iostat命令;(用法:iostat -d -k 1 10) 参数说明: -d:显示设备(磁盘)使用状态 -k:表示某些使用block为单位的列强制使用Kilobytes为单位 1 10表示:数据每隔1秒刷新一次,共显示10次
四、网络I/O nload工具; 用途:用来即时监控网络状态和各IP所使用的频宽 nload默认分为上下俩块: 上半部分:Incoding也就是进入网卡的流量 下半部分:Outgoing,也就是从这块网卡出去的流量
每部分都有当前流量(Curr);平均流量(Avg);最小流量(Min);最大流量(Max);总和流量(Tal)
|