对于磁盘有个iops的概念比较奇怪,想监控起来看下,利用zabbix的自动发现把每个磁盘的iops监控起来,思路:自动发现所有的磁盘,然后监控各个磁盘的iops。效果如下图(iops和io读写大小),
对于磁盘有个iops的概念比较奇怪,想监控起来看下,利用zabbix的自动发现把每个磁盘的iops监控起来,思路:自动发现所有的磁盘,然后监控各个磁盘的iops。效果如下图(iops和io读写大小),下图监控的磁盘是个sdd的,iops今天监控起来后峰值有30k:
思路分为两步,第一个,自动发现列出所有磁盘。第二个,监控每个磁盘的iops情况。
第一个实现如下:
先看一下自动发现脚本,使用python编写,利用linux的/proc/diskstats记得 的磁盘信息发现所有的磁盘。脚本如下:cat /usr/local/zabbix/discover_disk.py
#coding:utf-8try: import jsonexcept: import simplejson as jsonimport commands(status, output) = commands.getstatusoutput('''cat /proc/diskstats |awk '{print $3}'|egrep 'sd|vd|hd'|egrep -v '[0-9]'|sort -u''')if output: outputs = output.split('/n') disks = [] for disk in outputs: disks += [{'{#DISKONE}': disk}] print json.dumps({'data':disks},sort_keys=True,indent=4)else: print 'discovery error'
运行结果如下(此机器上有两个磁盘):
第二步,监控磁盘的iops,利用linux的/proc/diskstats的第四个字段和第八字段可监控读和写的iops,第四个记录是记录所有读的次数,第八个字段是记录所有写的次数。通过zabbix上的差速率即可监控磁盘的iops。脚本如下:cat /usr/local/zabbix/check_disk.sh。脚本中-d后面跟磁盘名称,-o后面跟需要读取的磁盘的信息。(第六个字段和第十个字段分别代表读的扇区和写的扇区,*512就为读写的Byte了,通过这两个字段可监控磁盘的io读写量)
#!/bin/sh# 8 0 sda 76880282531 8117316 937263519846 4237854729 62989000438 35668103347 777694636224 1190396494 3 2895102137 899093508while getopts "d:o:" optdo case $opt in d ) disk=$OPTARG;; o ) option=$OPTARG;; ? ) echo 'parameter is wrong!' exit 1;; esacdoneif [ ! "${disk}" ] || [ ! "${option}" ];then echo "parameter is null" exit 1fiif [[ ${option} == "read" ]];then cat /proc/diskstats |grep "${disk} "|awk '{print $6}'elif [[ ${option} == "write" ]];then cat /proc/diskstats |grep "${disk} "|awk '{print $10}'elif [[ ${option} == "readops" ]];then cat /proc/diskstats |grep "${disk} "|awk '{print $4}'elif [[ ${option} == "writeops" ]];then cat /proc/diskstats |grep "${disk} "|awk '{print $8}'elif [[ ${option} == "readtime" ]];then cat /proc/diskstats |grep "${disk} "|awk '{print $7}'elif [[ ${option} == "writetime" ]];then cat /proc/diskstats |grep "${disk} "|awk '{print $11}'fi
脚本运行结果如下:
两步写好后,zabbix agent加入如下配置,加完后重启zabbix,配置如下:
cat /usr/local/zabbix/etc/zabbix_agentd.conf.d/disk.conf
UserParameter=disk.discover,python /usr/local/zabbix/discover_disk.py
UserParameter=disk.status[*],sh /usr/local/zabbix/check_disk.sh -d $1 -o $2
加入好后在zabbix server运行检测一下,自动发现结果如下:
监控磁盘的结果如下:
以上都测试没问题就可以在zabbix的页面上添加自动发现规则了。可以新建个模板,发现规则截图如下:
自动发现发现所有的磁盘,发现后就要项目原型进行监控磁盘的iops了 ,{#DISKONE}代表每个磁盘。监控的项目配置如下:
把自动发现模板应用到主机后,监控的项目如下: