December 2017

Uncategorized

zabbix从听说到学会

一、zabbix简介 zabbix(音同 zæbix)是一个基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。 zabbix能监视各种网络参数,保证服务器系统的安全运营;并提供灵活的通知机制以让系统管理员快速定位/解决存在的各种问题。 zabbix由2部分构成,zabbix server与可选组件zabbix agent。 zabbix server可以通过SNMP,zabbix agent,ping,端口监视等方法提供对远程服务器/网络状态的监视,数据收集等功能,它可以运行在Linux,Solaris,HP-UX,AIX,Free BSD,Open BSD,OS X等平台上。 二、zabbix安装使用 zabbix agent需要安装在被监视的目标服务器上,它主要完成对硬件信息或与操作系统有关的内存,CPU等信息的收集。zabbix agent可以运行在Linux,Solaris,HP-UX,AIX,Free BSD,Open BSD, OS […]

Uncategorized

分布式监控Zabbix初入

Why Moniter 首先我们聊聊为什么需要监控? 在SRE Google运维解密中指出,监控一个系统有多个原因: 分析长期的趋势,如每日活动用户的数量增长的速度 跨时间范围的比较/或是观察实验组和控制组的区别,如随着新系统的上线,memcache的缓存率是否增加?网站是否比上周的速度慢 报警,这个很容易理解,如我们的物理内存即将耗尽,到达50%发送一个级别较低的告警信息,当内存只剩下20%发送一个级别更高的告警信息 构建监控台页面,更加方便的对系统问题直观考察 临时性的回溯分析/在线调试 众所周知,无论公司有多大,我们都需要一套监控系统来保障业务的正常运行,快速发现问题并解决问题是运维存在的价值,只有在问题出现之前将问题提前解决,才能体现出运维的更高的价值,这就需要一个完整的监控系统。 监控系统说白了最重要的是让我们透过现象看本质,所谓现象就是什么东西故障了或存在故障的可能性,以及为什么出现故障。 比如,现象:服务器响应很慢?本质:CPU被某个复杂度很高的程序跑满,数据库/web连接数过大典型如TIME-WAIT 一个好的监控系统就像信道一样,要有很高的信噪比才行,我们要更多的可用有价值的信息,才能帮助我们进行故障排查,运维不背锅 介绍 Zabbix是由Alexei Vladishev开发的一种网络监视、管理系统,和常用的其他软件架构类似,其是一种基于C/S(client/server)结构的开源软件 Zabbix是一种可以监控系统/网络等基础设施的服务软件,其可以采集一些性能指标数据,它不仅为运维人员原生提供了一系列科学通用的监控选项,也支持ops自定义我们更加感兴趣的一些性能指标。也就是说,zabbix可以解放我们自己动手去关注采集一系列的信息,从而降低了运维成本,针对不同的业务环境,zabbix官方也提供了对应的推荐的模板可供使用 zabbix server可以将我们感兴趣的数据进行采集并存储到RDBMS中,如常用的MySQL。这些数据可以供我们后期对业务数据进行分析,便于后期的故障回溯、容量规划等考量

Scroll to Top