有疑问,请拨打我们的联系电话:0523-86891000 网站首页

基于Cacti和Nagios的IP城域网数通网管系统的实现

2018-04-25 10:13:26 来源:凤城泰州网

周 昊


摘 要:随着城域网规模不断扩大,对网络设备的统一管理越来越重要。本文以江苏有线泰州分公司IP城域网为研究对象,基于Cacti和Nagios的IP城域网数通网管系统。借助网管系统,以技术和管理手段指导网络扩容建设,为业务的有序开展提供强有力的技术支撑。

关键词:Cacti;Nagios;IP城域网;网管

一、项目背景

江苏有线泰州分公司于2008年开始组建IP城域网,经过多年发展,已全部覆盖全市的核心集群和乡镇广电站。网络设备包括大量的服务器、核心交换机、汇聚接入交换机、EPON和安全设备。然而随着网络规模不断扩大,维护人员仍利用telnet及MRTG等简单工具监控管理城域网。为了提高网络的管理和维护能力,从降低IT运维成本、完善故障预警机制的角度,我们发现,cacti和Nagios两款软件很符合IP城域网的特性,在此基础上进行整合和二次开发,构建自有的IP城域网监控系统。

二、IP城域网数通网管系统介绍

1.Cacti和Nagios工具介绍

Cacti和Nagios都是开放式的开源网络管理工具,两者各有优势。Cacti集成了各种数据收集功能,着重于直观数据的监控,易于生成图形,偏重于网络流量、cpu使用率、硬盘使用率等系统负载方面的监控;Nagios则注重于主机和服务的监控,拥有强大的发送报警信息的功能。把两者整合在一起,既可以使报警机制高效及时,又能很容易地查看各项数据的情况。

2.IP城域网数通网管系统的架构

IP城域网数通网管系统是一套基于PHP、MySQL、RRDtool及SNMP开发的网络流量检测图形分析系统。网管系统通过SNMP-get获取数据,使用RRDtool绘制图形。

数通网管系统按模块化和组件技术进行分层,总分为数据采集、数据存储和数据展现的三层架构体系。(如图1所示)

图1:IP城域网数通网管系统框架

数通网管系统拥有四个主要组件,包括:数通网管系统WEB界面(PHP)、SNMP采集工具、RRDtool绘画引擎和MySQL数据库。(如图2所示)

图2:数通网管系统主要组件

网管系统会定时运行数据采集脚本,使用SNMPGET命令或其他自定义的方式进行数据采集;使用RRDtool的UPDATE命令指定将采集到的数据储存到MySQL的RRA文件中;在数通网管系统的PHP界面寻找该设备对应的RRA文件的名称,利用RRDtool进行图表绘制。

三、Cacti和Nagios在数通网管系统中的应用

受限于篇幅,具体的安装步骤不作过多阐述,我们着重介绍利用Cacti和Nagios搭建的数通网管系统主要功能的实现。数通网管系统有几项重要的功能,包括“图形”“阈值”“NPC”“监视器”“拓扑图”等。

“图形”功能:可按照设备类型、名称查询网络设备的相关端口流量,包括端口每小时、每天、每星期、每月、每年的流量视图。(如图3、图4所示)

图3:网络设备端口24小时流量图

图4:网络设备端口7天流量图

“阈值”功能:当被监控设备的端口流量触发设定阈值时,网管系统将详细显示出告警设备、设定阈值、相应端口及其当前流量信息。与此同时,设定接受报警的邮箱收到网管系统发来的告警通知;当被监控设备的端口流量恢复至阈值设置的范围内后,系统发送恢复信息邮件。

“监视器”视图:根据设备运行状态,显示不同颜色图例,让运维人员对所有被监控设备的状态一目了然。对于异常状态的主机,系统发送告警信息邮件。

“NPC”功能:数通网管系统将Cacti和Nagios利用NPC插件联系起来,登录数通网管系统后,通过NPC插件可看到Nagios里监控的相关服务的状态,方便用户访问查询。

“拓扑图”功能:可以查看数通设备整体组网架构,以及设备链路间的流量负载情况。

四、结束语

IP城域网数通网管系统的建设,能够帮助江苏有线泰州分公司有效提高网络运行维护的质量,提高运维人员的工作效率,进而提升对最终用户的服务水平,同时,提高网络资源利用率,增强公司综合竞争力。

参考文献:

[1] 刘钊.Cacti实战.第一版[M].北京:机械出版社,2015

[2] Dinangkur Kundu.Cacti 0.8 Network Monitoring.第一版[M].美国:Packt Publishing,2009

[3] Cacti官网.Cacti官方文档[EB/OL].[2017-7-14].https://www.cacti.net/documentation.php

(作者单位:江苏有线泰州分公司)