Nagios是一款用于监控系统运行状况与网络信息的工具,能够对指定的本地或远程主机及服务进行实时监测,并具备故障告警功能。该系统可在Linux和Unix平台上运行,支持通过可选的基于浏览器的Web界面,方便管理员直观查看网络运行状态、各类系统问题及日志信息,实现高效便捷的运维管理。
1、 配置安装环境,搭建Apache与PHP运行平台。
2、 首先创建一个名为nagios的用户并设置登录密码,同时建立一个名为nagcmd的用户组,以便通过Web界面进行访问。随后,将nagios用户和apache用户均添加至该用户组中,确保权限正常分配与协作。
3、 现在开始解压并安装Nagios源码包,安装过程中务必避免出现错误,否则后续排查问题将十分麻烦,请仔细操作确保每一步正确无误。
4、 配置WEB接口:安装过程中已将nagios.conf配置文件放置于/etc/httpd/conf.d/目录,打开该文件可发现其定义了两个别名路径,并启用了基于用户账户的身份验证机制,以实现对Web页面访问权限的控制,确保只有授权用户才能进入管理界面。
5、 应创建一个专用于Nagios网页登录的用户,妥善保管所设密码,后续步骤将用到。完成后需重启Apache服务以确保配置生效。
6、 将Nagios安装在/usr/local/nagios目录后,可进行基本配置以实现对本机的监控。该目录下包含多个关键子目录:bin目录中存放了用于检查主配置文件nagios.cfg语法是否正确的核心命令,确保配置无误;libexec目录用于存储所有监控脚本和插件命令,但需先安装nagios-plugins扩展包才能获得完整的检测功能;share目录是Nagios的Web界面所在路径,用户通过浏览器访问此目录查看监控状态和告警信息;var目录则用于保存Nagios运行过程中生成的日志、进程文件等动态数据。完成初步配置后,可通过执行相关命令验证配置文件的正确性,并启动服务,使Nagios开始对本机各项指标进行监控,及时发现系统异常。整个结构清晰,便于维护和扩展。
7、 安装Nagios插件,解压并编译后进行安装。
8、 插件安装后,会在/usr/local/nagios/libexec目录下生成大量类似check_http的监控命令,用于系统监测与管理,提升运维效率。
9、 启动Nagios服务,并将其添加至系统服务,实现开机自启。
10、 检查Nagios示例配置文件的正确性,确保无误后再启动服务。
11、 若无错误提示,即可启动Nagios服务。
12、 进入网页接口
13、 现在可通过WEB方式访问Nagios的Web接口,按照提示输入用户名nagiosadmin及之前设置的密码即可登录。请使用系统默认安装的浏览器,并点击下方超链接进入管理界面,完成后续操作。
14、 点击服务详情链接可查看本机监控信息。由于检测需耗时,建议稍等片刻,以便Nagios完成对您设备上依赖服务的检查。
15、 该页面用于监控服务器,正常情况下仅显示localhost主机的信息。
16、 服务通知级别包括:w-警告,u-未知,c-严重,r-恢复。
17、 主机通知设置:d表示宕机,u表示无法访问,r表示恢复。
18、 NRPE安装与配置方法
19、 NRPE是nagios的插件,部署在被监控服务器上,用于采集本地系统信息并发送至nagios平台,可监测CPU使用率、内存占用、磁盘空间等关键指标,实现对服务器运行状态的实时监控与管理。
20、 在Nagios监控服务器上部署NRPE插件以实现远程监控功能。
21、 安装成功后,可在/.../nagios/libexec目录下找到名为check_nrpe的插件。接下来需在监控平台中定义一条可用命令,该定义通常位于/.../nagios/etc/commands.cfg配置文件中。具体操作为:在commands.cfg文件内添加相应的命令配置内容,以便系统识别并调用该插件,实现远程监控功能。
22、 }
23、 定义服务时可直接调用该命令,例如:
24、 ...
25、 该示例用于监控远程主机服务器的CPU负载状况。
26、 在被监控服务器上安装NRPE的步骤与配置方法。
27、 需准备NRPE和nagios-plugin两个包,安装时先部署插件。
28、 接着安装NRPE插件
29、 安装完成后,进入 /usr/local/nagios/ 目录查看,应生成 bin、etc、libexec 和 share 四个子目录。接下来需进行配置,使 NRPE 能以守护进程方式运行,监听 5666 端口,并仅对指定 IP 地址的 Nagios 服务器提供服务,确保通信安全与稳定。
30、 首先需编辑 /usr/local/nagios/etc/nrpe.cfg 配置文件,确保参数设置正确以支持后续监控功能。
31、 将配置文件中的allowed_hosts=127.0.0.1修改为allowed_hosts=127.0.0.1,\$Nagios监控平台的地址或域名,以允许指定地址访问服务,确保监控平台能够正常连接并获取相关数据信息。
32、 启动NRPE守护进程,并建议将命令添加至/etc/rc.local文件,实现开机自动运行。
33、 该命令执行后产生的日志将记录在系统日志文件(/var/log/message)中。若运行过程中未出现错误,说明配置基本完成。接下来进行验证:可在本机执行命令/usr/local/nagios/libexec/check_nrpe -H 127.0.0.1进行测试,也可登录到nagios监控服务器上运行相同指令,确认通信是否正常,服务是否响应正确,从而确保NRPE组件已成功部署并可被远程调用。
34、 通过NRPE检测脚本连接目标主机,执行远程监控命令,检查系统状态与服务运行情况,确保主机健康稳定。
35、 返回值为被监控服务器上NRPE的版本号信息。
36、 若能看到这些信息,说明你的NRPE已安装成功。
37、 通过NRPE,可以监控被监控服务器上的各类信息。只要服务器上安装了相应的插件(位于/usr/local/nagios/libexec目录中),便可调用执行。换句话说,只要有合适的插件支持,任何需要监控的内容都能通过NRPE实现,灵活性强,适用范围广。
38、 在被监控端的 nrpe.cfg 配置文件中,存在如下设置内容。
39、 用于检测处理器工作负荷的工具。
