当前位置：首页 > Centos > 正文

Centos告警规则配置（手把手教你设置Linux系统监控告警）

主机测评网
Centos
2025-12-19
610

在运维工作中，及时发现服务器异常至关重要。通过合理配置Centos告警规则配置，我们可以在系统资源使用过高、服务宕机或磁盘空间不足时第一时间收到通知，从而快速响应问题，保障业务稳定运行。本文将从零开始，详细讲解如何在CentOS系统中设置基础的监控与告警规则，适合运维新手和有一定经验的用户。

Centos告警规则配置（手把手教你设置Linux系统监控告警） Centos告警规则配置 Centos监控告警系统告警设置 Linux告警规则第1张

一、为什么需要配置Centos监控告警？

随着服务器数量增加，手动检查每台机器的状态既低效又容易遗漏。通过Centos监控告警机制，系统可以自动检测关键指标（如CPU、内存、磁盘、网络、服务状态等），并在异常发生时通过邮件、短信或消息工具通知管理员。

二、准备工作

本教程以 CentOS 7/8 为例，假设你已具备以下条件：

拥有 root 或 sudo 权限的用户账号
系统已联网，可安装软件包
已配置好邮件服务（如 sendmail 或 Postfix），用于发送告警通知

三、使用 Shell 脚本实现简单告警

对于小型环境，我们可以编写一个简单的 Shell 脚本来监控磁盘使用率，并在超过阈值时发送邮件。

创建脚本文件 disk_alert.sh：

#!/bin/bash# 设置磁盘使用率阈值（百分比）THRESHOLD=85# 获取根分区使用率（去掉%符号）USAGE=$(df / | awk 'NR==2 {print $5}' | sed 's/%//')# 判断是否超过阈值if [ "$USAGE" -gt "$THRESHOLD" ]; then    echo "警告：根分区磁盘使用率已达到 ${USAGE}%！" | \    mail -s "[告警] CentOS 磁盘空间不足" your_email@example.comfi

赋予执行权限并测试：

chmod +x disk_alert.sh./disk_alert.sh

最后，将脚本加入 crontab 定时任务，每小时检查一次：

crontab -e# 添加以下行0 * * * * /path/to/disk_alert.sh

四、使用 Prometheus + Alertmanager（进阶方案）

对于更复杂的监控需求，推荐使用开源监控系统 Prometheus 配合 Alertmanager 实现强大的系统告警设置功能。

1. 安装 Node Exporter（用于采集系统指标）：

wget https://github.com/prometheus/node_exporter/releases/download/v1.6.1/node_exporter-1.6.1.linux-amd64.tar.gztar xvfz node_exporter-*.tar.gzcd node_exporter-*./node_exporter &

2. 在 Prometheus 的配置文件 prometheus.yml 中添加目标：

scrape_configs:  - job_name: 'centos-node'    static_configs:      - targets: ['localhost:9100']

3. 配置 Alertmanager 告警规则（例如 CPU 使用率持续高于 90%）：

groups:- name: system-alerts  rules:  - alert: HighCpuUsage    expr: 100 - (avg by (instance) (irate(node_cpu_seconds_total{mode="idle"}[5m])) * 100) > 90    for: 5m    labels:      severity: warning    annotations:      summary: "High CPU usage on {{ $labels.instance }}"      description: "CPU usage is above 90% for more than 5 minutes."

这种方式能实现更灵活、可扩展的Linux告警规则管理，适用于生产环境。