在日常使用 Linux 系统的过程中,你是否曾担心过硬盘突然损坏、CPU 过热或风扇失灵?其实,Linux 提供了多种强大的工具来帮助我们实时监控硬件的健康状态。本教程将手把手教你如何使用这些工具,即使是 Linux 小白也能轻松上手!
硬件是计算机运行的基础。一旦硬盘出现坏道、CPU 温度过高或电源不稳定,轻则系统卡顿,重则数据丢失甚至硬件报废。通过定期检查硬件状态,我们可以提前发现问题并采取措施,避免灾难性后果。
在 Linux 中,有两款非常实用的开源工具:
首先,我们需要安装这两个工具。以 Ubuntu/Debian 系统为例:
# 安装 smartctl(属于 smartmontools 包)sudo apt updatesudo apt install smartmontools# 安装 lm-sensorssudo apt install lm-sensors 安装完成后,运行以下命令自动检测传感器:
sudo sensors-detect 过程中会提示你是否启用各种模块,一般直接按回车选择默认“YES”即可。完成后,加载所需内核模块:
sudo service kmod start 首先查看你的硬盘设备名(通常是 /dev/sda、/dev/nvme0n1 等):
lsblk 然后检查硬盘的 S.M.A.R.T. 信息(以 /dev/sda 为例):
sudo smartctl -a /dev/sda 重点关注以下字段:
SMART overall-health self-assessment test result: PASSED 表示硬盘健康。Reallocated_Sector_Ct、Pending_Sectors 等数值不为 0,说明硬盘已有坏道,需警惕。直接运行以下命令即可查看当前传感器数据:
sensors 输出类似:
coretemp-isa-0000Adapter: ISA adapterPackage id 0: +52.0°C (high = +80.0°C, crit = +100.0°C)Core 0: +48.0°CCore 1: +50.0°Cacpitz-acpi-0Adapter: ACPI interfacetemp1: +27.8°C (crit = +119.0°C) 正常情况下,CPU 温度在 30–70°C 之间(视负载而定)。若长期超过 80°C,建议清理风扇或改善散热。
你可以将上述命令加入定时任务(cron),定期检查并邮件通知。例如,每天凌晨 2 点检查硬盘状态:
crontab -e# 添加一行:0 2 * * * /usr/sbin/smartctl -H /dev/sda | mail -s "Disk Health Report" your@email.com 通过 smartctl命令 和 lm-sensors工具,我们可以轻松实现对 Linux 系统硬件的全面监控。定期检查不仅能延长设备寿命,还能保护宝贵的数据安全。现在就动手试试吧,让你的 Linux 系统更稳定、更可靠!
小贴士:如果你使用的是服务器或 NAS,建议搭配 Grafana + Prometheus 实现可视化监控,效果更佳!
本文由主机测评网于2025-11-27发表在主机测评网_免费VPS_免费云服务器_免费独立服务器,如有疑问,请联系我们。
本文链接:https://vpshk.cn/202511838.html