你要是运维开发,那这5款不用图形界面的监控工具绝对得赶紧收起来。别以为后台看不见就没事,哪怕 CPU 不高或者网络红线报警了,你也抓不住真凶。只有第一时间拿到那些原始、实时、能查的数字,业务雪崩才能被及时拦住。这些工具都是无 GUI 安装的,脚本跑一遍就能上线,妥妥的省心透视眼。 先说说 iotop,这玩意儿专治磁盘 I/O 拖后腿的。服务卡顿的时候,top 只能给个百分比的虚头巴脑数据,而 iotop 像是拿显微镜看进程的 IOPS 排名,谁疯狂写日志、谁缓存被打穿都逃不过它的法眼。虽然它不太适合干基准测试的活,但生产环境实时刷新的速度那是相当给力。要是再配上 htop 或者 top 横着看 CPU、内存、I/O 这三方面的数据,不出 30 秒你就能知道到底是哪个货在拖后腿。 然后是 htop,比起 top 那种黑白文字报表简直太直观了。每个 CPU 核的使用率是用水平条形图显示的,内存压力也会根据颜色深浅自动分级高亮显示。最爽的是“瞬间定位”的功能,打开 htop 一看那块红色区域没跑了肯定是核心炸了。轻量又没依赖,就算是 2G 内存的老旧服务器跑起来也很流畅。 再来聊聊 IPTraf,这就是个菜单驱动的网络流量放大镜。你想知道哪个端口在狂吞带宽吗?把接口、协议、端口拆成菜单选项用光标键就能一级级往下钻看个底朝天。更妙的是它的“包大小统计”功能,流量按字节段切开后,那种攻击者常用的异常大包小包模式立马就露馅了。跟 Wireshark 那庞然大物比起来,IPTraf 小到能塞进 U 盘里直接插到任何 Linux 服务器上就能用。 接下来是 Monit,它的强项可不是光会报警那么简单。你可以把规则设定得很聪明:哪怕服务崩溃了它也能自动重启一次只算偶然失误;只有连续五次重启才发警报,并且还能同步把消息发在 Slack 或者 PagerDuty 上。它监控的对象也不光是进程这么简单,文件状态、端口情况、系统负载都能被纳入阈值管理;配好之后基本不需要人工去管它重启的事。 最后做个小结:这些工具就是把异常数据变成能执行的判断的放大镜。只要把 iotop、htop、IPTraf、Monit 按不同场景组合起来用,CPU、内存、磁盘、网络这四维的监控闭环就建好了。下一次服务抖动的时候你不用再瞎猜了,数字会告诉你到底谁在裸奔、哪里要爆盘、该在什么时候报警才行。