我觉得一个服务器的监控可以包括的内容比较多:
- 状态的监控
- 硬件状态
- 操作系统状态
- 应用的状态
- os性能的监控
- CPU性能
- 内存性能
- 网络性能
- 存储性能
- 应用性能监控
- 数据库
- 中间件
- 其他…
对于Linux系统来说可能关注最多的就是性能的监控了,还有部分状态的监控也可以获得。
1. 监控的内容
涉及到Linux的性能问题,真的是超级复杂的。Linux的监控和UNIX还是很相似的,CPU、内存、网络和io四个方面相互关联又相互影响。当一个操作系统出现性能问题的时候,需要综合判断才能得出哪里除了问题。
- CPU、MEM、Network、IO:出现性能问题主要考虑这四个方面;
- IPMI:硬件管理,但是可以通过它在操作系统层来获得硬件的一些实时信息;
2. 监控的方法
2.1 命令行
最简单的方法或者最直接的方法就是通过命令行获得实时信息。
2.1.1 实时信息
下面是一些Linux自带的命令:
- top命令:
- vmstat命令:
- iostat命令
- sar命令
下面是一些更人性化的命令:
- htop
2.1.2 统计性能
- nmon