top命令动态地监视进程活动与系统负载等信息.
使用示例:
效果如下图:
以上命令输出视图中分为两个区域,一个统计信息区,一个进程信息区.
统计信息区:
第二行信息依次为:进程总数、运行中的进程数、睡眠中的进程数、停止的进程数、僵死的进程数.
第三行信息依次为:用户占用资源百分比、系统内核占用资源百分比、改变过优先级的进程资源百分比、空闲的资源百分比等.
第四行信息依次为:物理内存总量、内存使用量、内存空闲量、作为内核缓存的内存量.
第五行信息依次为:虚拟内存总量、虚拟内存使用量、虚拟内存空闲量、预加载内存量.
进程信息区:
按 q 键退出监控页面.
uptime 用于查看系统的负载信息.
查看系统的负载信息.
输出说明:
当前用户数:1 users
free用于显示当前系统中内存的使用量信息.
命令语法: free [-bkmotV][-s 间隔秒数]
参数说明:
显示当前系统中内存的使用量信息.
ifconfig命令用于获取网卡配置与网络状态等信息.
获取网卡配置与网络状态等信息.
第一部分的第一行显示网卡状态信息.
eth0表示第一块网卡.
UP代表网卡开启状态.
RUNNING代表网卡的网线被接上.
MULTICAST表示支持组播.
第二行显示网卡的网络信息.
RX表示接收数据包的情况,TX表示发送数据包的情况.
Linux 系统中―/proc‖是个伪文件目录,不占用系统空间,及时的反应出内存现在使用的进程情况......其中许多文件都保存系统运行状态和相关信息对于―/proc‖中文件可使用文件查看命令浏览其内容,文件中包含系统特定信息:
cpuinfo 主机CPU 信息
filesystems 文件系统信息
meninfo 主机内存信息
version Linux 内存版本信息
diskstatus 磁盘负载情况
另外top 命令可以动态的显示当前系统进程用户的使用情况,而且是动态的显示出来,尤其是在该命令显示出来的对上方对系统的情况进行汇总.
free 命令呢可以查看真实使用的内存 一般用free -m
使用lsof 、ps -aux 可以查看详细的每个进程的使用状况
dmesg 也是常用来查看系统性能的命令
用 netstat 查看 Linux 网络状况.
netstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}'
前面的 netstat -n是netstat的命令,Windows和Linux都可以用,结果显示内容差不多
后面的 awk'/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}' 是Linux下的命令,主要作用是对netstat输出的结果进行过滤和处理:
运行这一句之后,显示的结果类似如下:
内容解释如下:
TIME-WAIT:等待足够的时间以确保远程TCP接收到连接中断请求的确认
FIN-WAIT-1:等待远程TCP连接中断请求,或先前的连接中断请求的确认
ESTABLISHED:代表一个打开的连接
SYN-RECV:再收到和发送一个连接请求后等待对方对连接请求的确认
SYN-SENT:再发送连接请求后等待匹配的连接请求
CLOSING:等待远程TCP对连接中断的确认
CLOSED:没有任何连接状态
CLOSE-WAIT:等待从本地用户发来的连接中断请求
LAST-ACK:等待原来的发向远程TCP的连接中断请求的确认
LISTEN:侦听来自远方的TCP端口的连接请求
打开终端
用top命令查看.输入:
top?#查看swap
iostat?-x?1?10#查看%util?%idle
#如果?iostat?没有要?yum?install?sysstat
#如果你想对硬盘做一个IO负荷的压力测试可以用如下命令
欢迎追问
uptime内容显示的内容一次是系统时间,开机到现在的天数,用户登录数,以及平均负载.
核心是平均负载,其实就是【单位时间内的活跃进程数】.
①.分钟:10.00 #CPU处理进程1分钟的繁忙程度,忙碌1分钟.
uptime:故障恢复了.
①.分钟:1.00 #CPU处理进程1分钟的繁忙程度,忙碌1分钟.
==============================================
==================要掌握的============================
①平均负载是运行队列中活跃的进程数.
面试官问:
你在工作中遇到过哪些生产故障,是怎么解决的?
最好和数据库相关(负载高),和web相关(PHP进程100%,JAVA内存泄漏)
下面,我们以三个示例分别来看这三种情况,并用 stress、mpstat、pidstat 等工具,找出平均负载升高的根源.
stress 是 Linux 系统压力测试工具,这里我们用作异常进程模拟平均负载升高的场景.
mpstat 是多核 CPU 性能分析工具,用来实时查看每个 CPU 的性能指标,以及所有 CPU 的平均指标.
pidstat 是一个常用的进程性能分析工具,用来实时查看进程的 CPU、内存、I/O 以及上下文切换等性能指标.
#如果出现无法使用mpstat、pidstat命令查看%wait指标建议更新下软件包
yum install sysstats -y
yum install stress -y
***场景一:CPU 密集型进程\***
①首先,我们在第一个终端运行 stress 命令,模拟一个 CPU 使用率 100% 的场景:
# 使用watch -d 参数表示高亮显示变化的区域(注意负载会持续升高)
#单核CPU,所以只有一个all和0
#从这里可以明显看到,stress进程的CPU使用率为100%.
- 模拟cpu负载高 +stress --cpu 1 --timeout 100+
- 通过uptime或w 查看 +watch -d uptime+
- 查看整体状态mpstat -P ALL 1 查看每个cpu核心使用率
- 精确到进程: pidstat 1
****场景二:I/O 密集型进程\****
①首先还是运行 stress 命令,但这次模拟 I/O 压力,即不停地执行 sync
#会发现cpu的与内核打交道的sys占用非常高
#可以发现,还是 stress 进程导致的.
- 通过w/uptime查看系统负载信息 +watch -d uptime+
- 通过top/mpstat 排查 +mpstat -P ALL 1 或 top 按1+
- 确定是iowati +iostat 1查看整体磁盘读写情况 或iotop -o 查看具体哪个进程读写+
- 根据对应的进程,进行相关处理.
***场景三:大量进程的场景 高并发场景 \***
*当系统中运行进程超出 CPU 运行能力时,就会出现等待 CPU 的进程.*
****分析完这三个案例,我再来归纳一下平均负载与CPU\****
***平均负载提供了一个快速查看系统整体性能的手段,反映了整体的负载情况.但只看平均负载本身,我们并不能直接发现,到底是哪里出现了瓶颈.所以,在理解平均负载时,也要注意:
平均负载高有可能是 CPU 密集型进程导致的;
平均负载高并不一定代表 CPU 使用率高,还有可能是 I/O 更繁忙了;
**系统负载的计算和意义**
进程以及子进程和线程产生的计算指令都会让cpu执行,产生请求的这些进程组成"运行队列",等待cpu执行,这个队列就是系统负载, 系统负载是所有cpu的运行队列的总和.
- w/uptime, 查看负载
- ps aux/top 看看 cpu百分比, io wait或者是内存占用的高? (三高 cpu,io,内存)
- top检查具体是哪个进程,找出可疑进程
- 追踪这个进程使用情况,做什么的?
- 看看对应**日志**是否有异常
- 系统日志: /var/log/messages(系统通用日志) /var/log/secure(用户登录情况)
- 服务软件的日志
*最理想的状态是每个 CPU核心 上都刚好运行着一个进程,这样每个 CPU 都得到了充分利用.所以在评判平均负载时,首先你要知道系统有几个 CPU核心,这可以通过 top 命令获取,或+grep 'model name' /proc/cpuinfo+*
系统平均负载被定义为在特定时间间隔内运行队列中的平均进程数.如果一个进程满足以下条件则其就会位于运行队列中:
- 它没有在等待I/O操作的结果
- 它没有主动进入等待状态(也就是没有调用'wait')
- 没有被停止(例如:等待终止)
<<内容来自老男孩老师的课堂笔记>>
盘Linux服务端的测试及故障处理办法
①.、查看系统负载情况
在服务端命令窗口中执行如下命令
hdparm -t /dev/hda (IDE硬盘)
hdparm -t /dev/sda (SATA、SCSI、硬RAID卡阵列)
hdparm -t /dev/md0 (软RAID设备)
当在客户机上启动执行网络盘上游戏经常出现异常错误时,很可能是网络盘上的文件系统或数据出现损坏,可使用如下办法尝试修复.
在一台客户机上登陆为超级工作站连接网络盘,例如网络盘为H:,在DOS命令窗口下执行 chkdsk H:/F 对网络盘文件系统进行检查修复,修复完成后重新启动客户机看修复是否起到相应的作用,如故障依旧则考虑对网络盘重新格式化拷贝数据.
有新的机器名需要连接网络磁盘时必须开启服务端虚拟磁盘管理器窗口
网众虚拟磁盘客户机系统还原功能失效情况的处理办法
a、分区或全盘恢复还原失效的客户机系统.
b、在服务器端虚拟磁盘管理器中删除还原失效的客户机.
c、客户机重新连接服务器,设置还原即可.
网众虚拟网络磁盘如何在没有盘符时进行磁盘扫描
a.在服务器上运行命令cmd,进入命令行状态
b.运行cd (这是方便生成的文件直接存放在c:目录下)
c.运行mountvol 1.bat (这会生成一个名为1.bat的批处理文件.)
d.将1.bat复制到桌面上.
无加载点
无加载点的这行的上面就是去掉了盘符的'盘的磁盘卷标.保留这一行内容其它的全部删除掉.
f.最后生成留下的文件应该如下面的格式
要注意啊!一定要chkdsk/f要加上f参数,才能真正修复,还有磁盘卷标的最后一个字符不是 而生成的文件是带了的,要把它删除掉.
最后说说什么时候才能用这个批处理进行扫描
a.当你发现在用超级用户更新之后,有的机看得到网络磁盘,有的机看不到网络磁盘,或者是打得开盘却看不到内容不得时,可以使用.
b.当服务器重新启动时,提示有磁盘扫描,并自动进行扫描时,本来以前是必须要等这个扫描过程完成才能进入WINDOWS,但现在你就可以直接跳过扫描,等系统进了WINDOWS再运行这个批处理了.这样就不会影响到客人玩游戏.
c.磁盘扫描完成之后,客户机有可能要重新启动才能正常看到网络盘的文件.
d.一定要注意,这是一个非常危险的命令,你在使用时必须要保证没有超级用户存在(就是标记为红色的电脑)否则有可能造游戏盘上所有的文件丢失得一干二净!