Load Average

在Linux系统下面,有很多的命令可以查看系统的负载情况:比如top,uptime,w,示例如下:

[wenchao.ren@l-cmsweb1.ops.cn1 ~]$ w
 18:39:10 up 761 days, 13:59,  1 user,  load average: 0.32, 0.45, 0.43
USER     TTY      FROM              LOGIN@   IDLE   JCPU   PCPU WHAT
wenchao. pts/1    192.168.22.28    17:55    0.00s  0.03s  0.02s sshd: wenchao.ren [priv]

[wenchao.ren@l-cmsweb1.ops.cn1 ~]$ uptime
 18:39:16 up 761 days, 13:59,  1 user,  load average: 0.29, 0.45, 0.43

[wenchao.ren@l-cmsweb1.ops.cn1 ~]$ top
top - 18:39:19 up 761 days, 13:59,  1 user,  load average: 0.27, 0.44, 0.42
Tasks: 104 total,   1 running, 103 sleeping,   0 stopped,   0 zombie
Cpu(s):  0.1%us,  0.1%sy,  0.0%ni, 99.7%id,  0.0%wa,  0.0%hi,  0.0%si,  0.1%st
Mem:   4194304k total,  4156132k used,    38172k free,   388176k buffers
Swap:  8385920k total,       96k used,  8385824k free,  1608244k cached

我们可以看到无论上面3个命令中的哪个,输出中都包含有load average这一项,他是由3个数字组成。分别代表了:

分别表示系统在过去1分钟、5分钟、15分钟内运行进程队列中的平均进程数量

有关这个运行进程队列,没有等待IO,没有WAIT,没有KILL的进程通通都进这个队列。另外还有一个最直接的显示系统平均负载的命令:

[wenchao.ren@l-cmsweb1.ops.cn1 ~]$ cat /proc/loadavg
0.32 0.35 0.38 1/292 2683

下面对这个命令进行解释:

前3个数字表示平均进程数量,后面的1个分数,分母表示系统进程总数,分子表示正在运行的进程数;最后一个数字表示最近运行的进程ID.

对负载的理解

单核CPU - 单车道 - 数字在0.00-1.00之间正常

0.00-1.00 之间的数字表示情况非常良好,没有拥堵

1.00 表示还算正常,但有可能会恶化并造成拥堵。此时系统已经没有多余的资源了,管理员需要进行优化。

1.00-*** 表示情况不太好了,这种情况你必须进行检查了。

多核CPU - 多车道 - 数字/CPU核数 在0.00-1.00之间正常

多核CPU的话,满负荷状态的数字为 "1.00 * CPU核数",即双核CPU为2.00,四核CPU为4.00。

安全的系统平均负载

一般认为单核负载在0.7以下是安全的,超过0.7就需要进行优化了。

应该看哪一个数字,1分钟,5分钟还是15分钟?

一般认为看5分钟和15分钟的比较好,即后面2个数字。

怎样知道我的CPU是几核呢?

使用以下命令可以直接获得CPU核心数目

grep 'model name' /proc/cpuinfo | wc -l

或者使用:

grep -c 'model name' /proc/cpuinfo

结论

取得CPU核心数目N,观察后面2个数字,用数字/N,如果得到的值小于0.7即可无忧。

参考资料

时间: 2024-09-27 01:29:01

Load Average的相关文章

shell如何监控cpu,memory,load average

shell 监控cpu,memory,load average,记录到log,当负载压力时,发电邮通知管理员. 原理: 1.获取cpu,memory,load average的数值 2.判断数值是否超过自定义的范围,例如(CPU>90%,Memory<10%,load average>2) 3.如数值超过范围,发送电邮通知管理员.发送有时间间隔,每小时只会发送一次. 4.将数值写入log. 5.设置crontab 每30秒运行一次. 返回栏目页:http://www.bianceng.c

Linux/Unix中的load average

使用top命令时,我们会看到第一行有个 1 load average: 0.01, 0.01, 0.00 当然,别的命令也看的到,比如uptime,w. 使用strace追踪uptime很容易发现这三个数据来自/proc/loadavg文件.另几个命令也是通过读取这个文件得到的. 1 $ strace -eopen uptime 2 #省略掉无关内容 3 open("/proc/loadavg", O_RDONLY)         = 4 load average是什么: 三个数字分

压力测试衡量CPU的三个指标:CPU Utilization、Load Average和Context Switch Rate

CPU Utilization 好理解,就是CPU的利用率,75%以上就比较高了(也有说法是80%或者更高).除了这个指标外,还要结合Load Average和Context Switch Rate来看,有可能CPU高是因为后两个指标高导致的.   Load Average ,这个很难衡量.网上搜了一圈,还没见到几个合理的解释.我100个并发用户测试数来这两个值是:77.534%,6.108,CPU利用率比较高,Load Average也好像有点高.后来发现了如下两片博文: 理解Load Ave

linux中load average判断服务器负载情况

top命令:top 显示如下: load average后面三个值分别是1分钟.5分钟.15分钟的负载情况.数据是每隔5秒钟检查一次活跃的进程数,然后根据这个数值算出来的.如果这个数除以CPU的数目,结果高于5的时候就表明系统在超负荷运转了. 查询cpu内核数: cat /proc/cpuinfo 很显然第二幅图中top后显示load average: 185.87,149.43,489.26 即可看出一分钟内185.87/4  远远大于5,此时服务器已经超负荷运转,必然很缓慢.(正常情况应该为

linux中进程上下文频繁切换导致load average过高

一.问题现象   现网有两台虚拟机主机95%的cpu处于idle状态,内存使用率也不是特别高,而主机的load average达到了40多.   二.问题分析   先在主机上通过top.free.ps.iostat 等常用工具分析了下主机的CPU.内存.IO使用情况,发现三者都不高.通过vmstat 1 查看的结果如下:     从vmstat的输出结果来看,io项的block in 和block out 并不频繁.而system项的每称的中断数(in).每秒的上下文切换(cs)特别频繁.这就造

UVa 10370 Above Average (water ver.)

10370 - Above Average Time limit: 3.000 seconds http://uva.onlinejudge.org/index.php?option=com_onlinejudge&Itemid=8&category=24&page=show_problem&problem=1311 It is said that 90% of frosh expect to be above average in their class. You are

【系统优化】数据库系统load飙高问题解决思路

工作过程中有时候会接收到数据库服务器器load 飙高的报警,比如:  load1 15.25 base: 8.52,collect time:2014-08-30 如何处理load 异常飙高的报警呢? 本文尝试从原理,原因,解决方法来阐述这类问题的解决思路. 一 原理分析     CPU作为服务器的关键资源经常成为性能瓶颈的根源,CPU使用率高并不总是意味着CPU工作繁忙,它有可能是正在等待其他子系统.在进行性能分析时,将所有子系统当做一个整体来看是非常重要的,因为在子系统中可能会出现瀑布效应.

性能测试指标的理解--cpu和load

第一次做性能测试,按照操作文档磕磕碰碰的完成了,并且拿到了结果,看到一堆的指标和数据,还是傻眼了,不知道各个指标是什么意思了. 咨询了大牛和度娘,消化理解了一下,不知道是不是正确的. CPU使用率: 一段时间内CPU的使用状况,从这个指标可以看出某一段时间内CPU资源被占用的情况. Load Average: 某一段时间内,CPU正在处理以及等待CPU处理的进程数的之和.Load Average是从另一个角度来体现CPU的使用状态的. CPU使用率和Load Average的关系: 拿去医院体检

海量用户实时定位和圈人 - 团圆社会公益系统(位置寻人\圈人)

标签 PostgreSQL , PostGIS , 空间数据 , 空间索引 , 寻人启事 , 位置寻人 , 公益系统 , 实时定位 , 海量圈人 背景 老人.儿童是最容易走丢的人群,一定要看好老人和小孩,但是万一走丢了怎么办呢? 阿里有一个公益系统,团圆,这个系统是用来帮助发布走丢人群信息的,公安通过发布的走丢人的照片,最后一次的位置信息,向社会发布. 通过公益平台的合作伙伴(例如运营商.购物软件等)可以向最后一次走丢人士出现的位置附近的人推送寻人启事,调动社会力量帮助寻找丢失人. 为了实现这个