解析Linux系统的平均负载概念

   一、什么是系统平均负载(Load average)?

  在Linux系统中,uptime、w、top等命令都会有系统平均负载load average的输出,那么什么是系统平均负载呢?

  系统平均负载被定义为在特定时间间隔内运行队列中的平均进程树。如果一个进程满足以下条件则其就会位于运行队列中:

  - 它没有在等待I/O操作的结果

  - 它没有主动进入等待状态(也就是没有调用'wait')

  - 没有被停止(例如:等待终止)

  例如:

  代码如下:

  [root@opendigest root]# uptime

  7:51pm up 2 days, 5:43, 2 users, load average: 8.13, 5.90, 4.94

  命令输出的最后内容表示在过去的1、5、15分钟内运行队列中的平均进程数量。

  一般来说只要每个CPU的当前活动进程数不大于3那么系统的性能就是良好的,如果每个CPU的任务数大于5,那么就表示这台机器的性能有严重问题。对于上面的例子来说,假设系统有两个CPU,那么其每个CPU的当前任务数为:8.13/2=4.065。这表示该系统的性能是可以接受的。

  二、Load average的算法

  上面的输出数据是每隔5秒钟检查一次活跃的进程数,然后根据这个数值算出来的。如果这个数除以CPU的数目,结果高于5的时候就表明系统在超负荷运转了。其算法(摘自Linux 2.4的内核代码)如下:

  文件: include/linux/sched.h:

  代码如下:

  #define FSHIFT 11 /* nr of bits of precision */

  #define FIXED_1 (1<#define LOAD_FREQ (5*HZ) /* 5 sec intervals */

  #define EXP_1 1884 /* 1/exp(5sec/1min) as fixed-point, 2048/pow(exp(1), 5.0/60) */

  #define EXP_5 2014 /* 1/exp(5sec/5min), 2048/pow(exp(1), 5.0/300) */

  #define EXP_15 2037 /* 1/exp(5sec/15min), 2048/pow(exp(1), 5.0/900) */

  #define CALC_LOAD(load,exp,n)

  load *= exp;

  load += n*(FIXED_1-exp);

  load >>= FSHIFT;

  文件: kernel/timer.c:

  代码如下:

  unsigned long avenrun[3];

  static inline void calc_load(unsigned long ticks)

  {

  unsigned long active_tasks; /* fixed-point */

  static int count = LOAD_FREQ;

  count -= ticks;

  if (count < 0) {

  count += LOAD_FREQ;

  active_tasks = count_active_tasks();

  CALC_LOAD(avenrun[0], EXP_1, active_tasks);

  CALC_LOAD(avenrun[1], EXP_5, active_tasks);

  CALC_LOAD(avenrun[2], EXP_15, active_tasks);

  }

  }

  文件: fs/proc/proc_misc.c:

  代码如下:

  #define LOAD_INT(x) ((x) >> FSHIFT)

  #define LOAD_FRAC(x) LOAD_INT(((x) & (FIXED_1-1)) * 100)

  static int loadavg_read_proc(char *page, char **start, off_t off,

  int count, int *eof, void *data)

  {

  int a, b, c;

  int len;

  a = avenrun[0] + (FIXED_1/200);

  b = avenrun[1] + (FIXED_1/200);

  c = avenrun[2] + (FIXED_1/200);

  len = sprintf(page,"%d.%02d %d.%02d %d.%02d %ld/%d %dn",

  LOAD_INT(a), LOAD_FRAC(a),

  LOAD_INT(b), LOAD_FRAC(b),

  LOAD_INT(c), LOAD_FRAC(c),

  nr_running(), nr_threads, last_pid);

  return proc_calc_metrics(page, start, off, count, eof, len);

  }

  三、/proc/loadavg 各项数据的含义

  /proc文件系统是一个虚拟的文件系统,不占用磁盘空间,它反映了当前操作系统在内存中的运行情况,查看/proc下的文件可以聊寄到系统的运行状态。查看系统平均负载使用“cat /proc/loadavg”命令,输出结果如下:

  0.27 0.36 0.37 4/83 4828/

  前三个数字大家都知道,是1、5、15分钟内的平均进程数(有人认为是系统负荷的百分比,其实不然,有些时候可以看到200甚至更多)。后面两个呢,一个的分子是正在运行的进程数,分母是进程总数;另一个是最近运行的进程ID号。

  四、查看系统平均负载的常用命令

  1、

  代码如下:

  cat /proc/loadavg

  2、uptime

  名称: uptime

  使用权限: 所有使用者

  使用方式: uptime [-V]

  说明: uptime 提供使用者下面的资讯,不需其他参数:

  现在的时间 系统开机运转到现在经过的时间 连线的使用者数量 最近一分钟,五分钟和十五分钟的系统负载

  参数: -V 显示版本资讯。

  范例: uptime

  其结果为:

  代码如下:

  10:41am up 5 days, 10 min, 1 users, load average: 0.00, 0.00, 1.99

  3、w

  功能说明:显示目前登入系统的用户信息。

  语  法:w [-fhlsuV][用户名称]

  补充说明:执行这项指令可得知目前登入系统的用户有那些人,以及他们正在执行的程序。单独执行w

  指令会显示所有的用户,您也可指定用户名称,仅显示某位用户的相关信息。

  参  数:

  -f  开启或关闭显示用户从何处登入系统。

  -h  不显示各栏位的标题信息列。

  -l  使用详细格式列表,此为预设值。

  -s  使用简洁格式列表,不显示用户登入时间,终端机阶段作业和程序所耗费的CPU时间。

  -u  忽略执行程序的名称,以及该程序耗费CPU时间的信息。

  -V  显示版本信息。

  4、top

  功能说明:显示,管理执行中的程序。

  语  法:top [bciqsS][d <间隔秒数>][n <执行次数>]

  补充说明:执行top指令可显示目前正在系统中执行的程序,并通过它所提供的互动式界面,用热键加以管理。

  参  数:

  b  使用批处理模式。

  c  列出程序时,显示每个程序的完整指令,包括指令名称,路径和参数等相关信息。

  d<间隔秒数>  设置top监控程序执行状况的间隔时间,单位以秒计算。

  i  执行top指令时,忽略闲置或是已成为Zombie的程序。

  n<执行次数>  设置监控信息的更新次数。

  q  持续监控程序执行的状况。

  s  使用保密模式,消除互动模式下的潜在危机。

  S  使用累计模式,其效果类似ps指令的"-S"参数。

  5、tload

  功能说明:显示系统负载状况。

  语  法:tload [-V][-d <间隔秒数>][-s <刻度大小>][终端机编号]

  补充说明:tload指令使用ASCII字符简单地以文字模式显示系统负载状态。假设不给予终端机编号,则会在执行tload指令的终端机显示负载情形。

  参  数:

  -d<间隔秒数>  设置tload检测系统负载的间隔时间,单位以秒计算。

  -s<刻度大小>  设置图表的垂直刻度大小,单位以列计算。

  -V  显示版本信息。

  四、系统平均负载-进阶解释

  为了更好地理解系统负载,我们用交通流量来做类比。

  1、单核CPU - 单车道 - 数字在0.00-1.00之间正常

  路况管理员会告知司机,如果前面比较拥堵,那司机就要等待,如果前面一路畅通,那么司机就可以驾车直接开过。


  具体来说:

  0.00-1.00 之间的数字表示此时路况非常良好,没有拥堵,车辆可以毫无阻碍地通过。

  1.00 表示道路还算正常,但有可能会恶化并造成拥堵。此时系统已经没有多余的资源了,管理员需要进行优化。

  1.00-*** 表示路况不太好了,如果到达2.00表示有桥上车辆一倍数目的车辆正在等待。这种情况你必须进行检查了。

  2、多核CPU - 多车道 - 数字/CPU核数 在0.00-1.00之间正常


  多核CPU的话,满负荷状态的数字为 "1.00 * CPU核数",即双核CPU为2.00,四核CPU为4.00。

  3、安全的系统平均负载

  作者认为单核负载在0.7以下是安全的,超过0.7就需要进行优化了。

  4、应该看哪一个数字,1分钟,5分钟还是15分钟?

  作者认为看5分钟和15分钟的比较好,即后面2个数字。

  5、怎样知道我的CPU是几核呢?

  使用以下命令可以直接获得CPU核心数目

  复制代码

  代码如下:

  grep 'model name' /proc/cpuinfo | wc -l

  结论

  取得CPU核心数目N,观察后面2个数字,用数字/N,如果得到的值小于0.7即可无忧。

时间: 2024-11-01 19:41:38

解析Linux系统的平均负载概念的相关文章

Linux系统的平均负载

有时候我们会觉得系统响应很慢,但是又找不到原因,这时就要查平均负载了,看它是否有大量的进程在排队等待. 查看Linux系统的平均负载 1.平均负载的概念 有时候我们会觉得系统响应很慢,但是又找不到原因,这时就要查平均负载了,看它是否有大量的进程在排队等待.特定的时间间隔内运行队列中的平均进程数可以反映系统的繁忙程度,所以我们通常会在自己的网站或系统变慢时第一时间查系统的负载,即CPU的平均负载. 2.查看平均负载 究竟应该如何查看平均负载呢?最简单的命令是uptime,如下所示: [root@l

查看Linux系统的平均负载

1.Linux系统的平均负载的概念 有时候我们会觉得系统响应很慢,但是又找不到原因,这时就要查看平均负载了,看它是否有大量的进程在排队等待.特定时间间隔内运行队列中的平均进程数可以反映系统的繁忙程度,所以我们通常会在自己的网站或系统变慢时第一时间查系统的负载,即CPU的平均负载. 2.查看平均负载 究竟应该如何查看平均负载呢?最简单的命令是uptime,如下所示: [root@localhost -]# uptime 11:31:11 up 11 days, 19:01, 2 users, lo

入门:查看Linux系统的平均负载

1.平均负载的概念 有时候我们会觉得系统响应很慢,但是又找不到原因,这时就要查平均负载了,看它是否有大量的进程在排队等待.特定的时间间隔内运行队列中的平均进程数可以反映系统的繁忙程度,所以我们通常会在自己的网站或系统变慢时第一时间查系统的负载,即CPU的平均负载. 20+ Excellent HD Wallpapers for Tech Enthusiasts 2.查看平均负载 究竟应该如何查看平均负载呢?最简单的命令是uptime,如下所示: [root@localhost ~]# uptim

深入解析Linux系统中的SELinux访问控制功能

  SELinux(Security-Enhanced Linux) 是美国国家安全局(NSA)对于强制访问控制的实现,是 Linux历史上最杰出的新安全子系统.NSA是在Linux社区的帮助下开发了一种访问控制体系,在这种访问控制体系的限制下,进程只能访问那些在他的任务中所需要文件.SELinux 默认安装在 Fedora 和 Red Hat Enterprise Linux 上,也可以作为其他发行版上容易安装的包得到. SELinux 是 2.6 版本的 Linux 内核中提供的强制访问控制

解析Linux系统中的/proc虚拟文件系统

  Linux 内核提供了一种通过 /proc 文件系统,在运行时访问内核内部数据结构. 改变内核设置的机制.尽管在各种硬件平台上的 Linux 系统的 /proc 文件系统的 基本概念都是相同的,但本文只讨论基于 intel x86 架构的 Linux /proc 文件系 统. /proc --- 一个虚拟文件系统 /proc 文件系统是一种内核和内核模块用来向进程 (process) 发送信息的机制 (所以叫做 /proc).这个伪文件系统让你可以和内核内部数据结构进行交互,获取 有关进程的

一次Linux系统1分钟负载5000+的故障排错

原创作品,允许转载,转载时请务必以超链接形式标明文章 原始出处 .作者信息和本声明.否则将追究法律责任.http://dgd2010.blog.51cto.com/1539422/1690817 昨天上午查看Zabbix监控界面时,发现其中一台服务器的进程数量和1分钟负载已经达到了一个非常惊人的数量,Zabbix默认报警数值是进程数量在5分钟平均值大于1000,1分钟系统负载5分钟平均值大于5. 先大体列一下服务器的软硬件信息: 服务器硬件:Dell PowerEdge R720, 2 x In

解析Linux系统的运行级与启动机制

一 系统运行级 windows系统有安全运行模式和正常运行模式,这是两个不同的运行级,同样,linux也有系统运行级别,并且linux系统的运行级别更加灵活,更加多样化. 在讲述运行级别前,先讲述下linux下的init程序,因为init程序直接和系统运行级别相关联, init程序是linux操作系统最主要的程序之一,是一个由系统内核启动的用户级进程,同时init进程也是所有其它系统进程的鼻祖,也就是说init进程是系统运行的第一个进程,它的进程号始终为1. linux系统有7个运行级别,这些运

解析Linux系统安全的命令

  虽然Linux和Windows NT/2000系统一样是一个多用户的系统,但是它们之间有不少重要的差别.对于很多习惯了Windows系统的管理员来讲,如何保证Linux操作系统安全.可靠将会面临许多新的挑战.本文将重点介绍Linux系统安全的命令. passwd 1.作用 passwd命令用来修改账户的登陆密码,使用权限是所有用户. 2.格式 passwd [选项] 账户名称 3.主要参数 -l:锁定已经命名的账户名称,只有具备超级用户权限的使用者方可使用. -u:解开账户锁定状态,只有具备

解析Linux系统下的高端内存

  Linux内核地址空间划分 通常32位Linux内核虚拟地址空间划分0~3G为用户空间,3~4G为内核空间(注意,内核可以使用的线性地址只有1G).注意这里是32位内核地址空间划分,64位内核地址空间划分是不同的. 通常32位Linux内核虚拟地址空间划分0~3G为用户空间,3~4G为内核空间(注意,内核可以使用的线性地址只有1G).注意这里是32位内核地址空间划分,64位内核地址空间划分是不同的. Linux内核高端内存的由来 当内核模块代码或线程访问内存时,代码中的内存地址都为逻辑地址,