读懂系统负载(Load Avg)的含义 | Devops

有过运维Linux服务器的选手,想必对于系统平均负载(load averages)参数不会陌生吧,我们可以通过top, htop, uptime这些命令找到它们(如下图),那么我们又改如何理解它们呢,今天这篇就来一起看看应该如何读懂这个load averages参数。

系统平均负载的取值分别来自1分,5分,15分这三个时间区间,对于单核CPU而言,当平均负载为0时,表示CPU完全空闲,当平均负载为1时,表示CPU为满负荷状态,但两个极端都不应出现在我们的服务器上,前者说明系统没有被充分利用到,后者说明系统濒临奔溃,都不是什么好事情。

关于负载的含义,网上最广泛的示例,是通过桥梁的通过率来解释的。讲的真心好,所以直接「借鉴」过来,需要看原文的直接从参考引用处自行穿越。注意这里的比喻是基于单核CPU的。

系统负荷为0,意味着大桥上一辆车也没有

系统负荷为0.5,意味着大桥一半的路段有车。

系统负荷为1.0,意味着大桥的所有路段都有车,但任然可以顺次通行

系统负荷为1.7,除了桥满之外,在桥的入口处还有70%的车辆在等待

就目前情况来说,单核的个人PC是不应该的,当然服务器就是另一回事儿了,比如可能你买了某云主机商的单核廉价套餐来搭梯子,但实际的真实环境中单核真的是很少,所以光知道单核的表现还不行,还得会换算到多核处理器上,其实这也简单,直接在单核的负载上乘以核数就可以了,换到刚才的大桥示例,多核就是多车道(下图),车道多了通过率自然就嘎嘎滴。

好了,知道了数值的含义,我们再来看看恰当的经验值该是多少,到底应该以三个值中的哪个位准,以及预告系统奔溃的经验值该设置成多少?

前面说到平均负载是1,5,15这三个时间区间的均值。因为偶尔系统负载会出现峰值,短时间1,5分钟的负载都不够客观存在抖动,所以最可靠的肯定是第三个,15分钟内的均值,如果系统平均负载的第三个值长时间居高不下,那么就应该考虑提升配置或者给系统进程做做减法了。

第二个问题,知道了基准值的位置,那么基准值该是多少呢?其实这个值完全是靠个人经验的,只能是种预判,就像阴天不一定下雨一样,好了不卖关子,实际中最好能让负载保持在满负载的75%左右,长时间高于这个值就应该考虑做出调整了,当然也恭喜你业务得到拓展了(2333~),另外在生产环境中,你可以通过Monit,Nagios等这样的监控软件来监控系统性能指标,从而做到「早发现,早治疗」。

如何获取CPU的核数

Mac

sysctl -n hw.ncpu

Linux

cat /proc/cpuinfo

-完-

你还可以看:

Monit让你的服务持续在线

关于Github的两个小技巧

教你如何在Commit时有话可说

使用Gulp-Rsync部署前端项目

Linux查看当前端口状况

几种服务端推送技术方案的比较

参考引用

 

 

http://www.wtoutiao.com/p/1faPwo8.html

时间: 2024-11-05 12:29:07

读懂系统负载(Load Avg)的含义 | Devops的相关文章

获取磁盘IO与系统负载Load的shell脚本

本节介绍的几段shell脚本,可以用于提取磁盘的I/O信息,系统负载Load信息等   1,提取系统负载信息 复制代码 代码如下: #!/bin/sh host=$(hostname) channel=$(hostname | sed 's/[0-9]//g') runday=$(date +%Y-%m-%d) IPhost=$(/sbin/ifconfig  | grep 'inet addr:'| grep -v '127.0.0.1' | cut -d: -f2 | awk '{ prin

获取磁盘IO与系统负载Load的shell脚本_linux shell

1,提取系统负载信息 复制代码 代码如下: #!/bin/shhost=$(hostname)channel=$(hostname | sed 's/[0-9]//g')runday=$(date +%Y-%m-%d)IPhost=$(/sbin/ifconfig  | grep 'inet addr:'| grep -v '127.0.0.1' | cut -d: -f2 | awk '{ print $1}')i=1 while [ $i -le 120 ];do rundaytime=$(

谷歌正在开发一套能够读懂人类情感的搜索系统

谷歌工程主管雷·库兹威尔(Ray Kurzweil)周二在接受采访时称,谷歌正在开发一套能够读懂人类情感的搜索系统. 库兹威尔以开发出第一套"文字转语音系统"(Text-to-Speech)软件而闻名,去年年底加盟谷歌.本周二在接受<连线>网站采访时称,他正在开发一套系统,能够真正读懂自然语言. 他说:"尽管当前的搜索已不再是简单的查找关键词,但还是不能读懂全部网页的语义内容.例如要写一篇博客,我们要讲述一些事情,而不是简单的单词罗列.我们希望计算机能够真正读懂其

Facebook将反馈融入AI系统,视觉障碍者现在也能“读懂”照片啦

雷锋网按:Automatic Alt-Text (AAT) 的发布让盲人(或使用屏幕阅读器的用户)更好地读懂新闻推送  (News Feeds) 里的照片的内容.以访谈,可用性测试以及调查为手段的用户研究给工具的发明提供了帮助.我们将在本文简要介绍这项工作的一些亮点,雷锋网(公众号:雷锋网)独家编译,未经许可不得转载. 这项工作的主要作者.数据科学家Shaomei Wu将会出席本周在波特兰举办的CSCW 2017,届时她将在会上详细介绍该工具的功能以及所进行的研究.如果您想面对面探讨,请在会上和

linux查看系统负载的常用命令

网站服务器经常会遇到linux系统负载的问题,那么linux下查看系统负载的命令有哪些呢? linux下查看负载的主要命令有下面一些: top, uptime,w,vmstat 1.top命令查看linux负载: 第一行解释: top - 15:13:34 up 252 days,  1:36,  1 user,  load average: 0.01, 0.01, 0.00 15:13:34 :系统当前时间 up 252 days :系统开机到现在经过了252天 1 users:当前1用户在线

独家 | 一文读懂Hadoop(四):YARN

随着全球经济的不断发展,大数据时代早已悄悄到来,而Hadoop又是大数据环境的基础,想入门大数据行业首先需要了解Hadoop的知识.2017年年初apache发行了Hadoop3.0,也意味着一直有一群人在对Hadoop不断的做优化,不仅如此,各个Hadoop的商业版本也有好多公司正在使用,这也印证了它的商业价值. 读者可以通过阅读"一文读懂Hadoop"系列文章,对Hadoop技术有个全面的了解,它涵盖了Hadoop官网的所有知识点,并且通俗易懂,英文不好的读者完全可以通过阅读此篇文

独家 | 一文读懂Hadoop(一):综述

随着全球经济的不断发展,大数据时代早已悄悄到来,而Hadoop又是大数据环境的基础,想入门大数据行业首先需要了解Hadoop的知识.2017年年初apache发行了Hadoop3.0,也意味着一直有一群人在对Hadoop不断的做优化,不仅如此,各个Hadoop的商业版本也有好多公司正在使用,这也印证了它的商业价值. 读者可以通过阅读"一文读懂Hadoop"系列文章,对Hadoop技术有个全面的了解,它涵盖了Hadoop官网的所有知识点,并且通俗易懂,英文不好的读者完全可以通过阅读此篇文

独家 | 一文读懂Hadoop(二)HDFS(上)

随着全球经济的不断发展,大数据时代早已悄悄到来,而Hadoop又是大数据环境的基础,想入门大数据行业首先需要了解Hadoop的知识.2017年年初apache发行了Hadoop3.0,也意味着一直有一群人在对Hadoop不断的做优化,不仅如此,各个Hadoop的商业版本也有好多公司正在使用,这也印证了它的商业价值. 读者可以通过阅读"一文读懂Hadoop"系列文章,对Hadoop技术有个全面的了解,它涵盖了Hadoop官网的所有知识点,并且通俗易懂,英文不好的读者完全可以通过阅读此篇文

一篇文章读懂企业如何升级到云安全体系

本文讲的是一篇文章读懂企业如何升级到云安全体系,本文为青藤云安全供稿,青藤是国内首家自适应安全提供商,自适应安全是为数不多的云安全落地解决方案. 对于云安全这个新兴概念,从咨询机构.云平台到安全厂商,行业内各家机构众各有解读.但很少从企业角度出发,清楚指明安全部门对云安全这种全新解决方案的真实需求是如何产生的,以及如何规划云安全架构,如何和原有安全功能进行协同. 最近,Gartner的一篇分析报告提出了一种全新的安全解决方案--云工作负载安全平台(Cloud Workload Protectio