原文:《BI那点儿事》三国数据分析系列——蜀汉五虎上将与魏五子良将武力分析,绝对的经典分析
献给广大的三国爱好者们,希望喜欢三国的朋友一起讨论,加深对传奇三国时代的了解
数据分析基础概念:
集中趋势分析是指在大量测评数据分布中,测评数据向某点集中的情况。
总体(population)是指客观存在的,并在同一性质的基础上结合起来的许多个别单位的整体,即具有某一特性的一类事物的全体,又叫母体或全域。简单地说,总体也就是我们所研究的性质相同个体的总和,用符号N表示。
样本(sample),是指从总体中抽出的一部分个体。样本中所包含个体数目称样本容量或含量,用符号n表示。
标准差与方差的区别:从公式上可以很明显看出,方差是标准差的平方,其余一模一样。
那它们二者的区别就体现在,标准差是以最初的单位存在,而方差是以平方单位存在。
建立准备分析环境:
蜀汉五虎上将,是指罗贯中的长篇小说《三国演义》中,蜀汉昭烈帝刘备麾下的五员猛将,分别是:关羽、张飞、赵云、马超、黄忠。原文描写为“五虎大将”,后人惯称“五虎上将”。
SELECT * FROM FactSanguo11 WHERE 姓名 IN ( N'关羽', N'张飞', N'赵云', N'马超', N'黄忠' )
关羽、张飞、赵云、马超、黄忠武力值为:97,98,96,97,93
分析过程:
验证分析结果:
SELECT AVG([武力]) AS 均值 , VARP([武力]) AS 总体方差 , VAR([武力]) AS 样本方差 , STDEVP([武力]) AS 总体标准差 , STDEV([武力]) AS 样本标准差 FROM FactSanguo11 WHERE 姓名 IN ( N'关羽', N'张飞', N'赵云', N'马超', N'黄忠' )
魏五子良将
五子良将是指三国时期,曹魏势力的五位将军,即前将军张辽、右将军乐进、左将军于禁、征西车骑将军张郃以及右将军徐晃。
陈寿撰写魏书卷十七时,将此五人合传,叙述诸将生平事迹后评曰:“太祖建兹武功,而时之良将,五子为先”,因此现代人将其称之为“五子良将”或“魏五子”。
SELECT * FROM FactSanguo11 WHERE 姓名 IN ( N'张辽', N'乐进', N'于禁', N'张郃', N'徐晃' )
张辽、乐进、于禁、张郃、徐晃 武力值为:92,84,78,89,90
分析过程:
验证分析结果:
SELECT AVG([武力]) AS 均值 , VARP([武力]) AS 总体方差 , VAR([武力]) AS 样本方差 , STDEVP([武力]) AS 总体标准差 , STDEV([武力]) AS 样本标准差 FROM FactSanguo11 WHERE 姓名 IN ( N'张辽', N'乐进', N'于禁', N'张郃', N'徐晃' )
分析结论:
|
蜀汉五虎上将 |
魏五子良将 |
1均值 |
96.2 |
86.6 |
2中位数 |
97 |
89 |
3众数 |
97 |
- |
4最大 |
98 |
92 |
5最小 |
93 |
78 |
6极差 |
5 |
14 |
7总体方差 |
2.96 |
25.44 |
8总体标准差 |
1.72 |
5.04 |
9样本方差 |
3.7 |
31.80 |
10样本标准差 |
1.92 |
5.64 |
11 CV(sample) |
1.9958% CV(sample)= (1.92/96.2)*100%=1.9958%
|
6.5127% CV(sample)= (5.64/86.6)*100%=6.5127%
|
附录:蜀汉五虎上将、魏五子良将配图