糟糕的数据是昂贵的。随着数据在人们的生活中做出如此多的决定,不良数据的成本真正影响了所有人,无论人们是否意识到这一点。根据IBM公司的估计,不利的数据每年消耗了美国经济3.1万亿美元左右。处理数据的大多数人都意识到,糟糕的数据可能是非常昂贵的,但是这个数字是真正惊人的。大多数企业分析的数据是关于客户的数据,如果企业依赖于不良数据,那么其业务将很难获得成功。
信息服务机构Experian Data公司的研究发现,不良数据对美国88%的公司的底线有着直接影响,每个企业的平均亏损约占总收入的12%。这些数字描绘了不良数据对人们经济的负面影响的真实情况。
除了不良数据的财务影响之外,不良数据的影响还包括错误信息的传播。在历史上,有很多错误数据和错误的例子帮助人们塑造了当今的世界。
来自Utopia公司的一些数据分析师已经在一个信息图中制定了一个综合实例的列表,显示了糟糕的数据错误导致了改变人们当今生活的历史和社会历程的灾难性决策。让我们从列表中探索一些更有趣的例子。
(1)2016年美国总统选举
最近结束的美国总统选举陷入了糟糕的数据。从无数的民意测验和民意调查总结,到预测网站FiveThrityEight和纽约时报高调的政治预言,大多数民意调查和预测指标都使得这次选举预测完全错误,并预测了希拉里·克林顿将会获得胜利。许多民主党人认为这是一个错误,导致很多选民在选举日呆在家里没有去投票。这个预测显然没有实现。
利用先进的统计数据分析以前的选举结果,并通过使用机器学习和基于选民滚动创建“厨房水槽”模型,可以防止这种不良数据的传播。这可能听起来很复杂,但它是改进民意调查的基本假设的确定方式。然而,这些方法对于大多数民意调查来说都是昂贵和耗时的,而是使用在线调查和公开的在线人口普查数据。
(2)2001年的安然公司丑闻
安然公司曾经是世界上最强大和规模最大的公司之一。在二十世纪初期,他们经历了令人沮丧的高管薪酬下降和股价飞涨的时期。然而,大量的欺诈性财务数据是导致安然公司的垮台直接原因。
从内部举报人到安然公司外部审计人员的文件破解,毫无疑问,提供给股东的数据基本上是虚构的。安然公司的高管及其审计机构向股东和董事会提交的年度报告和财务报告中的数据证明是错误的。
安然公司的一家伦理审计公司可能会阻止这种金融欺诈发生。2002年“萨班斯-奥克斯利法案”在安然丑闻之后颁布,这个法案可以确保审计师的独立性,企业责任,财务披露,利益冲突和公司上市的监督。如果这个法案早些时候颁布,也许会阻止安然公司的灾难发生。
(3)20世纪20年代汽油含有四乙基铅
20世纪20年代,美国将四乙基铅加入汽油作为发动机的抗爆剂,四乙基铅导致美国超过5000人死亡。这在一定程度上是由天然气行业和美国政府的故意欺骗引发的测试而实现的。
几十年来,铅涂料和含铅行业因铅中毒而相互指责,这两者都表明其产品对人类是安全的。业内科学家甚至建议人体自然就拥有铅,所以铅处于高水平不应该是一个健康问题。
在首次发现含铅汽油的潜在威胁后,应对其有害影响进行独立研究。美国政府和天然气行业对此都视而不见,而是依赖不利于他人生命健康的不良数据。
(4)哥伦布与美洲发现
即使美洲的发现也是数据不佳的结果。克里斯托弗·哥伦布在绘制欧洲和亚洲之间的距离时,就有一些重大的错误估算。首先,他深受波斯地理学家Alfraganus价值观的影响,希望对希腊地理学家Eratosthenes进行更准确的计算。第二,哥伦布认为Alfraganus在计算时指的是罗马里程,实际上他指的是阿拉伯里程。
哥伦布应该为糟糕的数据负责。哥伦布可能会坚持一个地理学家的计算,并验证测量他使用的测量单位实际上是正确的。
人们可以从错误的数据错误中吸取教训
在历史上有无数个数据错误的例子。更好的数据导致更好和更准确的决策。而依赖不良数据会对企业和整个社会产生负面影响。你能想到一些不良数据影响了业务或个人生活的例子吗?
本文转自d1net(转载)