数据挖掘与预测分析术语总结

数据挖掘目前在各类企业和机构中蓬勃发展。因此我们制作了一份此领域常见术语总结,希望你喜欢。

分析型客户关系管理(Analytical CRM/aCRM): 用于支持决策,改善公司跟顾客的互动或提高互动的价值。针对有关顾客的知识,和如何与顾客有效接触的知识,进行收集、分析、应用。参见>>>

大数据(Big Data): 大数据既是一个被滥用的流行语,也是一个当今社会的真实趋势。此术语指代总量与日俱增的数据,这些数据每天都在被捕获、处理、汇集、储存、分析。维基百科是这样描述“大数据”的:“数据集的总和如此庞大复杂,以至于现有的数据库管理工具难以处理(…)”。

商业智能(Business Intelligence): 分析数据、展示信息以帮助企业的执行者、管理层、其他人员进行更有根据的商业决策的应用、设施、工具、过程。

流失分析(Churn Analysis/Attrition Analysis): 描述哪些顾客可能停止使用公司的产品/业务,以及识别哪些顾客的流失会带来最大损失。流失分析的结果用于为可能要流失的顾客准备新的优惠。

联合分析/权衡分析(Conjoint Analysis/ Trade-off Analysis): 在消费者实际使用的基础上,比较同一产品/服务的几个不同变种。它能预测产品/服务上市后的接受度,用于产品线管理、定价等活动。

信用评分(Credit Scoring): 评估一个实体(公司或个人)的信用值。银行(借款人)以此判断借款者是否会还款。

配套销售/增值销售(Cross / Up selling): 一个营销概念。根据特定消费者的特征和过往行为,向其销售补充商品(配套销售)或附加商品(增值销售)。

顾客细分&画像(Customer Segmentation & Profiling): 根据现有的顾客数据,将特征、行为相似的顾客归类分组。描述和比较各组。

数据集市(Data Mart): 特定机构所储存的,关于一个特定主题或部门的数据,如销售、财务、营销数据。

数据仓库(Data Warehouse): 数据的中央存储库,采集、储存来自一个企业多个商业系统的数据。

数据质量(Data Quality): 有关确保数据可靠性和实用价值的过程和技术。高质量的数据应该忠实体现其背后的事务进程,并能满足在运营、决策、规划中的预期用途。

抽取-转换-加载 ETL (Extract-Transform-Load): 数据仓储中的一个过程。从一个来源获取数据,根据需求转换数据以便接下来使用,之后把数据放置在正确的目标数据库。

欺诈检测(Fraud Detection): 识别针对特定组织或公司的疑似欺诈式转账、订购、以及其他非法活动。在IT系统预先设计触发式警报,尝试或进行此类活动会出现警告。

Hadoop: 另一个当今大数据领域的热门。Apache Hadoop是一个在已有商业硬件组成的计算机集群上,分布式存储、处理庞大数据集的开源软件架构。它使得大规模数据储存和更快速数据处理成为可能。

物联网(Internet of Things, IoT): 广泛分布的网络,由诸多种类(个人、家庭、工业)诸多用途(医疗、休闲、媒体、购物、制造、环境调节)的电子设备组成。这些设备通过互联网交换数据,彼此协调活动。

顾客的生命周期价值 (Lifetime Value, LTV): 顾客在他/她的一生中为一个公司产生的预期折算利润。

机器学习(Machine Learning): 一个学科,研究从数据中自动学习,以便计算机能根据它们收到的反馈调整自身运行。与人工智能、数据挖掘、统计方法关系密切。

购物篮分析(Market Basket Analysis): 识别在交易中经常同时出现的商品组合或服务组合,例如经常被一起购买的产品。此类分析的结果被用于推荐附加商品,为陈列商品的决策提供依据等。

联机分析处理(On-Line Analytical Processing, OLAP): 能让用户轻松制作、浏览报告的工具,这些报告总结相关数据,并从多角度分析。

预测分析(Predictive Analytics): 从现存的数据集中提取信息以便识别模式、预测未来收益和趋势。在商业领域,预测模型及分析被用于分析当前数据和历史事实,以更好了解消费者、产品、合作伙伴,并为公司识别机遇和风险。

实时决策(Real Time Decisioning, RTD): 帮助企业做出实时(近乎无延迟)的最优销售/营销决策。比如,实时决策系统(打分系统)可以通过多种商业规则或模型,在顾客与公司互动的瞬间,对顾客进行评分和排名。

留存/顾客留存(Retention / Customer Retention): 指建立后能够长期维持的客户关系的百分比。

社交网络分析(Social Network Analysis, SNA): 描绘并测量人与人、组与组、机构与机构、电脑与电脑、URL与URL、以及其他种类相连的信息/知识实体之间的关系与流动。这些人或组是网络中的节点,而它们之间的连线表示关系或流动。SNA为分析人际关系提供了一种方法,既是数学的又是视觉的。

生存分析(Survival Analysis): 估测一名顾客继续使用某业务的时间,或在后续时段流失的可能性。此类信息能让企业判断所要预测时段的顾客留存,并引入合适的忠诚度政策。

文本挖掘(Text Mining): 对包含自然语言的数据的分析。对源数据中词语和短语进行统计计算,以便用数学术语表达文本结构,之后用传统数据挖掘技术分析文本结构。

非结构化数据(Unstructured Data):数据要么缺乏事先定义的数据模型,要么没按事先定义的规范进行组织。这个术语通常指那些不能放在传统的列式数据库中的信息,比如电子邮件信息、评论。

网络挖掘/网络数据挖掘(Web Mining / Web Data Mining) : 使用数据挖掘技术从互联网站点、文档或服务中自动发现和提取信息。

本文作者:佚名

来源:51CTO

时间: 2025-01-30 06:25:43

数据挖掘与预测分析术语总结的相关文章

预测分析:R语言实现.

数据科学与工程技术丛书 预测分析:R语言实现 Mastering Predictive Analytics with R [希] 鲁伊·米格尔·福特(Rui Miguel Forte) 著 吴今朝 译 图书在版编目(CIP)数据 预测分析:R语言实现/(希)鲁伊·米格尔·福特(Rui Miguel Forte)著:吴今朝译. -北京:机械工业出版社,2016.10 (数据科学与工程技术丛书) 书名原文:Mastering Predictive Analytics with R ISBN 978-

预测分析:R语言实现导读

前 言 预测分析以及更一般意义上的数据科学当前正处于被追捧的热潮中,因为像垃圾邮件过滤.单词补全和推荐引擎这样的预测性技术已经被广泛运用于日常生活.这些技术现在不仅越来越被我们所熟悉,还赢得了我们的信任.在计算机处理能力和软件方面(例如R语言及其大量专用的扩展包)的发展产生了这样的局面:用户经过培训就可以使用这些工具,而无需具备统计学的高级学位,也不需要使用公司或大学实验室专用的硬件.技术的成熟度和基础软硬件的可用性结合起来,让很多该领域的从业者倍感兴奋,他们感到可以为自己的领域和业务设计一些能

探索PMML预测分析和开放式标准的强大功能

PMML 受多种顶级统计工具的支持.因此,将预测分析模型应用于实践的过程非常简单,因为您可以在一个工具中建立一个模型,然后立即在另一个工具中对其进行部署.在这个传感器和http://www.aliyun.com/zixun/aggregation/12240.html">数据收集日益普遍深入的世界,像 PMML 这样的预测分析和标准使人们可以从智慧解决方案中受益,并真正改变他们的生活. 如果现在有人问您是否使用过预测分析,您可能会回答 "没有".其实并非如此,您可能每天

《Python机器学习——预测分析核心算法》——1.1 为什么这两类算法如此有用

1.1 为什么这两类算法如此有用 有几个因素造就了惩罚线性回归和集成方法成为有用的算法集.简单地说,面对实践中遇到的绝大多数预测分析(函数逼近)问题,这两类算法都具有最优或接近最优的性能.这些问题包含:大数据集.小数据集.宽数据集(wide data sets)[1].高瘦数据集(tall skinny data sets)[2].复杂问题.简单问题,等等.Rich Caruana及其同事的两篇论文为上述论断提供了证据. 1."An Empirical Comparison of Supervi

预测分析:R语言实现1.1 模型

1.1 模型 模型是预测分析学的核心,因此,本书一开始会讨论各种模型及其形式.简而言之,模型是我们要理解和分析的状态.流程或系统的一种表现形式.我们创建模型的目的是根据它得出推论以及(在本书中对我们更为重要的一点)对世界进行预测.模型的格式和风格有很多种,我们在本书中会探讨这种多样性中的一部分.模型可以是和我们能够观察或测量的数量值相关的一些方程,也可以是一套规则.我们大部分人在学校都熟悉的一个简单模型是牛顿第二运动定律.该定律表明,一个物体受到的合力会使之在合力作用的方向加速,加速度和合力大小

《 营销数据科学: 用R和Python进行预测分析的建模技术》——导读

前 言 "人总会失去养育自己的一切,自然界的事物莫不如此.勇敢的人总是从容应对,静观其变,而不会溜之大吉." --2012年美国电影<南方的野兽>中赫什帕皮(奎温简妮·沃利斯饰) 以前的市场营销教材编写者总会推广"营销理念",说营销既不是销售也不是买卖,而是去了解和满足顾客需求.他们往往把"营销研究(市场调查)"和"市场研究"区分开,把前者列为一门商业学科,而把后者划入经济学的范畴."营销研究"

营销自动化的4大预测分析错误

预测分析是数字营销的新领域.许多专家已经讨论了将预测分析与营销自动化工具(如HubSpot和Marketo)合并的好处. 将预测分析整合到用户的营销自动化策略中可能非常有益,但也很难执行.以下是可能会阻止其实施的一些常见的错误: 1.专注于数据收集的可扩展性高于一切 大数据为数字营销打开了许多大门.许多营销人员尽量收集目标客户的数据. 在目标市场上收集大量数据可能是有价值的.Kajabi公司最近推出了一种新的内容营销管道方法,对于拥有大量高质量数据的企业来说,这是非常有利可图的. 而其关键词是质

帮助您亲自了解预测分析的一些新应用(三)

过去,实际应用预测解决方案是一项非常繁杂的过程,需要投入大量的时间和资源.预测模型标记语言 (PMML) 的出现彻底改变了这一局面.构建解决方案的http://www.aliyun.com/zixun/aggregation/7155.html">开发人员现在可以在几分钟之内就将预测解决方案投入使用.作为预测分析的事实标准,PMML 受到所有顶级数据挖掘供应商的支持,包括商业和开源的供应商.构建好预测模型后,可以很轻松地将其导出到一个 PMML 文件中.之后,您可以直接将该文件部署到一个基

当前大数据和预测分析的新动力

当前,无论是从预测市场趋势到获取客户需求的洞察力,预测分析可以帮助企业利用他们的数据发现新的机遇并赢得竞争对手. 然而,通过研究发现,企业并不是用大数据和预测分析来实现他们的全部潜力. 这并不是说他们没有看到好处: 85%的机构受访者表示,预测分析对他们的业务产生了积极的影响,而77%的人认为这能帮助他们在竞争中占上风. 主要的障碍是技能,有四分之三的受访者发现企业内需要新的数据科学技能来利用技术. ●越来越重要 为什么预测分析变得越来越迫切? 在过去的几年中关于大数据我们已经听到了很多.企业收