数据挖掘——概述

数据挖掘:运用基于计算机的方法(包括新技术)从数据中获得有用知识的整个过程,这就叫做数据挖掘。

在当今竞争的世界中,数据挖掘所扮演的角色越来越重要。

数据挖掘是一个迭代的过程。它从大量数据中搜寻有价值,非同寻常的新信息。这是人和计算机合作的结果。

数据挖掘的基本目标为:预测 和 描述。

    预测性数据挖掘:生成给定数据集所描述的系统模型

    描述性数据挖掘: 在可用的数据基础上生成新的,非同寻常的信息。

数据挖掘的基本任务:

     分类——发现某个预测学习功能,将一个数据项分类到几个预定义类中的一个

     回归——发现某个预测学习功能,讲一个数据项映射到一个真实值预测变量上

     聚类——一个常见的描述性任务,用于确定有限的一组类别或聚类,来描述数据

     总结概括——一项附加的描述性任务,涉及寻找数据集与子集的简单描述的方法。

     关联建模——发现一个本地模型,来描述变量之间或者数据集货其一部分的特征值之间的重要相关性能

     变化和偏差监测——发现数据集中最重要的变化。

要成为数据挖掘过程的分析者和设计者,除了具备全面的专业知识外,还要有创新思维和从不同角度看待问题的主动性。

 

时间: 2024-10-01 03:50:42

数据挖掘——概述的相关文章

《python 与数据挖掘 》一第1章 数据挖掘概述 1.1 数据挖掘简介

本节书摘来自华章出版社<python 与数据挖掘 >一书中的第1章,第1.1节,作者张良均 杨海宏 何子健 杨 征,更多章节内容可以访问"华章计算机"公众号查看. 第1章 数据挖掘概述 广义的数据挖掘是指针对收集的大规模数据,应用整套科学工具和挖掘技术(如数据.计算.可视化.分析.统计.实验.问题定义.建模与验证等),从数据之中发现隐含的.对决策有参考意义的信息.价值和趋势.因此,数据挖掘是一个横跨多学科的计算机科学分支.强调它隶属计算机科学范畴,是希望读者认识到这个领域的

数据挖掘概述

数据 随着数据库技术的不断发展及数据库管理系统的广泛应用,数据库中存储的数据量急剧增大,在大量的数据背后隐藏着许多重要的信息,如果能把这些信息从数据库中抽取出来,将为公司创造很多潜在的利润,而这种从海量数据库中挖掘信息的技术,就称之为数据挖掘.     数据挖掘工具能够对将来的趋势和行为进行预测,从而很好地支持人们的决策,比如,经过对公司整个数据库系统的分析,数据挖掘工具可以回答诸如"哪个客户对我们公司的邮件推销活动最有可能作出反应,为什么"等类似的问题.有些数据挖掘工具还能够解决一些

数据挖掘概述(又)

数据 数据挖掘工具是怎样准确地告诉你那些隐藏在数据库深处的重要信息的呢?它们又是如何作出预测的?答案就是建模.建模实际上就是在你知道结果的情况下建立起一种模型,并且把这种模型应用到你所不知道的那种情况中.比如说,如果你想要在大海上去寻找一艘古老的西班牙沉船,也许你首先想到的就是去找找过去发现这些宝藏的时间和地点有哪些.那么,经过调查你发现这些沉船大部分都是在百慕大海区被发现,并且那个海区有着某种特征的洋流,以及那个时代的航线也有一定的特征可寻.在这众多的类似特征中,你将它们抽象并概括为一个普适的

数据库的数据挖掘概述(二)

数据|数据库 数据挖掘工具是怎样准确地告诉你那些隐藏在数据库深处的重要信息的呢?它们又是如何作出预测的?答案就是建模.建模实际上就是在你知道结果的情况下建立起一种模型,并且把这种模型应用到你所不知道的那种情况中.比如说,如果你想要在大海上去寻找一艘古老的西班牙沉船,也许你首先想到的就是去找找过去发现这些宝藏的时间和地点有哪些.那么,经过调查你发现这些沉船大部分都是在百慕大海区被发现,并且那个海区有着某种特征的洋流,以及那个时代的航线也有一定的特征可寻.在这众多的类似特征中,你将它们抽象并概括为一

数据库的数据挖掘概述(一)

数据|数据库 随着数据库技术的不断发展及数据库管理系统的广泛应用,数据库中存储的数据量急剧增大,在大量的数据背后隐藏着许多重要的信息,如果能把这些信息从数据库中抽取出来,将为公司创造很多潜在的利润,而这种从海量数据库中挖掘信息的技术,就称之为数据挖掘.     数据挖掘工具能够对将来的趋势和行为进行预测,从而很好地支持人们的决策,比如,经过对公司整个数据库系统的分析,数据挖掘工具可以回答诸如"哪个客户对我们公司的邮件推销活动最有可能作出反应,为什么"等类似的问题.有些数据挖掘工具还能够

数据挖掘与数据化运营实战

大数据技术丛书 数据挖掘与数据化运营实战:思路.方法.技巧与应用 卢辉 著 图书在版编目(CIP)数据 数据挖掘与数据化运营实战:思路.方法.技巧与应用 / 卢辉著.-北京:机械工业出版社,2013.6 (大数据技术丛书) ISBN 978-7-111-42650-9 I. 数- II. 卢- III. 数据采集 IV. TP274 中国版本图书馆CIP数据核字(2013)第111479号 版权所有·侵权必究 封底无防伪标均为盗版 本书法律顾问 北京市展达律师事务所     本书是目前有关数据挖

《python 与数据挖掘 》 一 导读

前 言 为什么要写本书? Python是什么? Python是一种带有动态语义的.解释性的.面向对象的高级编程语言.其高级内置数据结构,结合动态类型和动态绑定,使其对于敏捷软件开发非常具有吸引力.同时,Python作为脚本型(胶水)语言连接现有的组件也十分高效.Python语法简洁,可读性强,从而能降低程序的维护成本.不仅如此,Python支持模块和包,鼓励程序模块化和代码重用. Python语言的解释性使其语法更接近人类的表达和思维过程,开发程序的效率极高.习惯使用Python者,总习惯在介绍

数据挖掘与数据化运营实战.导读

 本书是目前有关数据挖掘在数据化运营实践领域比较全面和系统的著作,也是诸多数据挖掘书籍中为数不多的穿插大量真实的实践应用案例和场景的著作,更是创造性地针对数据化运营中不同分析挖掘课题类型,推出一一对应的分析思路集锦和相应的分析技巧集成,为读者提供"菜单化"实战锦囊的著作.作者结合自己数据化运营实践中大量的项目经验,用通俗易懂的"非技术"语言和大量活泼生动的案例,围绕数据分析挖掘中的思路.方法.技巧与应用,全方位整理.总结.分享,帮助读者深刻领会和掌握"以业

《python 与数据挖掘 》——第一部分 基 础 篇

第一部分 基 础 篇第1章 数据挖掘概述第2章 Python基础入门第3章 函数第4章 面向对象编程第5章 Python实用模块第6章 图表绘制入门