聚类分析用哪些公用数据集测试比较好?

问题描述

聚类分析用哪些公用数据集测试比较好?

UCI数据集有好多种类,不知道选什么好,貌似Clustering和Classfication类别下的都可以?这两个类别有什么区别啊,感觉都是分类呀?

不是UCI上的也可以给我推荐一下,比较迷茫,最好是二维的数据。

解决方案

也许你可以根据算法来 聚类分析有那么多算法 根据距离的 动态聚类 模糊聚类 遗传算法聚类等等 根据算法来选择适合这种算法的UCI类 也许能提高识别率 就像初期做人脸识别用PCA降维再用一种分类器 就比较适合选择ORL人脸库

解决方案二:

请问哪里可以下载UCI数据集

时间: 2024-10-29 12:23:07

聚类分析用哪些公用数据集测试比较好?的相关文章

用SQL语句生成带有小计合计的数据集脚本

使用SQL语句生成带有小计合计的数据集: 测试用户: scott 测试用表: dept,emp ////////////////////////////////// //检索出需要进行统计的数据集 select dept.dname,emp.job,sal from emp,dept where emp.deptno=dept.deptno; ////////////////////////////////// //根据部门名称以及职位进行汇总,并为每个部门 生成'小计',最后生成'合计'. s

阿里云数加(大数据)公开数据集(公测ing)

目前阿里云大数据产品已经免费向全部用户开放了多种公用数据集.在此之前,获取,分析,下载自定义的大型分析数据集需要数小时乃至数天才能完成. 而现在阿里云的任何用户都可以通过基于大数据计算服务[MaxCompute](https://www.aliyun.com/product/odps) 的大数据开发套件[DataIDE](https://data.aliyun.com/product/ide)快速.便捷的分析这些公用数据集. 开通MaxCompute&大数据开发套件的教程参考:https://h

基于超出内存可加载范围的数据集的逻辑回归分类器LR分类器

假如你想创建一个机器学习模型,但却发现你的输入数据集与你的计算机内存不相符?对于多机器的计算集群环境中通常可以使用如Hadoop和Apache Spark分布式计算工具.然而,Apache Spark能够在本地机器独立模式上,甚至在当输入数据集大于你的计算机内存时通过创建模型处理你的数据. 1.输入数据和预期结果 在上一篇文章我们讨论了"How To Find Simple And Interesting Multi-Gigabytes Data Set",本文将使用上文中提及数据集的

如何在Dreamweaver中设计首页

  一.网站设计思路 每个网页开始前,一般要在Firworks或在Photoshop等图像设计软件中设计好基本页面设计,图4-1-1就是Photoshop中设计好的基本页面设计图. 图4-1-1 Doking's BLOG基本页面设计图 在图4-1-1中序号①画上红色方圈部分的是网页的左边栏目,目前是空白的,它的栏目在以后章节中会一一添加上去的,序号②画上红色方圈部分的是网站的导航条,它是由第三章建立的dkblog.mdb数据库中的LM表动态生成的.基本思路已清楚后,开始构建立网站的模板. 二.

Dreamweaver构建Blog全程实录(4)-首页的实现

dreamweaver 第四章  Doking's BLOG首页的实现 现在,万事俱备,应该着手Doking's BLOG的页面设计和数据库前台的实现. 4.1  基本页面设计 这里,不是要谈网页艺术创造的知识,而是讲解在Dreamweaver MX2004中构建网站内页的思路和方法. 4.1.1 网站设计思路 每个网页开始前,一般要在Firworks或在Photoshop等图像设计软件中设计好基本页面设计,图4-1-1就是Photoshop中设计好的基本页面设计图. 图4-1-1  Dokin

Dreamweaver构建Blog(4):首页的实现

dreamweaver Dreamweaver构建Blog全程实录(1)·Dreamweaver构建Blog(2):构建开发环境 Dreamweaver构建Blog(3):数据库的设计和连接·Dreamweaver构建Blog(4):首页的实现 现在,万事俱备,应该着手Doking's BLOG的页面设计和数据库前台的实现. 4.1  基本页面设计 这里,不是要谈网页艺术创造的知识,而是讲解在Dreamweaver MX2004中构建网站内页的思路和方法. 4.1.1 网站设计思路 每个网页开始

PaperWeekly 第37期 | 论文盘点:检索式问答系统的语义匹配模型(神经网络篇)

" slvher 助理来也后端/算法工程师  目前研发方向为多轮对话系统 问答系统可以基于规则实现,可以基于检索实现,还可以通过对 query 进行解析或语义编码来生成候选回复(如通过解析 query并查询知识库后生成,或通过 SMT 模型生成,或通过 encoder-decoder 框架生成,有些 QA 场景可能还需要逻辑推理才能生成回复).   具体到检索式问答系统,其典型场景是:1)候选集先离线建好索引:2)在线服务收到 query 后,初步召回一批候选回复:3)matching 和 ra

《中国人工智能学会通讯》——5.25 受神经线路连接模式的启发

5.25 受神经线路连接模式的启发 单个神经元能完成的功能非常简单,而复杂的任务往往由很多神经元组成的神经网络来完成.视觉系统可以看作一个深层递归神经网络.首先,它是由多个皮层组成的层级结构,沿着层级通路(腹侧通路)由低到高各个皮层编码的特征逐渐由简单变复杂.然后,视觉系统中存在多种类型的连接,包括低层到高层的前馈连接.层内神经元相互之间的递归连接,以及高层神经元到低层神经元的反馈连接[13] .计算机视觉中常用的卷积神经网络(CNN)往往是纯前馈的.受大脑中广泛存在的递归连接的启发,文献 [5

关于Redis的一点思考与总结

关于Redis的一点思考与总结 Redis是一个复杂而又设计优良的系统,说它复杂是因为整个系统涉及到了很多方面的问题,比如:哈希存储.网络模型.集群特性等等.说它设计优良是因为这些问题它都提供了深思熟虑的解决方案. 我们花大量的时间学习一个技术,不仅为了能更好的使用它,同时希望学习它设计上的一些思路,这样在解决日常工作碰到的各种各样的问题的时候思路会更开阔.以下是对Redis一小部分内部机制的思考与总结. Slot机制 Slot机制的运维收益 Redis早期是不支持集群功能的,如果需要做数据分片