matlab-谱聚类一些疑问spectral clustering

问题描述

谱聚类一些疑问spectral clustering

以Unnormalized为例,W -> D -> L=D-W, 对拉普拉斯矩阵求特征值和特征向量,然后对选取的特征向量阵进行聚类,得到聚类结果

但是在Matlab中,我直接对W进行按行聚类,同样能得到聚类结果,而且这样时间还大大缩短。

疑问?为什么会这样呢!!?

解决方案

聚类效果和数据集有关系,

解决方案二:

聚类效果和数据集有关系,

时间: 2024-12-05 14:46:44

matlab-谱聚类一些疑问spectral clustering的相关文章

一个简单谱聚类的例子

聚类是一种常见的无监督学习方法,目的在于从原始无标记数据中提取出分类标记.最简单的代表是K-means聚类,下面给出一个简单例子: n=300; c=3; t=randperm(n); x=[randn(1,n/3)-2 randn(1,n/3) randn(1,n/3)+2; randn(1,n/3) randn(1,n/3)+4 randn(1,n/3)]'; m=x(t(1:c),:); x2=sum(x.^2,2); s0(1:c,1)=inf; for o=1:1000 m2=sum(

《中国人工智能学会通讯》——11.27 统一先验建模框架 I:约束谱聚类

11.27 统一先验建模框架 I:约束谱聚类 仅仅利用颜色.纹理等底层特征仅能得到关于图像的过分割,如图 1 中所示即为用文献 [1] 中方法得到的层次化分割结果.在第 2 章和第 3 章中,已经尝试利用多多视觉信号来实现视觉物体分割,在本章和下一章中,将尝试利用各种先验信息来实现语义物体分割.考虑图 5 中的先验信息,它们分别刻画了数据 点和类别的关系(一阶数据先验).两个数据点间的关系(二阶数据先验),以及多个数据点件的关系(三阶数据先验).这些先验信息有些是硬性的,例如上左的交互信息和上中

mahout系列:谱聚类

1.构造亲和矩阵W 2.构造度矩阵D 3.拉普拉斯矩阵L 4.计算L矩阵的第二小特征值(谱)对应的特征向量Fiedler 向量 5.以Fiedler向量作为kmean聚类的初始中心,用kmeans聚类 亲和矩阵 :W_ij=exp(-(d(s_i,s_j)/2o^2))             d (s_i,s_j)  = ||s_i,s_j||.    o 为事先设定的参数. 度矩阵:D_ii  =sum(w_i) 规范相似矩阵:D^(-1/2)*W*D^(1/2) ,即:W(i,j)/(D(

机器理解大数据的秘密:聚类算法深度详解

看看下面这张图,有各种各样的虫子和蜗牛,你试试将它们分成不同的组别? 不是很难吧,先从找出其中的蜘蛛开始吧! 完成了吗?尽管这里并不一定有所谓的「正确答案」,但一般来说我们可以将这些虫子分成四组:蜘蛛.蜗牛.蝴蝶/飞蛾.蜜蜂/黄蜂. 很简单吧?即使虫子数量再多一倍你也能把它们分清楚,对吗?你只需要一点时间以及对昆虫学的热情就够了--其实就算有成千上万只虫子你也能将它们分开. 但对于一台机器而言,将这 10 个对象分类成几个有意义的分组却并不简单--在一门叫做组合学(combinatorics)的

一文读懂聚类算法

1. 聚类的基本概念 1.1 定义 聚类是数据挖掘中的概念,就是按照某个特定标准(如距离)把一个数据集分割成不同的类或簇,使得同一个簇内的数据对象的相似性尽可能大,同时不在同一个簇中的数据对象的差异性也尽可能地大.也即聚类后同一类的数据尽可能聚集到一起,不同类数据尽量分离. 1.2 聚类与分类的区别 Clustering (聚类),简单地说就是把相似的东西分到一组,聚类的时候,我们并不关心某一类是什么,我们需要实现的目标只是把相似的东西聚到一起.因此,一个聚类算法通常只需要知道如何计算相似度就可

【独家】一文读懂聚类算法

1. 聚类的基本概念 1.1 定义 聚类是数据挖掘中的概念,就是按照某个特定标准(如距离)把一个数据集分割成不同的类或簇,使得同一个簇内的数据对象的相似性尽可能大,同时不在同一个簇中的数据对象的差异性也尽可能地大.也即聚类后同一类的数据尽可能聚集到一起,不同类数据尽量分离. 1.2 聚类与分类的区别 Clustering (聚类),简单地说就是把相似的东西分到一组,聚类的时候,我们并不关心某一类是什么,我们需要实现的目标只是把相似的东西聚到一起.因此,一个聚类算法通常只需要知道如何计算相似度就可

DIY图像压缩——机器学习实战之K-means 聚类图像压缩:色彩量化

更多深度文章,请关注:https://yq.aliyun.com/cloud 作者:ML bot2 这篇文章是K均值聚类算法(K-means clustering)的一个简单应用:压缩图像. 在彩色图像中,每个像素的大小为3字节(RGB),可以表示的颜色总数为256 * 256 * 256.下图为1280 x 720像素的图像,采用PNG格式(一种无损压缩技术),大小为1.71 MB. 我们的目标是使用颜色量化进一步压缩图像,尽管压缩过程会有损失. K均值聚类 这是一种在给定的数据点集合中找到"

k-means聚类算法介绍 k-means聚类算法怎么用

前提条件 特定领域的经验要求:无 专业经验要求:无行业经验 不需要机器学习的知识,但是读者应该熟悉基本的数据分析(如,描述性分析).为了实践该示例,读者也应该熟悉Python. K-means聚类简介 K-means聚类是一种无监督学习,用于有未标记的数据时(例如,数据没有定义类别或组).该算法的目标是在数据中找到分组,变量K代表分组的个数.该算法迭代地分配每个数据点到提供特征的K分组中的一个.数据点基于特征相似性聚集.K-means聚类算法的结果是: 1. K聚类的质心,它可以用来标记新数据

数据挖掘与数据分析

一.数据挖掘和数据分析概述 数据挖掘和数据分析都是从数据中提取一些有价值的信息,二者有很多联系,但是二者的侧重点和实现手法有所区分. 数据挖掘和数据分析的不同之处: 1.在应用工具上,数据挖掘一般要通过自己的编程来实现需要掌握编程语言;而数据分析更多的是借助现有的分析工具进行. 2.在行业知识方面,数据分析要求对所从事的行业有比较深的了解和理解,并且能够将数据与自身的业务紧密结合起来;而数据挖掘不需要有太多的行业的专业知识. 3.交叉学科方面,数据分析需要结合统计学.营销学.心理学以及金融.政治