0x06 - 聚类算法 - 我从哪里来,又到哪里去

聚类,Clustering

今天遇到了一个需求,需要在二维平面上将相似(相近)的坐标归类到一起,好方便下一步的数据分析工作。

那么趁此机会,不如来说说不同聚类算法的,计算过程。

施工中

开始之前

先来聊聊什么是聚类。

聚类是统计学上的概念,属于机器学习中的非监督学习。简单来说,应用这种算法的最根本目的就在于,让数据根据本身的特性进行分类,最终区分出同类与不同类的数据。

由于事先我们并不知道该如何分类处理这些数据,因此,我们并没有明确的分类准则。正因为这这样,我们需要数据本身来为我们提供划分标准,因而属于非监督学习。

0x00 K-Means

0x01 Meanshift Clustering

0x02 DBScan Clustering

Density-based spatial clustering of applications with noise (DBSCAN)

0x03 Agglomerative Hierarchical Clustering