0x06 - 聚类算法 - 我从哪里来,又到哪里去
聚类,Clustering
今天遇到了一个需求,需要在二维平面上将相似(相近)的坐标归类到一起,好方便下一步的数据分析工作。
那么趁此机会,不如来说说不同聚类算法的,计算过程。
施工中
开始之前
先来聊聊什么是聚类。
聚类是统计学上的概念,属于机器学习中的非监督学习。简单来说,应用这种算法的最根本目的就在于,让数据根据本身的特性进行分类,最终区分出同类与不同类的数据。
由于事先我们并不知道该如何分类处理这些数据,因此,我们并没有明确的分类准则。正因为这这样,我们需要数据本身来为我们提供划分标准,因而属于非监督学习。
0x00 K-Means
0x01 Meanshift Clustering
0x02 DBScan Clustering
Density-based spatial clustering of applications with noise (DBSCAN)