Примечание
Перейти в конец чтобы скачать полный пример кода или запустить этот пример в браузере через JupyterLite или Binder.
Демонстрация структурированной иерархической кластеризации Уорда на изображении монет#
Вычисляет сегментацию 2D-изображения с помощью иерархической кластеризации Уорда. Кластеризация пространственно ограничена, чтобы каждая сегментированная область была цельной.
# Authors: The scikit-learn developers
# SPDX-License-Identifier: BSD-3-Clause
Сгенерировать данные#
from skimage.data import coins
orig_coins = coins()
Измените его размер до 20% от исходного размера для ускорения обработки. Применение фильтра Гаусса для сглаживания перед уменьшением масштаба уменьшает артефакты наложения спектров.
import numpy as np
from scipy.ndimage import gaussian_filter
from skimage.transform import rescale
smoothened_coins = gaussian_filter(orig_coins, sigma=2)
rescaled_coins = rescale(
smoothened_coins,
0.2,
mode="reflect",
anti_aliasing=False,
)
X = np.reshape(rescaled_coins, (-1, 1))
Определить структуру данных#
Пиксели связаны со своими соседями.
from sklearn.feature_extraction.image import grid_to_graph
connectivity = grid_to_graph(*rescaled_coins.shape)
Вычисление кластеризации#
import time as time
from sklearn.cluster import AgglomerativeClustering
print("Compute structured hierarchical clustering...")
st = time.time()
n_clusters = 27 # number of regions
ward = AgglomerativeClustering(
n_clusters=n_clusters, linkage="ward", connectivity=connectivity
)
ward.fit(X)
label = np.reshape(ward.labels_, rescaled_coins.shape)
print(f"Elapsed time: {time.time() - st:.3f}s")
print(f"Number of pixels: {label.size}")
print(f"Number of clusters: {np.unique(label).size}")
Compute structured hierarchical clustering...
Elapsed time: 0.164s
Number of pixels: 4697
Number of clusters: 27
Построить результаты на изображении#
Агломеративная кластеризация способна сегментировать каждую монету, однако нам пришлось
использовать n_cluster больше, чем количество монет, потому что сегментация
находит большой на фоне.
import matplotlib.pyplot as plt
plt.figure(figsize=(5, 5))
plt.imshow(rescaled_coins, cmap=plt.cm.gray)
for l in range(n_clusters):
plt.contour(
label == l,
colors=[
plt.cm.nipy_spectral(l / float(n_clusters)),
],
)
plt.axis("off")
plt.show()

Общее время выполнения скрипта: (0 минут 0.335 секунд)
Связанные примеры
Сравнение различных методов иерархической связи на игрушечных наборах данных
Сравнение различных алгоритмов кластеризации на игрушечных наборах данных