Примечание

Перейти в конец чтобы скачать полный пример кода или запустить этот пример в браузере через JupyterLite или Binder.

Распространение меток по кругам: Обучение сложной структуре#

Пример обучения LabelPropagation сложной внутренней структуры для демонстрации "обучения многообразию". Внешний круг должен быть помечен как "красный", а внутренний — "синий". Поскольку обе группы меток находятся внутри своих отдельных форм, мы видим, что метки правильно распространяются по кругу.

# Authors: The scikit-learn developers
# SPDX-License-Identifier: BSD-3-Clause

Мы генерируем набор данных с двумя концентрическими окружностями. Кроме того, с каждым образцом набора данных связана метка: 0 (принадлежность к внешней окружности), 1 (принадлежность к внутренней окружности) и -1 (неизвестно). Здесь все метки, кроме двух, помечены как неизвестные.

import numpy as np

from sklearn.datasets import make_circles

n_samples = 200
X, y = make_circles(n_samples=n_samples, shuffle=False)
outer, inner = 0, 1
labels = np.full(n_samples, -1.0)
labels[0] = outer
labels[-1] = inner

Построить исходные данные

import matplotlib.pyplot as plt

plt.figure(figsize=(4, 4))
plt.scatter(
    X[labels == outer, 0],
    X[labels == outer, 1],
    color="navy",
    marker="s",
    lw=0,
    label="outer labeled",
    s=10,
)
plt.scatter(
    X[labels == inner, 0],
    X[labels == inner, 1],
    color="c",
    marker="s",
    lw=0,
    label="inner labeled",
    s=10,
)
plt.scatter(
    X[labels == -1, 0],
    X[labels == -1, 1],
    color="darkorange",
    marker=".",
    label="unlabeled",
)
plt.legend(scatterpoints=1, shadow=False, loc="center")
_ = plt.title("Raw data (2 classes=outer and inner)")

Целью LabelSpreading состоит в присвоении метки образцу, где метка изначально неизвестна.

from sklearn.semi_supervised import LabelSpreading

label_spread = LabelSpreading(kernel="knn", alpha=0.8)
label_spread.fit(X, labels)

LabelSpreading(alpha=0.8, kernel='knn')

В среде Jupyter, пожалуйста, перезапустите эту ячейку, чтобы показать HTML-представление, или доверьтесь блокноту.
На GitHub HTML-представление не может отображаться, попробуйте загрузить эту страницу с помощью nbviewer.org.

Теперь мы можем проверить, какие метки были связаны с каждым образцом, когда метка была неизвестна.

output_labels = label_spread.transduction_
output_label_array = np.asarray(output_labels)
outer_numbers = (output_label_array == outer).nonzero()[0]
inner_numbers = (output_label_array == inner).nonzero()[0]

plt.figure(figsize=(4, 4))
plt.scatter(
    X[outer_numbers, 0],
    X[outer_numbers, 1],
    color="navy",
    marker="s",
    lw=0,
    s=10,
    label="outer learned",
)
plt.scatter(
    X[inner_numbers, 0],
    X[inner_numbers, 1],
    color="c",
    marker="s",
    lw=0,
    s=10,
    label="inner learned",
)
plt.legend(scatterpoints=1, shadow=False, loc="center")
plt.title("Labels learned with Label Spreading (KNN)")
plt.show()

Labels learned with Label Spreading (KNN)

Общее время выполнения скрипта: (0 минут 0.131 секунд)

Связанные примеры

Граница решения полуконтролируемых классификаторов против SVM на наборе данных Iris

Демонстрация алгоритма Spectral Biclustering

Полу-контролируемая классификация на текстовом наборе данных

Распространение меток на цифрах: Демонстрация производительности

Галерея, созданная Sphinx-Gallery

	ядро kernel: {'knn', 'rbf'} или вызываемый, по умолчанию='rbf' Строковый идентификатор для используемой функции ядра или функция ядра сам. Только строки 'rbf' и 'knn' являются допустимыми входными данными. Функция передаваемая функция должна принимать два входа, каждый формы (n_samples, n_features), и вернуть матрицу весов формы (n_samples, n_samples).	'knn'
	gamma gamma: float, по умолчанию=20 Параметр для ядра rbf.	20
	n_neighbors n_neighbors: int, по умолчанию=7 Параметр для ядра knn, который является строго положительным целым числом.	7
	alpha alpha: float, по умолчанию=0.2 Коэффициент ограничения. Значение в (0, 1), которое определяет относительное количество что экземпляр должен принимать информацию от своих соседей как в отличие от его исходной метки. alpha=0 означает сохранение исходной информации меток; alpha=1 означает заменяя всю исходную информацию.	0.8
	max_iter max_iter: int, по умолчанию=30 Максимальное количество итераций, разрешенное.	30
	tol tol: float, по умолчанию=1e-3 Допуск сходимости: порог для рассмотрения системы в установившемся состоянии состояние.	0.001
	n_jobs n_jobs: int, default=None Количество параллельных задач для выполнения. ``None`` означает 1, если не в контексте :obj:`joblib.parallel_backend`. ``-1`` означает использование всех процессоров. См. :term:`Глоссарий ` для получения дополнительной информации.	None

Распространение меток по кругам: Обучение сложной структуре#

Эта страница