ClassicalMDS#

класс sklearn.manifold.ClassicalMDS(n_components=2, *, метрика='euclidean', metric_params=None)[источник]#

Классическое многомерное шкалирование (MDS).

Это также известно как анализ главных координат (PCoA) или масштабирование Торгерсона. Это версия MDS, имеющая точное решение в терминах собственного разложения. Если входная матрица несходства состоит из попарных евклидовых расстояний между некоторыми векторами, то классический MDS эквивалентен PCA, применённому к этому набору векторов.

Подробнее в Руководство пользователя.

Параметры:

n_componentsint, по умолчанию=2

Количество измерений вложения.

метрикаstr или callable, по умолчанию='euclidean'

Метрика для вычисления несходства. По умолчанию используется "евклидова".

Если metric является строкой, она должна быть одним из вариантов, разрешённых scipy.spatial.distance.pdist для его параметра metric, или метрика, перечисленная в sklearn.metrics.pairwise.distance_metrics

Если метрика "precomputed", предполагается, что X является матрицей расстояний и должна быть квадратной во время обучения.

Если metric - вызываемая функция, она принимает два массива, представляющих 1D векторы, в качестве входных данных и должна возвращать одно значение, указывающее расстояние между этими векторами. Это работает для метрик Scipy, но менее эффективно, чем передача имени метрики в виде строки.

metric_paramsdict, по умолчанию=None

Дополнительные ключевые аргументы для вычисления несходства.

Атрибуты:

embedding_ndarray формы (n_samples, n_components): Сохраняет позицию набора данных в пространстве вложений.
dissimilarity_matrix_ndarray формы (n_samples, n_samples): Попарные различия между точками.
eigenvalues_ndarray формы (n_components,): Собственные значения дважды центрированной матрицы несходства, соответствующие каждому из выбранных компонентов. Они равны квадратам 2-норм n_components переменных во вложенном пространстве.
n_features_in_int: Количество признаков, замеченных во время fit.
feature_names_in_ndarray формы (n_features_in_,): Имена признаков, наблюдаемых во время fit. Определено только когда X имеет имена признаков, которые все являются строками.

Смотрите также

sklearn.decomposition.PCA: Метод главных компонент.
MDS: Метрическое и неметрическое MDS.

Ссылки

[1]

«Современное многомерное шкалирование - теория и приложения» Борг, И.; Грунен П. Серия Springer по статистике (1997)

Примеры

>>> from sklearn.datasets import load_digits
>>> from sklearn.manifold import ClassicalMDS
>>> X, _ = load_digits(return_X_y=True)
>>> X.shape
(1797, 64)
>>> cmds = ClassicalMDS(n_components=2)
>>> X_emb = cmds.fit_transform(X[:100])
>>> X_emb.shape
(100, 2)

fit(X, y=None)[источник]#

Вычислить позиции встраивания.

Параметры:

Xмассивоподобный объект формы (n_samples, n_features) или (n_samples, n_samples): Входные данные. Если metric=='precomputed', вход должен быть матрицей несходства.
yИгнорируется: Не используется, присутствует для согласованности API по соглашению.

Возвращает:

selfobject: Обученный оценщик.

fit_transform(X, y=None)[источник]#

Вычислить и вернуть позиции вложения.

Параметры:

Xмассивоподобный объект формы (n_samples, n_features) или (n_samples, n_samples): Входные данные. Если metric=='precomputed', вход должен быть матрицей несходства.
yИгнорируется: Не используется, присутствует для согласованности API по соглашению.

Возвращает:

X_newndarray формы (n_samples, n_components): Координаты вложения.

6332()[источник]#

Получить маршрутизацию метаданных этого объекта.

Пожалуйста, проверьте Руководство пользователя о том, как работает механизм маршрутизации.

Возвращает:

маршрутизацияMetadataRequest: A MetadataRequest Инкапсуляция информации о маршрутизации.

get_params(глубокий=True)[источник]#

Получить параметры для этого оценщика.

Параметры:

глубокийbool, по умолчанию=True: Если True, вернет параметры для этого оценщика и вложенных подобъектов, которые являются оценщиками.

Возвращает:

paramsdict: Имена параметров, сопоставленные с их значениями.

set_params(**params)[источник]#

Установить параметры этого оценщика.

Метод работает как на простых оценщиках, так и на вложенных объектах (таких как Pipeline). Последние имеют параметры вида __ чтобы можно было обновить каждый компонент вложенного объекта.

Параметры: