Справочник API#

Это справочник по классам и функциям scikit-learn. Пожалуйста, обратитесь к полное руководство пользователя для дальнейших деталей, так как сырые спецификации классов и функций могут быть недостаточны, чтобы дать полные руководства по их использованию. Для справки по концепциям, повторяющимся в API, см. Глоссарий общих терминов и элементов API.

Объект

Описание

config_context

Контекстный менеджер для временного изменения глобальной конфигурации scikit-learn.

get_config

Получить текущую конфигурацию scikit-learn.

set_config

Установить глобальную конфигурацию scikit-learn.

show_versions

Выводить полезную отладочную информацию.

BaseEstimator

Базовый класс для всех оценщиков в scikit-learn.

BiclusterMixin

теперь имеет детерминированный вывод (разрешена неоднозначность знака в разложении по собственным значениям матрицы ядра).

ClassNamePrefixFeaturesOutMixin

Миксин-класс для трансформеров, которые генерируют свои имена с помощью префиксов.

ClassifierMixin

Mixin-класс для всех классификаторов в scikit-learn.

ClusterMixin

Миксин-класс для всех кластерных оценщиков в scikit-learn.

DensityMixin

Миксин-класс для всех оценщиков плотности в scikit-learn.

MetaEstimatorMixin

Миксин-класс для всех мета-оценщиков в scikit-learn.

OneToOneFeatureMixin

Предоставляет get_feature_names_out для простых трансформеров.

OutlierMixin

Миксин-класс для всех оценщиков обнаружения выбросов в scikit-learn.

RegressorMixin

Миксин-класс для всех регрессионных оценщиков в scikit-learn.

TransformerMixin

Миксин-класс для всех преобразователей в scikit-learn.

clone

Создать новый необученный оценщик с теми же параметрами.

is_classifier

Возвращает True, если данный оценщик (вероятно) является классификатором.

is_clusterer

Возвращает True, если данный оценщик (вероятно) является кластеризатором.

is_regressor

Возвращает True, если данный estimator (вероятно) является регрессором.

is_outlier_detector

Возвращает True, если данный оценщик (вероятно) является детектором выбросов.

CalibratedClassifierCV

Калибровка вероятностей с использованием изотонического, сигмоидного или температурного масштабирования.

calibration_curve

Вычислить истинные и предсказанные вероятности для калибровочной кривой.

CalibrationDisplay

Визуализация калибровочной кривой (также известной как диаграмма надежности).

AffinityPropagation

Выполнить кластеризацию данных методом распространения близости.

AgglomerativeClustering

Агломеративная кластеризация.

Birch

Реализует алгоритм кластеризации BIRCH.

BisectingKMeans

Биссекционный K-Means кластеризация.

DBSCAN

Выполнить кластеризацию DBSCAN из массива векторов или матрицы расстояний.

FeatureAgglomeration

Агломерировать признаки.

HDBSCAN

Кластеризация данных с использованием иерархической кластеризации на основе плотности.

KMeans

Кластеризация K-Means.

MeanShift

Кластеризация методом сдвига среднего с использованием плоского ядра.

MiniBatchKMeans

Кластеризация Mini-Batch K-Means.

OPTICS

Оценка структуры кластеризации из массива векторов.

SpectralBiclustering

Спектральная бикластеризация (Kluger, 2003) [R2af9f5762274-1].

SpectralClustering

Применить кластеризацию к проекции нормализованного лапласиана.

SpectralCoclustering

Алгоритм спектрального совместного кластерирования (Dhillon, 2001) [R0dd0f3306ba7-1].

affinity_propagation

Выполнить кластеризацию данных методом распространения близости.

cluster_optics_dbscan

Выполнить извлечение DBSCAN для произвольного эпсилон.

cluster_optics_xi

Автоматически извлекать кластеры в соответствии с методом Xi-steep.

compute_optics_graph

Вычислите граф достижимости OPTICS.

dbscan

Выполнить кластеризацию DBSCAN из массива векторов или матрицы расстояний.

estimate_bandwidth

Оцените ширину полосы для использования с алгоритмом mean-shift.

k_means

Выполнить алгоритм кластеризации K-средних.

kmeans_plusplus

Инициализировать n_clusters начальных значений в соответствии с k-means++.

mean_shift

Выполните кластеризацию методом сдвига среднего с использованием плоского ядра.

spectral_clustering

Применить кластеризацию к проекции нормализованного лапласиана.

ward_tree

Кластеризация Уорда на основе матрицы признаков.

ColumnTransformer

Применяет преобразователи к столбцам массива или pandas DataFrame.

TransformedTargetRegressor

Мета-оценщик для регрессии на преобразованной цели.

make_column_selector

Создать вызываемый объект для выбора столбцов для использования с

make_column_transformer

Создать ColumnTransformer из заданных преобразователей.

EllipticEnvelope

Объект для обнаружения выбросов в наборе данных с гауссовым распределением.

EmpiricalCovariance

Оценка ковариации методом максимального правдоподобия.

GraphicalLasso

Оценка разреженной обратной ковариации с оценщиком, использующим штраф L1.

GraphicalLassoCV

Разреженная обратная ковариация с кросс-валидированным выбором штрафа l1.

LedoitWolf

Оценщик LedoitWolf.

MinCovDet

Minimum Covariance Determinant (MCD): робастный оцениватель ковариации.

OAS

Oracle Approximating Shrinkage Estimator.

ShrunkCovariance

Оценщик ковариации с сжатием.

empirical_covariance

Вычислить оценку ковариации методом максимального правдоподобия.

graphical_lasso

Оценщик ковариации с L1-штрафом.

ledoit_wolf

Оцените сжатую ковариационную матрицу Ледойта-Вольфа.

ledoit_wolf_shrinkage

Оцените сжатую ковариационную матрицу Ледойта-Вольфа.

oas

Оценить ковариацию с Oracle Approximating Shrinkage.

shrunk_covariance

Вычислить ковариационные матрицы, сжатые по диагонали.

CCA

Канонический корреляционный анализ, также известный как "Режим B" PLS.

PLSCanonical

Преобразователь и регрессор частичных наименьших квадратов.

PLSRegression

PLS регрессия.

PLSSVD

Частичный метод наименьших квадратов SVD.

clear_data_home

Удалить все содержимое кэша домашней директории данных.

dump_svmlight_file

Сохранить набор данных в формате файла svmlight / libsvm.

fetch_20newsgroups

Загрузка имён файлов и данных из набора данных 20 новостных групп (классификация).

fetch_20newsgroups_vectorized

Загрузить и векторизовать набор данных 20 newsgroups (классификация).

fetch_california_housing

Загрузить набор данных о жилье в Калифорнии (регрессия).

fetch_covtype

Загрузите набор данных covertype (классификация).

fetch_file

Загрузите файл из интернета, если он еще не присутствует в локальной папке.

fetch_kddcup99

Загрузить набор данных kddcup99 (классификация).

fetch_lfw_pairs

Загрузить набор данных пар Labeled Faces in the Wild (LFW) (классификация).

fetch_lfw_people

Загрузить набор данных Labeled Faces in the Wild (LFW) людей (классификация).

fetch_olivetti_faces

Загрузите набор данных лиц Olivetti от AT&T (классификация).

fetch_openml

Загрузите набор данных из openml по имени или идентификатору набора данных.

fetch_rcv1

Загрузите многометочный набор данных RCV1 (классификация).

fetch_species_distributions

Загрузчик набора данных о распространении видов от Phillips et. al. (2006).

get_data_home

Возвращает путь к каталогу данных scikit-learn.

load_breast_cancer

Загрузить и вернуть набор данных о раке молочной железы в Висконсине (классификация).

load_diabetes

Загружает и возвращает набор данных по диабету (регрессия).

load_digits

Загрузить и вернуть набор данных digits (классификация).

load_files

Загрузить текстовые файлы с категориями в качестве имён подпапок.

load_iris

Загружает и возвращает набор данных ирисов (классификация).

load_linnerud

Загружает и возвращает набор данных Linnerud по физическим упражнениям.

load_sample_image

Загрузить массив numpy одного примера изображения.

load_sample_images

Загрузить примеры изображений для манипуляций с изображениями.

load_svmlight_file

Загрузить наборы данных в формате svmlight / libsvm в разреженную CSR-матрицу.

load_svmlight_files

Загрузить набор данных из нескольких файлов в формате SVMlight.

load_wine

Загрузить и вернуть набор данных wine (классификация).

make_biclusters

Сгенерировать массив структуры постоянного блочного диагоналя для бикластеризации.

make_blobs

Сгенерировать изотропные гауссовы сгустки для кластеризации.

make_checkerboard

Сгенерировать массив с блочной шахматной структурой для бикластеризации.

make_circles

Создать большой круг, содержащий меньший круг в 2D.

make_classification

Сгенерировать случайную задачу классификации на n классов.

make_friedman1

Сгенерировать регрессионную задачу "Friedman #1".

make_friedman2

Сгенерировать регрессионную задачу "Фридмана #2".

make_friedman3

Сгенерировать регрессионную задачу "Фридмана #3".

make_gaussian_quantiles

Генерировать изотропные гауссовы выборки и метки по квантилям.

make_hastie_10_2

Сгенерировать данные для бинарной классификации, использованные в Hastie et al. 2009, Пример 10.2.

make_low_rank_matrix

Сгенерировать в основном низкоранговую матрицу с колоколообразными сингулярными значениями.

make_moons

Создайте два переплетающихся полукруга.

make_multilabel_classification

Сгенерировать случайную многометочную задачу классификации.

make_regression

Сгенерировать случайную регрессионную задачу.

make_s_curve

Сгенерировать набор данных S-кривой.

make_sparse_coded_signal

Сгенерировать сигнал как разреженную комбинацию элементов словаря.

make_sparse_spd_matrix

Сгенерировать разреженную симметричную положительно определённую матрицу.

make_sparse_uncorrelated

Сгенерировать случайную регрессионную задачу с разреженным некоррелированным дизайном.

make_spd_matrix

Генерирует случайную симметричную, положительно определённую матрицу.

make_swiss_roll

Сгенерировать набор данных 'швейцарский рулет'.

DictionaryLearning

Словарное обучение.

FactorAnalysis

Факторный анализ (FA).

FastICA

FastICA: быстрый алгоритм для независимого компонентного анализа.

IncrementalPCA

Инкрементальный анализ главных компонент (IPCA).

KernelPCA

Анализ главных компонент с ядром (KPCA).

LatentDirichletAllocation

Латентное размещение Дирихле с алгоритмом онлайн вариационного Байеса.

MiniBatchDictionaryLearning

Мини-пакетное словарное обучение.

MiniBatchNMF

Мини-пакетное неотрицательное матричное разложение (NMF).

MiniBatchSparsePCA

Мини-пакетный разреженный анализ главных компонент.

NMF

Неотрицательная матричная факторизация (NMF).

PCA

Метод главных компонент (PCA).

SparseCoder

Разреженное кодирование.

SparsePCA

Разреженный анализ главных компонент (SparsePCA).

TruncatedSVD

Снижение размерности с использованием усеченного SVD (также известного как LSA).

dict_learning

Решить задачу матричной факторизации обучения словаря.

dict_learning_online

Решить задачу матричной факторизации словарного обучения онлайн.

fastica

Выполнить быстрый независимый компонентный анализ.

non_negative_factorization

Вычислить неотрицательную матричную факторизацию (NMF).

sparse_encode

Разреженное кодирование.

LinearDiscriminantAnalysis

Линейный дискриминантный анализ.

QuadraticDiscriminantAnalysis

Квадратичный дискриминантный анализ.

DummyClassifier

DummyClassifier делает предсказания, игнорируя входные признаки.

DummyRegressor

Регрессор, который делает прогнозы с использованием простых правил.

AdaBoostClassifier

Классификатор AdaBoost.

AdaBoostRegressor

Регрессор AdaBoost.

BaggingClassifier

Классификатор Bagging.

BaggingRegressor

Бэггинг-регрессор.

ExtraTreesClassifier

Классификатор extra-trees.

ExtraTreesRegressor

Экстра-деревья регрессор.

GradientBoostingClassifier

Градиентный бустинг для классификации.

GradientBoostingRegressor

Градиентный бустинг для регрессии.

HistGradientBoostingClassifier

Гистограммный градиентный бустинг для классификационных деревьев.

HistGradientBoostingRegressor

Гистограммное градиентное бустинговое дерево регрессии.

IsolationForest

Алгоритм Isolation Forest.

RandomForestClassifier

Классификатор случайного леса.

RandomForestRegressor

Регрессор случайного леса.

RandomTreesEmbedding

Ансамбль полностью случайных деревьев.

StackingClassifier

Стек оценщиков с финальным классификатором.

StackingRegressor

Стек оценщиков с финальным регрессором.

VotingClassifier

Классификатор мягкого голосования/правила большинства для необученных оценщиков.

VotingRegressor

Регрессор голосования предсказаний для необученных оценщиков.

ConvergenceWarning

Пользовательское предупреждение для захвата проблем сходимости

DataConversionWarning

Предупреждение, используемое для уведомления о неявных преобразованиях данных в коде.

DataDimensionalityWarning

Пользовательское предупреждение для уведомления о потенциальных проблемах с размерностью данных.

EfficiencyWarning

Предупреждение, используемое для уведомления пользователя о неэффективных вычислениях.

FitFailedWarning

Класс предупреждения, используемый при возникновении ошибки во время обучения оценщика.

InconsistentVersionWarning

Предупреждение, возникающее при распаковке оценщика с несовместимой версией.

NotFittedError

Класс исключения для вызова, если оценщик используется до обучения.

UndefinedMetricWarning

Предупреждение, используемое когда метрика недействительна

EstimatorCheckFailedWarning

Предупреждение, возникающее при неудачной проверке оценщика в общих тестах.

enable_halving_search_cv

Включает оценщики поиска с последовательным сокращением вдвое

enable_iterative_imputer

Включает IterativeImputer

DictVectorizer

Преобразует списки сопоставлений признак-значение в векторы.

FeatureHasher

Реализует хеширование признаков, также известное как трюк с хешированием.

PatchExtractor

Извлекает патчи из коллекции изображений.

extract_patches_2d

Преобразование 2D изображения в набор патчей.

grid_to_graph

Граф соединений пиксель-к-пикселю.

img_to_graph

Граф связей градиента от пикселя к пикселю.

reconstruct_from_patches_2d

Восстановить изображение из всех его патчей.

CountVectorizer

Преобразование коллекции текстовых документов в матрицу количества токенов.

HashingVectorizer

Преобразовать коллекцию текстовых документов в матрицу встречаемости токенов.

TfidfTransformer

Преобразовать матрицу частот в нормализованное представление tf или tf-idf.

TfidfVectorizer

Преобразовать коллекцию необработанных документов в матрицу признаков TF-IDF.

GenericUnivariateSelect

Одномерный селектор признаков с настраиваемой стратегией.

RFE

Ранжирование признаков с рекурсивным исключением признаков.

RFECV

Рекурсивное исключение признаков с перекрестной проверкой для выбора признаков.

SelectFdr

Фильтр: Выбрать p-значения для расчетной частоты ложных открытий.

SelectFpr

Фильтр: Выбрать p-значения ниже alpha на основе теста FPR.

SelectFromModel

Мета-трансформер для выбора признаков на основе весов важности.

SelectFwe

Фильтр: Выберите p-значения, соответствующие семейной ошибке.

SelectKBest

Выбор признаков по k наивысшим оценкам.

SelectPercentile

Выбор признаков в соответствии с процентилем наивысших оценок.

SelectorMixin

Миксин-трансформер, выполняющий выбор признаков по заданной маске поддержки

SequentialFeatureSelector

Преобразователь, выполняющий последовательный отбор признаков.

VarianceThreshold

Селектор признаков, который удаляет все признаки с низкой дисперсией.

chi2

Вычислите статистику хи-квадрат между каждым неотрицательным признаком и классом.

f_classif

Вычислить F-значение ANOVA для предоставленной выборки.

f_regression

Одномерные линейные регрессионные тесты, возвращающие F-статистику и p-значения.

mutual_info_classif

Оценить взаимную информацию для дискретной целевой переменной.

mutual_info_regression

Оценить взаимную информацию для непрерывной целевой переменной.

r_regression

Вычислите коэффициент корреляции Пирсона r для каждого признака и целевой переменной.

FrozenEstimator

Оценщик, который оборачивает обученный оценщик, чтобы предотвратить повторное обучение.

GaussianProcessClassifier

Гауссовский процесс классификации (GPC) на основе аппроксимации Лапласа.

GaussianProcessRegressor

Гауссовский процесс регрессии (GPR).

CompoundKernel

Ядро, которое состоит из набора других ядер.

ConstantKernel

Постоянное ядро.

DotProduct

Ядро скалярного произведения.

ExpSineSquared

Ядро Exp-Sine-Squared (также известное как периодическое ядро).

Exponentiation

Ядро возведения в степень принимает одно базовое ядро и скалярный параметр

Hyperparameter

Спецификация гиперпараметра ядра в виде namedtuple.

Kernel

Базовый класс для всех ядер.

Matern

Ядро Матерна.

PairwiseKernel

Обертка для ядер в sklearn.metrics.pairwise.

Product

The Product ядро принимает два ядра \(k_1\) и \(k_2\)

RBF

Радиально-базисная функция ядра (также известная как квадратно-экспоненциальное ядро).

RationalQuadratic

Ядро Rational Quadratic.

Sum

The Sum ядро принимает два ядра \(k_1\) и \(k_2\)

WhiteKernel

Ядро Уайта.

IterativeImputer

Многомерный импутер, который оценивает каждый признак по всем остальным.

KNNImputer

Импутация для заполнения пропущенных значений с использованием k-ближайших соседей.

MissingIndicator

Бинарные индикаторы пропущенных значений.

SimpleImputer

Одномерный импутер для заполнения пропущенных значений простыми стратегиями.

partial_dependence

Частная зависимость features.

permutation_importance

Важность перестановок для оценки признаков [Rd9e56ef97513-BRE].

DecisionBoundaryDisplay

Визуализация границ решений.

PartialDependenceDisplay

График частичной зависимости (PDP) и индивидуальное условное ожидание (ICE).

IsotonicRegression

Модель изотонической регрессии.

check_increasing

Определить, является ли y монотонно коррелированным с x.

isotonic_regression

Решить модель изотонической регрессии.

AdditiveChi2Sampler

Приближенное отображение признаков для аддитивного хи-квадрат ядра.

Nystroem

Приближение карты ядра с использованием подмножества обучающих данных.

PolynomialCountSketch

Аппроксимация полиномиального ядра с помощью Tensor Sketch.

RBFSampler

Аппроксимируйте карту признаков ядра RBF с использованием случайных признаков Фурье.

SkewedChi2Sampler

Приближенное отображение признаков для "скошенного хи-квадрат" ядра.

KernelRidge

Регрессия ядерного гребня.

LogisticRegression

Классификатор логистической регрессии (также известный как logit, MaxEnt).

LogisticRegressionCV

Логистическая регрессия CV (также известная как logit, MaxEnt) классификатор.

PassiveAggressiveClassifier

Пассивно-агрессивный классификатор.

Perceptron

Линейный классификатор перцептрона.

RidgeClassifier

Классификатор с использованием Ridge-регрессии.

RidgeClassifierCV

Ридж-классификатор со встроенной перекрестной проверкой.

SGDClassifier

Линейные классификаторы (SVM, логистическая регрессия и т.д.) с обучением SGD.

SGDOneClassSVM

Решает линейную One-Class SVM с использованием стохастического градиентного спуска.

LinearRegression

Линейная регрессия методом наименьших квадратов.

Ridge

Линейные наименьшие квадраты с L2-регуляризацией.

RidgeCV

Ридж-регрессия со встроенной кросс-валидацией.

SGDRegressor

Линейная модель, обученная путем минимизации регуляризованной эмпирической потери с SGD.

ElasticNet

Линейная регрессия с комбинированными априорными распределениями L1 и L2 в качестве регуляризатора.

ElasticNetCV

Модель Elastic Net с итеративной подгонкой вдоль пути регуляризации.

Lars

Модель регрессии с наименьшим углом, также известная как LAR.

LarsCV

Кросс-валидированная модель регрессии наименьшего угла.

Lasso

Линейная модель, обученная с априорным распределением L1 в качестве регуляризатора (также известная как Lasso).

LassoCV

Лассо линейная модель с итеративной подгонкой вдоль пути регуляризации.

LassoLars

Модель Lasso, обученная с использованием метода наименьших углов, также известного как Lars.

LassoLarsCV

Лассо с кросс-валидацией, использующий алгоритм LARS.

LassoLarsIC

Модель Lasso, обученная с помощью Lars с использованием BIC или AIC для выбора модели.

OrthogonalMatchingPursuit

Модель ортогонального согласованного преследования (OMP).

OrthogonalMatchingPursuitCV

Кросс-валидированная модель Orthogonal Matching Pursuit (OMP).

ARDRegression

Байесовская ARD-регрессия.

BayesianRidge

Байесовская гребневая регрессия.

MultiTaskElasticNet

Модель Multi-task ElasticNet, обученная с L1/L2 смешанной нормой в качестве регуляризатора.

MultiTaskElasticNetCV

Многозадачный L1/L2 ElasticNet со встроенной кросс-валидацией.

MultiTaskLasso

Многозадачная модель Lasso, обученная с регуляризацией смешанной нормы L1/L2.

MultiTaskLassoCV

Многозадачная модель Lasso, обученная с регуляризацией смешанной нормы L1/L2.

HuberRegressor

L2-регуляризованная линейная регрессионная модель, устойчивая к выбросам.

QuantileRegressor

Модель линейной регрессии, предсказывающая условные квантили.

RANSACRegressor

Алгоритм RANSAC (RANdom SAmple Consensus).

TheilSenRegressor

Оценщик Тейла-Сена: устойчивая многомерная модель регрессии.

GammaRegressor

Обобщённая линейная модель с гамма-распределением.

PoissonRegressor

Обобщённая линейная модель с распределением Пуассона.

TweedieRegressor

Обобщенная линейная модель с распределением Твиди.

PassiveAggressiveRegressor

Пассивно-агрессивный регрессор.

enet_path

Вычисление пути эластичной сети с координатным спуском.

lars_path

Вычисляет путь Least Angle Regression или Lasso с использованием алгоритма LARS.

lars_path_gram

lars_path в режиме достаточной статистики.

lasso_path

Вычислить путь Lasso с координатным спуском.

orthogonal_mp

Ортогональный жадный поиск (OMP).

orthogonal_mp_gram

Грам Ортогональный Поиск Совпадений (OMP).

ridge_regression

Решите уравнение гребневой регрессии методом нормальных уравнений.

ClassicalMDS

Классическое многомерное шкалирование (MDS).

Isomap

Изометрическое вложение.

LocallyLinearEmbedding

Локально-линейное вложение.

MDS

Многомерное шкалирование.

SpectralEmbedding

Спектральное вложение для нелинейного уменьшения размерности.

TSNE

Стохастическое вложение соседей с t-распределением.

locally_linear_embedding

Выполнить анализ локально линейного вложения на данных.

smacof

Вычисление многомерного шкалирования с использованием алгоритма SMACOF.

spectral_embedding

Проецируйте выборку на первые собственные векторы графа Лапласиана.

trustworthiness

Укажите, в какой степени сохраняется локальная структура.

check_scoring

Определить оценщик из пользовательских опций.

get_scorer

Получить оценщик из строки.

get_scorer_names

Получить имена всех доступных скореров.

make_scorer

Создать оценщик из метрики производительности или функции потерь.

accuracy_score

Оценка точности классификации.

auc

Вычислить площадь под кривой (AUC) с использованием правила трапеций.

average_precision_score

Вычислите среднюю точность (AP) из оценок предсказания.

balanced_accuracy_score

Вычисление сбалансированной точности.

brier_score_loss

Вычислить потерю по шкале Брайера.

class_likelihood_ratios

Вычислить положительные и отрицательные отношения правдоподобия для бинарной классификации.

classification_report

Построить текстовый отчет, показывающий основные метрики классификации.

cohen_kappa_score

Вычислить каппу Коэна: статистику, измеряющую согласие между аннотаторами.

confusion_matrix

Вычисление матрицы ошибок для оценки точности классификации.

confusion_matrix_at_thresholds

Вычислить бинарный термины матрицы ошибок для каждого порога классификации.

d2_brier_score

\(D^2\) функция оценки, доля объяснённого скора Брайера.

d2_log_loss_score

\(D^2\) функция оценки, доля объясненной логарифмической потери.

dcg_score

Вычисление дисконтированного кумулятивного выигрыша.

det_curve

Вычислите компромисс между ошибками обнаружения (DET) для различных порогов вероятности.

f1_score

Вычислите оценку F1, также известную как сбалансированная F-оценка или F-мера.

fbeta_score

Вычислить F-бета оценку.

hamming_loss

Вычисляет среднюю потерю Хэмминга.

hinge_loss

Средняя потеря на шарнире (нерегуляризованная).

jaccard_score

Коэффициент сходства Жаккара.

log_loss

Логарифмические потери, также известные как логистические потери или потери перекрестной энтропии.

matthews_corrcoef

Вычислить коэффициент корреляции Мэттьюса (MCC).

multilabel_confusion_matrix

Вычислить матрицу ошибок для каждого класса или образца.

ndcg_score

Вычислить нормализованный дисконтированный кумулятивный выигрыш.

precision_recall_curve

Вычислите пары точность-полнота для различных порогов вероятности.

precision_recall_fscore_support

Вычислить точность, полноту, F-меру и поддержку для каждого класса.

precision_score

Вычислить точность.

recall_score

Вычислить полноту (recall).

roc_auc_score

Вычисление площади под кривой рабочих характеристик приемника (ROC AUC) по прогнозным оценкам.

roc_curve

Вычислить характеристическую кривую оператора (ROC).

top_k_accuracy_score

Оценка классификации по точности Top-k.

zero_one_loss

Потеря классификации ноль-один.

d2_absolute_error_score

\(D^2\) функция оценки регрессии, доля абсолютной ошибки, объясненная.

d2_pinball_score

\(D^2\) функция оценки регрессии, доля объяснённой потери пинбола.

d2_tweedie_score

\(D^2\) функция оценки регрессии, доля объяснённого отклонения Твиди.

explained_variance_score

Функция оценки регрессии по объясненной дисперсии.

max_error

Метрика max_error вычисляет максимальную остаточную ошибку.

mean_absolute_error

Средняя абсолютная ошибка регрессии.

mean_absolute_percentage_error

Средняя абсолютная процентная ошибка (MAPE) потерь регрессии.

mean_gamma_deviance

Средняя гамма-девиансная регрессионная потеря.

mean_pinball_loss

Потеря пинбола для квантильной регрессии.

mean_poisson_deviance

Средняя регрессионная потеря по отклонению Пуассона.

mean_squared_error

Среднеквадратичная ошибка регрессии.

mean_squared_log_error

Среднеквадратичная логарифмическая ошибка регрессии.

mean_tweedie_deviance

Средняя регрессионная потеря по отклонению Твиди.

median_absolute_error

Медианная абсолютная ошибка регрессии.

r2_score

\(R^2\) (коэффициент детерминации) функция оценки регрессии.

root_mean_squared_error

Среднеквадратичная ошибка регрессии.

root_mean_squared_log_error

Среднеквадратичная логарифмическая ошибка регрессии.

coverage_error

Мера ошибки покрытия (coverage error).

label_ranking_average_precision_score

Вычислите среднюю точность на основе ранжирования.

label_ranking_loss

Вычислить меру потерь ранжирования.

adjusted_mutual_info_score

Скорректированная взаимная информация между двумя кластеризациями.

adjusted_rand_score

Индекс Рэнда, скорректированный на случайность.

calinski_harabasz_score

Вычислить оценку Калинского и Харабаша.

contingency_matrix

Построение матрицы сопряженности, описывающей связь между метками.

pair_confusion_matrix

Матрица парных несоответствий, возникающая из двух кластеризаций.

completeness_score

: Вычисляет порог для приемлемой производительности (лучший результат - 1 ст. откл.)

davies_bouldin_score

Вычислить оценку Дэвиса-Болдина.

fowlkes_mallows_score

Измеряет сходство двух кластеризаций набора точек.

homogeneity_completeness_v_measure

Вычислить однородность, полноту и показатель V-Measure за один раз.

homogeneity_score

Метрика однородности кластерной разметки при заданной истинной разметке.

mutual_info_score

Взаимная информация между двумя кластеризациями.

normalized_mutual_info_score

Нормализованная взаимная информация между двумя кластеризациями.

rand_score

Индекс Рэнда.

silhouette_samples

Вычислить коэффициент силуэта для каждого образца.

silhouette_score

Вычислить средний коэффициент силуэта всех образцов.

v_measure_score

V-мера кластеризации при заданной истинной разметке.

consensus_score

Сходство двух наборов бикластеров.

DistanceMetric

Унифицированный интерфейс для быстрых функций метрики расстояния.

additive_chi2_kernel

Вычислить аддитивное хи-квадрат ядро между наблюдениями в X и Y.

chi2_kernel

Вычислить экспоненциальное хи-квадрат ядро между X и Y.

cosine_distances

Вычислить косинусное расстояние между образцами в X и Y.

cosine_similarity

Вычисление косинусного сходства между образцами в X и Y.

distance_metrics

Допустимые метрики для pairwise_distances.

euclidean_distances

Вычислите матрицу расстояний между каждой парой из массивов признаков X и Y.

haversine_distances

Вычислить расстояние Хаверсина между образцами в X и Y.

kernel_metrics

Допустимые метрики для pairwise_kernels.

laplacian_kernel

Вычислить лапласово ядро между X и Y.

linear_kernel

Вычислить линейное ядро между X и Y.

manhattan_distances

Вычислить расстояния L1 между векторами в X и Y.

nan_euclidean_distances

Вычисление евклидовых расстояний при наличии пропущенных значений.

paired_cosine_distances

Вычислить парные косинусные расстояния между X и Y.

paired_distances

Вычислить парные расстояния между X и Y.

paired_euclidean_distances

Вычислить парные евклидовы расстояния между X и Y.

paired_manhattan_distances

Вычислить парные расстояния L1 между X и Y.

pairwise_kernels

Вычислить ядро между массивами X и необязательным массивом Y.

polynomial_kernel

Вычислить полиномиальное ядро между X и Y.

rbf_kernel

Вычислить rbf (гауссово) ядро между X и Y.

sigmoid_kernel

Вычислить сигмоидное ядро между X и Y.

pairwise_distances

Вычислить матрицу расстояний из массива признаков X и необязательного Y.

pairwise_distances_argmin

Вычислить минимальные расстояния между одной точкой и набором точек.

pairwise_distances_argmin_min

Вычислить минимальные расстояния между одной точкой и набором точек.

pairwise_distances_chunked

Генерировать матрицу расстояний по частям с возможным сокращением.

ConfusionMatrixDisplay

Визуализация матрицы ошибок.

DetCurveDisplay

Визуализация кривой компромисса ошибок обнаружения (DET).

PrecisionRecallDisplay

Визуализация Precision Recall.

PredictionErrorDisplay

Визуализация ошибки предсказания регрессионной модели.

RocCurveDisplay

Визуализация ROC-кривой.

BayesianGaussianMixture

Вариационный байесовский метод оценки гауссовой смеси.

GaussianMixture

Гауссова смесь.

GroupKFold

Вариант итератора K-кратной перекрёстной проверки с непересекающимися группами.

GroupShuffleSplit

Итератор перекрестной проверки Shuffle-Group(s)-Out.

KFold

K-кратный перекрестный валидатор.

LeaveOneGroupOut

Перекрестный валидатор Leave One Group Out.

LeaveOneOut

Кросс-валидатор Leave-One-Out.

LeavePGroupsOut

Кросс-валидатор "Оставить P группу(ы) вне выборки".

LeavePOut

Кросс-валидатор Leave-P-Out.

PredefinedSplit

Предопределенный разделитель для кросс-валидации.

RepeatedKFold

Повторяемый K-Fold кросс-валидатор.

RepeatedStratifiedKFold

Повторный послойный K-кратный перекрестный валидатор по классам.

ShuffleSplit

Перекрестный валидатор со случайной перестановкой.

StratifiedGroupKFold

Вариант итератора стратифицированной K-кратной перекрестной проверки по классам с непересекающимися группами.

StratifiedKFold

Стратифицированный K-блочный перекрестный валидатор по классам.

StratifiedShuffleSplit

Классово-стратифицированный перекрестный валидатор ShuffleSplit.

TimeSeriesSplit

Валидатор перекрестной проверки временных рядов.

check_cv

Утилита проверки входных данных для построения перекрёстного валидатора.

train_test_split

Разделить массивы или матрицы на случайные обучающую и тестовую подвыборки.

GridSearchCV

Полный перебор по заданным значениям параметров для оценщика.

HalvingGridSearchCV

Поиск по указанным значениям параметров с последовательным делением пополам.

HalvingRandomSearchCV

Рандомизированный поиск по гиперпараметрам.

ParameterGrid

Сетка параметров с дискретным числом значений для каждого.

ParameterSampler

Генератор параметров, выбранных из заданных распределений.

RandomizedSearchCV

Рандомизированный поиск по гиперпараметрам.

FixedThresholdClassifier

Бинарный классификатор, который вручную устанавливает порог принятия решения.

TunedThresholdClassifierCV

Классификатор, который пост-настраивает порог принятия решений с использованием перекрестной проверки.

cross_val_predict

Генерировать перекрёстно-валидированные оценки для каждой точки входных данных.

cross_val_score

Оценить оценку с помощью кросс-валидации.

cross_validate

Оценить метрику(и) с помощью перекрестной проверки и также записать время обучения/оценки.

learning_curve

Кривая обучения.

permutation_test_score

Оценить значимость перекрестно проверенной оценки с помощью перестановок.

validation_curve

Кривая валидации.

LearningCurveDisplay

Визуализация кривой обучения.

ValidationCurveDisplay

Визуализация кривой валидации.

OneVsOneClassifier

Многоклассовая стратегия "один против одного".

OneVsRestClassifier

Стратегия многоклассовой классификации "один против всех" (OvR).

OutputCodeClassifier

(Error-Correcting) Output-Code стратегия многоклассовой классификации.

ClassifierChain

Многометочная модель, которая организует бинарные классификаторы в цепочку.

MultiOutputClassifier

Многоклассовая классификация.

MultiOutputRegressor

Многозадачная регрессия.

RegressorChain

Многометочная модель, которая организует регрессии в цепочку.

BernoulliNB

Наивный байесовский классификатор для многомерных моделей Бернулли.

CategoricalNB

Наивный байесовский классификатор для категориальных признаков.

ComplementNB

Дополняющий наивный байесовский классификатор, описанный в Rennie et al. (2003).

GaussianNB

Гауссовский наивный байесовский классификатор (GaussianNB).

MultinomialNB

Наивный байесовский классификатор для мультиномиальных моделей.

BallTree

BallTree для быстрых обобщенных N-точечных задач

KDTree

KDTree для быстрых обобщённых N-точечных задач

KNeighborsClassifier

Классификатор, реализующий голосование k ближайших соседей.

KNeighborsRegressor

Регрессия на основе k ближайших соседей.

KNeighborsTransformer

Преобразовать X в (взвешенный) граф k ближайших соседей.

KernelDensity

Оценка плотности ядра.

LocalOutlierFactor

Обнаружение выбросов без учителя с использованием фактора локальных выбросов (LOF).

NearestCentroid

Классификатор ближайшего центроида.

NearestNeighbors

Неконтролируемый обучающийся для реализации поиска соседей.

NeighborhoodComponentsAnalysis

Анализ компонент соседства.

RadiusNeighborsClassifier

Классификатор, реализующий голосование среди соседей в заданном радиусе.

RadiusNeighborsRegressor

Регрессия на основе соседей в пределах фиксированного радиуса.

RadiusNeighborsTransformer

Преобразовать X в (взвешенный) граф соседей ближе, чем заданный радиус.

kneighbors_graph

Вычислить (взвешенный) граф k-ближайших соседей для точек в X.

radius_neighbors_graph

Вычислить (взвешенный) граф соседей для точек в X.

sort_graph_by_row_values

Отсортировать разреженный граф так, чтобы каждая строка хранилась с возрастающими значениями.

BernoulliRBM

Бернуллиевская ограниченная машина Больцмана (RBM).

MLPClassifier

Многослойный перцептрон-классификатор.

MLPRegressor

Многослойный перцептрон-регрессор.

FeatureUnion

Объединяет результаты нескольких объектов-трансформеров.

Pipeline

Последовательность преобразователей данных с опциональным финальным предсказателем.

make_pipeline

Создать Pipeline из заданных оценщиков.

make_union

Создать FeatureUnion из заданных преобразователей.

Binarizer

Бинаризация данных (установка значений признаков в 0 или 1) в соответствии с порогом.

FunctionTransformer

Создает преобразователь из произвольной вызываемой функции.

KBinsDiscretizer

Бинирование непрерывных данных в интервалы.

KernelCenterer

Центрирование произвольной матрицы ядра \(K\).

LabelBinarizer

Бинаризация меток в формате one-vs-all.

LabelEncoder

Кодировать целевые метки значениями от 0 до n_classes-1.

MaxAbsScaler

Масштабировать каждый признак по его максимальному абсолютному значению.

MinMaxScaler

Преобразование признаков путем масштабирования каждого признака до заданного диапазона.

MultiLabelBinarizer

Преобразование между итерируемыми объектами и многометочным форматом.

Normalizer

Нормализовать образцы индивидуально до единичной нормы.

OneHotEncoder

Закодировать категориальные признаки как однократно закодированный числовой массив.

OrdinalEncoder

Кодирует категориальные признаки как целочисленный массив.

PolynomialFeatures

Генерирует полиномиальные и интерактивные признаки.

PowerTransformer

Применить степенное преобразование по признакам, чтобы сделать данные более похожими на гауссовы.

QuantileTransformer

Преобразование признаков с использованием информации о квантилях.

RobustScaler

Масштабирование признаков с использованием статистики, устойчивой к выбросам.

SplineTransformer

Генерация одномерных B-сплайновых базисов для признаков.

StandardScaler

Стандартизировать признаки, удаляя среднее и масштабируя до единичной дисперсии.

TargetEncoder

Кодировщик целевой переменной для регрессии и классификации.

add_dummy_feature

Дополнить набор данных дополнительным фиктивным признаком.

binarize

Булево пороговое преобразование массивоподобных объектов или разреженной матрицы scipy.sparse.

label_binarize

Бинаризация меток в формате one-vs-all.

maxabs_scale

Масштабируйте каждый признак до диапазона [-1, 1] без нарушения разреженности.

minmax_scale

Преобразование признаков путем масштабирования каждого признака до заданного диапазона.

normalize

Масштабирование входных векторов индивидуально до единичной нормы (длины вектора).

power_transform

Параметрическое, монотонное преобразование для приведения данных к более гауссовскому виду.

quantile_transform

Преобразование признаков с использованием информации о квантилях.

robust_scale

Стандартизировать набор данных вдоль любой оси.

scale

Стандартизировать набор данных вдоль любой оси.

GaussianRandomProjection

Уменьшение размерности с помощью гауссовской случайной проекции.

SparseRandomProjection

Уменьшение размерности с помощью разреженного случайного проецирования.

johnson_lindenstrauss_min_dim

Найти «безопасное» количество компонентов для случайного проецирования.

LabelPropagation

Классификатор распространения меток.

LabelSpreading

Модель LabelSpreading для полуконтролируемого обучения.

SelfTrainingClassifier

Классификатор с самообучением.

LinearSVC

Линейная классификация методом опорных векторов.

LinearSVR

Линейная машина опорных векторов для регрессии.

NuSVC

Nu-метод опорных векторов для классификации.

NuSVR

Nu-метод опорных векторов для регрессии.

OneClassSVM

Обнаружение выбросов без учителя.

SVC

Классификация методом опорных векторов с C-регуляризацией.

SVR

Epsilon-Support Vector Regression.

l1_min_c

Возвращает нижнюю границу для C.

DecisionTreeClassifier

Классификатор дерева решений.

DecisionTreeRegressor

Регрессор дерева решений.

ExtraTreeClassifier

Крайне рандомизированный классификатор дерева.

ExtraTreeRegressor

Чрезвычайно рандомизированный регрессор дерева.

export_graphviz

Экспорт дерева решений в формате DOT.

export_text

Построить текстовый отчёт, показывающий правила дерева решений.

plot_tree

Постройте дерево решений.

Bunch

Объект-контейнер, предоставляющий ключи как атрибуты.

_safe_indexing

Возвращает строки, элементы или столбцы X, используя индексы.

as_float_array

Преобразовать массивоподобный объект в массив чисел с плавающей точкой.

assert_all_finite

Вызывает ValueError, если X содержит NaN или бесконечность.

deprecated

Декоратор для пометки функции или класса как устаревшего.

estimator_html_repr

Построить HTML-представление оценщика.

gen_batches

Генератор для создания срезов, содержащих batch_size элементы от 0 до n.

gen_even_slices

Генератор для создания n_packs равномерно распределенные срезы, идущие до n.

indexable

Сделать массивы индексируемыми для перекрёстной проверки.

murmurhash3_32

Вычислить 32-битный murmurhash3 ключа с заданным сидом.

resample

Перевыборка массивов или разреженных матриц согласованным образом.

safe_mask

Возвращает маску, безопасную для использования на X.

safe_sqr

Поэлементное возведение в квадрат массивоподобных объектов и разреженных матриц.

shuffle

Перемешивание массивов или разреженных матриц согласованным образом.

Tags

Теги для оценщика.

InputTags

Теги для входных данных.

TargetTags

Метки для целевых данных.

ClassifierTags

Метки для классификатора.

RegressorTags

Теги для регрессора.

TransformerTags

Теги для преобразователя.

get_tags

Получить теги оценщика.

check_X_y

Проверка входных данных для стандартных оценщиков.

check_array

Проверка входных данных на массиве, списке, разреженной матрице или подобном.

check_consistent_length

Проверьте, что все массивы имеют согласованные первые размерности.

check_random_state

Преобразовать seed в экземпляр np.random.RandomState.

check_scalar

Проверка типа и значения скалярных параметров.

check_is_fitted

Выполнить проверку is_fitted для оценщика.

check_memory

Проверьте, что memory является joblib.Memory-подобным.

check_symmetric

Убедитесь, что массив двумерный, квадратный и симметричный.

column_or_1d

Преобразовать столбец или одномерный массив numpy в одномерный, иначе вызывает ошибку.

has_fit_parameter

Проверить, поддерживает ли метод fit оценщика заданный параметр.

validate_data

Проверка входных данных и установка или проверка названий признаков и их количества во входных данных.

available_if

Атрибут, доступный только если check возвращает истинное значение.

compute_class_weight

Оценить веса классов для несбалансированных наборов данных.

compute_sample_weight

Оценить веса образцов по классам для несбалансированных наборов данных.

is_multilabel

Проверить, если y находится в многометочном формате.

type_of_target

Определить тип данных, указанный целью.

unique_labels

Извлечь упорядоченный массив уникальных меток.

density

Вычислить плотность разреженного вектора.

fast_logdet

Вычислить логарифм определителя квадратной матрицы.

randomized_range_finder

Вычислить ортонормированную матрицу, чье пространство приближает пространство A.

randomized_svd

Вычислить усечённое рандомизированное SVD.

safe_sparse_dot

Скалярное произведение, корректно обрабатывающее разреженные матрицы.

weighted_mode

Возвращает массив взвешенного модального (наиболее частого) значения в переданном массиве.

incr_mean_variance_axis

Вычислить инкрементальное среднее и дисперсию вдоль оси на матрице CSR или CSC.

inplace_column_scale

Масштабирование столбцов на месте для матрицы CSC/CSR.

inplace_csr_column_scale

Масштабирование столбцов на месте для матрицы CSR.

inplace_row_scale

Масштабирование строк на месте для CSR или CSC матрицы.

inplace_swap_column

Поменять местами два столбца матрицы CSC/CSR на месте.

inplace_swap_row

Поменять местами две строки матрицы CSC/CSR на месте.

mean_variance_axis

Вычислить среднее и дисперсию вдоль оси на CSR или CSC матрице.

inplace_csr_row_normalize_l1

Нормализовать на месте строки CSR-матрицы или массива по их L1-норме.

inplace_csr_row_normalize_l2

Нормализуйте на месте строки CSR-матрицы или массива по их L2-норме.

single_source_shortest_path_length

Возвращает длину кратчайшего пути от источника до всех достижимых узлов.

sample_without_replacement

Выборка целых чисел без замены.

min_pos

Найти минимальное значение массива по положительным значениям.

MetadataRequest

Содержит метаданные запроса информации потребителя.

MetadataRouter

Маршрутизация метаданных координат для маршрутизатор объект.

MethodMapping

Сохраняет соответствие между вызывающими и вызываемыми методами для маршрутизатор.

get_routing_for_object

Получить Metadata{Router, Request} экземпляр из данного объекта.

process_routing

Проверить и маршрутизировать метаданные.

all_displays

Получите список всех дисплеев из sklearn.

all_estimators

Получить список всех оценщиков из sklearn.

all_functions

Получить список всех функций из sklearn.

check_estimator

Проверить, соответствует ли оценщик соглашениям scikit-learn.

parametrize_with_checks

Специфичный для Pytest декоратор для параметризации проверок оценщиков.

estimator_checks_generator

Итеративно выдает все проверочные функции для оценщика.

Parallel

Настройка joblib.Parallel который распространяет конфигурацию scikit-learn.

delayed

Декоратор, используемый для захвата аргументов функции.