sklearn.utils#

Различные утилиты для помощи в разработке.

Руководство для разработчиков. См. Утилиты для разработчиков раздел для дальнейших деталей.

Bunch

Объект-контейнер, предоставляющий ключи как атрибуты.

_safe_indexing

Возвращает строки, элементы или столбцы X, используя индексы.

as_float_array

Преобразовать массивоподобный объект в массив чисел с плавающей точкой.

assert_all_finite

Вызывает ValueError, если X содержит NaN или бесконечность.

deprecated

Декоратор для пометки функции или класса как устаревшего.

estimator_html_repr

Построить HTML-представление оценщика.

gen_batches

Генератор для создания срезов, содержащих batch_size элементы от 0 до n.

gen_even_slices

Генератор для создания n_packs равномерно распределенные срезы, идущие до n.

indexable

Сделать массивы индексируемыми для перекрёстной проверки.

murmurhash3_32

Вычислить 32-битный murmurhash3 ключа с заданным сидом.

resample

Перевыборка массивов или разреженных матриц согласованным образом.

safe_mask

Возвращает маску, безопасную для использования на X.

safe_sqr

Поэлементное возведение в квадрат массивоподобных объектов и разреженных матриц.

shuffle

Перемешивание массивов или разреженных матриц согласованным образом.

Tags

Теги для оценщика.

InputTags

Теги для входных данных.

TargetTags

Метки для целевых данных.

ClassifierTags

Метки для классификатора.

RegressorTags

Теги для регрессора.

TransformerTags

Теги для преобразователя.

get_tags

Получить теги оценщика.

Проверка входных данных и параметров#

Функции для проверки входных данных и параметров в оценивателях scikit-learn.

check_X_y

Проверка входных данных для стандартных оценщиков.

check_array

Проверка входных данных на массиве, списке, разреженной матрице или подобном.

check_consistent_length

Проверьте, что все массивы имеют согласованные первые размерности.

check_random_state

Преобразовать seed в экземпляр np.random.RandomState.

check_scalar

Проверка типа и значения скалярных параметров.

validation.check_is_fitted

Выполнить проверку is_fitted для оценщика.

validation.check_memory

Проверьте, что memory является joblib.Memory-подобным.

validation.check_symmetric

Убедитесь, что массив двумерный, квадратный и симметричный.

validation.column_or_1d

Преобразовать столбец или одномерный массив numpy в одномерный, иначе вызывает ошибку.

validation.has_fit_parameter

Проверьте, поддерживает ли метод fit оценщика заданный параметр.

validation.validate_data

Проверка входных данных и установка или проверка названий признаков и их количества во входных данных.

Мета-оценщики#

Утилиты для мета-оценщиков.

metaestimators.available_if

Атрибут, доступный только если check возвращает истинное значение.

Обработка весов на основе меток классов#

Утилиты для обработки весов на основе меток классов.

class_weight.compute_class_weight

Оценить веса классов для несбалансированных наборов данных.

class_weight.compute_sample_weight

Оценить веса образцов по классам для несбалансированных наборов данных.

Работа с многоклассовой целевой переменной в классификаторах#

Утилиты для обработки многоклассовых/многомерных целевых переменных в классификаторах.

multiclass.is_multilabel

Проверить, если y находится в многометочном формате.

multiclass.type_of_target

Определить тип данных, указанный целью.

multiclass.unique_labels

Извлечь упорядоченный массив уникальных меток.

Оптимальные математические операции#

Утилиты для выполнения оптимальных математических операций в scikit-learn.

extmath.density

Вычислить плотность разреженного вектора.

extmath.fast_logdet

Вычислить логарифм определителя квадратной матрицы.

extmath.randomized_range_finder

Вычислить ортонормированную матрицу, чье пространство приближает пространство A.

extmath.randomized_svd

Вычислить усечённое рандомизированное SVD.

extmath.safe_sparse_dot

Скалярное произведение, корректно обрабатывающее разреженные матрицы.

extmath.weighted_mode

Возвращает массив взвешенного модального (наиболее частого) значения в переданном массиве.

Работа с разреженными матрицами и массивами#

A collection of utilities to work with sparse matrices and arrays.

sparsefuncs.incr_mean_variance_axis

Вычислить инкрементальное среднее и дисперсию вдоль оси на матрице CSR или CSC.

sparsefuncs.inplace_column_scale

Масштабирование столбцов на месте для матрицы CSC/CSR.

sparsefuncs.inplace_csr_column_scale

Масштабирование столбцов на месте для матрицы CSR.

sparsefuncs.inplace_row_scale

Масштабирование строк на месте для CSR или CSC матрицы.

sparsefuncs.inplace_swap_column

Поменять местами два столбца матрицы CSC/CSR на месте.

sparsefuncs.inplace_swap_row

Поменять местами две строки матрицы CSC/CSR на месте.

sparsefuncs.mean_variance_axis

Вычислить среднее и дисперсию вдоль оси на CSR или CSC матрице.

Утилиты для работы с разреженными матрицами и массивами, написанными на Cython.

sparsefuncs_fast.inplace_csr_row_normalize_l1

Нормализовать на месте строки CSR-матрицы или массива по их L1-норме.

sparsefuncs_fast.inplace_csr_row_normalize_l2

Нормализуйте на месте строки CSR-матрицы или массива по их L2-норме.

Работа с графами#

Утилиты и алгоритмы для работы с графами.

graph.single_source_shortest_path_length

Возвращает длину кратчайшего пути от источника до всех достижимых узлов.

Случайная выборка#

Утилиты для случайной выборки.

random.sample_without_replacement

Выборка целых чисел без замены.

Вспомогательные функции, работающие с массивами#

Небольшая коллекция вспомогательных функций, работающих с массивами.

arrayfuncs.min_pos

Найти минимальное значение массива по положительным значениям.

при использовании парсера pandas. Параметр#

Утилиты для маршрутизации метаданных внутри оценщиков scikit-learn.

Руководство пользователя. См. Маршрутизация метаданных раздел для дальнейших деталей.

metadata_routing.MetadataRequest

Содержит метаданные запроса информации потребителя.

metadata_routing.MetadataRouter

Маршрутизация метаданных координат для маршрутизатор объект.

metadata_routing.MethodMapping

Сохраняет соответствие между вызывающими и вызываемыми методами для маршрутизатор.

metadata_routing.get_routing_for_object

Получить Metadata{Router, Request} экземпляр из данного объекта.

metadata_routing.process_routing

Проверить и маршрутизировать метаданные.

Обнаружение объектов scikit-learn#

Утилиты для обнаружения объектов scikit-learn.

discovery.all_displays

Получите список всех дисплеев из sklearn.

discovery.all_estimators

Получить список всех оценщиков из sklearn.

discovery.all_functions

Получить список всех функций из sklearn.

Проверки совместимости API#

Различные утилиты для проверки совместимости оценщиков с API scikit-learn.

estimator_checks.check_estimator

Проверить, соответствует ли оценщик соглашениям scikit-learn.

estimator_checks.parametrize_with_checks

Специфичный для Pytest декоратор для параметризации проверок оценщиков.

estimator_checks.estimator_checks_generator

Итеративно выдает все проверочные функции для оценщика.

Параллельные вычисления#

Настройки joblib и threadpoolctl инструменты для использования scikit-learn.

parallel.Parallel

Настройка joblib.Parallel который распространяет конфигурацию scikit-learn.

parallel.delayed

Декоратор, используемый для захвата аргументов функции.