GenericUnivariateSelect#

класс sklearn.feature_selection.GenericUnivariateSelect(score_func= f_classif>, *, mode='percentile', param=1e-05)[источник]#

Одномерный селектор признаков с настраиваемой стратегией.

Подробнее в Руководство пользователя.

Параметры:
score_funcвызываемый объект, по умолчанию=f_classif

Функция, принимающая два массива X и y и возвращающая пару массивов (scores, pvalues). Для режимов 'percentile' или 'kbest' она может возвращать один массив scores.

mode.. versionchanged:: 0.21

Режим выбора признаков. Обратите внимание, что 'percentile' и 'kbest' режимы поддерживают неконтролируемый отбор признаков (когда y является None).

параметр“all”, float или int, default=1e-5

Параметр соответствующего режима.

Атрибуты:
scores_массивоподобный формы (n_features,)

Оценки признаков.

pvalues_массивоподобный формы (n_features,)

p-значения оценок признаков, None если score_func возвращенные оценки только.

n_features_in_int

Количество признаков, замеченных во время fit.

Добавлено в версии 0.24.

feature_names_in_ndarray формы (n_features_in_,)

Имена признаков, наблюдаемых во время fit. Определено только когда X имеет имена признаков, которые все являются строками.

Добавлено в версии 1.0.

Смотрите также

f_classif

ANOVA F-значение между меткой/признаком для задач классификации.

mutual_info_classif

Взаимная информация для дискретной цели.

chi2

Статистики хи-квадрат неотрицательных признаков для задач классификации.

f_regression

F-значение между меткой/признаком для задач регрессии.

mutual_info_regression

Взаимная информация для непрерывной цели.

SelectPercentile

Выбор признаков на основе процентиля наивысших оценок.

SelectKBest

Выбрать признаки на основе k наивысших оценок.

SelectFpr

Выбор признаков на основе теста ложноположительной частоты.

SelectFdr

Выберите признаки на основе оцененного уровня ложных открытий.

SelectFwe

Выбор признаков на основе семейной ошибки.

Примеры

>>> from sklearn.datasets import load_breast_cancer
>>> from sklearn.feature_selection import GenericUnivariateSelect, chi2
>>> X, y = load_breast_cancer(return_X_y=True)
>>> X.shape
(569, 30)
>>> transformer = GenericUnivariateSelect(chi2, mode='k_best', param=20)
>>> X_new = transformer.fit_transform(X, y)
>>> X_new.shape
(569, 20)
fit(X, y=None)[источник]#

Запустить функцию оценки на (X, y) и получить соответствующие признаки.

Параметры:
Xarray-like формы (n_samples, n_features)

Обучающие входные выборки.

yarray-like формы (n_samples,) или None

Целевые значения (метки классов в классификации, вещественные числа в регрессии). Если селектор неконтролируемый, то y может быть установлено в None.

Возвращает:
selfobject

Возвращает сам экземпляр.

fit_transform(X, y=None, **fit_params)[источник]#

Обучение на данных с последующим преобразованием.

Обучает преобразователь на X и y с необязательными параметрами fit_params и возвращает преобразованную версию X.

Параметры:
Xarray-like формы (n_samples, n_features)

Входные выборки.

yarray-like формы (n_samples,) или (n_samples, n_outputs), default=None

Целевые значения (None для неконтролируемых преобразований).

**fit_paramsdict

Дополнительные параметры обучения. Передавайте только если оценщик принимает дополнительные параметры в своем fit метод.

Возвращает:
X_newndarray массив формы (n_samples, n_features_new)

Преобразованный массив.

get_feature_names_out(input_features=None)[источник]#

Маскировать имена признаков в соответствии с выбранными признаками.

Параметры:
input_featuresarray-like из str или None, по умолчанию=None

Входные признаки.

  • Если input_features является None, затем feature_names_in_ используется как имена признаков в. Если feature_names_in_ не определено, тогда генерируются следующие имена входных признаков: ["x0", "x1", ..., "x(n_features_in_ - 1)"].

  • Если input_features является массивоподобным, тогда input_features должен соответствовать feature_names_in_ if feature_names_in_ определен.

Возвращает:
feature_names_outndarray из str объектов

Преобразованные имена признаков.

6332()[источник]#

Получить маршрутизацию метаданных этого объекта.

Пожалуйста, проверьте Руководство пользователя о том, как работает механизм маршрутизации.

Возвращает:
маршрутизацияMetadataRequest

A MetadataRequest Инкапсуляция информации о маршрутизации.

get_params(глубокий=True)[источник]#

Получить параметры для этого оценщика.

Параметры:
глубокийbool, по умолчанию=True

Если True, вернет параметры для этого оценщика и вложенных подобъектов, которые являются оценщиками.

Возвращает:
paramsdict

Имена параметров, сопоставленные с их значениями.

get_support(индексы=False)[источник]#

Получить маску или целочисленный индекс выбранных признаков.

Параметры:
индексыbool, по умолчанию=False

Если True, возвращаемое значение будет массивом целых чисел, а не булевой маской.

Возвращает:
поддержкамассив

Индекс, который выбирает сохраняемые признаки из вектора признаков. Если indices равно False, это булев массив формы [# входных признаков], в котором элемент равен True, если соответствующий признак выбран для сохранения. Если indices если True, это целочисленный массив формы [# выходных признаков], значения которого являются индексами входного вектора признаков.

inverse_transform(X)[источник]#

Обратить операцию преобразования.

Параметры:
Xмассив формы [n_samples, n_selected_features]

Входные образцы.

Возвращает:
X_originalмассив формы [n_samples, n_original_features]

X со столбцами нулей, вставленными там, где признаки были бы удалены с помощью transform.

set_output(*, преобразовать=None)[источник]#

Установить контейнер вывода.

См. Введение API set_output для примера использования API.

Параметры:
преобразовать{“default”, “pandas”, “polars”}, по умолчанию=None

Настройка вывода transform и fit_transform.

  • "default": Формат вывода трансформера по умолчанию

  • "pandas": DataFrame вывод

  • "polars": Вывод Polars

  • None: Конфигурация преобразования не изменена

Добавлено в версии 1.4: "polars" опция была добавлена.

Возвращает:
selfэкземпляр estimator

Экземпляр оценщика.

set_params(**params)[источник]#

Установить параметры этого оценщика.

Метод работает как на простых оценщиках, так и на вложенных объектах (таких как Pipeline). Последние имеют параметры вида __ чтобы можно было обновить каждый компонент вложенного объекта.

Параметры:
**paramsdict

Параметры оценщика.

Возвращает:
selfэкземпляр estimator

Экземпляр оценщика.

преобразовать(X)[источник]#

Уменьшить X до выбранных признаков.

Параметры:
Xмассив формы [n_samples, n_features]

Входные образцы.

Возвращает:
X_rмассив формы [n_samples, n_selected_features]

Входные выборки только с выбранными признаками.