f_classif#

sklearn.feature_selection.f_classif(X, y)[источник]#

Вычислить F-значение ANOVA для предоставленной выборки.

Подробнее в Руководство пользователя.

Параметры:
X{array-like, sparse matrix} формы (n_samples, n_features)

Набор регрессоров, которые будут тестироваться последовательно.

yarray-like формы (n_samples,)

Целевой вектор.

Возвращает:
f_statisticndarray формы (n_features,)

F-статистика для каждого признака.

p-значенияndarray формы (n_features,)

P-значения, связанные с F-статистикой.

Смотрите также

chi2

Статистики хи-квадрат неотрицательных признаков для задач классификации.

f_regression

F-значение между меткой/признаком для задач регрессии.

Примеры

>>> from sklearn.datasets import make_classification
>>> from sklearn.feature_selection import f_classif
>>> X, y = make_classification(
...     n_samples=100, n_features=10, n_informative=2, n_clusters_per_class=1,
...     shuffle=False, random_state=42
... )
>>> f_statistic, p_values = f_classif(X, y)
>>> f_statistic
array([2.21e+02, 7.02e-01, 1.70e+00, 9.31e-01,
       5.41e+00, 3.25e-01, 4.71e-02, 5.72e-01,
       7.54e-01, 8.90e-02])
>>> p_values
array([7.14e-27, 4.04e-01, 1.96e-01, 3.37e-01,
       2.21e-02, 5.70e-01, 8.29e-01, 4.51e-01,
       3.87e-01, 7.66e-01])