validate_data#

sklearn.utils.validation.validate_data(_estimator, /, X='no_validation', y='no_validation', сброс=True, validate_separately=False, skip_check_array=False, **check_params)[источник]#

Проверка входных данных и установка или проверка названий признаков и их количества во входных данных.

Эта вспомогательная функция должна использоваться в оценщике, который требует проверки входных данных. Это изменяет оценщик и устанавливает n_features_in_ и feature_names_in_ атрибуты, если reset=True.

Добавлено в версии 1.6.

Параметры:
_estimatorэкземпляр estimator

Оценщик для проверки входных данных.

X{array-like, sparse matrix, dataframe} формы (n_samples, n_features), по умолчанию='без проверки'

Входные выборки. Если 'no_validation', проверка не выполняется на X. Это полезно для мета-оценщиков, которые могут делегировать проверку входных данных своим базовым оценщикам. В этом случае y должен быть передан и единственный допустимый check_params являются multi_output и y_numeric.

yarray-like формы (n_samples,), по умолчанию='no_validation'

Целевые переменные.

  • Если None, check_array вызывается на X. Если оценщика requires_y если тег True, то будет вызвана ошибка.

  • Если 'no_validation', check_array вызывается на X и оценщика requires_y тег игнорируется. Это стандартный заполнитель и никогда не предназначен для явной установки. В этом случае X должен быть передан.

  • В противном случае, только y с _check_y или оба X и y проверяются с помощью check_array или check_X_y в зависимости от validate_separately.

сбросbool, по умолчанию=True

Сбрасывать ли n_features_in_ атрибут. Если False, входные данные будут проверены на соответствие данным, предоставленным при последнем установленном значении reset в True.

Примечание

Рекомендуется вызывать reset=True в fit и при первом вызове partial_fit. Все другие методы, которые проверяют X должен установить reset=False.

validate_separatelyFalse или кортеж словарей, по умолчанию=False

Используется только если y не является None. Если False, вызовите check_X_y. В противном случае это должен быть кортеж kwargs для вызова check_array на X и y соответственно.

estimator=self автоматически добавляется к этим словарям для генерации более информативных сообщений об ошибках в случае неверных входных данных.

skip_check_arraybool, по умолчанию=False

Если True, X и y остаются неизменными, и только feature_names_in_ и n_features_in_ проверяются. В противном случае, check_array вызывается на X и y.

**check_paramskwargs

Параметры, передаваемые в check_array или check_X_y. Игнорируется, если validate_separately не равно False.

estimator=self автоматически добавляется к этим параметрам для генерации более информативного сообщения об ошибке в случае неверных входных данных.

Возвращает:
выход{ndarray, разреженная матрица} или кортеж из них

Проверенный ввод. Кортеж возвращается, если оба X и y проверяются.