check_cv#

sklearn.model_selection.check_cv(cv=5, y=None, *, классификатор=False)[источник]#

Утилита проверки входных данных для построения перекрёстного валидатора.

Параметры:
cvint, генератор перекрестной проверки, итерируемый объект или None, по умолчанию=5

Определяет стратегию разделения для кросс-валидации. Возможные значения для cv: - None, чтобы использовать стандартную 5-кратную кросс-валидацию, - целое число, чтобы указать количество фолдов. - CV splitter, - Итерируемый объект, который генерирует разделения (обучающие, тестовые) как массивы индексов.

Для целочисленных/None входов, если classifier равен True и y является либо бинарным, либо многоклассовым, StratifiedKFold используется. Во всех остальных случаях, KFold используется.

Обратитесь Руководство пользователя для различных стратегий перекрестной проверки, которые можно использовать здесь.

Изменено в версии 0.22: cv значение по умолчанию изменено с 3-кратного на 5-кратное.

yarray-like, default=None

Целевая переменная для задач обучения с учителем.

классификаторbool, по умолчанию=False

Является ли задача задачей классификации, в этом случае будет использоваться стратифицированный KFold.

Возвращает:
checked_cvэкземпляр кросс-валидатора.

Возвращаемое значение - это кросс-валидатор, который генерирует разделения train/test через split метод.

Примеры

>>> from sklearn.model_selection import check_cv
>>> check_cv(cv=5, y=None, classifier=False)
KFold(...)
>>> check_cv(cv=5, y=[1, 1, 0, 0, 0, 0], classifier=True)
StratifiedKFold(...)