check_cv#
- sklearn.model_selection.check_cv(cv=5, y=None, *, классификатор=False)[источник]#
Утилита проверки входных данных для построения перекрёстного валидатора.
- Параметры:
- cvint, генератор перекрестной проверки, итерируемый объект или None, по умолчанию=5
Определяет стратегию разделения для кросс-валидации. Возможные значения для cv: - None, чтобы использовать стандартную 5-кратную кросс-валидацию, - целое число, чтобы указать количество фолдов. - CV splitter, - Итерируемый объект, который генерирует разделения (обучающие, тестовые) как массивы индексов.
Для целочисленных/None входов, если classifier равен True и
yявляется либо бинарным, либо многоклассовым,StratifiedKFoldиспользуется. Во всех остальных случаях,KFoldиспользуется.Обратитесь Руководство пользователя для различных стратегий перекрестной проверки, которые можно использовать здесь.
Изменено в версии 0.22:
cvзначение по умолчанию изменено с 3-кратного на 5-кратное.- yarray-like, default=None
Целевая переменная для задач обучения с учителем.
- классификаторbool, по умолчанию=False
Является ли задача задачей классификации, в этом случае будет использоваться стратифицированный KFold.
- Возвращает:
- checked_cvэкземпляр кросс-валидатора.
Возвращаемое значение - это кросс-валидатор, который генерирует разделения train/test через
splitметод.
Примеры
>>> from sklearn.model_selection import check_cv >>> check_cv(cv=5, y=None, classifier=False) KFold(...) >>> check_cv(cv=5, y=[1, 1, 0, 0, 0, 0], classifier=True) StratifiedKFold(...)