RepeatedKFold#

класс sklearn.model_selection.RepeatedKFold(*, n_splits=5, n_repeats=10, random_state=None)[источник]#

Повторяемый K-Fold кросс-валидатор.

Повторяющийся K-Fold n_repeats раз с различной рандомизацией в каждом повторении.

Подробнее в Руководство пользователя.

Параметры:

n_splitsint, по умолчанию=5: Количество фолдов. Должно быть не менее 2.
n_repeatsint, по умолчанию=10: Количество повторений перекрестного валидатора.
random_stateint, экземпляр RandomState или None, по умолчанию=None: Управляет случайностью каждого повторного экземпляра перекрестной проверки. Передайте int для воспроизводимого вывода при множественных вызовах функции. См. Глоссарий.

Смотрите также

RepeatedStratifiedKFold: Повторяет стратифицированный K-Fold n раз.

Примечания

Рандомизированные сплиттеры CV могут возвращать разные результаты для каждого вызова split. Вы можете сделать результаты идентичными, установив random_state в целое число.

Примеры

>>> import numpy as np
>>> from sklearn.model_selection import RepeatedKFold
>>> X = np.array([[1, 2], [3, 4], [1, 2], [3, 4]])
>>> y = np.array([0, 0, 1, 1])
>>> rkf = RepeatedKFold(n_splits=2, n_repeats=2, random_state=2652124)
>>> rkf.get_n_splits()
4
>>> print(rkf)
RepeatedKFold(n_repeats=2, n_splits=2, random_state=2652124)
>>> for i, (train_index, test_index) in enumerate(rkf.split(X)):
...     print(f"Fold {i}:")
...     print(f"  Train: index={train_index}")
...     print(f"  Test:  index={test_index}")
...
Fold 0:
  Train: index=[0 1]
  Test:  index=[2 3]
Fold 1:
  Train: index=[2 3]
  Test:  index=[0 1]
Fold 2:
  Train: index=[1 2]
  Test:  index=[0 3]
Fold 3:
  Train: index=[0 3]
  Test:  index=[1 2]

6332()[источник]#

Получить маршрутизацию метаданных этого объекта.

Пожалуйста, проверьте Руководство пользователя о том, как работает механизм маршрутизации.

Возвращает:

маршрутизацияMetadataRequest: A MetadataRequest Инкапсуляция информации о маршрутизации.

get_n_splits(X=None, y=None, группы=None)[источник]#

Возвращает количество итераций разделения, установленное с помощью n_splits param при создании кросс-валидатора.

Параметры:

Xмассивоподобный объект формы (n_samples, n_features), по умолчанию=None: Всегда игнорируется, существует для совместимости API.
yarray-like формы (n_samples,), по умолчанию=None: Всегда игнорируется, существует для совместимости API.
группыarray-like формы (n_samples,), по умолчанию=None: Всегда игнорируется, существует для совместимости API.

Возвращает:

n_splitsint: Возвращает количество итераций разделения в кросс-валидаторе.

split(X, y=None, группы=None)[источник]#

Сгенерировать индексы для разделения данных на обучающую и тестовую выборки.

Параметры:

Xarray-like формы (n_samples, n_features): Обучающие данные, где n_samples это количество образцов и n_features это количество признаков.
yarray-like формы (n_samples,), по умолчанию=None: Целевая переменная для задач обучения с учителем.
группыarray-like формы (n_samples,), по умолчанию=None: Всегда игнорируется, существует для совместимости API.

Возвращает:

обучатьndarray: Индексы обучающей выборки для этого разбиения.
тестndarray: Индексы тестового набора для этого разбиения.

Примеры галереи#

Распространённые ошибки в интерпретации коэффициентов линейных моделей

RepeatedKFold#

Примеры галереи#

Эта страница