make_hastie_10_2#
- sklearn.datasets.make_hastie_10_2(n_samples=12000, *, random_state=None)[источник]#
Сгенерировать данные для бинарной классификации, использованные в Hastie et al. 2009, Пример 10.2.
Десять признаков - стандартные независимые гауссовские, а целевая переменная
yопределяется как:y[i] = 1 if np.sum(X[i] ** 2) > 9.34 else -1
Подробнее в Руководство пользователя.
- Параметры:
- n_samplesint, по умолчанию=12000
Количество образцов.
- random_stateint, экземпляр RandomState или None, по умолчанию=None
Определяет генерацию случайных чисел для создания набора данных. Передайте целое число для воспроизводимого результата при нескольких вызовах функции. См. Глоссарий.
- Возвращает:
- Xndarray формы (n_samples, 10)
Входные образцы.
- yndarray формы (n_samples,)
Выходные значения.
Смотрите также
make_gaussian_quantilesОбобщение этого подхода к набору данных.
Ссылки
[1]Т. Хасти, Р. Тибширани и Дж. Фридман, “Элементы статистического обучения, изд. 2”, Springer, 2009.
Примеры
>>> from sklearn.datasets import make_hastie_10_2 >>> X, y = make_hastie_10_2(n_samples=24000, random_state=42) >>> X.shape (24000, 10) >>> y.shape (24000,) >>> list(y[:5]) [np.float64(-1.0), np.float64(1.0), np.float64(-1.0), np.float64(1.0), np.float64(-1.0)]
Примеры галереи#
Демонстрация многометрической оценки на cross_val_score и GridSearchCV
Демонстрация многометрической оценки на cross_val_score и GridSearchCV