make_hastie_10_2#

sklearn.datasets.make_hastie_10_2(n_samples=12000, *, random_state=None)[источник]#

Сгенерировать данные для бинарной классификации, использованные в Hastie et al. 2009, Пример 10.2.

Десять признаков - стандартные независимые гауссовские, а целевая переменная y определяется как:

y[i] = 1 if np.sum(X[i] ** 2) > 9.34 else -1

Подробнее в Руководство пользователя.

Параметры:
n_samplesint, по умолчанию=12000

Количество образцов.

random_stateint, экземпляр RandomState или None, по умолчанию=None

Определяет генерацию случайных чисел для создания набора данных. Передайте целое число для воспроизводимого результата при нескольких вызовах функции. См. Глоссарий.

Возвращает:
Xndarray формы (n_samples, 10)

Входные образцы.

yndarray формы (n_samples,)

Выходные значения.

Смотрите также

make_gaussian_quantiles

Обобщение этого подхода к набору данных.

Ссылки

[1]

Т. Хасти, Р. Тибширани и Дж. Фридман, “Элементы статистического обучения, изд. 2”, Springer, 2009.

Примеры

>>> from sklearn.datasets import make_hastie_10_2
>>> X, y = make_hastie_10_2(n_samples=24000, random_state=42)
>>> X.shape
(24000, 10)
>>> y.shape
(24000,)
>>> list(y[:5])
[np.float64(-1.0), np.float64(1.0), np.float64(-1.0), np.float64(1.0),
np.float64(-1.0)]