make_sparse_uncorrelated#

sklearn.datasets.make_sparse_uncorrelated(n_samples=100, n_features=10, *, random_state=None)[источник]#

Сгенерировать случайную регрессионную задачу с разреженным некоррелированным дизайном.

Этот набор данных описан в Celeux et al [1]. как:

X ~ N(0, 1)
y(X) = X[:, 0] + 2 * X[:, 1] - 2 * X[:, 2] - 1.5 * X[:, 3]

Только первые 4 признака являются информативными. Остальные признаки бесполезны.

Подробнее в Руководство пользователя.

Параметры:
n_samplesint, по умолчанию=100

Количество образцов.

n_featuresint, по умолчанию=10

Количество признаков.

random_stateint, экземпляр RandomState или None, по умолчанию=None

Определяет генерацию случайных чисел для создания набора данных. Передайте целое число для воспроизводимого результата при нескольких вызовах функции. См. Глоссарий.

Возвращает:
Xndarray формы (n_samples, n_features)

Входные образцы.

yndarray формы (n_samples,)

Выходные значения.

Ссылки

[1]

G. Celeux, M. El Anbari, J.-M. Marin, C. P. Robert, “Regularization in regression: comparing Bayesian and frequentist methods in a poorly informative situation”, 2009.

Примеры

>>> from sklearn.datasets import make_sparse_uncorrelated
>>> X, y = make_sparse_uncorrelated(random_state=0)
>>> X.shape
(100, 10)
>>> y.shape
(100,)