make_sparse_uncorrelated#

sklearn.datasets.make_sparse_uncorrelated(n_samples=100, n_features=10, *, random_state=None)[источник]#

Сгенерировать случайную регрессионную задачу с разреженным некоррелированным дизайном.

Этот набор данных описан в Celeux et al [1]. как:

X ~ N(0, 1)
y(X) = X[:, 0] + 2 * X[:, 1] - 2 * X[:, 2] - 1.5 * X[:, 3]

Только первые 4 признака являются информативными. Остальные признаки бесполезны.

Подробнее в Руководство пользователя.

Параметры:

n_samplesint, по умолчанию=100: Количество образцов.
n_featuresint, по умолчанию=10: Количество признаков.
random_stateint, экземпляр RandomState или None, по умолчанию=None: Определяет генерацию случайных чисел для создания набора данных. Передайте целое число для воспроизводимого результата при нескольких вызовах функции. См. Глоссарий.

Возвращает:

Xndarray формы (n_samples, n_features): Входные образцы.
yndarray формы (n_samples,): Выходные значения.

Ссылки

[1]

G. Celeux, M. El Anbari, J.-M. Marin, C. P. Robert, “Regularization in regression: comparing Bayesian and frequentist methods in a poorly informative situation”, 2009.

Примеры

>>> from sklearn.datasets import make_sparse_uncorrelated
>>> X, y = make_sparse_uncorrelated(random_state=0)
>>> X.shape
(100, 10)
>>> y.shape
(100,)

make_sparse_uncorrelated#

Эта страница