make_sparse_uncorrelated#
- sklearn.datasets.make_sparse_uncorrelated(n_samples=100, n_features=10, *, random_state=None)[источник]#
Сгенерировать случайную регрессионную задачу с разреженным некоррелированным дизайном.
Этот набор данных описан в Celeux et al [1]. как:
X ~ N(0, 1) y(X) = X[:, 0] + 2 * X[:, 1] - 2 * X[:, 2] - 1.5 * X[:, 3]
Только первые 4 признака являются информативными. Остальные признаки бесполезны.
Подробнее в Руководство пользователя.
- Параметры:
- n_samplesint, по умолчанию=100
Количество образцов.
- n_featuresint, по умолчанию=10
Количество признаков.
- random_stateint, экземпляр RandomState или None, по умолчанию=None
Определяет генерацию случайных чисел для создания набора данных. Передайте целое число для воспроизводимого результата при нескольких вызовах функции. См. Глоссарий.
- Возвращает:
- Xndarray формы (n_samples, n_features)
Входные образцы.
- yndarray формы (n_samples,)
Выходные значения.
Ссылки
[1]G. Celeux, M. El Anbari, J.-M. Marin, C. P. Robert, “Regularization in regression: comparing Bayesian and frequentist methods in a poorly informative situation”, 2009.
Примеры
>>> from sklearn.datasets import make_sparse_uncorrelated >>> X, y = make_sparse_uncorrelated(random_state=0) >>> X.shape (100, 10) >>> y.shape (100,)