make_gaussian_quantiles#

sklearn.datasets.make_gaussian_quantiles(*, mean=None, cov=1.0, n_samples=100, n_features=2, n_classes=3, перемешивание=True, random_state=None)[источник]#

Генерировать изотропные гауссовы выборки и метки по квантилям.

Этот классификационный набор данных создается путем взятия многомерного стандартного нормального распределения и определения классов, разделенных вложенными концентрическими многомерными сферами таким образом, что примерно равное количество образцов находится в каждом классе (квантили \(\chi^2\) распределение).

Подробнее в Руководство пользователя.

Параметры:
meanarray-like формы (n_features,), по умолчанию=None

Среднее многомерного нормального распределения. Если None, то используется начало координат (0, 0, …).

covfloat, по умолчанию=1.0

Ковариационная матрица будет равна этому значению, умноженному на единичную матрицу. Этот набор данных производит только симметричные нормальные распределения.

n_samplesint, по умолчанию=100

Общее количество точек, равномерно разделенных между классами.

n_featuresint, по умолчанию=2

Количество признаков для каждого образца.

n_classesint, по умолчанию=3

Количество классов.

перемешиваниеbool, по умолчанию=True

Перемешать образцы.

random_stateint, экземпляр RandomState или None, по умолчанию=None

Определяет генерацию случайных чисел для создания набора данных. Передайте целое число для воспроизводимого результата при нескольких вызовах функции. См. Глоссарий.

Возвращает:
Xndarray формы (n_samples, n_features)

Сгенерированные образцы.

yndarray формы (n_samples,)

Целочисленные метки для принадлежности к квантилю каждого образца.

Примечания

Набор данных взят из Zhu et al [1].

Ссылки

Примеры

>>> from sklearn.datasets import make_gaussian_quantiles
>>> X, y = make_gaussian_quantiles(random_state=42)
>>> X.shape
(100, 2)
>>> y.shape
(100,)
>>> list(y[:5])
[np.int64(2), np.int64(0), np.int64(1), np.int64(0), np.int64(2)]