make_blobs#

sklearn.datasets.make_blobs(n_samples=100, n_features=2, *, центры=None, cluster_std=1.0, center_box=(-10.0, 10.0), перемешивание=True, random_state=None, return_centers=False)[источник]#

Сгенерировать изотропные гауссовы сгустки для кластеризации.

Подробнее в Руководство пользователя.

Параметры:

n_samplesint или array-like, по умолчанию=100: Если int, это общее количество точек, равномерно распределенных между кластерами. Если массивоподобный, каждый элемент последовательности указывает количество образцов на кластер.

Изменено в версии v0.20: теперь можно передать array-like в n_samples параметр
n_featuresint, по умолчанию=2: Количество признаков для каждого образца.
центрыint или array-like формы (n_centers, n_features), по умолчанию=None: Количество центров для генерации или фиксированные местоположения центров. Если n_samples — целое число и centers равно None, генерируется 3 центра. Если n_samples — массивоподобный, centers должно быть либо None, либо массивом длины, равной длине n_samples.
cluster_stdfloat или array-like of float, default=1.0: Стандартное отклонение кластеров.
center_boxкортеж из float (мин, макс), по умолчанию=(-10.0, 10.0): Ограничивающий прямоугольник для каждого центра кластера, когда центры генерируются случайным образом.
перемешиваниеbool, по умолчанию=True: Перемешать образцы.
random_stateint, экземпляр RandomState или None, по умолчанию=None: Определяет генерацию случайных чисел для создания набора данных. Передайте целое число для воспроизводимого результата при нескольких вызовах функции. См. Глоссарий.
return_centersbool, по умолчанию=False: Если True, то возвращает центры каждого кластера.

Добавлено в версии 0.23.

Возвращает:

Xndarray формы (n_samples, n_features): Сгенерированные образцы.
yndarray формы (n_samples,): Целочисленные метки принадлежности каждого образца к кластеру.
центрыndarray формы (n_центров, n_признаков): Центры каждого кластера. Возвращается только если return_centers=True.

Смотрите также

make_classification: Более сложный вариант.

Примеры

>>> from sklearn.datasets import make_blobs
>>> X, y = make_blobs(n_samples=10, centers=3, n_features=2,
...                   random_state=0)
>>> print(X.shape)
(10, 2)
>>> y
array([0, 0, 1, 0, 2, 2, 2, 1, 1, 0])
>>> X, y = make_blobs(n_samples=[3, 3, 4], centers=None, n_features=2,
...                   random_state=0)
>>> print(X.shape)
(10, 2)
>>> y
array([0, 1, 2, 0, 2, 2, 2, 1, 1, 0])