make_checkerboard#

sklearn.datasets.make_checkerboard(shape, n_clusters, *, шум=0.0, minval=10, maxval=100, перемешивание=True, random_state=None)[источник]#

Сгенерировать массив с блочной шахматной структурой для бикластеризации.

Подробнее в Руководство пользователя.

Параметры:

shapeкортеж формы (n_rows, n_cols): Форма результата.
n_clustersint или массивоподобный формы (n_row_clusters, n_column_clusters): Количество кластеров строк и столбцов.
шумfloat, по умолчанию=0.0: Стандартное отклонение гауссовского шума.
minvalfloat, по умолчанию=10: Минимальное значение бикластера.
maxvalfloat, default=100: Максимальное значение бикластера.
перемешиваниеbool, по умолчанию=True: Перемешать образцы.
random_stateint, экземпляр RandomState или None, по умолчанию=None: Определяет генерацию случайных чисел для создания набора данных. Передайте целое число для воспроизводимого результата при нескольких вызовах функции. См. Глоссарий.

Возвращает:

Xndarray формы shape: Сгенерированный массив.
строкиndarray формы (n_clusters, X.shape[0]): Индикаторы принадлежности к кластеру для каждой строки.
colsndarray формы (n_clusters, X.shape[1]): Индикаторы принадлежности каждого столбца к кластеру.

Смотрите также

make_biclusters: Сгенерировать массив с постоянной блочно-диагональной структурой для бикластеризации.

Ссылки

[1]

Kluger, Y., Basri, R., Chang, J. T., & Gerstein, M. (2003). Spectral biclustering of microarray data: coclustering genes and conditions. Genome research, 13(4), 703-716.

Примеры

>>> from sklearn.datasets import make_checkerboard
>>> data, rows, columns = make_checkerboard(shape=(300, 300), n_clusters=10,
...                                         random_state=42)
>>> data.shape
(300, 300)
>>> rows.shape
(100, 300)
>>> columns.shape
(100, 300)
>>> print(rows[0][:5], columns[0][:5])
[False False False  True False] [False False False False False]

Примеры галереи#

Демонстрация алгоритма Spectral Biclustering

make_checkerboard#

Примеры галереи#

Эта страница