make_biclusters#

sklearn.datasets.make_biclusters(shape, n_clusters, *, шум=0.0, minval=10, maxval=100, перемешивание=True, random_state=None)[источник]#

Сгенерировать массив структуры постоянного блочного диагоналя для бикластеризации.

Подробнее в Руководство пользователя.

Параметры:
shapeкортеж формы (n_rows, n_cols)

Форма результата.

n_clustersint

Количество бикластеров.

шумfloat, по умолчанию=0.0

Стандартное отклонение гауссовского шума.

minvalfloat, по умолчанию=10

Минимальное значение бикластера.

maxvalfloat, default=100

Максимальное значение бикластера.

перемешиваниеbool, по умолчанию=True

Перемешать образцы.

random_stateint, экземпляр RandomState или None, по умолчанию=None

Определяет генерацию случайных чисел для создания набора данных. Передайте целое число для воспроизводимого результата при нескольких вызовах функции. См. Глоссарий.

Возвращает:
Xndarray формы shape

Сгенерированный массив.

строкиndarray формы (n_clusters, X.shape[0])

Индикаторы принадлежности к кластеру для каждой строки.

colsndarray формы (n_clusters, X.shape[1])

Индикаторы принадлежности каждого столбца к кластеру.

Смотрите также

make_checkerboard

Сгенерировать массив с блочной шахматной структурой для бикластеризации.

Ссылки

[1]

Dhillon, I. S. (2001, August). Co-clustering documents and words using bipartite spectral graph partitioning. In Proceedings of the seventh ACM SIGKDD international conference on Knowledge discovery and data mining (pp. 269-274). ACM.

Примеры

>>> from sklearn.datasets import make_biclusters
>>> data, rows, cols = make_biclusters(
...     shape=(10, 20), n_clusters=2, random_state=42
... )
>>> data.shape
(10, 20)
>>> rows.shape
(2, 10)
>>> cols.shape
(2, 20)