make_checkerboard#
- sklearn.datasets.make_checkerboard(shape, n_clusters, *, шум=0.0, minval=10, maxval=100, перемешивание=True, random_state=None)[источник]#
Сгенерировать массив с блочной шахматной структурой для бикластеризации.
Подробнее в Руководство пользователя.
- Параметры:
- shapeкортеж формы (n_rows, n_cols)
Форма результата.
- n_clustersint или массивоподобный формы (n_row_clusters, n_column_clusters)
Количество кластеров строк и столбцов.
- шумfloat, по умолчанию=0.0
Стандартное отклонение гауссовского шума.
- minvalfloat, по умолчанию=10
Минимальное значение бикластера.
- maxvalfloat, default=100
Максимальное значение бикластера.
- перемешиваниеbool, по умолчанию=True
Перемешать образцы.
- random_stateint, экземпляр RandomState или None, по умолчанию=None
Определяет генерацию случайных чисел для создания набора данных. Передайте целое число для воспроизводимого результата при нескольких вызовах функции. См. Глоссарий.
- Возвращает:
- Xndarray формы
shape Сгенерированный массив.
- строкиndarray формы (n_clusters, X.shape[0])
Индикаторы принадлежности к кластеру для каждой строки.
- colsndarray формы (n_clusters, X.shape[1])
Индикаторы принадлежности каждого столбца к кластеру.
- Xndarray формы
Смотрите также
make_biclustersСгенерировать массив с постоянной блочно-диагональной структурой для бикластеризации.
Ссылки
[1]Kluger, Y., Basri, R., Chang, J. T., & Gerstein, M. (2003). Spectral biclustering of microarray data: coclustering genes and conditions. Genome research, 13(4), 703-716.
Примеры
>>> from sklearn.datasets import make_checkerboard >>> data, rows, columns = make_checkerboard(shape=(300, 300), n_clusters=10, ... random_state=42) >>> data.shape (300, 300) >>> rows.shape (100, 300) >>> columns.shape (100, 300) >>> print(rows[0][:5], columns[0][:5]) [False False False True False] [False False False False False]