load_digits#

sklearn.datasets.load_digits(*, n_class=10, return_X_y=False, as_frame=False)[источник]#

Загрузить и вернуть набор данных digits (классификация).

Каждая точка данных — это изображение цифры размером 8x8.

Классы

10

Примеров на класс

~180

Всего образцов

1797

Снижение размерности

64

Признаки

целые числа 0-16

Это копия тестового набора наборов данных рукописных цифр UCI ML https://archive.ics.uci.edu/ml/datasets/Optical+Recognition+of+Handwritten+Digits

Подробнее в Руководство пользователя.

Параметры:
n_classint, по умолчанию=10

Количество классов для возврата. Между 0 и 10.

return_X_ybool, по умолчанию=False

Если True, возвращает (data, target) вместо объекта Bunch. См. ниже для получения дополнительной информации о data и target объект.

Добавлено в версии 0.18.

as_framebool, по умолчанию=False

Если True, данные представляют собой pandas DataFrame, включающий столбцы с соответствующими типами данных (числовые). Цель — pandas DataFrame или Series в зависимости от количества целевых столбцов. Если return_X_y равно True, тогда (data, target) будут pandas DataFrame или Series, как описано ниже.

Добавлено в версии 0.23.

Возвращает:
данныеBunch

Объект, подобный словарю, со следующими атрибутами.

данные{ndarray, dataframe} формы (1797, 64)

Выровненная матрица данных. Если as_frame=True, data будет pandas DataFrame.

target: {ndarray, Series} формы (1797,)

Целевая переменная классификации. Если as_frame=True, target будет pandas Series.

feature_names: list

Имена столбцов набора данных.

target_names: список

Имена целевых классов.

Добавлено в версии 0.20.

frame: DataFrame формы (1797, 65)

Только присутствует, когда as_frame=TrueМы определяем функцию для загрузки данных из data и target.

Добавлено в версии 0.23.

изображения: {ndarray} формы (1797, 8, 8)

Необработанные данные изображения.

DESCR: str

Полное описание набора данных.

(data, target)кортеж если return_X_y равно True

Кортеж из двух ndarray по умолчанию. Первый содержит 2D ndarray формы (1797, 64), где каждая строка представляет один образец, а каждый столбец представляет признаки. Второй ndarray формы (1797) содержит целевые образцы. Если as_frame=True, оба массива являются объектами pandas, т.е. X фрейм данных и y серия.

Добавлено в версии 0.18.

Примеры

Чтобы загрузить данные и визуализировать изображения:

>>> from sklearn.datasets import load_digits
>>> digits = load_digits()
>>> print(digits.data.shape)
(1797, 64)
>>> import matplotlib.pyplot as plt
>>> plt.matshow(digits.images[0], cmap="gray")
<...>
>>> plt.show()
../../_images/sklearn-datasets-load_digits-1.png