load_digits#
- sklearn.datasets.load_digits(*, n_class=10, return_X_y=False, as_frame=False)[источник]#
Загрузить и вернуть набор данных digits (классификация).
Каждая точка данных — это изображение цифры размером 8x8.
Классы
10
Примеров на класс
~180
Всего образцов
1797
Снижение размерности
64
Признаки
целые числа 0-16
Это копия тестового набора наборов данных рукописных цифр UCI ML https://archive.ics.uci.edu/ml/datasets/Optical+Recognition+of+Handwritten+Digits
Подробнее в Руководство пользователя.
- Параметры:
- n_classint, по умолчанию=10
Количество классов для возврата. Между 0 и 10.
- return_X_ybool, по умолчанию=False
Если True, возвращает
(data, target)вместо объекта Bunch. См. ниже для получения дополнительной информации оdataиtargetобъект.Добавлено в версии 0.18.
- as_framebool, по умолчанию=False
Если True, данные представляют собой pandas DataFrame, включающий столбцы с соответствующими типами данных (числовые). Цель — pandas DataFrame или Series в зависимости от количества целевых столбцов. Если
return_X_yравно True, тогда (data,target) будут pandas DataFrame или Series, как описано ниже.Добавлено в версии 0.23.
- Возвращает:
- данные
Bunch Объект, подобный словарю, со следующими атрибутами.
- данные{ndarray, dataframe} формы (1797, 64)
Выровненная матрица данных. Если
as_frame=True,dataбудет pandas DataFrame.- target: {ndarray, Series} формы (1797,)
Целевая переменная классификации. Если
as_frame=True,targetбудет pandas Series.- feature_names: list
Имена столбцов набора данных.
- target_names: список
Имена целевых классов.
Добавлено в версии 0.20.
- frame: DataFrame формы (1797, 65)
Только присутствует, когда
as_frame=TrueМы определяем функцию для загрузки данных изdataиtarget.Добавлено в версии 0.23.
- изображения: {ndarray} формы (1797, 8, 8)
Необработанные данные изображения.
- DESCR: str
Полное описание набора данных.
- (data, target)кортеж если
return_X_yравно True Кортеж из двух ndarray по умолчанию. Первый содержит 2D ndarray формы (1797, 64), где каждая строка представляет один образец, а каждый столбец представляет признаки. Второй ndarray формы (1797) содержит целевые образцы. Если
as_frame=True, оба массива являются объектами pandas, т.е.Xфрейм данных иyсерия.Добавлено в версии 0.18.
- данные
Примеры
Чтобы загрузить данные и визуализировать изображения:
>>> from sklearn.datasets import load_digits >>> digits = load_digits() >>> print(digits.data.shape) (1797, 64) >>> import matplotlib.pyplot as plt >>> plt.matshow(digits.images[0], cmap="gray") <...> >>> plt.show()
Примеры галереи#
Различные агломеративные кластеризации на 2D-вложении цифр
Демонстрация кластеризации K-Means на данных рукописных цифр
Выбор уменьшения размерности с помощью Pipeline и GridSearchCV
Конвейеризация: объединение PCA и логистической регрессии
L1-штраф и разреженность в логистической регрессии
Обучение многообразию на рукописных цифрах: Locally Linear Embedding, Isomap…
Граница Джонсона-Линденштрауса для вложения с помощью случайных проекций
Аппроксимация явного отображения признаков для RBF-ядер
Пользовательская стратегия повторного обучения для поиска по сетке с кросс-валидацией
Баланс сложности модели и кросс-валидационной оценки
Построение кривых обучения и проверка масштабируемости моделей
Сравнение рандомизированного поиска и поиска по сетке для оценки гиперпараметров
Снижение размерности с помощью анализа компонентов соседства
Сравнение стохастических стратегий обучения для MLPClassifier
Признаки ограниченной машины Больцмана для классификации цифр
Распространение меток на цифрах: Демонстрация производительности