fetch_lfw_people#

sklearn.datasets.fetch_lfw_people(*, data_home=None, воронкообразный=True, изменить размер=0.5, min_faces_per_person=0, цвет=False, slice_=(slice(70, 195, None), slice(78, 172, None)), download_if_missing=True, return_X_y=False, n_retries=3, задержка=1.0)[источник]#

Загрузить набор данных Labeled Faces in the Wild (LFW) людей (классификация).

Загружает его, если необходимо.

Классы

5749

Всего образцов

13233

Снижение размерности

5828

Признаки

действительное число от 0 до 255

Пример использования этого набора данных см. Пример распознавания лиц с использованием собственных лиц и SVM.

Подробнее в Руководство пользователя.

Параметры:
data_homestr или path-like, по умолчанию=None

Укажите другую папку для загрузки и кэширования наборов данных. По умолчанию все данные scikit-learn хранятся в подпапках '~/scikit_learn_data'.

воронкообразныйbool, по умолчанию=True

Загрузите и используйте воронкообразный вариант набора данных.

изменить размерfloat или None, по умолчанию=0.5

Коэффициент изменения размера каждого изображения лица. Если None, изменение размера не выполняется.

min_faces_per_personint, default=None

Извлеченный набор данных будет содержать только изображения людей, у которых есть хотя бы min_faces_per_person разные изображения.

цветbool, по умолчанию=False

Сохранять 3 канала RGB вместо усреднения их до одного канала серого уровня. Если color=True, форма данных имеет на одно измерение больше, чем форма с color=False.

slice_кортеж срезов, по умолчанию=(slice(70, 195), slice(78, 172))

Предоставьте пользовательский 2D срез (высота, ширина) для извлечения 'интересной' части jpeg-файлов и избегания использования статистической корреляции с фоном.

download_if_missingbool, по умолчанию=True

Если False, вызывает OSError, если данные недоступны локально, вместо попытки загрузить их с исходного сайта.

return_X_ybool, по умолчанию=False

Если True, возвращает (dataset.data, dataset.target) вместо объекта Bunch. Дополнительную информацию см. ниже в разделе dataset.data и dataset.target объект.

Добавлено в версии 0.20.

n_retriesint, по умолчанию=3

Количество повторных попыток при возникновении HTTP-ошибок.

Добавлено в версии 1.5.

задержкаfloat, по умолчанию=1.0

Количество секунд между повторными попытками.

Добавлено в версии 1.5.

Возвращает:
набор данныхBunch

Объект, подобный словарю, со следующими атрибутами.

данныемассив numpy формы (13233, 2914)

Каждая строка соответствует развернутому изображению лица исходного размера 62 x 47 пикселей. Изменение slice_ или параметры изменения размера изменят форму вывода.

изображениямассив numpy формы (13233, 62, 47)

Каждая строка представляет собой изображение лица, соответствующее одному из 5749 людей в наборе данных. Изменение slice_ или параметры изменения размера изменят форму вывода.

цельмассив numpy формы (13233,)

Метки, связанные с каждым изображением лица. Эти метки находятся в диапазоне от 0 до 5748 и соответствуют идентификаторам людей.

target_namesмассив numpy формы (5749,)

Имена всех лиц в наборе данных. Позиция в массиве соответствует ID лица в целевом массиве.

DESCRstr

Описание набора данных Labeled Faces in the Wild (LFW).

(data, target)кортеж если return_X_y равно True

Кортеж из двух ndarray. Первый содержит двумерный массив формы (n_samples, n_features), где каждая строка представляет один образец, а каждый столбец — признаки. Второй ndarray формы (n_samples,) содержит целевые образцы.

Добавлено в версии 0.20.

Примеры

>>> from sklearn.datasets import fetch_lfw_people
>>> lfw_people = fetch_lfw_people()
>>> lfw_people.data.shape
(13233, 2914)
>>> lfw_people.target.shape
(13233,)
>>> for name in lfw_people.target_names[:5]:
...    print(name)
AJ Cook
AJ Lamas
Aaron Eckhart
Aaron Guiel
Aaron Patterson