load_iris#

sklearn.datasets.load_iris(*, return_X_y=False, as_frame=False)[источник]#

Загружает и возвращает набор данных ирисов (классификация).

Набор данных iris — это классический и очень простой набор данных для многоклассовой классификации.

Классы

3

Примеров на класс

50

Всего образцов

150

Снижение размерности

4

Признаки

действительное, положительное

Подробнее в Руководство пользователя.

Изменено в версии 0.20: Исправлены две ошибочные точки данных в соответствии с работой Фишера. Новая версия совпадает с версией в R, но не с версией в репозитории UCI Machine Learning Repository.

Параметры:
return_X_ybool, по умолчанию=False

Если True, возвращает (data, target) вместо объекта Bunch. См. ниже для получения дополнительной информации о data и target объект.

Добавлено в версии 0.18.

as_framebool, по умолчанию=False

Если True, данные представляют собой pandas DataFrame, включающий столбцы с соответствующими типами данных (числовые). Цель — pandas DataFrame или Series в зависимости от количества целевых столбцов. Если return_X_y равно True, тогда (data, target) будут pandas DataFrame или Series, как описано ниже.

Добавлено в версии 0.23.

Возвращает:
данныеBunch

Объект, подобный словарю, со следующими атрибутами.

данные{ndarray, dataframe} формы (150, 4)

Матрица данных. Если as_frame=True, data будет pandas DataFrame.

target: {ndarray, Series} формы (150,)

Целевая переменная классификации. Если as_frame=True, target будет pandas Series.

feature_names: list

Имена столбцов набора данных.

target_names: ndarray формы (3, )

Имена целевых классов.

фрейм: DataFrame формы (150, 5)

Только присутствует, когда as_frame=TrueМы определяем функцию для загрузки данных из data и target.

Добавлено в версии 0.23.

DESCR: str

Полное описание набора данных.

filename: str

Путь к местоположению данных.

Добавлено в версии 0.20.

(data, target)кортеж если return_X_y равно True

Кортеж из двух ndarray. Первый содержит 2D-массив формы (n_samples, n_features), где каждая строка представляет один образец, а каждый столбец представляет признаки. Второй ndarray формы (n_samples,) содержит целевые образцы.

Добавлено в версии 0.18.

Примеры

Допустим, вас интересуют выборки 10, 25 и 50, и вы хотите узнать их названия классов.

>>> from sklearn.datasets import load_iris
>>> data = load_iris()
>>> samples = [10, 25, 50]
>>> data.target[samples]
array([0, 0, 1])
>>> data.target_names[data.target[samples]]
array(['setosa', 'setosa', 'versicolor'], dtype='

См. Анализ главных компонент (PCA) на наборе данных Iris для более подробного примера работы с набором данных iris.