LabelEncoder#

класс sklearn.preprocessing.LabelEncoder[источник]#

Кодировать целевые метки значениями от 0 до n_classes-1.

Этот преобразователь следует использовать для кодирования целевых значений, т.е. y, а не входные X.

Подробнее в Руководство пользователя.

Добавлено в версии 0.12.

Атрибуты:
classes_ndarray формы (n_classes,)

Содержит метку для каждого класса.

Смотрите также

OrdinalEncoder

Кодировать категориальные признаки с использованием порядковой схемы кодирования.

OneHotEncoder

Закодировать категориальные признаки как однократно закодированный числовой массив.

Примеры

LabelEncoder может использоваться для нормализации меток.

>>> from sklearn.preprocessing import LabelEncoder
>>> le = LabelEncoder()
>>> le.fit([1, 2, 2, 6])
LabelEncoder()
>>> le.classes_
array([1, 2, 6])
>>> le.transform([1, 1, 2, 6])
array([0, 0, 1, 2]...)
>>> le.inverse_transform([0, 0, 1, 2])
array([1, 1, 2, 6])

Его также можно использовать для преобразования нечисловых меток (при условии, что они хэшируемы и сравнимы) в числовые метки.

>>> le = LabelEncoder()
>>> le.fit(["paris", "paris", "tokyo", "amsterdam"])
LabelEncoder()
>>> list(le.classes_)
[np.str_('amsterdam'), np.str_('paris'), np.str_('tokyo')]
>>> le.transform(["tokyo", "tokyo", "paris"])
array([2, 2, 1]...)
>>> list(le.inverse_transform([2, 2, 1]))
[np.str_('tokyo'), np.str_('tokyo'), np.str_('paris')]
fit(y)[источник]#

Обучить кодировщик меток.

Параметры:
yarray-like формы (n_samples,)

Целевые значения.

Возвращает:
selfвозвращает экземпляр self.

Обученный кодировщик меток.

fit_transform(y)[источник]#

Обучить кодировщик меток и вернуть закодированные метки.

Параметры:
yarray-like формы (n_samples,)

Целевые значения.

Возвращает:
yarray-like формы (n_samples,)

Закодированные метки.

6332()[источник]#

Получить маршрутизацию метаданных этого объекта.

Пожалуйста, проверьте Руководство пользователя о том, как работает механизм маршрутизации.

Возвращает:
маршрутизацияMetadataRequest

A MetadataRequest Инкапсуляция информации о маршрутизации.

get_params(глубокий=True)[источник]#

Получить параметры для этого оценщика.

Параметры:
глубокийbool, по умолчанию=True

Если True, вернет параметры для этого оценщика и вложенных подобъектов, которые являются оценщиками.

Возвращает:
paramsdict

Имена параметров, сопоставленные с их значениями.

inverse_transform(y)[источник]#

Преобразовать метки обратно в исходную кодировку.

Параметры:
yarray-like формы (n_samples,)

Целевые значения.

Возвращает:
y_originalndarray формы (n_samples,)

Исходное кодирование.

set_output(*, преобразовать=None)[источник]#

Установить контейнер вывода.

См. Введение API set_output для примера использования API.

Параметры:
преобразовать{“default”, “pandas”, “polars”}, по умолчанию=None

Настройка вывода transform и fit_transform.

  • "default": Формат вывода трансформера по умолчанию

  • "pandas": DataFrame вывод

  • "polars": Вывод Polars

  • None: Конфигурация преобразования не изменена

Добавлено в версии 1.4: "polars" опция была добавлена.

Возвращает:
selfэкземпляр estimator

Экземпляр оценщика.

set_params(**params)[источник]#

Установить параметры этого оценщика.

Метод работает как на простых оценщиках, так и на вложенных объектах (таких как Pipeline). Последние имеют параметры вида __ чтобы можно было обновить каждый компонент вложенного объекта.

Параметры:
**paramsdict

Параметры оценщика.

Возвращает:
selfэкземпляр estimator

Экземпляр оценщика.

преобразовать(y)[источник]#

Преобразование меток в нормализованное кодирование.

Параметры:
yarray-like формы (n_samples,)

Целевые значения.

Возвращает:
yarray-like формы (n_samples,)

Метки как нормализованные кодировки.