LabelEncoder#

класс sklearn.preprocessing.LabelEncoder[источник]#

Кодировать целевые метки значениями от 0 до n_classes-1.

Этот преобразователь следует использовать для кодирования целевых значений, т.е. y, а не входные X.

Подробнее в Руководство пользователя.

Добавлено в версии 0.12.

Атрибуты:

classes_ndarray формы (n_classes,): Содержит метку для каждого класса.

Смотрите также

OrdinalEncoder: Кодировать категориальные признаки с использованием порядковой схемы кодирования.
OneHotEncoder: Закодировать категориальные признаки как однократно закодированный числовой массив.

Примеры

LabelEncoder может использоваться для нормализации меток.

>>> from sklearn.preprocessing import LabelEncoder
>>> le = LabelEncoder()
>>> le.fit([1, 2, 2, 6])
LabelEncoder()
>>> le.classes_
array([1, 2, 6])
>>> le.transform([1, 1, 2, 6])
array([0, 0, 1, 2]...)
>>> le.inverse_transform([0, 0, 1, 2])
array([1, 1, 2, 6])

Его также можно использовать для преобразования нечисловых меток (при условии, что они хэшируемы и сравнимы) в числовые метки.

>>> le = LabelEncoder()
>>> le.fit(["paris", "paris", "tokyo", "amsterdam"])
LabelEncoder()
>>> list(le.classes_)
[np.str_('amsterdam'), np.str_('paris'), np.str_('tokyo')]
>>> le.transform(["tokyo", "tokyo", "paris"])
array([2, 2, 1]...)
>>> list(le.inverse_transform([2, 2, 1]))
[np.str_('tokyo'), np.str_('tokyo'), np.str_('paris')]

fit(y)[источник]#

Обучить кодировщик меток.

Параметры:

yarray-like формы (n_samples,): Целевые значения.

Возвращает:

selfвозвращает экземпляр self.: Обученный кодировщик меток.

fit_transform(y)[источник]#

Обучить кодировщик меток и вернуть закодированные метки.

Параметры:

yarray-like формы (n_samples,): Целевые значения.

Возвращает:

yarray-like формы (n_samples,): Закодированные метки.

6332()[источник]#

Получить маршрутизацию метаданных этого объекта.

Пожалуйста, проверьте Руководство пользователя о том, как работает механизм маршрутизации.

Возвращает:

маршрутизацияMetadataRequest: A MetadataRequest Инкапсуляция информации о маршрутизации.

get_params(глубокий=True)[источник]#

Получить параметры для этого оценщика.

Параметры:

глубокийbool, по умолчанию=True: Если True, вернет параметры для этого оценщика и вложенных подобъектов, которые являются оценщиками.

Возвращает:

paramsdict: Имена параметров, сопоставленные с их значениями.

inverse_transform(y)[источник]#

Преобразовать метки обратно в исходную кодировку.

Параметры:

yarray-like формы (n_samples,): Целевые значения.

Возвращает:

y_originalndarray формы (n_samples,): Исходное кодирование.

set_output(*, преобразовать=None)[источник]#

Установить контейнер вывода.

См. Введение API set_output для примера использования API.

Параметры:

преобразовать{“default”, “pandas”, “polars”}, по умолчанию=None

Настройка вывода transform и fit_transform.

"default": Формат вывода трансформера по умолчанию
"pandas": DataFrame вывод
"polars": Вывод Polars
None: Конфигурация преобразования не изменена

Добавлено в версии 1.4: "polars" опция была добавлена.

Возвращает:

selfэкземпляр estimator: Экземпляр оценщика.

set_params(**params)[источник]#

Установить параметры этого оценщика.

Метод работает как на простых оценщиках, так и на вложенных объектах (таких как Pipeline). Последние имеют параметры вида __ чтобы можно было обновить каждый компонент вложенного объекта.

Параметры:

**paramsdict: Параметры оценщика.

Возвращает:

selfэкземпляр estimator: Экземпляр оценщика.

преобразовать(y)[источник]#

Преобразование меток в нормализованное кодирование.

Параметры:

yarray-like формы (n_samples,): Целевые значения.

Возвращает:

yarray-like формы (n_samples,): Метки как нормализованные кодировки.

LabelEncoder#

Эта страница