pandas.api.extensions.ExtensionArray.factorize#

ExtensionArray.factorize(use_na_sentinel=True)[источник]#

Закодировать массив расширений как перечисляемый тип.

Параметры:
use_na_sentinelbool, по умолчанию True

Если True, для значений NaN будет использоваться маркер -1. Если False, значения NaN будут закодированы как неотрицательные целые числа и не будут удалены из уникальных значений.

Добавлено в версии 1.5.0.

Возвращает:
кодыndarray

Целочисленный массив NumPy, который является индексатором в исходном ExtensionArray.

уникальные значенияExtensionArray

ExtensionArray, содержащий уникальные значения self.

Примечание

уникальные значения будут не содержит запись для значения NA в ExtensionArray, если в self.

Смотрите также

factorize

Метод факторизации верхнего уровня, который перенаправляет сюда.

Примечания

pandas.factorize() предлагает sort ключевое слово также.

Примеры

>>> idx1 = pd.PeriodIndex(["2014-01", "2014-01", "2014-02", "2014-02",
...                       "2014-03", "2014-03"], freq="M")
>>> arr, idx = idx1.factorize()
>>> arr
array([0, 0, 1, 1, 2, 2])
>>> idx
PeriodIndex(['2014-01', '2014-02', '2014-03'], dtype='period[M]')