pandas.api.extensions.ExtensionArray.factorize#
- ExtensionArray.factorize(use_na_sentinel=True)[источник]#
Закодировать массив расширений как перечисляемый тип.
- Параметры:
- use_na_sentinelbool, по умолчанию True
Если True, для значений NaN будет использоваться маркер -1. Если False, значения NaN будут закодированы как неотрицательные целые числа и не будут удалены из уникальных значений.
Добавлено в версии 1.5.0.
- Возвращает:
- кодыndarray
Целочисленный массив NumPy, который является индексатором в исходном ExtensionArray.
- уникальные значенияExtensionArray
ExtensionArray, содержащий уникальные значения self.
Примечание
уникальные значения будут не содержит запись для значения NA в ExtensionArray, если в self.
Смотрите также
factorizeМетод факторизации верхнего уровня, который перенаправляет сюда.
Примечания
pandas.factorize()предлагает sort ключевое слово также.Примеры
>>> idx1 = pd.PeriodIndex(["2014-01", "2014-01", "2014-02", "2014-02", ... "2014-03", "2014-03"], freq="M") >>> arr, idx = idx1.factorize() >>> arr array([0, 0, 1, 1, 2, 2]) >>> idx PeriodIndex(['2014-01', '2014-02', '2014-03'], dtype='period[M]')