pandas.Series.to_numpy#

Series.to_numpy(dtype=None, copy=False, na_value=, **kwargs)[источник]#

Массив NumPy ndarray, представляющий значения в этой Series или Index.

Параметры:
dtypestr или numpy.dtype, опционально

Тип данных для передачи в numpy.asarray().

copybool, по умолчанию False

Следует ли гарантировать, что возвращаемое значение не является представлением другого массива. Обратите внимание, что copy=False не обеспечить что to_numpy() не копирует. Скорее, copy=True гарантировать, что создается копия, даже если это не строго необходимо.

na_valueAny, опционально

Значение для использования в качестве пропущенных значений. Значение по умолчанию зависит от dtype и тип массива.

**kwargs

Дополнительные ключевые слова, передаваемые в to_numpy метод базового массива (для расширенных массивов).

Возвращает:
numpy.ndarray

Смотрите также

Series.array

Получить фактические данные, хранящиеся внутри.

Index.array

Получить фактические данные, хранящиеся внутри.

DataFrame.to_numpy

Аналогичный метод для DataFrame.

Примечания

Возвращаемый массив будет одинаковым с точностью до равенства (значения равны в self будут равны в возвращаемом массиве; аналогично для значений которые не равны). Когда self содержит ExtensionArray, dtype может отличаться. Например, для Series с категориальным dtype, to_numpy() вернет массив NumPy, и категориальный тип данных будет потерян.

Для типов данных NumPy это будет ссылка на фактические данные, хранящиеся в этом Series или Index (предполагая copy=False). Изменение результата на месте изменит данные, хранящиеся в Series или Index (не рекомендуется это делать).

Для типов расширений, to_numpy() может требуют копирования данных и приведения результата к типу NumPy (возможно, object), что может быть затратно. Когда вам нужна ссылка без копирования на исходные данные, Series.array следует использовать вместо.

Эта таблица описывает различные типы данных и типы возвращаемых значений по умолчанию для to_numpy() для различных типов данных в pandas.

dtype

тип массива

category[T]

ndarray[T] (тот же dtype, что и входные данные)

период

ndarray[object] (Periods)

интервал

ndarray[object] (Интервалы)

IntegerNA

ndarray[object]

datetime64[ns]

datetime64[ns]

datetime64[ns, tz]

ndarray[object] (Timestamps)

Примеры

>>> ser = pd.Series(pd.Categorical(['a', 'b', 'a']))
>>> ser.to_numpy()
array(['a', 'b', 'a'], dtype=object)

Укажите dtype для управления представлением данных с учетом времени. Используйте dtype=object для возврата ndarray из pandas Timestamp объекты, каждый с правильным tz.

>>> ser = pd.Series(pd.date_range('2000', periods=2, tz="CET"))
>>> ser.to_numpy(dtype=object)
array([Timestamp('2000-01-01 00:00:00+0100', tz='CET'),
       Timestamp('2000-01-02 00:00:00+0100', tz='CET')],
      dtype=object)

Или dtype='datetime64[ns]' для возврата ndarray из нативных значений datetime64. Значения преобразуются в UTC, и информация о часовом поясе удаляется.

>>> ser.to_numpy(dtype="datetime64[ns]")
... 
array(['1999-12-31T23:00:00.000000000', '2000-01-01T23:00:00...'],
      dtype='datetime64[ns]')