pandas.arrays.SparseArray#

класс pandas.arrays.SparseArray(данные, sparse_index=None, fill_value=None, kind='integer', dtype=None, copy=False)[источник]#

ExtensionArray для хранения разреженных данных.

Параметры:
данныемассивоподобный объект или скаляр

Плотный массив значений для хранения в SparseArray. Он может содержать fill_value.

sparse_indexSparseIndex, optional
fill_valueскаляр, опционально

Элементы в данных, которые fill_value не хранятся в SparseArray. Для экономии памяти это должно быть наиболее частое значение в данные. По умолчанию, fill_value зависит от типа данных (dtype) в данные:

data.dtype

na_value

float

np.nan

int

0

bool

False

datetime64

pd.NaT

timedelta64

pd.NaT

Значение заполнения может быть указано тремя способами. В порядке приоритета это

  1. The fill_value аргумент

  2. dtype.fill_value if fill_value равно None и dtype is a SparseDtype

  3. data.dtype.fill_value if fill_value равно None и dtype не является SparseDtype и данные является SparseArray.

kindstr

Может быть 'integer' или 'block', по умолчанию 'integer'. Тип хранения для разреженных местоположений.

  • 'block': Хранит блок и block_length для каждого непрерывного span разреженных значений. Это лучше всего, когда разреженные данные имеют тенденцию группироваться вместе, с большими областями fill-value значения между разреженными значениями.

  • 'integer': использует целое число для хранения местоположения каждого разреженного значения.

dtypenp.dtype или SparseDtype, опционально

Тип данных для использования в SparseArray. Для numpy dtypes это определяет dtype self.sp_values. Для SparseDtype, это определяет self.sp_values и self.fill_value.

copybool, по умолчанию False

Следует ли явно копировать входящие данные массив.

Атрибуты

None

Методы

None

Примеры

>>> from pandas.arrays import SparseArray
>>> arr = SparseArray([0, 0, 1, 2])
>>> arr
[0, 0, 1, 2]
Fill: 0
IntIndex
Indices: array([2, 3], dtype=int32)