pandas.arrays.SparseArray#
- класс pandas.arrays.SparseArray(данные, sparse_index=None, fill_value=None, kind='integer', dtype=None, copy=False)[источник]#
ExtensionArray для хранения разреженных данных.
- Параметры:
- данныемассивоподобный объект или скаляр
Плотный массив значений для хранения в SparseArray. Он может содержать fill_value.
- sparse_indexSparseIndex, optional
- fill_valueскаляр, опционально
Элементы в данных, которые
fill_valueне хранятся в SparseArray. Для экономии памяти это должно быть наиболее частое значение в данные. По умолчанию, fill_value зависит от типа данных (dtype) в данные:data.dtype
na_value
float
np.nanint
0bool
False
datetime64
pd.NaTtimedelta64
pd.NaTЗначение заполнения может быть указано тремя способами. В порядке приоритета это
The fill_value аргумент
dtype.fill_valueif fill_value равно None и dtype is aSparseDtypedata.dtype.fill_valueif fill_value равно None и dtype не являетсяSparseDtypeи данные являетсяSparseArray.
- kindstr
Может быть 'integer' или 'block', по умолчанию 'integer'. Тип хранения для разреженных местоположений.
'block': Хранит блок и block_length для каждого непрерывного span разреженных значений. Это лучше всего, когда разреженные данные имеют тенденцию группироваться вместе, с большими областями
fill-valueзначения между разреженными значениями.'integer': использует целое число для хранения местоположения каждого разреженного значения.
- dtypenp.dtype или SparseDtype, опционально
Тип данных для использования в SparseArray. Для numpy dtypes это определяет dtype
self.sp_values. Для SparseDtype, это определяетself.sp_valuesиself.fill_value.- copybool, по умолчанию False
Следует ли явно копировать входящие данные массив.
Атрибуты
None
Методы
None
Примеры
>>> from pandas.arrays import SparseArray >>> arr = SparseArray([0, 0, 1, 2]) >>> arr [0, 0, 1, 2] Fill: 0 IntIndex Indices: array([2, 3], dtype=int32)