pandas.Series#

класс pandas.Series(data=None, index=None, dtype=None, name=None, copy=None, fastpath=)[источник]#

Одномерный ndarray с метками осей (включая временные ряды).

Метки не обязательно должны быть уникальными, но должны быть хешируемого типа. Объект поддерживает индексацию как по целым числам, так и по меткам, и предоставляет множество методов для выполнения операций с индексом. Статистические методы из ndarray были переопределены для автоматического исключения пропущенных данных (в настоящее время представленных как NaN).

Операции между Series (+, -, /, *, **) выравнивают значения на основе их связанных значений индекса - они не обязательно должны быть одинаковой длины. Результирующий индекс будет отсортированным объединением двух индексов.

Параметры:
данныеподобный массиву, Iterable, dict или скалярное значение

Содержит данные, хранящиеся в Series. Если данные являются словарем, порядок аргументов сохраняется.

indexмассивоподобный объект или Index (1d)

Значения должны быть хэшируемыми и иметь ту же длину, что и данные. Допускаются неуникальные значения индекса. По умолчанию будет использоваться RangeIndex (0, 1, 2, …, n), если не указано иное. Если данные имеют вид словаря и индекс равен None, то ключи в данных используются как индекс. Если индекс не равен None, результирующий Series переиндексируется со значениями индекса.

dtypestr, numpy.dtype, или ExtensionDtype, опционально

Тип данных для выходного Series. Если не указан, он будет выведен из данные. См. руководство пользователя для дополнительных вариантов использования.

имяHashable, по умолчанию None

Имя, которое нужно дать Series.

copybool, по умолчанию False

Копировать входные данные. Влияет только на входные данные Series или 1d ndarray. См. примеры.

Примечания

Пожалуйста, обратитесь к Руководство пользователя для получения дополнительной информации.

Примеры

Создание Series из словаря с указанным Index

>>> d = {'a': 1, 'b': 2, 'c': 3}
>>> ser = pd.Series(data=d, index=['a', 'b', 'c'])
>>> ser
a   1
b   2
c   3
dtype: int64

Ключи словаря соответствуют значениям Index, поэтому значения Index не оказывают влияния.

>>> d = {'a': 1, 'b': 2, 'c': 3}
>>> ser = pd.Series(data=d, index=['x', 'y', 'z'])
>>> ser
x   NaN
y   NaN
z   NaN
dtype: float64

Обратите внимание, что Index сначала строится с ключами из словаря. После этого Series переиндексируется с заданными значениями Index, поэтому мы получаем все NaN в результате.

Создание Series из списка с copy=False.

>>> r = [1, 2]
>>> ser = pd.Series(r, copy=False)
>>> ser.iloc[0] = 999
>>> r
[1, 2]
>>> ser
0    999
1      2
dtype: int64

Из-за типа входных данных Series имеет copy исходных данных, даже если copy=False, поэтому данные остаются неизменными.

Создание Series из одномерного ndarray с copy=False.

>>> r = np.array([1, 2])
>>> ser = pd.Series(r, copy=False)
>>> ser.iloc[0] = 999
>>> r
array([999,   2])
>>> ser
0    999
1      2
dtype: int64

Из-за типа входных данных Series имеет представление на исходных данных, поэтому данные также изменяются.

Атрибуты

T

Возвращает транспонирование, которое по определению является самим объектом.

array

ExtensionArray данных, лежащих в основе этого Series или Index.

at

Получите одно значение для пары меток строки/столбца.

attrs

Словарь глобальных атрибутов этого набора данных.

axes

Возвращает список меток строковой оси.

dtype

Вернуть объект dtype исходных данных.

dtypes

Вернуть объект dtype исходных данных.

empty

Индикатор, пуст ли Series/DataFrame.

flags

Получить свойства, связанные с этим объектом pandas.

hasnans

Возвращает True, если есть какие-либо NaN.

iat

Доступ к одиночному значению для пары строка/столбец по целочисленной позиции.

iloc

(УСТАРЕЛО) Индексирование, основанное исключительно на целочисленных позициях для выбора по положению.

index

Индекс (метки оси) Series.

is_monotonic_decreasing

Возвращает булево значение, если значения в объекте монотонно убывают.

is_monotonic_increasing

Возвращает булево значение, если значения в объекте монотонно возрастают.

is_unique

Возвращает булево значение, если значения в объекте уникальны.

loc

Доступ к группе строк и столбцов по метке(ам) или булевому массиву.

name

Возвращает имя Series.

nbytes

Возвращает количество байтов в базовых данных.

ndim

Количество измерений исходных данных, по определению 1.

shape

Вернуть кортеж формы базовых данных.

size

Возвращает количество элементов в базовых данных.

values

Возвращает Series как ndarray или ndarray-подобный объект в зависимости от dtype.

Методы

abs()

Возвращает Series/DataFrame с абсолютным числовым значением каждого элемента.

add(other[, level, fill_value, axis])

Возвращает сложение series и other поэлементно (бинарный оператор добавить).

add_prefix(prefix[, axis])

Добавить префикс к меткам строкой префикс.

add_suffix(suffix[, axis])

Добавление строковых суффиксов к меткам суффикс.

agg([func, axis])

Агрегировать с использованием одной или нескольких операций по указанной оси.

aggregate([func, axis])

Агрегировать с использованием одной или нескольких операций по указанной оси.

align(other[, join, axis, level, copy, ...])

Выровнять два объекта по их осям с указанным методом соединения.

all([axis, bool_only, skipna])

Возвращает, являются ли все элементы True, возможно по оси.

any(*[, axis, bool_only, skipna])

Возвращает, является ли какой-либо элемент True, возможно, по оси.

apply(func[, convert_dtype, args, by_row])

Вызвать функцию для значений Series.

argmax([axis, skipna])

Возвращает целочисленную позицию наибольшего значения в Series.

argmin([axis, skipna])

Возвращает целочисленную позицию наименьшего значения в Series.

argsort([axis, kind, order, stable])

Вернуть целочисленные индексы, которые отсортировали бы значения Series.

asfreq(freq[, method, how, normalize, ...])

Преобразовать временной ряд в указанную частоту.

asof(where[, subset])

Вернуть последнюю строку(и) без каких-либо NaN перед где.

astype(dtype[, copy, errors])

Привести объект pandas к указанному типу данных dtype.

at_time(time[, asof, axis])

Выбор значений в определенное время суток (например, 9:30 утра).

autocorr([lag])

Вычислите автокорреляцию с лагом N.

backfill(*[, axis, inplace, limit, downcast])

(УСТАРЕЛО) Заполнение значений NA/NaN с использованием следующего допустимого наблюдения для заполнения пропуска.

between(left, right[, inclusive])

Возвращает булевый Series, эквивалентный left <= series <= right.

between_time(start_time, end_time[, ...])

Выбрать значения между определенными временами дня (например, 9:00-9:30 утра).

bfill(*[, axis, inplace, limit, limit_area, ...])

Заполните значения NA/NaN, используя следующее допустимое наблюдение для заполнения пробела.

bool()

(УСТАРЕЛО) Возвращает логическое значение для одного элемента Series или DataFrame.

case_when(список случаев)

Заменяет значения там, где условия истинны.

clip([lower, upper, axis, inplace])

Обрежьте значения по заданному порогу(ам).

combine(other, func[, fill_value])

Объединить Series с Series или скаляром в соответствии с функция.

combine_first(other)

Обновить нулевые элементы значением из того же места в 'other'.

compare(other[, align_axis, keep_shape, ...])

Сравнить с другой Series и показать различия.

convert_dtypes([infer_objects, ...])

Преобразование столбцов к наилучшим возможным типам данных с использованием типов, поддерживающих pd.NA.

copy([deep])

Создать копию индексов и данных этого объекта.

corr(other[, method, min_periods])

Вычисление корреляции с other Series, исключая пропущенные значения.

count()

Возвращает количество ненулевых/непустых наблюдений в Series.

cov(other[, min_periods, ddof])

Вычисление ковариации с Series, исключая пропущенные значения.

cummax([axis, skipna])

Возвращает кумулятивный максимум по оси DataFrame или Series.

cummin([axis, skipna])

Возвращает кумулятивный минимум по оси DataFrame или Series.

cumprod([axis, skipna])

Возвращает кумулятивное произведение по оси DataFrame или Series.

cumsum([axis, skipna])

Возвращает кумулятивную сумму по оси DataFrame или Series.

describe([percentiles, include, exclude])

Генерация описательной статистики.

diff([периоды])

Первая дискретная разность элемента.

div(other[, level, fill_value, axis])

Возвращает деление с плавающей точкой серии и другого объекта, поэлементно (бинарный оператор truediv).

divide(other[, level, fill_value, axis])

Возвращает деление с плавающей точкой серии и другого объекта, поэлементно (бинарный оператор truediv).

divmod(other[, level, fill_value, axis])

Возвращает целочисленное деление и остаток от деления серии и другого объекта поэлементно (бинарный оператор divmod).

dot(other)

Вычисляет скалярное произведение между Series и столбцами other.

drop([labels, axis, index, columns, level, ...])

Возвращает Series с удаленными указанными метками индекса.

drop_duplicates(*[, keep, inplace, ignore_index])

Возвращает Series с удаленными дублирующимися значениями.

droplevel(level[, axis])

Возвращает Series/DataFrame с удаленным запрошенным уровнем индекса/столбца.

dropna(*[, axis, inplace, how, ignore_index])

Возвращает новый Series с удалёнными пропущенными значениями.

duplicated([keep])

Указывает дублирующиеся значения Series.

eq(other[, level, fill_value, axis])

Возвращает результат поэлементного сравнения series и other на равенство (бинарный оператор eq).

equals(other)

Проверить, содержат ли два объекта одинаковые элементы.

ewm([com, span, halflife, alpha, ...])

Предоставить экспоненциально взвешенные (EW) вычисления.

expanding([min_periods, axis, method])

Предоставить вычисления с расширяющимся окном.

explode([ignore_index])

Преобразуйте каждый элемент спискообразного объекта в строку.

factorize([sort, use_na_sentinel])

Кодировать объект как перечисленный тип или категориальную переменную.

ffill(*[, axis, inplace, limit, limit_area, ...])

Заполнение NA/NaN значений путем распространения последнего валидного наблюдения до следующего валидного.

fillna([value, method, axis, inplace, ...])

Заполнить значения NA/NaN с использованием указанного метода.

filter([items, like, regex, axis])

Выберите подмножество строк или столбцов фрейма данных в соответствии с указанными метками индекса.

first(смещение)

(УСТАРЕЛО) Выбор начальных периодов временных рядов на основе смещения даты.

first_valid_index()

Возвращает индекс первого не-NA значения или None, если не-NA значение не найдено.

floordiv(other[, level, fill_value, axis])

Возвращает целочисленное деление серии и другого объекта поэлементно (бинарный оператор floordiv).

ge(other[, level, fill_value, axis])

Возвращает больше или равно для серии и другого объекта, поэлементно (бинарный оператор ge).

get(key[, default])

Получить элемент из объекта по заданному ключу (например, столбец DataFrame).

groupby([by, axis, level, as_index, sort, ...])

Группировать Series с помощью маппера или по Series столбцов.

gt(other[, level, fill_value, axis])

Возвращает 'Больше чем' для серии и другого объекта, поэлементно (бинарный оператор gt).

head([n])

Вернуть первый n строк.

hist([by, ax, grid, xlabelsize, xrot, ...])

Строит гистограмму входного ряда с использованием matplotlib.

idxmax([axis, skipna])

Возвращает метку строки с максимальным значением.

idxmin([axis, skipna])

Возвращает метку строки минимального значения.

infer_objects([copy])

Попытка вывести лучшие типы данных для столбцов object.

info([verbose, buf, max_cols, memory_usage, ...])

Вывод краткой сводки Series.

interpolate([method, axis, limit, inplace, ...])

Заполнить значения NaN с помощью метода интерполяции.

isin(values)

Содержатся ли элементы в Series в values.

isna()

Обнаружить пропущенные значения.

isnull()

Series.isnull является псевдонимом для Series.isna.

item()

Вернуть первый элемент исходных данных как скаляр Python.

items()

Лениво перебирать кортежи (индекс, значение).

keys()

Возвращает псевдоним для индекса.

kurt([axis, skipna, numeric_only])

Возвращает несмещённый эксцесс по запрошенной оси.

kurtosis([axis, skipna, numeric_only])

Возвращает несмещённый эксцесс по запрошенной оси.

last(смещение)

(УСТАРЕЛО) Выбирать последние периоды временных рядов на основе смещения даты.

last_valid_index()

Возвращает индекс последнего не-NA значения или None, если не найдено ни одного не-NA значения.

le(other[, level, fill_value, axis])

Возвращает меньше или равно для series и other, поэлементно (бинарный оператор le).

lt(other[, level, fill_value, axis])

Возвращает меньшее из значений серии и другого объекта поэлементно (бинарный оператор lt).

map(arg[, na_action])

Сопоставление значений Series в соответствии с входным отображением или функцией.

mask(cond[, other, inplace, axis, level])

Заменить значения, где условие истинно.

max([axis, skipna, numeric_only])

Возвращает максимальное значение по запрошенной оси.

mean([axis, skipna, numeric_only])

Возвращает среднее значение по запрошенной оси.

median([axis, skipna, numeric_only])

Возвращает медиану значений по запрошенной оси.

memory_usage([index, deep])

Возвращает использование памяти Series.

min([axis, skipna, numeric_only])

Возвращает минимальное значение по указанной оси.

mod(other[, level, fill_value, axis])

Возвращает остаток от деления series и other поэлементно (бинарный оператор mod).

mode([dropna])

Возвращает моду(ы) Series.

mul(other[, level, fill_value, axis])

Возвращает умножение series и other поэлементно (бинарный оператор mul).

multiply(other[, level, fill_value, axis])

Возвращает умножение series и other поэлементно (бинарный оператор mul).

ne(other[, level, fill_value, axis])

Возвращает неравенство серии и другого объекта, поэлементно (бинарный оператор ne).

nlargest([n, keep])

Возвращает наибольший n элементы.

notna()

Обнаружить существующие (не пропущенные) значения.

notnull()

Series.notnull является псевдонимом для Series.notna.

nsmallest([n, keep])

Вернуть наименьший n элементы.

nunique([dropna])

Возвращает количество уникальных элементов в объекте.

pad(*[, axis, inplace, limit, downcast])

(УСТАРЕЛО) Заполнение значений NA/NaN путем распространения последнего допустимого наблюдения на следующее допустимое.

pct_change([periods, fill_method, limit, freq])

Дробное изменение между текущим и предыдущим элементом.

pipe(func, *args, **kwargs)

Применение цепочечных функций, которые ожидают Series или DataFrames.

pop(элемент)

Возвращает элемент и удаляет из серии.

pow(other[, level, fill_value, axis])

Возвращает экспоненциальную степень series и other, поэлементно (бинарный оператор pow).

prod([axis, skipna, numeric_only, min_count])

Возвращает произведение значений по запрошенной оси.

product([axis, skipna, numeric_only, min_count])

Возвращает произведение значений по запрошенной оси.

quantile([q, interpolation])

Возвращает значение по заданному квантилю.

radd(other[, level, fill_value, axis])

Возвращает сложение series и other поэлементно (бинарный оператор radd).

rank([axis, method, numeric_only, ...])

Вычисление числовых рангов данных (от 1 до n) вдоль оси.

ravel([order])

(УСТАРЕЛО) Возвращает выровненные базовые данные как ndarray или ExtensionArray.

rdiv(other[, level, fill_value, axis])

Возвращает деление с плавающей точкой серии и другого объекта, поэлементно (бинарный оператор rtruediv).

rdivmod(other[, level, fill_value, axis])

Возвращает целочисленное деление и остаток от деления серии и другого объекта поэлементно (бинарный оператор rdivmod).

reindex([index, axis, method, copy, level, ...])

Привести Series к новому индексу с опциональной логикой заполнения.

reindex_like(other[, method, copy, limit, ...])

Возвращает объект с совпадающими индексами, как другой объект.

rename([index, axis, copy, inplace, level, ...])

Изменение меток индекса или имени Series.

rename_axis([mapper, index, axis, copy, inplace])

Установите имя оси для индекса или столбцов.

reorder_levels(порядок)

Переупорядочить уровни индекса, используя порядок ввода.

repeat(repeats[, axis])

Повторение элементов Series.

replace([to_replace, value, inplace, limit, ...])

Заменить значения, указанные в to_replace с значение.

resample(rule[, axis, closed, label, ...])

Передискретизация временных рядов.

reset_index([level, drop, name, inplace, ...])

Создать новый DataFrame или Series со сброшенным индексом.

rfloordiv(other[, level, fill_value, axis])

Возвращает целочисленное деление серии и другого объекта поэлементно (бинарный оператор rfloordiv).

rmod(other[, level, fill_value, axis])

Возвращает остаток от деления series и other поэлементно (бинарный оператор rmod).

rmul(other[, level, fill_value, axis])

Возвращает умножение series и other поэлементно (бинарный оператор rmul).

rolling(window[, min_periods, center, ...])

Предоставляет скользящие оконные вычисления.

round([decimals])

Округлить каждое значение в Series до заданного количества десятичных знаков.

rpow(other[, level, fill_value, axis])

Возвращает экспоненциальную степень series и other, поэлементно (бинарный оператор rpow).

rsub(other[, level, fill_value, axis])

Возвращает вычитание series и other поэлементно (бинарный оператор rsub).

rtruediv(other[, level, fill_value, axis])

Возвращает деление с плавающей точкой серии и другого объекта, поэлементно (бинарный оператор rtruediv).

sample([n, frac, replace, weights, ...])

Вернуть случайную выборку элементов из оси объекта.

searchsorted(value[, side, sorter])

Найти индексы, куда следует вставить элементы для сохранения порядка.

sem([axis, skipna, ddof, numeric_only])

Возвращает несмещённую стандартную ошибку среднего по запрошенной оси.

set_axis(labels, *[, axis, copy])

Назначить желаемый индекс для заданной оси.

set_flags(*[, copy, allows_duplicate_labels])

Возвращает новый объект с обновленными флагами.

shift([periods, freq, axis, fill_value, suffix])

Сдвинуть индекс на желаемое количество периодов с необязательным временем freq.

skew([axis, skipna, numeric_only])

Возвращает несмещенное асимметричное распределение по запрошенной оси.

sort_index(*[, axis, level, ascending, ...])

Сортировка Series по меткам индекса.

sort_values(*[, axis, ascending, inplace, ...])

Сортировка по значениям.

squeeze([axis])

Сжать одномерные объекты осей в скаляры.

std([axis, skipna, ddof, numeric_only])

Возвращает выборочное стандартное отклонение по указанной оси.

sub(other[, level, fill_value, axis])

Возвращает вычитание series и other поэлементно (бинарный оператор sub).

subtract(other[, level, fill_value, axis])

Возвращает вычитание series и other поэлементно (бинарный оператор sub).

sum([axis, skipna, numeric_only, min_count])

Возвращает сумму значений по запрошенной оси.

swapaxes(axis1, axis2[, copy])

(УСТАРЕЛО) Поменять местами оси и соответствующим образом поменять значения осей.

swaplevel([i, j, copy])

Поменять местами уровни i и j в MultiIndex.

tail([n])

Возвращает последний n строк.

take(indices[, axis])

Возвращает элементы в заданном позиционный индексы вдоль оси.

to_clipboard(*[, excel, sep])

Копировать объект в буфер обмена системы.

to_csv([path_or_buf, sep, na_rep, ...])

Запись объекта в файл значений, разделенных запятыми (csv).

to_dict(*[, into])

Преобразовать Series в словарь {метка -> значение} или объект, подобный словарю.

to_excel(excel_writer, *[, sheet_name, ...])

Запись объекта на лист Excel.

to_frame([name])

Преобразовать Series в DataFrame.

to_hdf(path_or_buf, *, key[, mode, ...])

Записать содержащиеся данные в файл HDF5 с использованием HDFStore.

to_json([path_or_buf, orient, date_format, ...])

Преобразовать объект в строку JSON.

to_latex([buf, columns, header, index, ...])

Отобразить объект в виде таблицы LaTeX, longtable или вложенной таблицы.

to_list()

Возвращает список значений.

to_markdown([buf, mode, index, storage_options])

Вывод Series в формате, удобном для Markdown.

to_numpy([dtype, copy, na_value])

Массив NumPy ndarray, представляющий значения в этой Series или Index.

to_period([freq, copy])

Преобразование Series из DatetimeIndex в PeriodIndex.

to_pickle(path, *[, compression, protocol, ...])

Pickle (сериализация) объекта в файл.

to_sql(name, con, *[, schema, if_exists, ...])

Записать записи, хранящиеся в DataFrame, в базу данных SQL.

to_string([buf, na_rep, float_format, ...])

Отображение строкового представления Series.

to_timestamp([freq, how, copy])

Привести к DatetimeIndex временных меток, в начало периода.

to_xarray()

Вернуть объект xarray из объекта pandas.

tolist()

Возвращает список значений.

transform(func[, axis])

Вызов func на self, производя Series с той же формой оси, что и self.

transpose(*args, **kwargs)

Возвращает транспонирование, которое по определению является самим объектом.

truediv(other[, level, fill_value, axis])

Возвращает деление с плавающей точкой серии и другого объекта, поэлементно (бинарный оператор truediv).

truncate([before, after, axis, copy])

Обрезать Series или DataFrame до и после некоторого значения индекса.

tz_convert(tz[, axis, level, copy])

Преобразовать ось с учетом часового пояса в целевой часовой пояс.

tz_localize(tz[, axis, level, copy, ...])

Локализует индекс Series или DataFrame без часового пояса в целевой часовой пояс.

unique()

Возвращает уникальные значения объекта Series.

unstack([level, fill_value, sort])

Развернуть, также известное как свод, Series с MultiIndex для создания DataFrame.

update(other)

Изменение Series на месте с использованием значений из переданного Series.

value_counts([normalize, sort, ascending, ...])

Вернуть Series, содержащий количество уникальных значений.

var([axis, skipna, ddof, numeric_only])

Возвращает несмещенную дисперсию по запрошенной оси.

view([dtype])

(УСТАРЕЛО) Создать новое представление Series.

where(cond[, other, inplace, axis, level])

Заменить значения, где условие ложно.

xs(key[, axis, level, drop_level])

Возвращает поперечное сечение из Series/DataFrame.