pandas.Series#

класс pandas.Series(data=None, index=None, dtype=None, name=None, copy=None, fastpath=)[источник]#

Одномерный ndarray с метками осей (включая временные ряды).

Метки не обязательно должны быть уникальными, но должны быть хешируемого типа. Объект поддерживает индексацию как по целым числам, так и по меткам, и предоставляет множество методов для выполнения операций с индексом. Статистические методы из ndarray были переопределены для автоматического исключения пропущенных данных (в настоящее время представленных как NaN).

Операции между Series (+, -, /, *, **) выравнивают значения на основе их связанных значений индекса - они не обязательно должны быть одинаковой длины. Результирующий индекс будет отсортированным объединением двух индексов.

Параметры:

данныеподобный массиву, Iterable, dict или скалярное значение: Содержит данные, хранящиеся в Series. Если данные являются словарем, порядок аргументов сохраняется.
indexмассивоподобный объект или Index (1d): Значения должны быть хэшируемыми и иметь ту же длину, что и данные. Допускаются неуникальные значения индекса. По умолчанию будет использоваться RangeIndex (0, 1, 2, …, n), если не указано иное. Если данные имеют вид словаря и индекс равен None, то ключи в данных используются как индекс. Если индекс не равен None, результирующий Series переиндексируется со значениями индекса.
dtypestr, numpy.dtype, или ExtensionDtype, опционально: Тип данных для выходного Series. Если не указан, он будет выведен из данные. См. руководство пользователя для дополнительных вариантов использования.
имяHashable, по умолчанию None: Имя, которое нужно дать Series.
copybool, по умолчанию False: Копировать входные данные. Влияет только на входные данные Series или 1d ndarray. См. примеры.

Примечания

Пожалуйста, обратитесь к Руководство пользователя для получения дополнительной информации.

Примеры

Создание Series из словаря с указанным Index

>>> d = {'a': 1, 'b': 2, 'c': 3}
>>> ser = pd.Series(data=d, index=['a', 'b', 'c'])
>>> ser
a   1
b   2
c   3
dtype: int64

Ключи словаря соответствуют значениям Index, поэтому значения Index не оказывают влияния.

>>> d = {'a': 1, 'b': 2, 'c': 3}
>>> ser = pd.Series(data=d, index=['x', 'y', 'z'])
>>> ser
x   NaN
y   NaN
z   NaN
dtype: float64

Обратите внимание, что Index сначала строится с ключами из словаря. После этого Series переиндексируется с заданными значениями Index, поэтому мы получаем все NaN в результате.

Создание Series из списка с copy=False.

>>> r = [1, 2]
>>> ser = pd.Series(r, copy=False)
>>> ser.iloc[0] = 999
>>> r
[1, 2]
>>> ser
0    999
1      2
dtype: int64

Из-за типа входных данных Series имеет copy исходных данных, даже если copy=False, поэтому данные остаются неизменными.

Создание Series из одномерного ndarray с copy=False.

>>> r = np.array([1, 2])
>>> ser = pd.Series(r, copy=False)
>>> ser.iloc[0] = 999
>>> r
array([999,   2])
>>> ser
0    999
1      2
dtype: int64

Из-за типа входных данных Series имеет представление на исходных данных, поэтому данные также изменяются.

Атрибуты

`T`	Возвращает транспонирование, которое по определению является самим объектом.
`array`	ExtensionArray данных, лежащих в основе этого Series или Index.
`at`	Получите одно значение для пары меток строки/столбца.
`attrs`	Словарь глобальных атрибутов этого набора данных.
`axes`	Возвращает список меток строковой оси.
`dtype`	Вернуть объект dtype исходных данных.
`dtypes`	Вернуть объект dtype исходных данных.
`empty`	Индикатор, пуст ли Series/DataFrame.
`flags`	Получить свойства, связанные с этим объектом pandas.
`hasnans`	Возвращает True, если есть какие-либо NaN.
`iat`	Доступ к одиночному значению для пары строка/столбец по целочисленной позиции.
`iloc`	(УСТАРЕЛО) Индексирование, основанное исключительно на целочисленных позициях для выбора по положению.
`index`	Индекс (метки оси) Series.
`is_monotonic_decreasing`	Возвращает булево значение, если значения в объекте монотонно убывают.
`is_monotonic_increasing`	Возвращает булево значение, если значения в объекте монотонно возрастают.
`is_unique`	Возвращает булево значение, если значения в объекте уникальны.
`loc`	Доступ к группе строк и столбцов по метке(ам) или булевому массиву.
`name`	Возвращает имя Series.
`nbytes`	Возвращает количество байтов в базовых данных.
`ndim`	Количество измерений исходных данных, по определению 1.
`shape`	Вернуть кортеж формы базовых данных.
`size`	Возвращает количество элементов в базовых данных.
`values`	Возвращает Series как ndarray или ndarray-подобный объект в зависимости от dtype.

Методы

`abs`()	Возвращает Series/DataFrame с абсолютным числовым значением каждого элемента.
`add`(other[, level, fill_value, axis])	Возвращает сложение series и other поэлементно (бинарный оператор добавить).
`add_prefix`(prefix[, axis])	Добавить префикс к меткам строкой префикс.
`add_suffix`(suffix[, axis])	Добавление строковых суффиксов к меткам суффикс.
`agg`([func, axis])	Агрегировать с использованием одной или нескольких операций по указанной оси.
`aggregate`([func, axis])	Агрегировать с использованием одной или нескольких операций по указанной оси.
`align`(other[, join, axis, level, copy, ...])	Выровнять два объекта по их осям с указанным методом соединения.
`all`([axis, bool_only, skipna])	Возвращает, являются ли все элементы True, возможно по оси.
`any`(*[, axis, bool_only, skipna])	Возвращает, является ли какой-либо элемент True, возможно, по оси.
`apply`(func[, convert_dtype, args, by_row])	Вызвать функцию для значений Series.
`argmax`([axis, skipna])	Возвращает целочисленную позицию наибольшего значения в Series.
`argmin`([axis, skipna])	Возвращает целочисленную позицию наименьшего значения в Series.
`argsort`([axis, kind, order, stable])	Вернуть целочисленные индексы, которые отсортировали бы значения Series.
`asfreq`(freq[, method, how, normalize, ...])	Преобразовать временной ряд в указанную частоту.
`asof`(where[, subset])	Вернуть последнюю строку(и) без каких-либо NaN перед где.
`astype`(dtype[, copy, errors])	Привести объект pandas к указанному типу данных `dtype`.
`at_time`(time[, asof, axis])	Выбор значений в определенное время суток (например, 9:30 утра).
`autocorr`([lag])	Вычислите автокорреляцию с лагом N.
`backfill`(*[, axis, inplace, limit, downcast])	(УСТАРЕЛО) Заполнение значений NA/NaN с использованием следующего допустимого наблюдения для заполнения пропуска.
`between`(left, right[, inclusive])	Возвращает булевый Series, эквивалентный left <= series <= right.
`between_time`(start_time, end_time[, ...])	Выбрать значения между определенными временами дня (например, 9:00-9:30 утра).
`bfill`(*[, axis, inplace, limit, limit_area, ...])	Заполните значения NA/NaN, используя следующее допустимое наблюдение для заполнения пробела.
`bool`()	(УСТАРЕЛО) Возвращает логическое значение для одного элемента Series или DataFrame.
`case_when`(список случаев)	Заменяет значения там, где условия истинны.
`clip`([lower, upper, axis, inplace])	Обрежьте значения по заданному порогу(ам).
`combine`(other, func[, fill_value])	Объединить Series с Series или скаляром в соответствии с функция.
`combine_first`(other)	Обновить нулевые элементы значением из того же места в 'other'.
`compare`(other[, align_axis, keep_shape, ...])	Сравнить с другой Series и показать различия.
`convert_dtypes`([infer_objects, ...])	Преобразование столбцов к наилучшим возможным типам данных с использованием типов, поддерживающих `pd.NA`.
`copy`([deep])	Создать копию индексов и данных этого объекта.
`corr`(other[, method, min_periods])	Вычисление корреляции с other Series, исключая пропущенные значения.
`count`()	Возвращает количество ненулевых/непустых наблюдений в Series.
`cov`(other[, min_periods, ddof])	Вычисление ковариации с Series, исключая пропущенные значения.
`cummax`([axis, skipna])	Возвращает кумулятивный максимум по оси DataFrame или Series.
`cummin`([axis, skipna])	Возвращает кумулятивный минимум по оси DataFrame или Series.
`cumprod`([axis, skipna])	Возвращает кумулятивное произведение по оси DataFrame или Series.
`cumsum`([axis, skipna])	Возвращает кумулятивную сумму по оси DataFrame или Series.
`describe`([percentiles, include, exclude])	Генерация описательной статистики.
`diff`([периоды])	Первая дискретная разность элемента.
`div`(other[, level, fill_value, axis])	Возвращает деление с плавающей точкой серии и другого объекта, поэлементно (бинарный оператор truediv).
`divide`(other[, level, fill_value, axis])	Возвращает деление с плавающей точкой серии и другого объекта, поэлементно (бинарный оператор truediv).
`divmod`(other[, level, fill_value, axis])	Возвращает целочисленное деление и остаток от деления серии и другого объекта поэлементно (бинарный оператор divmod).
`dot`(other)	Вычисляет скалярное произведение между Series и столбцами other.
`drop`([labels, axis, index, columns, level, ...])	Возвращает Series с удаленными указанными метками индекса.
`drop_duplicates`(*[, keep, inplace, ignore_index])	Возвращает Series с удаленными дублирующимися значениями.
`droplevel`(level[, axis])	Возвращает Series/DataFrame с удаленным запрошенным уровнем индекса/столбца.
`dropna`(*[, axis, inplace, how, ignore_index])	Возвращает новый Series с удалёнными пропущенными значениями.
`duplicated`([keep])	Указывает дублирующиеся значения Series.
`eq`(other[, level, fill_value, axis])	Возвращает результат поэлементного сравнения series и other на равенство (бинарный оператор eq).
`equals`(other)	Проверить, содержат ли два объекта одинаковые элементы.
`ewm`([com, span, halflife, alpha, ...])	Предоставить экспоненциально взвешенные (EW) вычисления.
`expanding`([min_periods, axis, method])	Предоставить вычисления с расширяющимся окном.
`explode`([ignore_index])	Преобразуйте каждый элемент спискообразного объекта в строку.
`factorize`([sort, use_na_sentinel])	Кодировать объект как перечисленный тип или категориальную переменную.
`ffill`(*[, axis, inplace, limit, limit_area, ...])	Заполнение NA/NaN значений путем распространения последнего валидного наблюдения до следующего валидного.
`fillna`([value, method, axis, inplace, ...])	Заполнить значения NA/NaN с использованием указанного метода.
`filter`([items, like, regex, axis])	Выберите подмножество строк или столбцов фрейма данных в соответствии с указанными метками индекса.
`first`(смещение)	(УСТАРЕЛО) Выбор начальных периодов временных рядов на основе смещения даты.
`first_valid_index`()	Возвращает индекс первого не-NA значения или None, если не-NA значение не найдено.
`floordiv`(other[, level, fill_value, axis])	Возвращает целочисленное деление серии и другого объекта поэлементно (бинарный оператор floordiv).
`ge`(other[, level, fill_value, axis])	Возвращает больше или равно для серии и другого объекта, поэлементно (бинарный оператор ge).
`get`(key[, default])	Получить элемент из объекта по заданному ключу (например, столбец DataFrame).
`groupby`([by, axis, level, as_index, sort, ...])	Группировать Series с помощью маппера или по Series столбцов.
`gt`(other[, level, fill_value, axis])	Возвращает 'Больше чем' для серии и другого объекта, поэлементно (бинарный оператор gt).
`head`([n])	Вернуть первый n строк.
`hist`([by, ax, grid, xlabelsize, xrot, ...])	Строит гистограмму входного ряда с использованием matplotlib.
`idxmax`([axis, skipna])	Возвращает метку строки с максимальным значением.
`idxmin`([axis, skipna])	Возвращает метку строки минимального значения.
`infer_objects`([copy])	Попытка вывести лучшие типы данных для столбцов object.
`info`([verbose, buf, max_cols, memory_usage, ...])	Вывод краткой сводки Series.
`interpolate`([method, axis, limit, inplace, ...])	Заполнить значения NaN с помощью метода интерполяции.
`isin`(values)	Содержатся ли элементы в Series в values.
`isna`()	Обнаружить пропущенные значения.
`isnull`()	Series.isnull является псевдонимом для Series.isna.
`item`()	Вернуть первый элемент исходных данных как скаляр Python.
`items`()	Лениво перебирать кортежи (индекс, значение).
`keys`()	Возвращает псевдоним для индекса.
`kurt`([axis, skipna, numeric_only])	Возвращает несмещённый эксцесс по запрошенной оси.
`kurtosis`([axis, skipna, numeric_only])	Возвращает несмещённый эксцесс по запрошенной оси.
`last`(смещение)	(УСТАРЕЛО) Выбирать последние периоды временных рядов на основе смещения даты.
`last_valid_index`()	Возвращает индекс последнего не-NA значения или None, если не найдено ни одного не-NA значения.
`le`(other[, level, fill_value, axis])	Возвращает меньше или равно для series и other, поэлементно (бинарный оператор le).
`lt`(other[, level, fill_value, axis])	Возвращает меньшее из значений серии и другого объекта поэлементно (бинарный оператор lt).
`map`(arg[, na_action])	Сопоставление значений Series в соответствии с входным отображением или функцией.
`mask`(cond[, other, inplace, axis, level])	Заменить значения, где условие истинно.
`max`([axis, skipna, numeric_only])	Возвращает максимальное значение по запрошенной оси.
`mean`([axis, skipna, numeric_only])	Возвращает среднее значение по запрошенной оси.
`median`([axis, skipna, numeric_only])	Возвращает медиану значений по запрошенной оси.
`memory_usage`([index, deep])	Возвращает использование памяти Series.
`min`([axis, skipna, numeric_only])	Возвращает минимальное значение по указанной оси.
`mod`(other[, level, fill_value, axis])	Возвращает остаток от деления series и other поэлементно (бинарный оператор mod).
`mode`([dropna])	Возвращает моду(ы) Series.
`mul`(other[, level, fill_value, axis])	Возвращает умножение series и other поэлементно (бинарный оператор mul).
`multiply`(other[, level, fill_value, axis])	Возвращает умножение series и other поэлементно (бинарный оператор mul).
`ne`(other[, level, fill_value, axis])	Возвращает неравенство серии и другого объекта, поэлементно (бинарный оператор ne).
`nlargest`([n, keep])	Возвращает наибольший n элементы.
`notna`()	Обнаружить существующие (не пропущенные) значения.
`notnull`()	Series.notnull является псевдонимом для Series.notna.
`nsmallest`([n, keep])	Вернуть наименьший n элементы.
`nunique`([dropna])	Возвращает количество уникальных элементов в объекте.
`pad`(*[, axis, inplace, limit, downcast])	(УСТАРЕЛО) Заполнение значений NA/NaN путем распространения последнего допустимого наблюдения на следующее допустимое.
`pct_change`([periods, fill_method, limit, freq])	Дробное изменение между текущим и предыдущим элементом.
`pipe`(func, args, *kwargs)	Применение цепочечных функций, которые ожидают Series или DataFrames.
`pop`(элемент)	Возвращает элемент и удаляет из серии.
`pow`(other[, level, fill_value, axis])	Возвращает экспоненциальную степень series и other, поэлементно (бинарный оператор pow).
`prod`([axis, skipna, numeric_only, min_count])	Возвращает произведение значений по запрошенной оси.
`product`([axis, skipna, numeric_only, min_count])	Возвращает произведение значений по запрошенной оси.
`quantile`([q, interpolation])	Возвращает значение по заданному квантилю.
`radd`(other[, level, fill_value, axis])	Возвращает сложение series и other поэлементно (бинарный оператор radd).
`rank`([axis, method, numeric_only, ...])	Вычисление числовых рангов данных (от 1 до n) вдоль оси.
`ravel`([order])	(УСТАРЕЛО) Возвращает выровненные базовые данные как ndarray или ExtensionArray.
`rdiv`(other[, level, fill_value, axis])	Возвращает деление с плавающей точкой серии и другого объекта, поэлементно (бинарный оператор rtruediv).
`rdivmod`(other[, level, fill_value, axis])	Возвращает целочисленное деление и остаток от деления серии и другого объекта поэлементно (бинарный оператор rdivmod).
`reindex`([index, axis, method, copy, level, ...])	Привести Series к новому индексу с опциональной логикой заполнения.
`reindex_like`(other[, method, copy, limit, ...])	Возвращает объект с совпадающими индексами, как другой объект.
`rename`([index, axis, copy, inplace, level, ...])	Изменение меток индекса или имени Series.
`rename_axis`([mapper, index, axis, copy, inplace])	Установите имя оси для индекса или столбцов.
`reorder_levels`(порядок)	Переупорядочить уровни индекса, используя порядок ввода.
`repeat`(repeats[, axis])	Повторение элементов Series.
`replace`([to_replace, value, inplace, limit, ...])	Заменить значения, указанные в to_replace с значение.
`resample`(rule[, axis, closed, label, ...])	Передискретизация временных рядов.
`reset_index`([level, drop, name, inplace, ...])	Создать новый DataFrame или Series со сброшенным индексом.
`rfloordiv`(other[, level, fill_value, axis])	Возвращает целочисленное деление серии и другого объекта поэлементно (бинарный оператор rfloordiv).
`rmod`(other[, level, fill_value, axis])	Возвращает остаток от деления series и other поэлементно (бинарный оператор rmod).
`rmul`(other[, level, fill_value, axis])	Возвращает умножение series и other поэлементно (бинарный оператор rmul).
`rolling`(window[, min_periods, center, ...])	Предоставляет скользящие оконные вычисления.
`round`([decimals])	Округлить каждое значение в Series до заданного количества десятичных знаков.
`rpow`(other[, level, fill_value, axis])	Возвращает экспоненциальную степень series и other, поэлементно (бинарный оператор rpow).
`rsub`(other[, level, fill_value, axis])	Возвращает вычитание series и other поэлементно (бинарный оператор rsub).
`rtruediv`(other[, level, fill_value, axis])	Возвращает деление с плавающей точкой серии и другого объекта, поэлементно (бинарный оператор rtruediv).
`sample`([n, frac, replace, weights, ...])	Вернуть случайную выборку элементов из оси объекта.
`searchsorted`(value[, side, sorter])	Найти индексы, куда следует вставить элементы для сохранения порядка.
`sem`([axis, skipna, ddof, numeric_only])	Возвращает несмещённую стандартную ошибку среднего по запрошенной оси.
`set_axis`(labels, *[, axis, copy])	Назначить желаемый индекс для заданной оси.
`set_flags`(*[, copy, allows_duplicate_labels])	Возвращает новый объект с обновленными флагами.
`shift`([periods, freq, axis, fill_value, suffix])	Сдвинуть индекс на желаемое количество периодов с необязательным временем freq.
`skew`([axis, skipna, numeric_only])	Возвращает несмещенное асимметричное распределение по запрошенной оси.
`sort_index`(*[, axis, level, ascending, ...])	Сортировка Series по меткам индекса.
`sort_values`(*[, axis, ascending, inplace, ...])	Сортировка по значениям.
`squeeze`([axis])	Сжать одномерные объекты осей в скаляры.
`std`([axis, skipna, ddof, numeric_only])	Возвращает выборочное стандартное отклонение по указанной оси.
`sub`(other[, level, fill_value, axis])	Возвращает вычитание series и other поэлементно (бинарный оператор sub).
`subtract`(other[, level, fill_value, axis])	Возвращает вычитание series и other поэлементно (бинарный оператор sub).
`sum`([axis, skipna, numeric_only, min_count])	Возвращает сумму значений по запрошенной оси.
`swapaxes`(axis1, axis2[, copy])	(УСТАРЕЛО) Поменять местами оси и соответствующим образом поменять значения осей.
`swaplevel`([i, j, copy])	Поменять местами уровни i и j в `MultiIndex`.
`tail`([n])	Возвращает последний n строк.
`take`(indices[, axis])	Возвращает элементы в заданном позиционный индексы вдоль оси.
`to_clipboard`(*[, excel, sep])	Копировать объект в буфер обмена системы.
`to_csv`([path_or_buf, sep, na_rep, ...])	Запись объекта в файл значений, разделенных запятыми (csv).
`to_dict`(*[, into])	Преобразовать Series в словарь {метка -> значение} или объект, подобный словарю.
`to_excel`(excel_writer, *[, sheet_name, ...])	Запись объекта на лист Excel.
`to_frame`([name])	Преобразовать Series в DataFrame.
`to_hdf`(path_or_buf, *, key[, mode, ...])	Записать содержащиеся данные в файл HDF5 с использованием HDFStore.
`to_json`([path_or_buf, orient, date_format, ...])	Преобразовать объект в строку JSON.
`to_latex`([buf, columns, header, index, ...])	Отобразить объект в виде таблицы LaTeX, longtable или вложенной таблицы.
`to_list`()	Возвращает список значений.
`to_markdown`([buf, mode, index, storage_options])	Вывод Series в формате, удобном для Markdown.
`to_numpy`([dtype, copy, na_value])	Массив NumPy ndarray, представляющий значения в этой Series или Index.
`to_period`([freq, copy])	Преобразование Series из DatetimeIndex в PeriodIndex.
`to_pickle`(path, *[, compression, protocol, ...])	Pickle (сериализация) объекта в файл.
`to_sql`(name, con, *[, schema, if_exists, ...])	Записать записи, хранящиеся в DataFrame, в базу данных SQL.
`to_string`([buf, na_rep, float_format, ...])	Отображение строкового представления Series.
`to_timestamp`([freq, how, copy])	Привести к DatetimeIndex временных меток, в начало периода.
`to_xarray`()	Вернуть объект xarray из объекта pandas.
`tolist`()	Возвращает список значений.
`transform`(func[, axis])	Вызов `func` на self, производя Series с той же формой оси, что и self.
`transpose`(args, *kwargs)	Возвращает транспонирование, которое по определению является самим объектом.
`truediv`(other[, level, fill_value, axis])	Возвращает деление с плавающей точкой серии и другого объекта, поэлементно (бинарный оператор truediv).
`truncate`([before, after, axis, copy])	Обрезать Series или DataFrame до и после некоторого значения индекса.
`tz_convert`(tz[, axis, level, copy])	Преобразовать ось с учетом часового пояса в целевой часовой пояс.
`tz_localize`(tz[, axis, level, copy, ...])	Локализует индекс Series или DataFrame без часового пояса в целевой часовой пояс.
`unique`()	Возвращает уникальные значения объекта Series.
`unstack`([level, fill_value, sort])	Развернуть, также известное как свод, Series с MultiIndex для создания DataFrame.
`update`(other)	Изменение Series на месте с использованием значений из переданного Series.
`value_counts`([normalize, sort, ascending, ...])	Вернуть Series, содержащий количество уникальных значений.
`var`([axis, skipna, ddof, numeric_only])	Возвращает несмещенную дисперсию по запрошенной оси.
`view`([dtype])	(УСТАРЕЛО) Создать новое представление Series.
`where`(cond[, other, inplace, axis, level])	Заменить значения, где условие ложно.
`xs`(key[, axis, level, drop_level])	Возвращает поперечное сечение из Series/DataFrame.