pandas.Series#
-
класс pandas.Series(data=None, index=None, dtype=None, name=None, copy=None, fastpath=
)[источник]# Одномерный ndarray с метками осей (включая временные ряды).
Метки не обязательно должны быть уникальными, но должны быть хешируемого типа. Объект поддерживает индексацию как по целым числам, так и по меткам, и предоставляет множество методов для выполнения операций с индексом. Статистические методы из ndarray были переопределены для автоматического исключения пропущенных данных (в настоящее время представленных как NaN).
Операции между Series (+, -, /, *, **) выравнивают значения на основе их связанных значений индекса - они не обязательно должны быть одинаковой длины. Результирующий индекс будет отсортированным объединением двух индексов.
- Параметры:
- данныеподобный массиву, Iterable, dict или скалярное значение
Содержит данные, хранящиеся в Series. Если данные являются словарем, порядок аргументов сохраняется.
- indexмассивоподобный объект или Index (1d)
Значения должны быть хэшируемыми и иметь ту же длину, что и данные. Допускаются неуникальные значения индекса. По умолчанию будет использоваться RangeIndex (0, 1, 2, …, n), если не указано иное. Если данные имеют вид словаря и индекс равен None, то ключи в данных используются как индекс. Если индекс не равен None, результирующий Series переиндексируется со значениями индекса.
- dtypestr, numpy.dtype, или ExtensionDtype, опционально
Тип данных для выходного Series. Если не указан, он будет выведен из данные. См. руководство пользователя для дополнительных вариантов использования.
- имяHashable, по умолчанию None
Имя, которое нужно дать Series.
- copybool, по умолчанию False
Копировать входные данные. Влияет только на входные данные Series или 1d ndarray. См. примеры.
Примечания
Пожалуйста, обратитесь к Руководство пользователя для получения дополнительной информации.
Примеры
Создание Series из словаря с указанным Index
>>> d = {'a': 1, 'b': 2, 'c': 3} >>> ser = pd.Series(data=d, index=['a', 'b', 'c']) >>> ser a 1 b 2 c 3 dtype: int64
Ключи словаря соответствуют значениям Index, поэтому значения Index не оказывают влияния.
>>> d = {'a': 1, 'b': 2, 'c': 3} >>> ser = pd.Series(data=d, index=['x', 'y', 'z']) >>> ser x NaN y NaN z NaN dtype: float64
Обратите внимание, что Index сначала строится с ключами из словаря. После этого Series переиндексируется с заданными значениями Index, поэтому мы получаем все NaN в результате.
Создание Series из списка с copy=False.
>>> r = [1, 2] >>> ser = pd.Series(r, copy=False) >>> ser.iloc[0] = 999 >>> r [1, 2] >>> ser 0 999 1 2 dtype: int64
Из-за типа входных данных Series имеет copy исходных данных, даже если copy=False, поэтому данные остаются неизменными.
Создание Series из одномерного ndarray с copy=False.
>>> r = np.array([1, 2]) >>> ser = pd.Series(r, copy=False) >>> ser.iloc[0] = 999 >>> r array([999, 2]) >>> ser 0 999 1 2 dtype: int64
Из-за типа входных данных Series имеет представление на исходных данных, поэтому данные также изменяются.
Атрибуты
Возвращает транспонирование, которое по определению является самим объектом.
ExtensionArray данных, лежащих в основе этого Series или Index.
Получите одно значение для пары меток строки/столбца.
Словарь глобальных атрибутов этого набора данных.
axesВозвращает список меток строковой оси.
Вернуть объект dtype исходных данных.
Вернуть объект dtype исходных данных.
Индикатор, пуст ли Series/DataFrame.
Получить свойства, связанные с этим объектом pandas.
Возвращает True, если есть какие-либо NaN.
Доступ к одиночному значению для пары строка/столбец по целочисленной позиции.
(УСТАРЕЛО) Индексирование, основанное исключительно на целочисленных позициях для выбора по положению.
Индекс (метки оси) Series.
Возвращает булево значение, если значения в объекте монотонно убывают.
Возвращает булево значение, если значения в объекте монотонно возрастают.
Возвращает булево значение, если значения в объекте уникальны.
Доступ к группе строк и столбцов по метке(ам) или булевому массиву.
Возвращает имя Series.
Возвращает количество байтов в базовых данных.
Количество измерений исходных данных, по определению 1.
Вернуть кортеж формы базовых данных.
Возвращает количество элементов в базовых данных.
Возвращает Series как ndarray или ndarray-подобный объект в зависимости от dtype.
Методы
abs()Возвращает Series/DataFrame с абсолютным числовым значением каждого элемента.
add(other[, level, fill_value, axis])Возвращает сложение series и other поэлементно (бинарный оператор добавить).
add_prefix(prefix[, axis])Добавить префикс к меткам строкой префикс.
add_suffix(suffix[, axis])Добавление строковых суффиксов к меткам суффикс.
agg([func, axis])Агрегировать с использованием одной или нескольких операций по указанной оси.
aggregate([func, axis])Агрегировать с использованием одной или нескольких операций по указанной оси.
align(other[, join, axis, level, copy, ...])Выровнять два объекта по их осям с указанным методом соединения.
all([axis, bool_only, skipna])Возвращает, являются ли все элементы True, возможно по оси.
any(*[, axis, bool_only, skipna])Возвращает, является ли какой-либо элемент True, возможно, по оси.
apply(func[, convert_dtype, args, by_row])Вызвать функцию для значений Series.
argmax([axis, skipna])Возвращает целочисленную позицию наибольшего значения в Series.
argmin([axis, skipna])Возвращает целочисленную позицию наименьшего значения в Series.
argsort([axis, kind, order, stable])Вернуть целочисленные индексы, которые отсортировали бы значения Series.
asfreq(freq[, method, how, normalize, ...])Преобразовать временной ряд в указанную частоту.
asof(where[, subset])Вернуть последнюю строку(и) без каких-либо NaN перед где.
astype(dtype[, copy, errors])Привести объект pandas к указанному типу данных
dtype.at_time(time[, asof, axis])Выбор значений в определенное время суток (например, 9:30 утра).
autocorr([lag])Вычислите автокорреляцию с лагом N.
backfill(*[, axis, inplace, limit, downcast])(УСТАРЕЛО) Заполнение значений NA/NaN с использованием следующего допустимого наблюдения для заполнения пропуска.
between(left, right[, inclusive])Возвращает булевый Series, эквивалентный left <= series <= right.
between_time(start_time, end_time[, ...])Выбрать значения между определенными временами дня (например, 9:00-9:30 утра).
bfill(*[, axis, inplace, limit, limit_area, ...])Заполните значения NA/NaN, используя следующее допустимое наблюдение для заполнения пробела.
bool()(УСТАРЕЛО) Возвращает логическое значение для одного элемента Series или DataFrame.
case_when(список случаев)Заменяет значения там, где условия истинны.
clip([lower, upper, axis, inplace])Обрежьте значения по заданному порогу(ам).
combine(other, func[, fill_value])Объединить Series с Series или скаляром в соответствии с функция.
combine_first(other)Обновить нулевые элементы значением из того же места в 'other'.
compare(other[, align_axis, keep_shape, ...])Сравнить с другой Series и показать различия.
convert_dtypes([infer_objects, ...])Преобразование столбцов к наилучшим возможным типам данных с использованием типов, поддерживающих
pd.NA.copy([deep])Создать копию индексов и данных этого объекта.
corr(other[, method, min_periods])Вычисление корреляции с other Series, исключая пропущенные значения.
count()Возвращает количество ненулевых/непустых наблюдений в Series.
cov(other[, min_periods, ddof])Вычисление ковариации с Series, исключая пропущенные значения.
cummax([axis, skipna])Возвращает кумулятивный максимум по оси DataFrame или Series.
cummin([axis, skipna])Возвращает кумулятивный минимум по оси DataFrame или Series.
cumprod([axis, skipna])Возвращает кумулятивное произведение по оси DataFrame или Series.
cumsum([axis, skipna])Возвращает кумулятивную сумму по оси DataFrame или Series.
describe([percentiles, include, exclude])Генерация описательной статистики.
diff([периоды])Первая дискретная разность элемента.
div(other[, level, fill_value, axis])Возвращает деление с плавающей точкой серии и другого объекта, поэлементно (бинарный оператор truediv).
divide(other[, level, fill_value, axis])Возвращает деление с плавающей точкой серии и другого объекта, поэлементно (бинарный оператор truediv).
divmod(other[, level, fill_value, axis])Возвращает целочисленное деление и остаток от деления серии и другого объекта поэлементно (бинарный оператор divmod).
dot(other)Вычисляет скалярное произведение между Series и столбцами other.
drop([labels, axis, index, columns, level, ...])Возвращает Series с удаленными указанными метками индекса.
drop_duplicates(*[, keep, inplace, ignore_index])Возвращает Series с удаленными дублирующимися значениями.
droplevel(level[, axis])Возвращает Series/DataFrame с удаленным запрошенным уровнем индекса/столбца.
dropna(*[, axis, inplace, how, ignore_index])Возвращает новый Series с удалёнными пропущенными значениями.
duplicated([keep])Указывает дублирующиеся значения Series.
eq(other[, level, fill_value, axis])Возвращает результат поэлементного сравнения series и other на равенство (бинарный оператор eq).
equals(other)Проверить, содержат ли два объекта одинаковые элементы.
ewm([com, span, halflife, alpha, ...])Предоставить экспоненциально взвешенные (EW) вычисления.
expanding([min_periods, axis, method])Предоставить вычисления с расширяющимся окном.
explode([ignore_index])Преобразуйте каждый элемент спискообразного объекта в строку.
factorize([sort, use_na_sentinel])Кодировать объект как перечисленный тип или категориальную переменную.
ffill(*[, axis, inplace, limit, limit_area, ...])Заполнение NA/NaN значений путем распространения последнего валидного наблюдения до следующего валидного.
fillna([value, method, axis, inplace, ...])Заполнить значения NA/NaN с использованием указанного метода.
filter([items, like, regex, axis])Выберите подмножество строк или столбцов фрейма данных в соответствии с указанными метками индекса.
first(смещение)(УСТАРЕЛО) Выбор начальных периодов временных рядов на основе смещения даты.
Возвращает индекс первого не-NA значения или None, если не-NA значение не найдено.
floordiv(other[, level, fill_value, axis])Возвращает целочисленное деление серии и другого объекта поэлементно (бинарный оператор floordiv).
ge(other[, level, fill_value, axis])Возвращает больше или равно для серии и другого объекта, поэлементно (бинарный оператор ge).
get(key[, default])Получить элемент из объекта по заданному ключу (например, столбец DataFrame).
groupby([by, axis, level, as_index, sort, ...])Группировать Series с помощью маппера или по Series столбцов.
gt(other[, level, fill_value, axis])Возвращает 'Больше чем' для серии и другого объекта, поэлементно (бинарный оператор gt).
head([n])Вернуть первый n строк.
hist([by, ax, grid, xlabelsize, xrot, ...])Строит гистограмму входного ряда с использованием matplotlib.
idxmax([axis, skipna])Возвращает метку строки с максимальным значением.
idxmin([axis, skipna])Возвращает метку строки минимального значения.
infer_objects([copy])Попытка вывести лучшие типы данных для столбцов object.
info([verbose, buf, max_cols, memory_usage, ...])Вывод краткой сводки Series.
interpolate([method, axis, limit, inplace, ...])Заполнить значения NaN с помощью метода интерполяции.
isin(values)Содержатся ли элементы в Series в values.
isna()Обнаружить пропущенные значения.
isnull()Series.isnull является псевдонимом для Series.isna.
item()Вернуть первый элемент исходных данных как скаляр Python.
items()Лениво перебирать кортежи (индекс, значение).
keys()Возвращает псевдоним для индекса.
kurt([axis, skipna, numeric_only])Возвращает несмещённый эксцесс по запрошенной оси.
kurtosis([axis, skipna, numeric_only])Возвращает несмещённый эксцесс по запрошенной оси.
last(смещение)(УСТАРЕЛО) Выбирать последние периоды временных рядов на основе смещения даты.
Возвращает индекс последнего не-NA значения или None, если не найдено ни одного не-NA значения.
le(other[, level, fill_value, axis])Возвращает меньше или равно для series и other, поэлементно (бинарный оператор le).
lt(other[, level, fill_value, axis])Возвращает меньшее из значений серии и другого объекта поэлементно (бинарный оператор lt).
map(arg[, na_action])Сопоставление значений Series в соответствии с входным отображением или функцией.
mask(cond[, other, inplace, axis, level])Заменить значения, где условие истинно.
max([axis, skipna, numeric_only])Возвращает максимальное значение по запрошенной оси.
mean([axis, skipna, numeric_only])Возвращает среднее значение по запрошенной оси.
median([axis, skipna, numeric_only])Возвращает медиану значений по запрошенной оси.
memory_usage([index, deep])Возвращает использование памяти Series.
min([axis, skipna, numeric_only])Возвращает минимальное значение по указанной оси.
mod(other[, level, fill_value, axis])Возвращает остаток от деления series и other поэлементно (бинарный оператор mod).
mode([dropna])Возвращает моду(ы) Series.
mul(other[, level, fill_value, axis])Возвращает умножение series и other поэлементно (бинарный оператор mul).
multiply(other[, level, fill_value, axis])Возвращает умножение series и other поэлементно (бинарный оператор mul).
ne(other[, level, fill_value, axis])Возвращает неравенство серии и другого объекта, поэлементно (бинарный оператор ne).
nlargest([n, keep])Возвращает наибольший n элементы.
notna()Обнаружить существующие (не пропущенные) значения.
notnull()Series.notnull является псевдонимом для Series.notna.
nsmallest([n, keep])Вернуть наименьший n элементы.
nunique([dropna])Возвращает количество уникальных элементов в объекте.
pad(*[, axis, inplace, limit, downcast])(УСТАРЕЛО) Заполнение значений NA/NaN путем распространения последнего допустимого наблюдения на следующее допустимое.
pct_change([periods, fill_method, limit, freq])Дробное изменение между текущим и предыдущим элементом.
pipe(func, *args, **kwargs)Применение цепочечных функций, которые ожидают Series или DataFrames.
pop(элемент)Возвращает элемент и удаляет из серии.
pow(other[, level, fill_value, axis])Возвращает экспоненциальную степень series и other, поэлементно (бинарный оператор pow).
prod([axis, skipna, numeric_only, min_count])Возвращает произведение значений по запрошенной оси.
product([axis, skipna, numeric_only, min_count])Возвращает произведение значений по запрошенной оси.
quantile([q, interpolation])Возвращает значение по заданному квантилю.
radd(other[, level, fill_value, axis])Возвращает сложение series и other поэлементно (бинарный оператор radd).
rank([axis, method, numeric_only, ...])Вычисление числовых рангов данных (от 1 до n) вдоль оси.
ravel([order])(УСТАРЕЛО) Возвращает выровненные базовые данные как ndarray или ExtensionArray.
rdiv(other[, level, fill_value, axis])Возвращает деление с плавающей точкой серии и другого объекта, поэлементно (бинарный оператор rtruediv).
rdivmod(other[, level, fill_value, axis])Возвращает целочисленное деление и остаток от деления серии и другого объекта поэлементно (бинарный оператор rdivmod).
reindex([index, axis, method, copy, level, ...])Привести Series к новому индексу с опциональной логикой заполнения.
reindex_like(other[, method, copy, limit, ...])Возвращает объект с совпадающими индексами, как другой объект.
rename([index, axis, copy, inplace, level, ...])Изменение меток индекса или имени Series.
rename_axis([mapper, index, axis, copy, inplace])Установите имя оси для индекса или столбцов.
reorder_levels(порядок)Переупорядочить уровни индекса, используя порядок ввода.
repeat(repeats[, axis])Повторение элементов Series.
replace([to_replace, value, inplace, limit, ...])Заменить значения, указанные в to_replace с значение.
resample(rule[, axis, closed, label, ...])Передискретизация временных рядов.
reset_index([level, drop, name, inplace, ...])Создать новый DataFrame или Series со сброшенным индексом.
rfloordiv(other[, level, fill_value, axis])Возвращает целочисленное деление серии и другого объекта поэлементно (бинарный оператор rfloordiv).
rmod(other[, level, fill_value, axis])Возвращает остаток от деления series и other поэлементно (бинарный оператор rmod).
rmul(other[, level, fill_value, axis])Возвращает умножение series и other поэлементно (бинарный оператор rmul).
rolling(window[, min_periods, center, ...])Предоставляет скользящие оконные вычисления.
round([decimals])Округлить каждое значение в Series до заданного количества десятичных знаков.
rpow(other[, level, fill_value, axis])Возвращает экспоненциальную степень series и other, поэлементно (бинарный оператор rpow).
rsub(other[, level, fill_value, axis])Возвращает вычитание series и other поэлементно (бинарный оператор rsub).
rtruediv(other[, level, fill_value, axis])Возвращает деление с плавающей точкой серии и другого объекта, поэлементно (бинарный оператор rtruediv).
sample([n, frac, replace, weights, ...])Вернуть случайную выборку элементов из оси объекта.
searchsorted(value[, side, sorter])Найти индексы, куда следует вставить элементы для сохранения порядка.
sem([axis, skipna, ddof, numeric_only])Возвращает несмещённую стандартную ошибку среднего по запрошенной оси.
set_axis(labels, *[, axis, copy])Назначить желаемый индекс для заданной оси.
set_flags(*[, copy, allows_duplicate_labels])Возвращает новый объект с обновленными флагами.
shift([periods, freq, axis, fill_value, suffix])Сдвинуть индекс на желаемое количество периодов с необязательным временем freq.
skew([axis, skipna, numeric_only])Возвращает несмещенное асимметричное распределение по запрошенной оси.
sort_index(*[, axis, level, ascending, ...])Сортировка Series по меткам индекса.
sort_values(*[, axis, ascending, inplace, ...])Сортировка по значениям.
squeeze([axis])Сжать одномерные объекты осей в скаляры.
std([axis, skipna, ddof, numeric_only])Возвращает выборочное стандартное отклонение по указанной оси.
sub(other[, level, fill_value, axis])Возвращает вычитание series и other поэлементно (бинарный оператор sub).
subtract(other[, level, fill_value, axis])Возвращает вычитание series и other поэлементно (бинарный оператор sub).
sum([axis, skipna, numeric_only, min_count])Возвращает сумму значений по запрошенной оси.
swapaxes(axis1, axis2[, copy])(УСТАРЕЛО) Поменять местами оси и соответствующим образом поменять значения осей.
swaplevel([i, j, copy])Поменять местами уровни i и j в
MultiIndex.tail([n])Возвращает последний n строк.
take(indices[, axis])Возвращает элементы в заданном позиционный индексы вдоль оси.
to_clipboard(*[, excel, sep])Копировать объект в буфер обмена системы.
to_csv([path_or_buf, sep, na_rep, ...])Запись объекта в файл значений, разделенных запятыми (csv).
to_dict(*[, into])Преобразовать Series в словарь {метка -> значение} или объект, подобный словарю.
to_excel(excel_writer, *[, sheet_name, ...])Запись объекта на лист Excel.
to_frame([name])Преобразовать Series в DataFrame.
to_hdf(path_or_buf, *, key[, mode, ...])Записать содержащиеся данные в файл HDF5 с использованием HDFStore.
to_json([path_or_buf, orient, date_format, ...])Преобразовать объект в строку JSON.
to_latex([buf, columns, header, index, ...])Отобразить объект в виде таблицы LaTeX, longtable или вложенной таблицы.
to_list()Возвращает список значений.
to_markdown([buf, mode, index, storage_options])Вывод Series в формате, удобном для Markdown.
to_numpy([dtype, copy, na_value])Массив NumPy ndarray, представляющий значения в этой Series или Index.
to_period([freq, copy])Преобразование Series из DatetimeIndex в PeriodIndex.
to_pickle(path, *[, compression, protocol, ...])Pickle (сериализация) объекта в файл.
to_sql(name, con, *[, schema, if_exists, ...])Записать записи, хранящиеся в DataFrame, в базу данных SQL.
to_string([buf, na_rep, float_format, ...])Отображение строкового представления Series.
to_timestamp([freq, how, copy])Привести к DatetimeIndex временных меток, в начало периода.
Вернуть объект xarray из объекта pandas.
tolist()Возвращает список значений.
transform(func[, axis])Вызов
funcна self, производя Series с той же формой оси, что и self.transpose(*args, **kwargs)Возвращает транспонирование, которое по определению является самим объектом.
truediv(other[, level, fill_value, axis])Возвращает деление с плавающей точкой серии и другого объекта, поэлементно (бинарный оператор truediv).
truncate([before, after, axis, copy])Обрезать Series или DataFrame до и после некоторого значения индекса.
tz_convert(tz[, axis, level, copy])Преобразовать ось с учетом часового пояса в целевой часовой пояс.
tz_localize(tz[, axis, level, copy, ...])Локализует индекс Series или DataFrame без часового пояса в целевой часовой пояс.
unique()Возвращает уникальные значения объекта Series.
unstack([level, fill_value, sort])Развернуть, также известное как свод, Series с MultiIndex для создания DataFrame.
update(other)Изменение Series на месте с использованием значений из переданного Series.
value_counts([normalize, sort, ascending, ...])Вернуть Series, содержащий количество уникальных значений.
var([axis, skipna, ddof, numeric_only])Возвращает несмещенную дисперсию по запрошенной оси.
view([dtype])(УСТАРЕЛО) Создать новое представление Series.
where(cond[, other, inplace, axis, level])Заменить значения, где условие ложно.
xs(key[, axis, level, drop_level])Возвращает поперечное сечение из Series/DataFrame.