Что нового в 2.0.1 (24 апреля 2023)#
Это изменения в pandas 2.0.1. См. Примечания к выпуску для полного списка изменений, включая другие версии pandas.
Исправленные регрессии#
Исправлена регрессия для унаследованного Series при построении из словаря (GH 52445)
Исправлена регрессия в
SeriesGroupBy.agg()ошибка при группировке с категориальными данными, множественные группировки,as_index=False, и список агрегаций (GH 52760)Исправлена регрессия в
DataFrame.pivot()изменениеIndexимя входного объекта (GH 52629)Исправлена регрессия в
DataFrame.resample()вызов исключения на DataFrame без столбцов (GH 52484)Исправлена регрессия в
DataFrame.sort_values()не сбрасывая индекс приDataFrameуже отсортирован иignore_index=True(GH 52553)Исправлена регрессия в
MultiIndex.isin()вызовTypeErrorдляGenerator(GH 52568)Исправлена регрессия в
Series.describe()показываяRuntimeWarningдля расширенного типа данныхSeriesс одним элементом (GH 52515)Исправлена регрессия при добавлении нового столбца в
DataFrameкогдаDataFrame.columnsбылRangeIndexи новый ключ был хэшируемым, но не скаляром (GH 52652)
Исправления ошибок#
Ошибка в
Series.dt.daysкоторый приведет к переполнениюint32количество дней (GH 52391)Ошибка в
arrays.DatetimeArrayконструктор возвращал некорректную единицу измерения при передаче не-наносекундного numpy datetime массива (GH 52555)Ошибка в
ArrowExtensionArrayс переполнением типа данных длительности при создании из данных, содержащих numpyNaT(GH 52843)Ошибка в
Series.dt.round()при передачеfreqравного или более высокого разрешения по сравнению сSeriesвызоветZeroDivisionError(GH 52761)Ошибка в
Series.median()сArrowDtypeвозвращая приблизительную медиану (GH 52679)Ошибка в
api.interchange.from_dataframe()необоснованно вызывал исключение для категориальных типов данных (GH 49889)Ошибка в
api.interchange.from_dataframe()необоснованно вызывал исключение на больших строковых типах данных (GH 52795)Ошибка в
pandas.testing.assert_series_equal()гдеcheck_dtype=Falseвсе равно вызывал бы ошибку для типов datetime или timedelta с разным разрешением (GH 52449)Ошибка в
read_csv()приведение дат PyArrow к NumPy, когдаdtype_backend="pyarrow"иparse_datesустановлен, вызывая узкое место производительности в процессе (GH 52546)Ошибка в
to_datetime()иto_timedelta()при попытке преобразовать числовые данные сArrowDtype(GH 52425)Ошибка в
to_numeric()сerrors='coerce'иdtype_backend='pyarrow'сArrowDtypeданные (GH 52588)Ошибка в
ArrowDtype.__from_arrow__()не учитывается, если dtype явно задан (GH 52533)Ошибка в
DataFrame.describe()не учитываяArrowDtypeвincludeиexclude(GH 52570)Ошибка в
DataFrame.max()и связанное приведение разноеTimestampразрешения всегда в наносекундах (GH 52524)Ошибка в
Series.describe()не возвращаетArrowDtypeсpyarrow.float64тип с числовыми данными (GH 52427)Ошибка в
Series.dt.tz_localize()неправильная локализация временных меток сArrowDtype(GH 52677)Ошибка в арифметике между
np.datetime64иnp.timedelta64NaTскаляры с единицами измерения всегда возвращают разрешение в наносекундах (GH 52295)Ошибка в логических и сравнительных операциях между
ArrowDtypeи маскированные типы numpy (например,"boolean") (GH 52625)Исправлена ошибка в
merge()при слиянии сArrowDtypeодин один и NumPy dtype с другой стороны (GH 52406)Исправлен сегфолт в
Series.to_numpy()сnull[pyarrow]тип данных (GH 52443)
Другие#
DataFrameсозданные из пустых словарей имелиcolumnsтипа данныхobject. Теперь этоRangeIndex(GH 52404)Seriesсозданные из пустых словарей имелиindexтипа данныхobject. Теперь этоRangeIndex(GH 52404)Реализовано
Series.str.split()иSeries.str.rsplit()дляArrowDtypeсpyarrow.string(GH 52401)Реализовано большинство
strметоды доступа дляArrowDtypeсpyarrow.string(GH 52401)Предоставление нецелочисленного хэшируемого ключа, который проверяет
Falseвapi.types.is_scalar()теперь вызываетKeyErrorдляRangeIndex.get_loc(), как это происходит дляIndex.get_loc(). Ранее вызывалосьInvalidIndexError(GH 52652).
Участники#
Всего 20 человек внесли патчи в этот выпуск. Люди с «+» рядом с именами внесли патч впервые.
Alex Malins +
Chris Carini +
Dea María Léon
Joris Van den Bossche
Люк Мэнли
Марк Гарсия
Marco Edward Gorelli
Марко Горелли
Мэтью Рёшке
MeeseeksMachine
Natalia Mokeeva
Nirav +
Команда разработчиков Pandas
Patrick Hoefler
Richard Shadrach
Stefanie Molin
Терджи Петерсен
Томас +
Thomas Li
yonashub