Что нового в 2.0.1 (24 апреля 2023)#

Это изменения в pandas 2.0.1. См. Примечания к выпуску для полного списка изменений, включая другие версии pandas.

Исправленные регрессии#

  • Исправлена регрессия для унаследованного Series при построении из словаря (GH 52445)

  • Исправлена регрессия в SeriesGroupBy.agg() ошибка при группировке с категориальными данными, множественные группировки, as_index=False, и список агрегаций (GH 52760)

  • Исправлена регрессия в DataFrame.pivot() изменение Index имя входного объекта (GH 52629)

  • Исправлена регрессия в DataFrame.resample() вызов исключения на DataFrame без столбцов (GH 52484)

  • Исправлена регрессия в DataFrame.sort_values() не сбрасывая индекс при DataFrame уже отсортирован и ignore_index=True (GH 52553)

  • Исправлена регрессия в MultiIndex.isin() вызов TypeError для Generator (GH 52568)

  • Исправлена регрессия в Series.describe() показывая RuntimeWarning для расширенного типа данных Series с одним элементом (GH 52515)

  • Исправлена регрессия при добавлении нового столбца в DataFrame когда DataFrame.columns был RangeIndex и новый ключ был хэшируемым, но не скаляром (GH 52652)

Исправления ошибок#

  • Ошибка в Series.dt.days который приведет к переполнению int32 количество дней (GH 52391)

  • Ошибка в arrays.DatetimeArray конструктор возвращал некорректную единицу измерения при передаче не-наносекундного numpy datetime массива (GH 52555)

  • Ошибка в ArrowExtensionArray с переполнением типа данных длительности при создании из данных, содержащих numpy NaT (GH 52843)

  • Ошибка в Series.dt.round() при передаче freq равного или более высокого разрешения по сравнению с Series вызовет ZeroDivisionError (GH 52761)

  • Ошибка в Series.median() с ArrowDtype возвращая приблизительную медиану (GH 52679)

  • Ошибка в api.interchange.from_dataframe() необоснованно вызывал исключение для категориальных типов данных (GH 49889)

  • Ошибка в api.interchange.from_dataframe() необоснованно вызывал исключение на больших строковых типах данных (GH 52795)

  • Ошибка в pandas.testing.assert_series_equal() где check_dtype=False все равно вызывал бы ошибку для типов datetime или timedelta с разным разрешением (GH 52449)

  • Ошибка в read_csv() приведение дат PyArrow к NumPy, когда dtype_backend="pyarrow" и parse_dates установлен, вызывая узкое место производительности в процессе (GH 52546)

  • Ошибка в to_datetime() и to_timedelta() при попытке преобразовать числовые данные с ArrowDtype (GH 52425)

  • Ошибка в to_numeric() с errors='coerce' и dtype_backend='pyarrow' с ArrowDtype данные (GH 52588)

  • Ошибка в ArrowDtype.__from_arrow__() не учитывается, если dtype явно задан (GH 52533)

  • Ошибка в DataFrame.describe() не учитывая ArrowDtype в include и exclude (GH 52570)

  • Ошибка в DataFrame.max() и связанное приведение разное Timestamp разрешения всегда в наносекундах (GH 52524)

  • Ошибка в Series.describe() не возвращает ArrowDtype с pyarrow.float64 тип с числовыми данными (GH 52427)

  • Ошибка в Series.dt.tz_localize() неправильная локализация временных меток с ArrowDtype (GH 52677)

  • Ошибка в арифметике между np.datetime64 и np.timedelta64 NaT скаляры с единицами измерения всегда возвращают разрешение в наносекундах (GH 52295)

  • Ошибка в логических и сравнительных операциях между ArrowDtype и маскированные типы numpy (например, "boolean") (GH 52625)

  • Исправлена ошибка в merge() при слиянии с ArrowDtype один один и NumPy dtype с другой стороны (GH 52406)

  • Исправлен сегфолт в Series.to_numpy() с null[pyarrow] тип данных (GH 52443)

Другие#

Участники#

Всего 20 человек внесли патчи в этот выпуск. Люди с «+» рядом с именами внесли патч впервые.

  • Alex Malins +

  • Chris Carini +

  • Dea María Léon

  • Joris Van den Bossche

  • Люк Мэнли

  • Марк Гарсия

  • Marco Edward Gorelli

  • Марко Горелли

  • Мэтью Рёшке

  • MeeseeksMachine

  • Natalia Mokeeva

  • Nirav +

  • Команда разработчиков Pandas

  • Patrick Hoefler

  • Richard Shadrach

  • Stefanie Molin

  • Терджи Петерсен

  • Томас +

  • Thomas Li

  • yonashub