Что нового в 2.3.3 (29 сентября 2025)#

Это изменения в pandas 2.3.3. Смотрите Примечания к выпуску для полного списка изменений, включая другие версии pandas.

Pandas 2.3.3 теперь совместим с Python 3.14#

Pandas 2.3.3 — первая версия pandas, которая в целом совместима с предстоящим Python 3.14, и для этого выпуска будут загружены как колеса для свободнопоточного, так и для обычного Python 3.14.

Как обычно, сообщайте о любых обнаруженных ошибках в наш трекер проблем

Улучшения и исправления для StringDtype#

Большинство изменений в этом выпуске связаны с StringDtype который станет типом строк по умолчанию в pandas 3.0. См. Предстоящие изменения в pandas 3.0 для получения дополнительной информации.

Улучшения#

  • Обновить DataFrame.select_dtypes() для продолжения выбора str столбцы при указании include=["object"] для обратной совместимости. В будущем релизе это будет устаревшим, и код для pandas 3+ должен быть обновлён, чтобы делать include=["str"] (GH 61916)

  • Поддержка / операция между pathlib.Path объект и StringDtype Series, аналогично тому, как это работает для Series с типом object (GH 61940)

Исправления ошибок#

  • Исправлена ошибка в Series.str.replace() используя именованные группы захвата (например, \g) с типом данных на основе Arrow вызвало бы ошибку (GH 57636)

  • Исправление регрессии в Series.str.contains(), match() и fullmatch() с скомпилированным регулярным выражением и пользовательскими флагами (GH 62240)

  • Исправление Series.str.match() и fullmatch() неправильное сопоставление шаблонов с группами для строкового dtype на основе Arrow (GH 61072)

  • Исправлена ошибка в groupby() с sum() и ненаблюдаемые категории, приводящие к 0 вместо пустой строки "" (GH 61909)

  • Исправление Series.str.isdigit() для корректного распознавания символов Unicode в верхнем индексе как цифр для StringDtype с поддержкой PyArrow (GH 61466)

  • Исправлено сравнение StringDtype Series со смешанными объектами вызывает ошибку (GH 60228)

  • Исправлена ошибка, возникающая при использовании numpy ufunc с массивом строк на основе Python (GH 40800)

Прочие изменения#

  • Устаревание использования Series.resample() и DataFrame.resample() с PeriodIndex (и ключевое слово 'convention') было отменено. Ресемплинг с PeriodIndex снова поддерживается, но подмножество методов, возвращающих некорректные результаты, вызовет ошибку в pandas 3.0 (GH 57033)

Другие исправления ошибок#

  • Исправлена утечка памяти в DataFrame.to_json() со столбцами datetime (GH 62204)

  • Исправлена регрессия в DataFrame.from_records() неправильная инициализация подклассов (GH 57008)

  • The DataFrame.iloc() теперь работает корректно с copy_on_write опция при присваивании значений после выбора подмножества столбцов однородного DataFrame (GH 60309)

Участники#

Всего 15 человек внесли патчи в этот релиз. Люди со знаком «+» рядом с именами внесли патч впервые.

  • ChiLin Chiu

  • Evgenii Mosikhin +

  • Ian Hunt-Isaak +

  • Joris Van den Bossche

  • Laurie O +

  • Lumberbot (он же Джек)

  • Мэтью Рёшке

  • Nathan Goldbaum

  • Patrick Hoefler

  • Richard Shadrach

  • Scott Talbert

  • jbrockmendel

  • Команда разработчиков pandas

  • ptth222 +

  • Álvaro Kothe +