Версия 0.20.2 (4 июня 2017)#

Это минорный релиз с исправлениями ошибок в серии 0.20.x, включающий небольшие исправления регрессий, ошибок и улучшения производительности. Рекомендуем всем пользователям обновиться до этой версии.

Улучшения#

  • Разблокирован доступ к дополнительным типам сжатия, поддерживаемым в pytables: 'blosc:blosclz, 'blosc:lz4', 'blosc:lz4hc', 'blosc:snappy', 'blosc:zlib', 'blosc:zstd' (GH 14478)

  • Series предоставляет to_latex метод (GH 16180)

  • Новый метод groupby GroupBy.ngroup(), параллельно существующему GroupBy.cumcount(), был добавлен для возврата порядка групп (GH 11642); см. здесь.

Улучшения производительности#

  • Исправление регрессии производительности при индексировании с помощью спискообразного объекта (GH 16285)

  • Исправление регрессии производительности для MultiIndexes (GH 16319, GH 16346)

  • Улучшена производительность .clip() со скалярными аргументами (GH 15400)

  • Улучшена производительность groupby с категориальными группировщиками (GH 16413)

  • Улучшена производительность MultiIndex.remove_unused_levels() (GH 16556)

Исправления ошибок#

  • Подавлено предупреждение в некоторых средах Windows о "tput: terminal attributes: No such device or address" при определении размера терминала. Это исправление применяется только к python 3 (GH 16496)

  • Ошибка при использовании pathlib.Path или py.path.local объектов с функциями ввода-вывода (GH 16291)

  • Ошибка в Index.symmetric_difference() на двух одинаковых MultiIndex, приводит к TypeError (GH 13490)

  • Ошибка в DataFrame.update() с overwrite=False и NaN values (GH 15593)

  • Передача недопустимого движка в read_csv() теперь вызывает информативное ValueError вместо UnboundLocalError. (GH 16511)

  • Ошибка в unique() на массиве кортежей (GH 16519)

  • Ошибка в cut() когда labels установлены, что приводит к некорректному порядку меток (GH 16459)

  • Исправлена проблема совместимости с автодополнением вкладок IPython 6.0, показывающим предупреждения об устаревании на Categoricals (GH 16409)

Преобразование#

  • Ошибка в to_numeric() в котором пустые входные данные вызывали сбой интерпретатора (GH 16302)

  • Отключить предупреждения numpy при трансляции DataFrame to Series с операторами сравнения (GH 16378, GH 16306)

Индексирование#

  • Ошибка в DataFrame.reset_index(level=) с одноуровневым индексом (GH 16263)

  • Ошибка в частичной строковой индексации с монотонным, но не строго монотонным индексом, некорректно обращающая границы среза (GH 16515)

  • Ошибка в MultiIndex.remove_unused_levels() который не возвращал бы MultiIndex равны исходным. (GH 16556)

Ввод-вывод#

  • Ошибка в read_csv() когда comment передаётся в текстовом файле с разделителями-пробелами (GH 16472)

  • Ошибка в read_csv() не вызывает исключение с несуществующими столбцами в usecols когда он имел правильную длину (GH 14671)

  • Ошибка, которая приводила к принудительному импорту процедур буфера обмена без необходимости, потенциально вызывая ошибку импорта при запуске (GH 16288)

  • Ошибка, которая возникала IndexError при HTML-рендеринге пустого DataFrame (GH 15953)

  • Ошибка в read_csv() в котором входные данные объекта tarfile вызывали ошибку в Python 2.x для движка C (GH 16530)

  • Ошибка, где DataFrame.to_html() игнорировал index_names параметр (Alan Velasco +)

  • Ошибка, где pd.read_hdf() возвращает строки numpy для имен индекса (GH 13492)

  • Ошибка в HDFStore.select_as_multiple() где аргументы start/stop не учитывались (GH 16209)

Построение графиков#

  • Ошибка в DataFrame.plot с одним столбцом и списком color (GH 3486)

  • Ошибка в plot где NaT в DatetimeIndex приводит к Timestamp.min (GH 12405)

  • Ошибка в DataFrame.boxplot где figsize ключевое слово не учитывалось для негруппированных диаграмм размаха (GH 11959)

GroupBy/resample/rolling#

  • Ошибка при создании скользящего окна на основе времени для пустого DataFrame (GH 15819)

  • Ошибка в rolling.cov() с окном смещения (GH 16058)

  • Ошибка в .resample() и .groupby() при агрегировании целых чисел (GH 16361)

Разреженный#

  • Ошибка в построении SparseDataFrame из scipy.sparse.dok_matrix (GH 16179)

Изменение формы#

  • Ошибка в DataFrame.stack с несортированными уровнями в MultiIndex столбцы (GH 16323)

  • Ошибка в pd.wide_to_long() где ошибка не возникала, когда i не был уникальным идентификатором (GH 16382)

  • Ошибка в Series.isin(..) со списком кортежей (GH 16394)

  • Ошибка при построении DataFrame со смешанными типами данных, включая столбец полностью из NA значений времени. (GH 16395)

  • Ошибка в DataFrame.agg() и Series.agg() с агрегированием по невызываемым атрибутам (GH 16405)

Числовой#

  • Ошибка в .interpolate(), где limit_direction не учитывался при limit=None (по умолчанию) был передан (GH 16282)

Категориальный#

  • Исправлены операции сравнения с учётом порядка категорий, когда обе категориальные переменные неупорядочены (GH 16014)

Другие#

  • Ошибка в DataFrame.drop() с пустым списком при неуникальных индексах (GH 16270)

Участники#

Всего 34 человека внесли патчи в этот релиз. Люди с «+» рядом с именами внесли патч впервые.

  • Aaron Barber +

  • Andrew 亮 +

  • Becky Sweger +

  • Christian Prinoth +

  • Christian Stade-Schuldt +

  • DSM

  • Erik Fredriksen +

  • Hugues Valois +

  • Jeff Reback

  • Jeff Tratner

  • JimStearns206 +

  • John W. O’Brien

  • Joris Van den Bossche

  • JosephWagner +

  • Keith Webber +

  • Мехмет Али "Мали" Акманалп +

  • Pankaj Pandey

  • Patrick Luo +

  • Patrick O’Melveny +

  • Пьетро Баттистон

  • RobinFiveWords +

  • Ryan Hendrickson +

  • SimonBaron +

  • Tom Augspurger

  • WBare +

  • bpraggastis +

  • чернрик +

  • chris-b1

  • экономика +

  • gfyoung

  • jaredsnyder +

  • keitakurita +

  • linebp

  • lloydkirk +