Версия 0.19.2 (24 декабря 2016)#

Это минорный релиз с исправлениями ошибок в серии 0.19.x и включает небольшие исправления регрессий, исправления ошибок и улучшения производительности. Мы рекомендуем всем пользователям обновиться до этой версии.

Основные моменты включают:

Улучшения#

The pd.merge_asof(), добавлен в 0.19.0, получил некоторые улучшения:

  • pd.merge_asof() получил left_index/right_index и left_by/right_by аргументы (GH 14253)

  • pd.merge_asof() может принимать несколько столбцов в by параметр и имеет специализированные dtypes для лучшей производительности (GH 13936)

Улучшения производительности#

  • Регрессия производительности с PeriodIndex (GH 14822)

  • Регрессия производительности при индексировании с помощью getitem (GH 14930)

  • Улучшена производительность .replace() (GH 12745)

  • Улучшенная производительность Series создание с индексом datetime и данными в виде словаря (GH 14894)

Исправления ошибок#

  • Совместимость с Python 3.6 для сериализации некоторых смещений (GH 14685)

  • Совместимость с Python 3.6 для некоторых типов исключений индексирования (GH 14684, GH 14689)

  • Совместимость с python 3.6 для предупреждений об устаревании в тестовом наборе (GH 14681)

  • Совместимость с Python 3.6 для пиклов Timestamp (GH 14689)

  • Совместимость с dateutil==2.6.0; ошибка сегментации, зарегистрированная в наборе тестов (GH 14621)

  • Разрешить nanoseconds в Timestamp.replace в качестве аргумента ключевого слова (GH 14621)

  • Ошибка в pd.read_csv в котором выполнялось псевдонимирование для na_values когда передается в виде словаря (GH 14203)

  • Ошибка в pd.read_csv в котором индексы столбцов для словарного объекта na_values не соблюдались (GH 14203)

  • Ошибка в pd.read_csv где чтение файлов завершается неудачей, если количество заголовков равно количеству строк в файле (GH 14515)

  • Ошибка в pd.read_csv для движка Python, в котором выводилось бесполезное сообщение об ошибке, когда многозначные разделители не учитывались в кавычках (GH 14582)

  • Исправлены ошибки (GH 14734, GH 13654) в pd.read_sas и pandas.io.sas.sas7bdat.SAS7BDATReader что вызывало проблемы при инкрементальном чтении файла SAS.

  • Ошибка в pd.read_csv для движка Python, в котором выводилось бесполезное сообщение об ошибке, когда skipfooter не учитывался библиотекой CSV Python (GH 13879)

  • Ошибка в .fillna() в котором значения datetime64 с часовым поясом были некорректно округлены (GH 14872)

  • Ошибка в .groupby(..., sort=True) нелексически отсортированного MultiIndex при группировке с несколькими уровнями (GH 14776)

  • Ошибка в pd.cut с отрицательными значениями и одним бином (GH 14652)

  • Ошибка в pd.to_numeric где 0 не был беззнаковым на downcast='unsigned' аргумент (GH 14401)

  • Ошибка при построении графиков регулярных и нерегулярных временных рядов с использованием общих осей (sharex=True или ax.twinx()) (GH 13341, GH 14322).

  • Ошибка в непередаче исключений при разборе недопустимых дат, отмеченная в python 3.6 (GH 14561)

  • Ошибка при ресемплинге DatetimeIndex в локальном часовом поясе, охватывающий переход на летнее время, что вызывало AmbiguousTimeError (GH 14682)

  • Ошибка в индексировании, которая преобразовывала RecursionError в KeyError или IndexingError (GH 14554)

  • Ошибка в HDFStore при записи MultiIndex при использовании data_columns=True (GH 14435)

  • Ошибка в HDFStore.append() при записи Series и передача min_itemsize аргумент, содержащий значение для index (GH 11412)

  • Ошибка при записи в HDFStore в table формат с min_itemsize значение для index и без запроса на добавление (GH 10381)

  • Ошибка в Series.groupby.nunique() вызов IndexError для пустого Series (GH 12553)

  • Ошибка в DataFrame.nlargest и DataFrame.nsmallest когда индекс имел повторяющиеся значения (GH 13412)

  • Ошибка в функциях буфера обмена на linux с python2 с юникодом и разделителями (GH 13747)

  • Ошибка в функциях буфера обмена на Windows 10 и Python 3 (GH 14362, GH 12807)

  • Ошибка в .to_clipboard() и совместимость с Excel (GH 12529)

  • Ошибка в DataFrame.combine_first() для целочисленных столбцов (GH 14687).

  • Ошибка в pd.read_csv() в котором dtype параметр не учитывался для пустых данных (GH 14712)

  • Ошибка в pd.read_csv() в котором nrows параметр не учитывался для больших входных данных при использовании движка C для парсинга (GH 7626)

  • Ошибка в pd.merge_asof() не мог обрабатывать DatetimeIndex с часовым поясом, когда была указана погрешность (GH 14844)

  • Явная проверка в to_stata и StataWriter для значений вне диапазона при записи чисел двойной точности (GH 14618)

  • Ошибка в .plot(kind='kde') который не удалял пропущенные значения для построения графика KDE, вместо этого создавая пустой график. (GH 14821)

  • Ошибка в unstack() если вызывается со списком столбцов в качестве аргумента, независимо от типов данных всех столбцов, они приводятся к object (GH 11847)

Участники#

Всего 33 человека внесли патчи в этот релиз. Люди с "+" рядом с именами внесли патч впервые.

  • Ajay Saxena +

  • Бен Кандел

  • Chris

  • Крис Хэм +

  • Christopher C. Aycock

  • Daniel Himmelstein +

  • Dave Willmer +

  • Др-Ирв

  • Джефф Кэри +

  • Jeff Reback

  • Joe Jevnik

  • Joris Van den Bossche

  • Julian Santander +

  • Керби Шедден

  • Keshav Ramaswamy

  • Кевин Шеппард

  • Luca Scarabello +

  • Matt Roeschke +

  • Матти Пикус +

  • Maximilian Roos

  • Mykola Golubyev +

  • Nate Yoder +

  • Nicholas Ver Halen +

  • Pawel Kordek

  • Пьетро Баттистон

  • Rodolfo Fernandez +

  • Tara Adiseshan +

  • Tom Augspurger

  • Yaroslav Halchenko

  • gfyoung

  • hesham.shabana@hotmail.com +

  • sinhrks

  • wandersoncferreira +