Версия 0.5.0 (24 октября 2011)#

Новые возможности#

  • Добавлен DataFrame.align метод со стандартными параметрами соединения

  • Добавлен parse_dates опция для read_csv и read_table методы для опциональной попытки разбора дат в столбцах индекса

  • Добавлен nrows, chunksize, и iterator аргументы для read_csv и read_table. Последние два возвращают новый TextParser класс, способный лениво итерироваться по фрагментам плоского файла (GH 242)

  • Добавлен возможность соединения по нескольким столбцам в DataFrame.join (GH 214)

  • Добавлен приватный _get_duplicates функция для Index для более легкого выявления дублирующихся значений (ENH5c)

  • Добавлен доступ к атрибутам столбцов DataFrame.

  • Добавлен Хук автодополнения Python для столбцов DataFrame. (GH 233, GH 230)

  • Реализовано Series.describe для Series, содержащих объекты (GH 241)

  • Добавлен опция внутреннего соединения для DataFrame.join при соединении по ключу(ам) (GH 248)

  • Реализовано выбор столбцов DataFrame путём передачи списка в __getitem__ (GH 253)

  • Реализовано & и | для пересечения / объединения объектов Index соответственно (GH 261)

  • Добавлен pivot_table удобная функция в пространстве имен pandas (GH 234)

  • Реализовано Panel.rename_axis функция (GH 243)

  • DataFrame будет показывать имена уровней индекса в выводе консоли (GH 334)

  • Реализовано Panel.take

  • Добавлен set_eng_float_format для альтернативного форматирования строк с плавающей точкой DataFrame (ENH61)

  • Добавлен удобство set_index функция для создания индекса DataFrame из существующих столбцов

  • Реализовано groupby имя уровня иерархического индекса (GH 223)

  • Добавлен поддержка разных разделителей в DataFrame.to_csv (GH 244)

Улучшения производительности#

  • VBENCH Значительные улучшения производительности в функциях парсинга файлов read_csv и read_table

  • VBENCH Добавлена функция Cython для очень быстрого преобразования кортежей в ndarray. Ускоряет многие операции, связанные с MultiIndex

  • VBENCH Рефакторинг кода слияния/объединения в аккуратный класс и отключение ненужных вычислений в случае float/object, что дало примерно 10% прироста производительности (GH 211)

  • VBENCH Улучшена скорость DataFrame.xs на объектах DataFrame смешанных типов примерно в 5 раз, регрессия с версии 0.3.0 (GH 215)

  • VBENCH С новым DataFrame.align метод, ускоряющий бинарные операции между объектами DataFrame с разными индексами на 10-25%.

  • VBENCH Значительно ускорено преобразование вложенного словаря в DataFrame (GH 212)

  • VBENCH Значительно ускоряет DataFrame __repr__ и count на больших смешанно-типовых объектах DataFrame

Участники#

Всего 9 человек внесли патчи в этот релиз. Люди со знаком “+” рядом с именами внесли патч впервые.

  • Aman Thakral +

  • Luca Beltrame +

  • Nick Pentreath +

  • Skipper Seabold

  • Thomas Kluyver +

  • Wes McKinney

  • Yaroslav Halchenko +

  • lodagro +

  • неизвестный +