Версия 0.5.0 (24 октября 2011)#

Новые возможности#

Добавлен DataFrame.align метод со стандартными параметрами соединения
Добавлен parse_dates опция для read_csv и read_table методы для опциональной попытки разбора дат в столбцах индекса
Добавлен nrows, chunksize, и iterator аргументы для read_csv и read_table. Последние два возвращают новый TextParser класс, способный лениво итерироваться по фрагментам плоского файла (GH 242)
Добавлен возможность соединения по нескольким столбцам в DataFrame.join (GH 214)
Добавлен приватный _get_duplicates функция для Index для более легкого выявления дублирующихся значений (ENH5c)
Добавлен доступ к атрибутам столбцов DataFrame.
Добавлен Хук автодополнения Python для столбцов DataFrame. (GH 233, GH 230)
Реализовано Series.describe для Series, содержащих объекты (GH 241)
Добавлен опция внутреннего соединения для DataFrame.join при соединении по ключу(ам) (GH 248)
Реализовано выбор столбцов DataFrame путём передачи списка в __getitem__ (GH 253)
Реализовано & и | для пересечения / объединения объектов Index соответственно (GH 261)
Добавлен pivot_table удобная функция в пространстве имен pandas (GH 234)
Реализовано Panel.rename_axis функция (GH 243)
DataFrame будет показывать имена уровней индекса в выводе консоли (GH 334)
Реализовано Panel.take
Добавлен set_eng_float_format для альтернативного форматирования строк с плавающей точкой DataFrame (ENH61)
Добавлен удобство set_index функция для создания индекса DataFrame из существующих столбцов
Реализовано groupby имя уровня иерархического индекса (GH 223)
Добавлен поддержка разных разделителей в DataFrame.to_csv (GH 244)

Улучшения производительности#

VBENCH Значительные улучшения производительности в функциях парсинга файлов read_csv и read_table
VBENCH Добавлена функция Cython для очень быстрого преобразования кортежей в ndarray. Ускоряет многие операции, связанные с MultiIndex
VBENCH Рефакторинг кода слияния/объединения в аккуратный класс и отключение ненужных вычислений в случае float/object, что дало примерно 10% прироста производительности (GH 211)
VBENCH Улучшена скорость DataFrame.xs на объектах DataFrame смешанных типов примерно в 5 раз, регрессия с версии 0.3.0 (GH 215)
VBENCH С новым DataFrame.align метод, ускоряющий бинарные операции между объектами DataFrame с разными индексами на 10-25%.
VBENCH Значительно ускорено преобразование вложенного словаря в DataFrame (GH 212)
VBENCH Значительно ускоряет DataFrame __repr__ и count на больших смешанно-типовых объектах DataFrame

Участники#

Всего 9 человек внесли патчи в этот релиз. Люди со знаком “+” рядом с именами внесли патч впервые.

Aman Thakral +
Luca Beltrame +
Nick Pentreath +
Skipper Seabold
Thomas Kluyver +
Wes McKinney
Yaroslav Halchenko +
lodagro +
неизвестный +