Версии 0.4.1–0.4.3 (25 сентября – 9 октября 2011 г.)#

Новые возможности#

Добавлена поддержка Python 3 с использованием 2to3 (GH 200)
Добавлен name атрибут для Series, теперь выводится как часть Series.__repr__
Series.isnull`() и Series.notnull() (GH 209, GH 203)
Добавлен Series.align метод для выравнивания двух рядов с выбором метода объединения (ENH56)
Добавлен метод get_level_values to MultiIndex (GH 188)
Установка значений в смешанных типах DataFrame объектов через .ix атрибут индексирования (GH 135)
Добавлен новый DataFrame методы get_dtype_counts и свойство dtypes (ENHdc)
Добавлен ignore_index опция для DataFrame.append для стекирования DataFrames (ENH1b)
read_csv пытается sniff разделители с использованием csv.Sniffer (GH 146)
read_csv может читать несколько столбцов в MultiIndex; DataFrame’s to_csv метод записывает соответствующий MultiIndex (GH 151)
DataFrame.rename имеет новый copy параметр для переименовать DataFrame на месте (Улучшено)
Включить разворачивание по имени (GH 142)
Включить sortlevel для работы по уровню (GH 141)

Улучшения производительности#

Изменены бинарные операции для объектов SparseSeries с разными индексами, чтобы использовать логику выравнивания на основе целых чисел (плотную), которая быстрее при большом количестве блоков (GH 205)
Написал более быстрые Cython-процедуры выравнивания / слияния данных, что привело к значительному увеличению скорости
Улучшена производительность isnull и notnull, регрессия с v0.3.0 (GH 187)
Рефакторинг кода, связанного с DataFrame.join чтобы промежуточные выровненные копии данных в каждом DataFrame аргумент не нужно создавать. Значительное повышение производительности в результате (GH 176)
Значительно улучшена производительность generic Index.intersection и Index.union
Реализовано BlockManager.take что приводит к значительно более быстрому take производительность на смешанных типах DataFrame объекты (GH 104)
Улучшена производительность Series.sort_index
Значительное улучшение производительности groupby: удалены ненужные проверки целостности во внутренних структурах DataFrame, которые замедляли операции срезов для получения групп
Оптимизировано _ensure_index функция, приводящая к экономии производительности при проверке типов объектов Index
Написал быстрые методы слияния/объединения временных рядов на Cython. Будет интегрировано позже в DataFrame.join и связанные функции

Участники#

Всего 2 человека внесли патчи в этот выпуск. Люди с «+» рядом с именами внесли патч впервые.

Thomas Kluyver +
Wes McKinney