Версии 0.4.1–0.4.3 (25 сентября – 9 октября 2011 г.)#

Новые возможности#

  • Добавлена поддержка Python 3 с использованием 2to3 (GH 200)

  • Добавлен name атрибут для Series, теперь выводится как часть Series.__repr__

  • Series.isnull`() и Series.notnull() (GH 209, GH 203)

  • Добавлен Series.align метод для выравнивания двух рядов с выбором метода объединения (ENH56)

  • Добавлен метод get_level_values to MultiIndex (GH 188)

  • Установка значений в смешанных типах DataFrame объектов через .ix атрибут индексирования (GH 135)

  • Добавлен новый DataFrame методы get_dtype_counts и свойство dtypes (ENHdc)

  • Добавлен ignore_index опция для DataFrame.append для стекирования DataFrames (ENH1b)

  • read_csv пытается sniff разделители с использованием csv.Sniffer (GH 146)

  • read_csv может читать несколько столбцов в MultiIndex; DataFrame’s to_csv метод записывает соответствующий MultiIndex (GH 151)

  • DataFrame.rename имеет новый copy параметр для переименовать DataFrame на месте (Улучшено)

  • Включить разворачивание по имени (GH 142)

  • Включить sortlevel для работы по уровню (GH 141)

Улучшения производительности#

  • Изменены бинарные операции для объектов SparseSeries с разными индексами, чтобы использовать логику выравнивания на основе целых чисел (плотную), которая быстрее при большом количестве блоков (GH 205)

  • Написал более быстрые Cython-процедуры выравнивания / слияния данных, что привело к значительному увеличению скорости

  • Улучшена производительность isnull и notnull, регрессия с v0.3.0 (GH 187)

  • Рефакторинг кода, связанного с DataFrame.join чтобы промежуточные выровненные копии данных в каждом DataFrame аргумент не нужно создавать. Значительное повышение производительности в результате (GH 176)

  • Значительно улучшена производительность generic Index.intersection и Index.union

  • Реализовано BlockManager.take что приводит к значительно более быстрому take производительность на смешанных типах DataFrame объекты (GH 104)

  • Улучшена производительность Series.sort_index

  • Значительное улучшение производительности groupby: удалены ненужные проверки целостности во внутренних структурах DataFrame, которые замедляли операции срезов для получения групп

  • Оптимизировано _ensure_index функция, приводящая к экономии производительности при проверке типов объектов Index

  • Написал быстрые методы слияния/объединения временных рядов на Cython. Будет интегрировано позже в DataFrame.join и связанные функции

Участники#

Всего 2 человека внесли патчи в этот выпуск. Люди с «+» рядом с именами внесли патч впервые.

  • Thomas Kluyver +

  • Wes McKinney