Версия 0.6.0 (25 ноября 2011)#
Новые возможности#
Добавлен
meltфункция дляpandas.core.reshapeДобавлен
levelпараметр для группировки по уровню в описательной статистике Series и DataFrame (GH 313)Добавлен
headиtailметоды для Series, аналогичные DataFrame (GH 296)Добавлен
Series.isinфункция, которая проверяет, содержится ли каждое значение в переданной последовательности (GH 289)Добавлен
float_formatопция дляSeries.to_stringДобавлен
skip_footer(GH 291) иconverters(GH 343) опции дляread_csvиread_tableДобавлен
drop_duplicatesиduplicatedфункции для удаления дублирующихся строк DataFrame и проверки на дублирующиеся строки соответственно (GH 319)Реализовано операторы '&', '|', '^', '-' на DataFrame (GH 347)
Добавлен
Series.mad, среднее абсолютное отклонениеДобавлен
orientопция дляDataFrame.from_dictДобавлен передача списка кортежей или списка списков в
DataFrame.from_records(GH 357)Разрешить несколько столбцов в
byаргументDataFrame.sort_index(GH 92, GH 362)Добавлен быстро
get_valueиput_valueметоды в DataFrame (GH 360)Добавлен
covметоды экземпляров для Series и DataFrame (GH 194, GH 362)Добавлен
read_clipboardфункция для разбора DataFrame из буфера обмена (GH 300)Добавлен
nuniqueфункцию для Series для подсчета уникальных элементов (GH 297)Сделано Конструктор DataFrame использует имя Series, если столбцы не переданы (GH 373)
Поддержка регулярные выражения в read_table/read_csv (GH 364)
Добавлен
DataFrame.to_htmlдля записи DataFrame в HTML (GH 387)Добавлен поддержка данных MaskedArray в DataFrame, замаскированные значения преобразуются в NaN (GH 396)
Может передать дополнительные args, kwds в DataFrame.apply (GH 376)
Реализовать
DataFrame.joinс векторомonаргумент (GH 312)Может передать несколько столбцов значений в
pivot_table(GH 381)Используйте Имя Series в GroupBy для результирующего индекса (GH 363)
Добавлен
rawопция дляDataFrame.applyдля производительности, если нужен только ndarray (GH 309)Добавлен правильный, протестированный взвешенный метод наименьших квадратов для стандартного и панельного OLS (GH 303)
Улучшения производительности#
VBENCH Cythonized
cache_readonly, что привело к значительным микро-улучшениям производительности по всей кодовой базе (GH 361)VBENCH Специальный итератор матриц Cython для применения произвольных операций редукции с производительностью в 3-5 раз лучше, чем
np.apply_along_axis(GH 309)VBENCH Улучшена производительность
MultiIndex.from_tuplesVBENCH Специальный итератор матриц Cython для применения произвольных операций редукции
VBENCH + DOCUMENT Add
rawопция дляDataFrame.applyдля повышения производительности приVBENCH Ускоренный цитонизированный подсчет по уровням в Series и DataFrame (GH 341)
VBENCH? Значительное улучшение производительности GroupBy с несколькими ключами с множеством "пустых" комбинаций
VBENCH Новая векторизованная функция Cython
map_inferускоряетSeries.applyиSeries.mapзначительно при передаче поэлементной функции Python, мотивировано (GH 355)VBENCH Значительно улучшена производительность
Series.order, что также ускоряет вызов np.unique для Series (GH 327)VBENCH Значительно улучшена производительность GroupBy на осях с MultiIndex (GH 299)
Участники#
Всего 8 человек внесли патчи в этот выпуск. Люди с "+" рядом с их именами внесли патч впервые.
Адам Кляйн +
Chang She +
Dieter Vandenbussche
Джефф Хаммербахер +
Натан Пингер +
Томас Клуйвер
Wes McKinney
Wouter Overmeire +