numpy.polyfit#
- numpy.polyfit(x, y, deg, rcond=None, полный=False, w=None, cov=False)[источник]#
Полиномиальная аппроксимация методом наименьших квадратов.
Примечание
Это часть старого API полиномов. Начиная с версии 1.4, новый API полиномов, определенный в
numpy.polynomialпредпочтительнее. Сводку различий можно найти в руководство по переходу.Подобрать полином
p[0] * x**deg + ... + p[deg]степени deg к точкам (x, y). Возвращает вектор коэффициентов p который минимизирует квадратичную ошибку в порядке deg, deg-1, … 0.The
Polynomial.fitкласс метод рекомендуется для нового кода, так как он более устойчив численно. См. документацию метода для получения дополнительной информации.- Параметры:
- xarray_like, shape (M,)
x-координаты M точек выборки
(x[i], y[i]).- yarray_like, форма (M,) или (M, K)
y-координаты точек выборки. Несколько наборов данных точек выборки, использующих одинаковые x-координаты, могут быть обработаны одновременно путём передачи двумерного массива, содержащего один набор данных в каждом столбце.
- degint
Степень аппроксимирующего полинома
- rcondfloat, опционально
Относительное число обусловленности подгонки. Сингулярные значения, меньшие этого значения относительно наибольшего сингулярного значения, будут проигнорированы. Значение по умолчанию равно len(x)*eps, где eps - относительная точность типа float, обычно около 2e-16.
- полныйbool, необязательно
Переключатель, определяющий тип возвращаемого значения. Когда он установлен в False (по умолчанию), возвращаются только коэффициенты; когда в True, также возвращается диагностическая информация из сингулярного разложения.
- warray_like, shape (M,), optional
Веса. Если не None, вес
w[i]применяется к не возведённому в квадрат остаткуy[i] - y_hat[i]вx[i]. В идеале веса выбираются так, чтобы ошибки произведенийw[i]*y[i]все имеют одинаковую дисперсию. При использовании взвешивания по обратной дисперсии используйтеw[i] = 1/sigma(y[i]). Значение по умолчанию — None.- covbool или str, необязательно
Если задано и не False, возвращать не только оценку, но и её ковариационную матрицу. По умолчанию ковариации масштабируются на chi2/dof, где dof = M - (deg + 1), т.е. веса считаются ненадёжными, кроме как в относительном смысле, и всё масштабируется так, чтобы приведённый chi2 был равен единице. Это масштабирование опускается, если
cov='unscaled', что актуально для случая, когда веса w = 1/sigma, где sigma известно как надёжная оценка неопределённости.
- Возвращает:
- pndarray, форма (deg + 1,) или (deg + 1, K)
Коэффициенты полинома, начиная с высшей степени. Если y был 2-мерным, коэффициенты для k-го набора данных находятся в
p[:,k].- остатки, ранг, сингулярные значения, rcond
Эти значения возвращаются только если
full == Trueостатки – сумма квадратов остатков подгонки методом наименьших квадратов
rank – эффективный ранг масштабированной матрицы коэффициентов Вандермонда
singular_values – сингулярные значения масштабированной матрицы коэффициентов Вандермонда
rcond – значение rcond.
Для более подробной информации см.
numpy.linalg.lstsq.- Vndarray, форма (deg + 1, deg + 1) или (deg + 1, deg + 1, K)
Присутствует только если
full == Falseиcov == True. Ковариационная матрица оценок коэффициентов полинома. Диагональ этой матрицы - оценки дисперсии для каждого коэффициента. Если y является двумерным массивом, то ковариационная матрица для k-й набор данных находится вV[:,:,k]
- Предупреждает:
- RankWarning
Ранг матрицы коэффициентов в методе наименьших квадратов недостаточен. Предупреждение выводится только если
full == False.Предупреждения можно отключить с помощью
>>> import warnings >>> warnings.simplefilter('ignore', np.exceptions.RankWarning)
Смотрите также
polyvalВычисление значений полинома.
linalg.lstsqВычисляет аппроксимацию методом наименьших квадратов.
scipy.interpolate.UnivariateSplineВычисляет сплайн-аппроксимации.
Примечания
Решение минимизирует квадратичную ошибку
\[E = \sum_{j=0}^k |p(x_j) - y_j|^2\]в уравнениях:
x[0]**n * p[0] + ... + x[0] * p[n-1] + p[n] = y[0] x[1]**n * p[0] + ... + x[1] * p[n-1] + p[n] = y[1] ... x[k]**n * p[0] + ... + x[k] * p[n-1] + p[n] = y[k]
Матрица коэффициентов коэффициентов p является матрицей Вандермонда.
polyfitвыдаетRankWarningкогда метод наименьших квадратов плохо обусловлен. Это означает, что наилучшая аппроксимация плохо определена из-за численной ошибки. Результаты могут быть улучшены путём снижения степени полинома или замены x by x - x.mean(). rcond параметр также может быть установлен в значение меньшее, чем по умолчанию, но полученная аппроксимация может быть ложной: включение вкладов от малых сингулярных значений может добавить числовой шум к результату.Обратите внимание, что подгонка полиномиальных коэффициентов по своей природе плохо обусловлена, когда степень полинома велика или интервал точек выборки плохо центрирован. Качество подгонки всегда следует проверять в этих случаях. Когда полиномиальные подгонки неудовлетворительны, сплайны могут быть хорошей альтернативой.
Ссылки
[1]Википедия, «Аппроксимация кривых», https://en.wikipedia.org/wiki/Curve_fitting
[2]Википедия, «Полиномиальная интерполяция», https://en.wikipedia.org/wiki/Polynomial_interpolation
Примеры
>>> import numpy as np >>> import warnings >>> x = np.array([0.0, 1.0, 2.0, 3.0, 4.0, 5.0]) >>> y = np.array([0.0, 0.8, 0.9, 0.1, -0.8, -1.0]) >>> z = np.polyfit(x, y, 3) >>> z array([ 0.08703704, -0.81349206, 1.69312169, -0.03968254]) # may vary
Удобно использовать
poly1dобъекты для работы с полиномами:>>> p = np.poly1d(z) >>> p(0.5) 0.6143849206349179 # may vary >>> p(3.5) -0.34732142857143039 # may vary >>> p(10) 22.579365079365115 # may vary
Полиномы высокого порядка могут сильно осциллировать:
>>> with warnings.catch_warnings(): ... warnings.simplefilter('ignore', np.exceptions.RankWarning) ... p30 = np.poly1d(np.polyfit(x, y, 30)) ... >>> p30(4) -0.80000000000000204 # may vary >>> p30(5) -0.99999999999999445 # may vary >>> p30(4.5) -0.10547061179440398 # may vary
Иллюстрация:
>>> import matplotlib.pyplot as plt >>> xp = np.linspace(-2, 6, 100) >>> _ = plt.plot(x, y, '.', xp, p(xp), '-', xp, p30(xp), '--') >>> plt.ylim(-2,2) (-2, 2) >>> plt.show()