numpy.polyfit #
- 麻木的。polyfit ( x , y , deg , rcond = None , full = False , w = None , cov = False ) [来源] #
最小二乘多项式拟合。
笔记
这构成了旧多项式 API 的一部分。从版本 1.4 开始,
numpy.polynomial
首选中定义的新多项式 API 。差异摘要可以在 转换指南中找到。将 deg 次多项式拟合到点( x , y)。返回系数p的向量,该向量按deg、deg-1、 … 0的顺序最小化平方误差。
p(x) = p[0] * x**deg + ... + p[deg]
Polynomial.fit
建议新代码使用类方法,因为它在数值上更稳定。有关详细信息,请参阅该方法的文档。- 参数:
- x类似数组,形状 (M,)
M 个样本点的 x 坐标。
(x[i], y[i])
- y类似数组,形状 (M,) 或 (M, K)
样本点的 y 坐标。通过传入每列包含一个数据集的 2D 数组,可以一次性拟合共享相同 x 坐标的多个样本点数据集。
- 度整数
拟合多项式的次数
- rcond浮动,可选
拟合的相对条件数。相对于最大奇异值小于此值的奇异值将被忽略。默认值为len(x)*eps,其中eps是float类型的相对精度,大多数情况下约为2e-16。
- 满布尔值,可选
开关确定返回值的性质。当为 False(默认值)时,仅返回系数;当为 True 时,还会返回来自奇异值分解的诊断信息。
- w array_like,形状 (M,),可选
重量。如果不是“无”,则权重适用于处的
w[i]
未平方残差。理想情况下,选择权重以使产品的误差都具有相同的方差。当使用逆方差加权时,使用 。默认值为无。y[i] - y_hat[i]
x[i]
w[i]*y[i]
w[i] = 1/sigma(y[i])
- cov bool 或 str,可选
如果给定且不是False,则不仅返回估计值,还返回其协方差矩阵。默认情况下,协方差按 chi2/dof 缩放,其中 dof = M - (deg + 1),即,除非在相对意义上,否则权重被认为是不可靠的,并且所有内容都经过缩放,使得减少的 chi2 为单位。如果 ,则省略此缩放
cov='unscaled'
,与权重为 w = 1/sigma 的情况相关,已知 sigma 是不确定性的可靠估计。
- 返回:
- p ndarray,形状 (deg + 1,) 或 (deg + 1, K)
多项式系数,最高次幂在前。如果y是二维的,则第 k个数据集的系数在 中
p[:,k]
。- 残差、等级、奇异值、rcond
仅在以下情况下才返回这些值
full == True
残差 – 最小二乘拟合的残差平方和
- 等级 – 缩放后的范德蒙德的有效等级
系数矩阵
- single_values – 缩放后的 Vandermonde 的奇异值
系数矩阵
rcond – rcond的值。
有关更多详细信息,请参阅
numpy.linalg.lstsq
。- V ndarray,形状 (M,M) 或 (M,M,K)
仅当且时出现。多项式系数估计的协方差矩阵。该矩阵的对角线是每个系数的方差估计。如果 y 是二维数组,则第 k个数据集的协方差矩阵为
full == False
cov == True
V[:,:,k]
- 警告:
- 排名警告
最小二乘拟合中系数矩阵的秩不足。仅在以下情况下才会发出警告。
full == False
可以通过以下方式关闭警告
>>> import warnings >>> warnings.simplefilter('ignore', np.RankWarning)
也可以看看
polyval
计算多项式值。
linalg.lstsq
计算最小二乘拟合。
scipy.interpolate.UnivariateSpline
计算样条拟合。
笔记
该解决方案最小化平方误差
\[E = \sum_{j=0}^k |p(x_j) - y_j|^2\]在方程中:
x[0]**n * p[0] + ... + x[0] * p[n-1] + p[n] = y[0] x[1]**n * p[0] + ... + x[1] * p[n-1] + p[n] = y[1] ... x[k]**n * p[0] + ... + x[k] * p[n-1] + p[n] = y[k]
系数p的系数矩阵是范德蒙矩阵。
polyfit
RankWarning
当最小二乘拟合条件不好时会出现问题。这意味着由于数值误差,最佳拟合并未明确定义。通过降低多项式次数或用x - x .mean()替换x可以改善结果。 rcond参数也可以设置为小于其默认值的值,但结果拟合可能是虚假的:包括小奇异值的贡献可能会给结果增加数值噪声。请注意,当多项式的次数很大或样本点的间隔居中不良时,拟合多项式系数本质上会受到不良条件的影响。在这些情况下,应始终检查配合质量。当多项式拟合不令人满意时,样条曲线可能是一个不错的选择。
参考
[ 1 ]维基百科,“曲线拟合”, https://en.wikipedia.org/wiki/Curve_fitting
[ 2 ]维基百科,“多项式插值”, https://en.wikipedia.org/wiki/Polynomial_interpolation
例子
>>> import warnings >>> x = np.array([0.0, 1.0, 2.0, 3.0, 4.0, 5.0]) >>> y = np.array([0.0, 0.8, 0.9, 0.1, -0.8, -1.0]) >>> z = np.polyfit(x, y, 3) >>> z array([ 0.08703704, -0.81349206, 1.69312169, -0.03968254]) # may vary
使用
poly1d
对象来处理多项式很方便:>>> p = np.poly1d(z) >>> p(0.5) 0.6143849206349179 # may vary >>> p(3.5) -0.34732142857143039 # may vary >>> p(10) 22.579365079365115 # may vary
高阶多项式可能会剧烈振荡:
>>> with warnings.catch_warnings(): ... warnings.simplefilter('ignore', np.RankWarning) ... p30 = np.poly1d(np.polyfit(x, y, 30)) ... >>> p30(4) -0.80000000000000204 # may vary >>> p30(5) -0.99999999999999445 # may vary >>> p30(4.5) -0.10547061179440398 # may vary
插图:
>>> import matplotlib.pyplot as plt >>> xp = np.linspace(-2, 6, 100) >>> _ = plt.plot(x, y, '.', xp, p(xp), '-', xp, p30(xp), '--') >>> plt.ylim(-2,2) (-2, 2) >>> plt.show()