在数据科学领域,最小二乘法是一种经典且强大的算法,用于拟合线性模型。它通过最小化误差平方和来确定最佳拟合直线。简单来说,就是找到一条直线,让所有点到这条直线的距离平方和最小。
首先,我们需要准备数据。假设我们有一组二维数据点 (x, y),可以用NumPy轻松创建:
```python
import numpy as np
x = np.array([1, 2, 3, 4, 5])
y = np.array([2, 4, 5, 4, 5])
```
接着,利用公式计算斜率和截距:
```python
n = len(x)
m = (n np.sum(xy) - np.sum(x) np.sum(y)) / (n np.sum(x2) - (np.sum(x)2))
b = (np.sum(y) - m np.sum(x)) / n
```
最后,用Matplotlib绘制结果:
```python
import matplotlib.pyplot as plt
plt.scatter(x, y, color='blue')
plt.plot(x, mx + b, color='red')
plt.show()
```
最小二乘法不仅适用于线性问题,还能扩展到多项式拟合和其他场景。掌握了这项技能,你就能轻松应对数据分析中的各种挑战啦!💪