设y=hθ(x)=a+bx+??是一个直线方程,其中𝜀 是高斯噪声。请采100个输入样本,计算出相应的输出样本,并利用线性回归模型拟合这些样本,利用最小二乘求解。可视化这两类算法的回归的结果
import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
np.random.seed(42)
# 1. 生成100个输入样本
x = np.random.rand(100, 1) * 10 # 随机生成在0-10范围内的100个数
# 2. 根据方程 y = a + bx + epsilon 计算输出
# 生日: 12月
a = 2
b = 1
epsilon = np.random.randn(100, 1) # 生成高斯噪声
y = a + b*x + epsilon
# 3. 使用线性回归模型拟合这些样本
reg = LinearRegression().fit(x, y)
# 4. 获取拟合的参数
a_hat = reg.intercept_[0]
b_hat = reg.coef_[0][0]
# 5. 可视化原始数据和回归结果
plt.scatter(x, y, color='blue', label='Original Data with Noise')
plt.plot(x, reg.predict(x), color='red', label=f'Fitted Line: y = {a_hat:.2f} + {b_hat:.2f}x')
plt.title("Linear Regression Result")
plt.xlabel("x")
plt.ylabel("y")
plt.legend()
plt.show()