线性回归 quickstart

构建一元一次方程

100个(X, y ),大概是'y=3x+4'

python 复制代码
import numpy as np

np.random.seed(42)  # to make this code example reproducible
m = 100  # number of instances
X = 2 * np.random.rand(m, 1)  # column vector
y = 4 + 3 * X + np.random.randn(m, 1)  # column vector

将坐标可视化

python 复制代码
import matplotlib.pyplot as plt

plt.figure(figsize=(6, 4))
plt.scatter(X, y, c='b', label='Data points')
plt.xlabel("x")
plt.ylabel("y")
plt.axis([0, 2, 0, 15])
plt.grid()
plt.legend()
plt.show()

根据坐标数据,推出函数

矩阵计算,怎么计算的不用管,只需要知道根据坐标就可以计算得出

python 复制代码
from sklearn.preprocessing import add_dummy_feature

X_b = add_dummy_feature(X)  # add x0 = 1 to each instance
theta_best = np.linalg.inv(X_b.T @ X_b) @ X_b.T @ y

输出

这里有两个参数,对应y=ax+b中的a,b,现在只需要根据横坐标的起始结束0,2就可以画出线性

也是通过上述的矩阵计算

python 复制代码
X_new = np.array([[0], [2]])
X_new_b = add_dummy_feature(X_new)  # add x0 = 1 to each instance
y_predict = X_new_b @ theta_best
y_predict

输出

也就是,我们得到两个坐标,(0, 4.21509616),(2, 9.75532293),根据这两个点,我们就可以画出一条线

python 复制代码
import matplotlib.pyplot as plt

plt.figure(figsize=(6, 4))

plt.plot(X_new, y_predict, "r-")
plt.plot(X, y, "b.")

plt.xlabel("x")
plt.ylabel("y")
plt.axis([0, 2, 0, 15])
plt.grid()
plt.show()

图中红色的线就是我们根据数据推出来的,也就是通过数据学习到的,然后可以根据红色的线,我们就可以去预测其他的数据了,这就是我们机器学习的过程

简化流程,得到参数ab

直接使用sklearn提供的LinearRegression模型,输入数据就可以得到参数了

python 复制代码
from sklearn.linear_model import LinearRegression

lin_reg = LinearRegression()
lin_reg.fit(X, y)
lin_reg.intercept_, lin_reg.coef_

输出

再跟进起始结束,就可以画出线了

python 复制代码
X_new = np.array([[0], [2]])
lin_reg.predict(X_new)

y_predict = lin_reg.predict(X_new)
y_predict

画图

python 复制代码
import matplotlib.pyplot as plt

plt.figure(figsize=(6, 4))

plt.plot(X_new, y_predict, "r-")
plt.plot(X, y, "b.")

plt.xlabel("x")
plt.ylabel("y")
plt.axis([0, 2, 0, 15])
plt.grid()
plt.show()

到这里,已经完成了入门

相关推荐
艾莉丝努力练剑36 分钟前
【LeetCode&数据结构】单链表的应用——反转链表问题、链表的中间节点问题详解
c语言·开发语言·数据结构·学习·算法·leetcode·链表
_殊途2 小时前
《Java HashMap底层原理全解析(源码+性能+面试)》
java·数据结构·算法
橡晟4 小时前
深度学习入门:让神经网络变得“深不可测“⚡(二)
人工智能·python·深度学习·机器学习·计算机视觉
墨尘游子4 小时前
神经网络的层与块
人工智能·python·深度学习·机器学习
Leah01055 小时前
机器学习、深度学习、神经网络之间的关系
深度学习·神经网络·机器学习·ai
珊瑚里的鱼6 小时前
LeetCode 692题解 | 前K个高频单词
开发语言·c++·算法·leetcode·职场和发展·学习方法
秋说7 小时前
【PTA数据结构 | C语言版】顺序队列的3个操作
c语言·数据结构·算法
lifallen7 小时前
Kafka 时间轮深度解析:如何O(1)处理定时任务
java·数据结构·分布式·后端·算法·kafka
liupenglove7 小时前
自动驾驶数据仓库:时间片合并算法。
大数据·数据仓库·算法·elasticsearch·自动驾驶
九章云极AladdinEdu8 小时前
摩尔线程MUSA架构深度调优指南:从CUDA到MUSA的显存访问模式重构原则
人工智能·pytorch·深度学习·机器学习·语言模型·tensorflow·gpu算力