人工智能实验5 逻辑回归

【实验目的】掌握逻辑回归算法

【实验内容】处理样本，使用逻辑回归算法进行参数估计，并画出分类边界

【实验要求】写明实验步骤，必要时补充截图

1、参照"2.1梯度下降法实现线性逻辑回归.ipynb"和"2.2 sklearn实现线性逻辑回归.ipynb"，在Jupyter Notebook中新建Python运行环境，以单元格为单位运行代码，在实验报告中解释每行代码的含义，分析运行结果，把运行结果截图保存到实验报告中，并比较两种实现方式的优劣。

2.1：

python 复制代码

import numpy as np  # 导入numpy库，用于数值计算
import matplotlib.pyplot as plt  # 导入matplotlib库，用于绘图

# 读取数据
data = np.genfromtxt("C:/Users/a1830/Desktop/实验5-逻辑回归/实验素材/LR-testSet.txt", delimiter=",")
data  # 打印读取的数据

# 特征：选择前两列
x_data = data[:,:-1]
# 标签：y
y_data = data[:,-1]

# 定义sigmoid函数  x=θ^T*X
def sigmoid_(x):
    return 1/(1+np.exp(-x))  # 返回sigmoid函数值

# 定义损失函数 xMat:x_data矩阵 yMat：y_data矩阵 ws：参数向量的转置
def cost_(xMat,yMat,ws):
    # 进行相乘
    left = np.multiply(yMat,np.log(sigmoid_(xMat*ws)))  # 计算左半部分
    right = np.multiply(1-yMat,np.log(1-sigmoid_(xMat*ws)))  # 计算右半部分
    
    # 进行求和 除以样本的个数
    return np.sum(left+right)/-(len(xMat))  # 返回损失值
    
# 定义梯度下降求解θ
def gradAscent(xArr,yArr):
    # 将ndarry类型转为矩阵
    xMat = np.mat(xArr)
    yMat = np.mat(yArr)
    
    # 初始化学习率
    lr = 0.001
    
    # 初始化迭代次数
    epochs = 10000
    
    # 取出 样本个数m 以及 特征个数n
    m,n = np.shape(xMat)  
    
    # 初始化的θ --> θ^T*xMat   θ0*x0+θ1*x1+θ2*x2  
    ws = np.mat(np.ones((n,1)))
    
    # 初始化损失列表
    costList = [] 
    
    # 迭代
    for i in range(epochs+1):
        # 求导
        # 1.h(x)  100*3 3*1 --> 100*1 -->每个样本都有一个h(x)
        h = sigmoid_(xMat*ws)
        # print(f"xMat shape:{np.shape(xMat)}")
        # print(f"ws shape:{np.shape(ws)}")

        # 矩阵乘法：n*m m*1 --> n*1 -->
        # xMat:m*n  3*100   m*1 1*100
        # h-->预测值  (m*1)
        # yMat-->真实值 (m*1)
        ws_grad = xMat.T*(h - yMat.T)/m
        # print(f"xmat.T shape{np.shape(xMat.T)}")
        # print(f"yMat shape{np.shape(h - yMat.T)}")

        # print(np.shape(ws_grad))
        
        # 更新ws-->theta向量
        ws = ws - lr*ws_grad
        
        if i%50 == 0:
            costList.append(cost_(xMat,yMat,ws))  # 每50次迭代记录一次损失值
            
    # 返回theta向量ws，以及损失列表
    return ws,costList

# 训练模型
ws,costList = gradAscent(x_data,y_data)
print(ws)  # 打印训练得到的权重向量

"""
可视化
- 横轴:x1
- 纵轴:x2
x1*theta1+x2*theta2+theta0=0
x2 = -(x1*theta1+theta0)/theta2
"""
"""
可视化
- y_data为0是一个类别，圆
- y_data为1是一个类型，叉
实现：构建x1,x2
"""
def plot_logi():
    # 初始化列表
    x_0 = []
    y_0 = []
    x_1 = []
    y_1 = []
    # 切分不同类别的数据
    for i in range(len(x_data)):
        # 取类别为0的数据
        if y_data[i] == 0:
            # 将特征1添加到x_0中
            x_0.append(x_data[i,0])
            # 将特征2添加到y_0中
            y_0.append(x_data[i,1])
        else:
            # 将特征1添加到x_1中
            x_1.append(x_data[i,0])
            # 将特征2添加到y_1中
            y_1.append(x_data[i,1])

    # 画图
    plt.scatter(x_0,y_0,c="skyblue",marker="o",label="class0")
    plt.scatter(x_1,y_1,c="red",marker="x",label="class1")    
    plt.legend()


# 绘制点
plot_logi()

# 初始化测试集的数据
x_test = [[-4],[3]]
# 计算分类函数
y_test = -(x_test*ws[1]+ws[0])/ws[2]
# 可视化
plt.plot(x_test,y_test)
plt.show()

# 绘制loss曲线
# 生成0,10000
x = np.linspace(0,10000,201)
plt.plot(x,costList)
plt.xlabel("epochs")
plt.ylabel("Cost")
plt.show()


    
    
    
plot_logi()
plt.show()
# 特征：选择前两列
x_data = data[:,:-1]
# 标签：y
y_data = data[:,-1]

# θ^T*X  给X添加一列全为1的数据
X_data = np.concatenate((np.ones((len(x_data),1)),x_data),axis=1)

# 定义sigmoid函数，输入为x=θ^T*X
def sigmoid_(x):
    return 1/(1+np.exp(-x))

# 定义损失函数，输入为xMat:x_data矩阵, yMat：y_data矩阵, ws：参数向量的转置
def cost_(xMat,yMat,ws):
    # 进行相乘
    left = np.multiply(yMat,np.log(sigmoid_(xMat*ws)))
    right = np.multiply(1-yMat,np.log(1-sigmoid_(xMat*ws)))
    
    # 进行求和并除以样本的个数
    return np.sum(left+right)/-(len(xMat))
    
# 定义梯度下降求解θ
def gradAscent(xArr,yArr):
    # 将ndarry类型转为矩阵
    xMat = np.mat(xArr)
    yMat = np.mat(yArr)
    
    # 初始化学习率
    lr = 0.001
    
    # 初始化迭代次数
    epochs = 10000
    
    # 取出样本个数m以及特征个数n
    m,n = np.shape(xMat)  
    
    # 初始化的θ --> θ^T*xMat   θ0*x0+θ1*x1+θ2*x2  
    ws = np.mat(np.ones((n,1)))
    
    # 初始化损失列表
    costList = [] 
    
    # 迭代
    for i in range(epochs+1):
        # 求导
        # 1.h(x)  100*3 3*1 --> 100*1 -->每个样本都有一个h(x)
        h = sigmoid_(xMat*ws)
        
        # 矩阵乘法：n*m m*1 --> n*1 -->
        # xMat:m*n  3*100   m*1 1*100
        # h-->预测值  (m*1)
        # yMat-->真实值 (m*1)
        ws_grad = xMat.T*(h - yMat.T)/m
        
        # 更新ws-->theta向量
        ws = ws - lr*ws_grad
        
        if i%50 == 0:
            costList.append(cost_(xMat,yMat,ws))
            
    # 返回theta向量ws，以及损失列表
    return ws,costList

# 训练模型
ws,costList = gradAscent(X_data, y_data)
print(ws)

"""
可视化部分
- 横轴:x1
- 纵轴:x2
x1*theta1+x2*theta2+theta0=0
x2 = -(x1*theta1+theta0)/theta2
"""
# 绘制点
plot_logi()

# 初始化测试集的数据
x_test = [[-4],[3]]
# 计算分类函数
y_test = -(x_test*ws[1]+ws[0])/ws[2]
# 可视化
plt.plot(x_test,y_test)
plt.show()

# 绘制loss曲线
# 生成0,10000
x = np.linspace(0,10000,201)
plt.plot(x,costList)
plt.xlabel("epochs")
plt.ylabel("Cost")
plt.show()

运行结果

2.2：

python 复制代码

import numpy as np  # 导入numpy库，用于数值计算
import matplotlib.pyplot as plt  # 导入matplotlib库中的pyplot模块，用于绘图

# 读取数据
data = np.genfromtxt("C:/Users/a1830/Desktop/人工智能 实验5-逻辑回归/实验素材/LR-testSet.txt", delimiter=",")  # 从指定路径读取数据文件，使用逗号作为分隔符
data  # 打印读取的数据

# 特征：选择前两列
x_data = data[:,:-1]  # 提取数据的前两列作为特征
# 标签：y
y_data = data[:,-1]  # 提取数据的最后一列作为标签

def plot_logi():
    # 初始化列表
    x_0 = []  # 存储类别为0的特征1
    y_0 = []  # 存储类别为0的特征2
    x_1 = []  # 存储类别为1的特征1
    y_1 = []  # 存储类别为1的特征2
    # 切分不同类别的数据
    for i in range(len(x_data)):  # 遍历所有数据点
        # 取类别为0的数据
        if y_data[i] == 0:  # 如果当前数据点的标签为0
            # 将特征1添加到x_0中
            x_0.append(x_data[i,0])  # 添加特征1到x_0列表
            # 将特征2添加到y_0中
            y_0.append(x_data[i,1])  # 添加特征2到y_0列表
        else:  # 如果当前数据点的标签不为0（即为1）
            # 将特征1添加到x_1中
            x_1.append(x_data[i,0])  # 添加特征1到x_1列表
            # 将特征2添加到y_1中
            y_1.append(x_data[i,1])  # 添加特征2到y_1列表
    
    # 画图
    plt.scatter(x_0,y_0,c="skyblue",marker="o",label="class0")  # 绘制类别为0的散点图，颜色为天蓝色，标记为圆圈
    plt.scatter(x_1,y_1,c="red",marker="x",label="class1")  # 绘制类别为1的散点图，颜色为红色，标记为叉号
    plt.legend()  # 显示图例
    
plot_logi()  # 调用函数绘制初始散点图

# 训练模型
from sklearn.linear_model import LogisticRegression  # 导入LogisticRegression类
logistic = LogisticRegression()  # 创建LogisticRegression对象
logistic.fit(x_data,y_data)  # 使用数据拟合模型

# 截距
print(logistic.intercept_)  # 打印模型的截距项
# theta1 theta2
print(logistic.coef_)  # 打印模型的系数（权重）
# x2 = -(x1*theta1+theta0)/theta2

# 画出散点
plot_logi()  # 再次调用函数绘制散点图

# 画出决策边界
x_test = np.array([[-4],[3]])  # 定义测试数据，用于绘制决策边界
y_test = -(x_test*logistic.coef_[0,0]+logistic.intercept_)/logistic.coef_[0,1]  # 根据模型参数计算决策边界的y值
plt.plot(x_test,y_test)  # 绘制决策边界
plt.show()  # 显示图形

print(logistic.score(x_data,y_data))  # 打印模型在训练数据上的准确率