0305芯片检测-逻辑回归实战-机器学习-人工智能

逻辑回归之芯片通过预测

  • 首先基于chip_test.csv数据建立回归模型(二阶边界),评估模型表现。
  • 以函数的方式求解边界曲线。
  • 描绘出完整的边界曲线。

chip_test.csv示例数据如下:

csv 复制代码
test1,test2,pass
0.051267,0.69956,1
-0.092742,0.68494,1
-0.21371,0.69225,1
-0.375,0.50219,1

以下是结合数据可视化的完整代码,包含数据点、决策边界标记:

python 复制代码
import matplotlib
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.linear_model import LogisticRegression
from sklearn.preprocessing import PolynomialFeatures
from sklearn.metrics import accuracy_score, confusion_matrix

matplotlib.use('TkAgg')
# 设置 Matplotlib 使用支持中文的字体
plt.rcParams['font.sans-serif'] = ['Noto Sans CJK SC']  # 根据字体名称调整
plt.rcParams['axes.unicode_minus'] = False  # 解决负号显示问题

# 加载数据
data = pd.read_csv('chip_test.csv')
X = data[['test1', 'test2']].values
y = data['pass'].values

# 生成二阶多项式特征 (包含常数项、线性项和二次项)
poly = PolynomialFeatures(degree=2, include_bias=True)
X_poly = poly.fit_transform(X)

# 训练逻辑回归模型(无正则化)- 使用 penalty=None
model = LogisticRegression(penalty=None, max_iter=1000, solver='lbfgs')
model.fit(X_poly, y)

# 模型评估
y_pred = model.predict(X_poly)
accuracy = accuracy_score(y, y_pred)
conf_matrix = confusion_matrix(y, y_pred)

print(f"模型准确率: {accuracy:.4f}")
print("混淆矩阵:")
print(conf_matrix)


# 边界曲线函数
def decision_boundary(x1, x2):
    # 创建测试点并转换为多项式特征
    point = np.array([[x1, x2]])
    point_poly = poly.transform(point)

    # 计算预测概率并返回决策值
    proba = model.predict_proba(point_poly)[0][1]
    return proba - 0.5


# 可视化完整边界曲线
# 创建网格点
x1_min, x1_max = X[:, 0].min() - 0.1, X[:, 0].max() + 0.1
x2_min, x2_max = X[:, 1].min() - 0.1, X[:, 1].max() + 0.1

xx1, xx2 = np.meshgrid(np.linspace(x1_min, x1_max, 300),
                       np.linspace(x2_min, x2_max, 300))

# 计算每个网格点的决策值 - 向量化计算提高效率
points = np.c_[xx1.ravel(), xx2.ravel()]
points_poly = poly.transform(points)
Z = model.predict_proba(points_poly)[:, 1] - 0.5
Z = Z.reshape(xx1.shape)

# 设置图形
plt.figure(figsize=(10, 8))

# 绘制原始数据点
plt.scatter(X[y == 1, 0], X[y == 1, 1],
            c='royalblue', marker='o', s=60,
            label='通过 (1)', edgecolor='k')
plt.scatter(X[y == 0, 0], X[y == 0, 1],
            c='crimson', marker='x', s=60,
            label='失败 (0)')

# 绘制决策边界 (Z=0的等高线)
contour = plt.contour(xx1, xx2, Z, levels=[0],
                      colors='darkgreen', linewidths=2.5)
plt.clabel(contour, inline=True, fontsize=12)

# 填充决策区域
plt.contourf(xx1, xx2, Z, levels=[-10, 0, 10],
             colors=['crimson', 'royalblue'], alpha=0.15)

# 添加标签和标题
plt.xlabel('测试1', fontsize=12)
plt.ylabel('测试2', fontsize=12)
plt.title('芯片测试结果与决策边界 (二阶多项式)', fontsize=14)
plt.legend(loc='upper right', fontsize=11)
plt.grid(alpha=0.3)

# 添加准确率信息
plt.text(0.75, -0.9, f'准确率: {accuracy:.2%}',
         fontsize=12, bbox=dict(facecolor='white', alpha=0.8))

plt.tight_layout()
plt.show()

运行修正后的代码效果:

  1. 打印模型准确率(约84.75%)
  2. 显示混淆矩阵
  3. 绘制决策边界图,其中:
    • 蓝色点:实际通过的芯片
    • 红色叉:实际失败的芯片
    • 绿色曲线:决策边界(P=0.5)
    • 蓝色区域:预测"通过"区域(P>0.5)
    • 红色区域:预测"失败"区域(P<0.5)

如下图所示:

结语

❓QQ:806797785

⭐️仓库地址:https://gitee.com/gaogzhen

⭐️仓库地址:https://github.com/gaogzhen

1\][AI人工智能从入门到精通全套教程](https://www.bilibili.com/video/BV1ug4y1t7Ty)\[CP/OL\].

相关推荐
youngerwang19 小时前
AI 编程环境与主流 AI IDE 对比分析报告
ide·人工智能
猿小猴子19 小时前
主流 AI IDE 之一的 Google Antigravity IDE 介绍
ide·人工智能·google·antigravity
Teacher.chenchong19 小时前
GEE云端林业遥感:贯通森林分类、森林砍伐与退化监测、火灾评估、森林扰动监测、森林关键生理参数(树高/生物量/碳储量)反演等
人工智能·分类·数据挖掘
@sinner21 小时前
你好,Scikit-learn:从零开始你的第一个机器学习项目
python·机器学习·scikit-learn
2501_9411474221 小时前
人工智能赋能智慧城市互联网应用:智能交通、能源与公共管理优化实践探索》
人工智能
咚咚王者1 天前
人工智能之数据分析 numpy:第十五章 项目实践
人工智能·数据分析·numpy
Jay20021111 天前
【机器学习】7-9 分类任务 & 逻辑回归的成本函数 & 逻辑回归的梯度下降
笔记·机器学习·分类
水月wwww1 天前
深度学习——神经网络
人工智能·深度学习·神经网络
司铭鸿1 天前
祖先关系的数学重构:从家谱到算法的思维跃迁
开发语言·数据结构·人工智能·算法·重构·c#·哈希算法
机器之心1 天前
从推荐算法优化到AI4S、Pico和大模型,杨震原长文揭秘字节跳动的技术探索
人工智能·openai