import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LogisticRegression
# 获得数据
names=['Sample code number','Clump Thickness','Uniformity of Cell Size','Uniformity of Cell Shape','Marginal Adhesion','Single Hpithelial Cell Size','Bare Nucle','Bland Chromatin','Normal Nucleoli','Mitomeos','Class']
data=pd.read_csv("https://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer-wisconsin/breast-cancer-wisconsin.data",names=names)
# 处理数据 处理掉数据里的缺失值
data=data.replace(to_replace="?",value=np.nan)
# 使用dropna删除替代过的数据
data=data.dropna()
# 分类数据 特征值 标准值
x=data.iloc[:,1:-1]
y=data["Class"]
# 分割数据
x_train,x_test,y_train,y_test=train_test_split(x,y,test_size=0.2,random_state=20)
# 标准化数据
transfer =StandardScaler()
x_train=transfer.fit_transform(x_train)
x_test=transfer.fit_transform(x_test)
# 训练模型
estimator=LogisticRegression()
ret=estimator.fit(x_train,y_train)
print(ret)
# 模型评估
print(estimator.score(x_test,y_test))
机器学习之逻辑回归
我叫小邋遢2023-08-19 22:53
相关推荐
海边夕阳20065 小时前
【每天一个AI小知识】:什么是生成对抗网络?CoderYanger7 小时前
递归、搜索与回溯-穷举vs暴搜vs深搜vs回溯vs剪枝:12.全排列搞科研的小刘选手8 小时前
【高录用|快检索】第二届图像处理、多媒体技术与机器学习国际学术会议(IPMML 2025)高锰酸钾_8 小时前
机器学习基础 | KNN(K-近邻)CM莫问9 小时前
详解机器学习经典模型(原理及应用)——岭回归xcLeigh9 小时前
AI的提示词专栏:Prompt 与传统机器学习特征工程的异同DuHz9 小时前
论文阅读——Edge Impulse:面向微型机器学习的MLOps平台诚丞成9 小时前
机器学习——生成对抗网络(GANs):原理、进展与应用前景分析爱数学的程序猿9 小时前
机器学习“捷径”:自动特征工程全面解析一个处女座的程序猿9 小时前
AI:新书预告—从机器学习避坑指南(分类/回归/聚类/可解释性)到大语言模型落地手记(RAG/Agent/MCP),一场耗时5+3年的技术沉淀—“代码可跑,经验可抄”—【一个处女座的程序猿】携两本AI