import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LogisticRegression
# 获得数据
names=['Sample code number','Clump Thickness','Uniformity of Cell Size','Uniformity of Cell Shape','Marginal Adhesion','Single Hpithelial Cell Size','Bare Nucle','Bland Chromatin','Normal Nucleoli','Mitomeos','Class']
data=pd.read_csv("https://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer-wisconsin/breast-cancer-wisconsin.data",names=names)
# 处理数据 处理掉数据里的缺失值
data=data.replace(to_replace="?",value=np.nan)
# 使用dropna删除替代过的数据
data=data.dropna()
# 分类数据 特征值 标准值
x=data.iloc[:,1:-1]
y=data["Class"]
# 分割数据
x_train,x_test,y_train,y_test=train_test_split(x,y,test_size=0.2,random_state=20)
# 标准化数据
transfer =StandardScaler()
x_train=transfer.fit_transform(x_train)
x_test=transfer.fit_transform(x_test)
# 训练模型
estimator=LogisticRegression()
ret=estimator.fit(x_train,y_train)
print(ret)
# 模型评估
print(estimator.score(x_test,y_test))
机器学习之逻辑回归
我叫小邋遢2023-08-19 22:53
相关推荐
pen-ai6 小时前
【高级机器学习】 10. 领域适应与迁移学习CV实验室6 小时前
AAAI 2026 Oral 之江实验室等提出MoEGCL:在6大基准数据集上刷新SOTA,聚类准确率最高提升超8%!机器觉醒时代6 小时前
“干活”机器人“教练”登场:宇树机器人推出首款轮式机器人G1-Dm0_635129268 小时前
身智能-一文详解视觉-语言-动作(VLA)大模型(3)pen-ai8 小时前
【高级机器学习】 12. 强化学习,Q-learning, DQN码上地球11 小时前
大数据成矿预测系列(九) | 数据的“自我画像”:自编码器如何实现非监督下的“特征学习”北邮刘老师14 小时前
智能家居,需要的是“主控智能体”而不是“主控节点”Blossom.11815 小时前
大模型量化压缩实战:从FP16到INT4的生产级精度保持之路K2_BPM15 小时前
打通 AI 与业务的 “最后一公里”:流程优化的底层逻辑与三种战略选择Blossom.11817 小时前
大模型知识蒸馏实战:从Qwen-72B到Qwen-7B的压缩艺术