机器学习之逻辑回归

复制代码
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import  StandardScaler
from sklearn.linear_model import LogisticRegression
# 获得数据
names=['Sample code number','Clump Thickness','Uniformity of Cell Size','Uniformity of Cell Shape','Marginal Adhesion','Single Hpithelial Cell Size','Bare Nucle','Bland Chromatin','Normal Nucleoli','Mitomeos','Class']
data=pd.read_csv("https://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer-wisconsin/breast-cancer-wisconsin.data",names=names)
# 处理数据  处理掉数据里的缺失值
data=data.replace(to_replace="?",value=np.nan)
# 使用dropna删除替代过的数据
data=data.dropna()
# 分类数据  特征值  标准值
x=data.iloc[:,1:-1]
y=data["Class"]
# 分割数据
x_train,x_test,y_train,y_test=train_test_split(x,y,test_size=0.2,random_state=20)

# 标准化数据
transfer =StandardScaler()
x_train=transfer.fit_transform(x_train)
x_test=transfer.fit_transform(x_test)
# 训练模型
estimator=LogisticRegression()
ret=estimator.fit(x_train,y_train)
print(ret)
# 模型评估
print(estimator.score(x_test,y_test))
相关推荐
顾北辰205 小时前
基本算法——回归
java·spring boot·机器学习
我的运维人生6 小时前
机器学习算法深度解析:以支持向量机(SVM)为例的实践应用
算法·机器学习·支持向量机·运维开发·技术共享
人总该做点什么7 小时前
【机器学习】梯度下降
人工智能·机器学习
顾北辰207 小时前
基本算法——分类
java·spring boot·机器学习
新加坡内哥谈技术11 小时前
OpenAI发布o3:圣诞前夜的AI惊喜,颠覆性突破还是技术焦虑?
人工智能·深度学习·机器学习·自动化
Loving_enjoy12 小时前
计算机专业硕士有哪些研究方向
大数据·人工智能·计算机网络·机器学习·自然语言处理
ALISHENGYA14 小时前
决策树(二)属性选择度量之基尼系数详细讲解
算法·决策树·机器学习
martian66514 小时前
【人工智能机器学习基础篇】——深入详解强化学习之常用算法Q-Learning与策略梯度,掌握智能体与环境的交互机制
人工智能·算法·机器学习·强化学习
yvestine14 小时前
数据挖掘——认识数据
人工智能·笔记·学习·机器学习·数据挖掘·认识数据