sklearn 机器学习基本用法

python 复制代码
# # 科学计算模块
# import numpy as np
# import pandas as pd
# # 绘图模块
# import matplotlib as mpl
# import matplotlib.pyplot as plt
# from sklearn.linear_model import LinearRegression
# from sklearn import datasets
# from sklearn.model_selection import train_test_split
# from sklearn.neighbors import KNeighborsClassifier
# from sklearn import preprocessing
# from sklearn.svm import SVC
# #栾尾花数据预测
# # X,y = datasets.load_iris(return_X_y=True)
# # x_train ,x_test,y_train,y_test=train_test_split(X,y,test_size=0.3)
# # knn=KNeighborsClassifier()
# # knn.fit(x_train,y_train)
# # print(knn.predict(x_test))
# # print(y_test)
# #knn.coef_   斜率
# #knn.intercept_ 截距      y=0.3x+6
# 
# #datasets 自定义数据
# # X,y = datasets.make_regression(n_samples=100,n_features=2,n_targets=2,noise=2)
# # plt.scatter(X,y)
# # plt.show()
# 
# #标准数字化
# # X,y=datasets.make_classification(n_samples=300,n_features=2,n_redundant=0,n_informative=2,random_state=22,n_clusters_per_class=1,scale=100)
# # # sp=np.array(X).shape
# # print(np.array(y).shape)
# # # plt.scatter(X[:,0],X[:,1],c=y)
# # # plt.show()
# # X=preprocessing.scale(X)  #因为数据差距比较大,此处将数据标准化,可增加预测相似度
# # x_train,x_test,y_train,y_test=train_test_split(X,y,test_size=0.3)
# # clf=SVC()
# # clf.fit(x_train,y_train)
# # print(clf.score(x_test,y_test))  #评估预测集,与预测集的相似度,相当于predict 与 y_test 对比度
# 
# 
# #栾尾花数据交叉验证
# from sklearn.model_selection import cross_val_score     #交叉验证可选择好用的model ,参数等等
# X,y = datasets.load_iris(return_X_y=True)
# x_train ,x_test,y_train,y_test=train_test_split(X,y,test_size=0.3)
# # knn=KNeighborsClassifier(n_neighbors=5)
# # scores=cross_val_score(knn,X,y,cv=5,scoring='accuracy')
# # print(scores.mean())    #此处是将数据分成5组取出5组的概率,最后取均值
# 
# #此处判断k值在什么区间这个概率较大
# # k_range=range(2,31)
# # k_scores=[]
# # for k in k_range:
# #     knn = KNeighborsClassifier(n_neighbors=k)
# #     #scores = cross_val_score(knn, X, y, cv=10, scoring='accuracy') #for classfication   选择概率大的
#     # loss = -cross_val_score(knn, X, y, cv=10, scoring='mean_squared_error') #for regression 选择误差小的
#     # k_scores.append(scores.mean())
# #
# # plt.plot(k_range,k_scores)
# # plt.show()
# 
# import pickle
# #保存读取model.fit() 数据
# clf=SVC()
# iris=datasets.load_iris()
# X,y=iris.data,iris.target
# clf.fit(X,y)
# #
# # # pickle.dump()
# # with open('./model_iris' ,'wb') as ff:
# #     pickle.dump(clf, ff)
# #
# # with open('./model_iris', 'rb') as ff:
# #     clf2=pickle.load(ff)
# #     print(clf2.predict([X[0:1]]))
# 
# import joblib
# joblib.dump(clf,'./model_iris')
# clf3=joblib.load('./model_iris')
# print(clf3.predict([X[0:1]]))

学习链接

11 Save_哔哩哔哩_bilibili

相关推荐
老蒋新思维几秒前
创客匠人观察:知识IP的下一站——与AI智能体共生的“人机协同”模式
大数据·人工智能·网络协议·tcp/ip·重构·创始人ip·创客匠人
爱装代码的小瓶子2 分钟前
大语言模型的巧用:
人工智能·语言模型·自然语言处理
未来之窗软件服务3 分钟前
幽冥大陆(五十三)人工智能开发语言选型指南——东方仙盟筑基期
开发语言·人工智能·仙盟创梦ide·东方仙盟
合方圆~小文3 分钟前
四倍枪机日夜模式自动切换控制
数据结构·人工智能
Loacnasfhia95 分钟前
基于YOLO13-C3k2-Star的阿塞拜疆传统服饰目标检测模型实现
人工智能·目标检测·目标跟踪
2401_841495646 分钟前
【自然语言处理】汉字表管理工具
人工智能·python·自然语言处理·初始化·数据关联·汉字表管理工具·批量操作到版本控制
庄周迷蝴蝶7 分钟前
Flaminggo
人工智能·多模态
wayuncn8 分钟前
预算49800,99800,299800能买到什么样的算力服务器
运维·服务器·人工智能·算力一体机·ai算力服务器
洋生巅峰12 分钟前
Python+AI:智能数据可视化新境界
人工智能·python·信息可视化
六行神算API-天璇12 分钟前
虚拟偶像的“暗面”:大模型安全对齐在娱乐场景下的极端挑战
人工智能·安全·娱乐