机器学习 分类算法

【实验名称】 实验:分类算法

【实验目的】

1.了解分类算法理论基础

2.平台实现算法

  1. 编程实现分类算法

【实验原理】

分类(Categorization or Classification)就是按照某种标准给对象贴标签(label),再根据标签来区分归类。

【实验环境】

OS:Ubuntu16.04

PyCharm: 2017.3

Mining

【实验步骤】

复习分类算法的简单实现:

一起通过一个小案例回顾如何构建一个最简单的分类器:

1)导入数据

from sklearn import datasets

iris = datasets.load_iris()

2)创建分类器

from sklearn.naive_bayes import GaussianNB

gnb = GaussianNB()

3)训练

y_pred = gnb.fit(iris.data, iris.target).predict(iris.data)

4)分类器的效果

print("Number of mislabeled points out of a total %d points : %d" % (iris.data.shape[0],(iris.target != y_pred).sum()))

题目:人群的收入预测

现在我们获得了一个数据集adult.data.txt,该数据集由多组个人信息构成,其中信息包含年龄、工作、婚姻等属性,以及类别收入,我们希望根据这些已有数据推出未知收入群体的收入情况。

STEP1:加载数据并查看数据,我们希望依据不同的类别收入加载相同数量的数据,因为如果不同的类别的数据体量相差很大会造成分类器向大数据体量一方倾斜,问题一:补充代码,实现上述效果。

STEP2:转换数据的属性编码,因为原数据中的属性是包含英文字符,无法进行数学运算,请将其转换为数值型数据,问题二:补充代码,实现上述功能。

STEP3:创建一个分类器,将STEP1、STEP2处理好的数据进行训练,并使用交叉验证评测分类器的效果,问题三:补充代码,实现上述功能。

STEP4:对新个体采用同样的编码处理,预测其收入类别,问题四:补充代码,实现上述功能。

相关推荐
ZKNOW甄知科技3 分钟前
数智同行:甄知科技2026年Q1季度回顾
运维·服务器·人工智能·科技·程序人生·安全·自动化
呆呆敲代码的小Y3 分钟前
【Unity工具篇】| 游戏完整资源热更新流程,YooAsset官方示例项目
人工智能·游戏·unity·游戏引擎·热更新·yooasset·免费游戏
jikemaoshiyanshi4 分钟前
B2B企业GEO服务商哪家好?深度解析径硕科技(JINGdigital)及其JINGEO产品为何是首选
大数据·运维·人工智能·科技
Lab_AI4 分钟前
浩天药业携手创腾科技,开启研发数字化新篇章!电子实验记录本(ELN)落地浩天药业
人工智能
supericeice6 分钟前
大模型建筑隐患管理方案怎么做?创邻科技用知识图谱、图数据库和企业AI大脑打通隐患问答、整改与推荐
人工智能·科技·知识图谱
蕤葳-10 分钟前
非编程背景学习AI的方法
人工智能
handsomestWei11 分钟前
scikit-learn数据预处理模块
python·机器学习·scikit-learn
北京耐用通信13 分钟前
不换设备、不重写程序:耐达讯自动化网关如何实现CC-Link IE转Modbus TCP的高效互通?
人工智能·科技·物联网·网络协议·自动化·信息与通信
计算机毕业设计指导13 分钟前
基于机器学习和深度学习的恶意WebURL检测系统实战详解
人工智能·深度学习·机器学习·网络安全
珂朵莉MM14 分钟前
第七届全球校园人工智能算法精英大赛-算法巅峰赛产业命题赛第3赛季优化题--多策略混合算法
人工智能·算法