下面是实践百度飞桨上面的pm2.5分类项目_logistic regression相关

part1:数据的引入,和前一个linear regression基本是一样

part2:数据解析------也就是数据的"规格化"

首先,打算用dataMat[]和labelMat[]数据存储feature和label,并且文件变量fr

然后,是这个for line in fr.readlines()循环,就是逐行的读取字符串到line中,

比如上面的那个data.txt中的数据,一行有3个数据用"\t"制表符进行分隔,结果就是这个3个数据作为curLine[]这个一维数组中的3个数据,

dataMat,存储的是[1.0,curline[0],curline[1]]作为元素的数组,总共15组

labelMat,存储的是curline[2]作为元素的数组,总共15组

part3:定义那个sigmoid function

part4:通过输入dataMat 和 labelMat作为 训练集,通过线性gradien descent计算出分割线的斜率

(1)具体的过程应该就是 如何通过训练集中的数据 计算出对应的 logistic regression的分割线的问题,详细可以参考李宏毅老师的 logistic regression相关的代码

(2)里面的alpha是学习率,可以通过设置不同的学习率和循环次数观察结果

part5:绘制出 需要测试的点的数据 并将label用颜色标出, 最后画出由训练集得到的 分割线

part6:调用上述定义的函数,并且得到最终的结果:

其实这个代码和data.txt给的一点也不好,

(1)它只有训练集,最终的结果也只是在训练集上做的测试

(2)data.txt看着有15组数据,其实只有5组,都是重复的,所以最终的图只有5个点

相关推荐
HyperAI超神经几秒前
【Triton 教程】triton_language.load
人工智能·学习·大语言模型·cpu·gpu·编程语言·triton
科士威传动5 分钟前
丝杆支撑座同轴度如何安装?
人工智能·科技·机器学习·自动化
2401_841495647 分钟前
【自然语言处理】中文 n-gram 词模型
人工智能·python·算法·自然语言处理·n-gram·中文文本生成模型·kneser-ney平滑
百***24378 分钟前
GPT5.1 vs Claude-Opus-4.5 全维度对比及快速接入实战
大数据·人工智能·gpt
腾讯云开发者20 分钟前
与 AI 共生,腾讯云携手行业专家共话数智驱动新质生长
人工智能
WLJT12312312331 分钟前
AI懂你,家更暖:重塑生活温度的智能家电新范式
人工智能·生活
roman_日积跬步-终至千里1 小时前
【计算机视觉(16)】语义理解-训练神经网络1_激活_预处理_初始化_BN
人工智能·神经网络·计算机视觉
AI营销实验室1 小时前
原圈科技AI CRM系统引领2025文旅行业智能升级新趋势
人工智能·科技
AI营销前沿1 小时前
私域AI首倡者韩剑,原圈科技领航AI营销
大数据·人工智能
咚咚王者1 小时前
人工智能之数学基础 概率论与统计:第一章 基础概念
人工智能·概率论