下面是实践百度飞桨上面的pm2.5分类项目_logistic regression相关

part1:数据的引入,和前一个linear regression基本是一样

part2:数据解析------也就是数据的"规格化"

首先,打算用dataMat[]和labelMat[]数据存储feature和label,并且文件变量fr

然后,是这个for line in fr.readlines()循环,就是逐行的读取字符串到line中,

比如上面的那个data.txt中的数据,一行有3个数据用"\t"制表符进行分隔,结果就是这个3个数据作为curLine[]这个一维数组中的3个数据,

dataMat,存储的是[1.0,curline[0],curline[1]]作为元素的数组,总共15组

labelMat,存储的是curline[2]作为元素的数组,总共15组

part3:定义那个sigmoid function

part4:通过输入dataMat 和 labelMat作为 训练集,通过线性gradien descent计算出分割线的斜率

(1)具体的过程应该就是 如何通过训练集中的数据 计算出对应的 logistic regression的分割线的问题,详细可以参考李宏毅老师的 logistic regression相关的代码

(2)里面的alpha是学习率,可以通过设置不同的学习率和循环次数观察结果

part5:绘制出 需要测试的点的数据 并将label用颜色标出, 最后画出由训练集得到的 分割线

part6:调用上述定义的函数,并且得到最终的结果:

其实这个代码和data.txt给的一点也不好,

(1)它只有训练集,最终的结果也只是在训练集上做的测试

(2)data.txt看着有15组数据,其实只有5组,都是重复的,所以最终的图只有5个点

相关推荐
amhjdx29 分钟前
星巽短剧以科技赋能影视创新,构建全球短剧新生态!
人工智能·科技
听风南巷1 小时前
机器人全身控制WBC理论及零空间原理解析(数学原理解析版)
人工智能·数学建模·机器人
美林数据Tempodata1 小时前
“双新”指引,AI驱动:工业数智应用生产性实践创新
大数据·人工智能·物联网·实践中心建设·金基地建设
电科_银尘2 小时前
【大语言模型】-- 私有化部署
人工智能·语言模型·自然语言处理
翔云 OCR API3 小时前
人工智能驱动下的OCR API技术演进与实践应用
人工智能·ocr
南方者4 小时前
重磅升级!文心 ERNIE-5.0 新一代原生全模态大模型,这你都不认可它吗?!
人工智能·aigc
庄周迷蝴蝶4 小时前
旋转位置编码(Rotary Position Embedding,RoPE)
人工智能·机器学习
xier_ran4 小时前
深度学习:RMSprop 优化算法详解
人工智能·深度学习·算法
大千AI助手4 小时前
Prefix-Tuning:大语言模型的高效微调新范式
人工智能·神经网络·自然语言处理·llm·prefix-tuning·大千ai助手·前缀微调
雾江流4 小时前
RikkaHub 1.6.11 | 开源的本地大型语言模型聚合应用,支持多种AI服务提供商
人工智能·语言模型·自然语言处理·软件工程