机器学习概述自用笔记(李宏毅)

机器学习概述

机器学习即找一个复杂的人类写不出来的函数,把输入(向量,矩阵,序列)转换为输出。

regression:输出是一个数值(预测PM2.5的数值)

classification:选择设置好的类别(是否为垃圾邮件)

structured Lenrning:生成一个有结构的东西

机器学习的三步

假设求今天视频订阅的人数和昨天视频订阅的人数之间有什么关系。

第一步 Function:先设置一个y=wx+b叫做模型

第二步 Define Loss:误差损失L(b,w)

y=wx+b

频道订阅L(0.5k,1)y=1x+0.5k计算出预测值和label的差值e

第三步 optimization(最佳化)看看代入哪个数值可以使Loss最小

gradient descent : Loss-w曲线选取一个随机的w0,计算出w=w0时L对W微分,如果为负数增加W,如果为正数减少W,η走的步长自己设置(hyperparameter)W1=W0-η*L对W微分

最大的问题时微分为0的时候即看作找到了最佳的点,但是容易为Local minima ,找不到global minima(这种方法为假义的)

这三部叫做Training,只是在已知的数据集合上面去预测,统计2017年到2020年的频道订阅有周期性的原因,只考虑前一天的误差L=0.48k,考虑七天的误差L=0.38k

w为斜率,b为截距,这个函数恒为直线,但是现实情况下不一定是直线,这种限制叫Model Bias, 我们需要更复杂的方程来做模型,用多条曲线相加去拟合原来的直线

但是很多情况下原来的变化曲线很复杂,要用多条曲线去拟合相加,导致模型很复杂。甚至是原来的完美数据变化图是曲线,要用Sigmoid Function去拟合。

所以原来的相加拟合可以用这个来表示

用θ表示所有的未知数,然后去一个θ0求出η,计算出θ1,然后利用batch不断迭代,

Sigmoid---->ReLU:

两个ReLU叠起来可以代替一个Hard Sigmoid

用很多Sigmoid和ReLU即可构成Neuron,多个Neuron可以构成Neuron Netw(神经元网络),这一整套技术叫做Deep Learning

层数过多会发生Overfitting,在测试数据上表现好,在预测数据上表述的差

相关推荐
江华森几秒前
Git + Maven Java 项目部署实战全指南
运维·笔记·git·学习·maven
LLM精进之路1 分钟前
CVPR|Video-MME:判断模型“会不会看视频“的统一标尺
人工智能·深度学习·机器学习·计算机视觉·目标跟踪
古方路杰出青年1 分钟前
语音探秘:从波形到频谱,拆解清音、浊音、爆破音的声学DNA
人工智能·语音识别
咖啡星人k2 分钟前
长亭百智云:全新一代AI基础服务平台深度解读
大数据·人工智能·架构·rag·mcp·百智云
阿里云云原生3 分钟前
告别 30 分钟故障演练!ChaosBlade AI 让混沌工程像“聊天”一样简单
人工智能·阿里云·云原生·chaosblade
东坡肘子3 分钟前
稳定 > 新功能 -- 肘子的 Swift 周报 #138
人工智能·swiftui·swift
架构源启3 分钟前
Spring AI进阶系列(14)- 2026 可观测性最佳实践:从链路追踪到企业级 AI 治理落地
java·人工智能·spring
Anchenry4 分钟前
CoinTrail-智能Ai记账软件
人工智能·软件工程·软件需求
superantwmhsxx5 分钟前
ChatGPT Images 2.0 角色一致性实战:如何在多轮对话中保持人物形象统一
人工智能·chatgpt
悟乙己7 分钟前
在Netflix实现机器学习民主化:构建模型生命周期图
人工智能·机器学习