Datawhale X 李宏毅苹果书 AI夏令营 入门 Task1-机器学习

目录

机器学习基础

机器学习:机器具备有学习的能力/让机器具备找一个函数的能力。比如语音识别、图像识别、

机器学习有不同的类别。

1)回归:假设要找的函数的输出是一个数值/标量,这种机器学习的任务称为回归。

2)分类:分类任务要让机器做选择题。人类先准备好一些选项,这些选项称为类别。

3)结构化学习:机器不只是要做选择题或输出一个数字,而是产生一个有结构的物体,比如让机器画一张图,写一篇文章。这种叫机器产生有结构的东西的问题称为结构化学习。

案例分析-视频的点击次数预测

机器学习流程

1)构建模型

写出一个带有未知参数的函数(模型),用于预测未来观看次数。

例如, y = b + w x 1 y = b + wx_1 y=b+wx1,其中 y 是预测的观看次数, x 1 x_1 x1 是前一天的观看次数,b 和 w 是未知参数。

其中,带有未知的参数的函数称为模型。特征 x 1 x_1 x1是这个函数里面已知的,而 w 跟 b 是未知的参数。w 称为权重,b 称为偏置。

2)定义损失函数

损失函数用于评估模型预测值与实际值之间的差异。

例如,如果 b = 500 和 w = 1,则预测函数为 y = 500 + x 1 y = 500 + x_1 y=500+x1。

计算每一条记录的预测值与实际值之间的差距,并求平均值得到损失。

3)最优化

使用梯度下降算法来调整模型参数,以最小化损失函数。

初始参数随机选取,然后根据损失函数的梯度来更新参数。

更新规则为: w 1 ← w 0 − η ∂ L / ∂ w ∣ w = w 0 w1 ← w0 - η ∂L/∂w | w=w_0 w1←w0−η∂L/∂w∣w=w0,其中 η 是学习率。

梯度下降过程中可能遇到局部最小值,但这通常不是一个严重的问题。

4)结果

在训练数据上找到了最佳参数 w* = 0.97, b* = 100。

使用这些参数得到的平均误差约为 480。

在未见过的数据上(2021年的数据),模型的误差为 0.58。

相关公式

1.模型公式:

2.损失函数

3.参数更新

相关推荐
70asunflower2 分钟前
从Token到芯片:AI推理时代的效率竞争与市场逻辑
人工智能
xrgs_shz7 分钟前
MATLAB 纹理特征提取:一文读懂 graycomatrix 与 graycoprops
人工智能·计算机视觉·matlab
BlockChain88811 分钟前
AI+区块链深度探索:算法与账本的共生时代
人工智能·算法·区块链
生成论实验室21 分钟前
《源·觉·知·行·事·物:生成论视域下的统一认知语法》第一章 源:不可言说的生成之源
人工智能·科技·算法·生活·创业创新
jinglong.zha26 分钟前
AI萌宠短剧实战:从0孵化动物IP,用AI制作爆款短视频
人工智能·ai·音视频·网赚教程·萌宠
AI医影跨模态组学31 分钟前
如何将CT影像语义特征与肝癌术后辅助TACE获益相关的免疫抑制性肿瘤微环境建立关联,并进一步解释其与预后、PA-TACE治疗响应的机制联系
人工智能·深度学习·论文·医学·医学影像·影像组学
汤姆yu35 分钟前
OpenAI GPT-5.5 全面详解与使用
人工智能·openai
xcbrand36 分钟前
政府事业机构品牌策划公司哪家可靠
大数据·人工智能·python
逻辑君37 分钟前
认知神经科学研究报告【20260020】
人工智能·神经网络·机器学习
2zcode1 小时前
基于低光照增强与轻量型CNN道路实时识别算法研究(UI界面+数据集+训练代码)
人工智能·算法·cnn·低光照增强·自动驾驶技术