机器学习笔记-2

文章目录

  • [一、Linear model](#一、Linear model)
  • [二、How to represent this function](#二、How to represent this function)
  • [三、Function with unknown parameter](#三、Function with unknown parameter)
  • 四、ReLU
  • [总结、A fancy name](#总结、A fancy name)

一、Linear model

线性模型过于简单,有很大限制,我们需要更多复杂模式

蓝色是线性模型,线性模型无法去表示红色的那个线

所以线性模型有严重的局限性这被成为

Model Bias(模型偏差)

我们需要一个复杂的有位置参数的function

所有分段线性曲线=常数+多个分段线性函数的叠加

二、How to represent this function

用这个Sigmoid function来逼近这条蓝色的Hard Sigmoid function

例:

分别改变w,b,c

假设要写出红色的这条线

从简单模型到复杂模型

初始线性回归模型

引入非线性(sigmoid 函数):将模型扩展为使用 sigmoid 激活函数引入更多权重和偏移

多特征线性模型:在此基础上,模型扩展为多输入特征

多特征与非线性结合:非线性函数 sigmoid 被应用在多个输入特征的线性组合上

通过多个输入特征和权重计算激活函数

简化成矩阵

将线性加权求和的结果通过非线性激活函数进行转换。

最后输出计算

最后用线性代数得到式子

三、Function with unknown parameter

将神经网络中的所有权重和偏置统一为一个参数向量 𝜃,便于进行优化

ML框架

定Loss

新模型优化

通过梯度下降法优化模型参数 𝜃 来最小化损失函数L。

找到最优的𝜃使L值最小

四、ReLU

也可以用ReLU,将Sigmoid的地方换成ReLU

例:



总结、A fancy name

我们给这些起了一个好听的名字

Neuron

Neuron Network

Deep Learning

发展变化

相关推荐
2601_957786772 分钟前
AI 原生营销矩阵系统:底层安全架构与多模态内容生产技术实现
人工智能·矩阵·安全架构
沪漂阿龙2 分钟前
字节跳动大模型面试题深度拆解:项目深挖、SFT 与 RLHF、Claude Code、记忆机制、并发锁与手撕题全攻略
人工智能·面试
Jurio.9 分钟前
当 AI 不再只是对话:Codex app 的自动化功能
运维·人工智能·ai·自动化·codex
财经资讯数据_灵砚智能17 分钟前
基于全球经济类多源新闻的NLP情感分析与数据可视化(夜间-次晨)2026年5月14日
人工智能·python·信息可视化·自然语言处理·ai编程
跨境卫士—小依17 分钟前
低值包裹全面计税之后跨境卖家如何重做小额订单承接逻辑
大数据·人工智能·跨境电商·亚马逊·营销策略
沪漂阿龙22 分钟前
AI大模型面试题:大模型训练优化全解析——AdamW、Warmup、Annealing、Scaling Law、SFT、RLHF、拒绝采样、PPO 一文讲透
人工智能
五月底_22 分钟前
RAG、LangChain、SSL整理
人工智能
沪漂阿龙25 分钟前
面试题:大模型训练中的思维链 CoT 与长思维链冷启动详解——Chain-of-Thought、Long CoT、拒绝采样、STaR、自回归推理全解析
人工智能·数据挖掘·回归
k093325 分钟前
免费大语言模型API平台汇总指南(2026年最新)
人工智能·语言模型·自然语言处理
美狐美颜sdk30 分钟前
Android/iOS/鸿蒙美颜SDK开发指南:实时美颜与推流
人工智能·直播美颜sdk·视频美颜sdk·美颜api·美狐美颜sdk