机器学习(day2)

监督学习

线性回归 (Linear Regression)

线性回归(Linear Regression)是机器学习中最基础且广泛应用的算法之一。

线性回归 (Linear Regression) 是一种用于预测连续值的最基本的机器学习算法,它假设目标变量 y 和特征变量 x 之间存在线性关系,并试图找到一条最佳拟合直线来描述这种关系。

复制代码
y = w * x + b

其中:

  • y 是预测值

  • x 是特征变量

  • w 是权重 (斜率)

  • b 是偏置 (截距)

线性回归的目标是找到最佳的 wb,使得预测值 y 与真实值之间的误差最小。

Housing price prediction

已知一个数据集,已知房子的平方英尺数,预测房子的价格。可以通过一条直线拟合数据,或者通过二次函数拟合数据。如何选择和如何决定用什么拟合数据会有更好的结果。

Supervised Learning"right answers" given →数据集包含正确答案,算法基于正确答案预测更多的正确答案

Regression: Predict continuous valued output (price) →回归问题:预测连续值输出

Breast cancer (malignant, benign)

已知一个数据集,已知肿瘤的大小,预测肿瘤是良性还是恶性的概率。

Classification: Discrete valued output (0 or 1) →分类问题:预测一个离散值输出

机器学习会有很多feature特征

Training set of housing prices

Nocation

m = Number of training examples →训练样本的数量

x's = "input" variable / features →输入变量 / 特征

y's = "output" variable / "target" variable →输出变量 / 目标变量

(x, y) = single training example →一个训练样本

(x(i), y(i)) = ith training example →第i个训练样本

Supervised learning algorithm work

training set → learning algorithm→hypothesis假设函数

h是一个映射x到y的函数

How do we represent h ?

hθ​(x)=θ0​+θ1​x

Linear regression with one variable. = Univariate linear regression →单变量线性回归

θi's: Parameters →模型参数

Cost function

How to choose θi's ?

1.选择能使h(x)也就是输入x时预测的值最接近该样本对应的y值的参数θ_0, θ_1

hθ(x) =θ0+θ1x

  • 找到参数θ0, θ1使得所有训练样本的h(x)预测值和y实际值之间的差的平方和最小化
  • m为训练样本的个数
  • 1/2m为了减少平均误差(只是为了使数学更加直白一点)

2.cost function代价函数J(θ_0, θ_1)也叫做squared error function平方误差函数

Formulation

Hypotheis:

hθ(x) =θ0+θ1x

Parameters:

θ0, θ1

Cost function:

Goal:

Simplified cost function

hθ(x)= θ1x(θ0= 0)

3.如果θ_0=0相当于选择了经过原点的假设函数(过点(0,0)的函数)

4.分别计算θ_1对应的J(θ_1)可以绘制出J(θ_1)的曲线

5.学习算法的优化目标是通过选择θ_1的值获得最小的J(θ_1)

Two parameters cost function

1.随着θ_0和θ_1的不断接近代价函数的中心,假设函数对数据的拟合越来越好

相关推荐
装不满的克莱因瓶几秒前
自然语言处理常见任务——从文本理解到生成式AI的完整任务体系
人工智能·pytorch·python·深度学习·ai·自然语言处理
朱大喜3 分钟前
AI 数据分析实战:大模型驱动的自动化报表生成,从数据到洞察的工程化链路
人工智能
wb0430720114 分钟前
阿明的二次创业——从阿明用 AI 开第二家店,看 AI 原生创业的四阶段方法论
大数据·人工智能·架构
Godspeed Zhao15 分钟前
Level 4自动驾驶系统设计0——功能与场景0
人工智能·机器学习·自动驾驶
Dola_Zou17 分钟前
边缘智能的“黑暗森林”:工业 AI 模型下沉的资产防护与变现密码
人工智能·安全·自动化·软件工程·软件加密
青岛前景互联信息技术有限公司18 分钟前
前景互联·新一代智能接处警系统:AI+大模型+Agent智能接处警一体化解决方案
大数据·人工智能·物联网
xin_yao_xin21 分钟前
Claude Code 安装与 DeepSeek-V4 模型配置(2026 最新)
人工智能·ai·大模型·deepseek·claude code
北京软秦科技有限公司21 分钟前
通用零部件来料材质证书智能把关,IACheck搭配AI报告审核通审Agent版比对订单与报告参数
人工智能·材质
Charlotte_jc25 分钟前
ai agent 真实项目开发工程实践
人工智能
CCC:CarCrazeCurator26 分钟前
大模型核心注意力机制技术深度报告:MHA、MQA、GQA 与 MLA 技术原理、性能对比与场景适配
人工智能·机器学习·自动驾驶·transformer