唐宇迪2025最新机器学习课件——学习心得(1)

今天是10.21日,开始学习

这里推导了求似然函数,推导到最后让似然函数置零,得到最小二乘解,相当于构建了问题和问题的求解方向

下一步,需要用某个解法去更新他,不能求出来一个值就完事了,还要找到让目标函数最优的那个theta,即下图的梯度下降

批量下降和随机下降的区别就是运算量的区别,避免了m个样本数量过大带来计算量过大的问题,这么说,小样本是否是可以用枚举来满足目标函数最小的?

步长就是学习率

这里也侧面帮助理解梯度下降的本质其实就是一个搜索策略,每次将自变量往梯度的方向求解计算,然后直到目标函数不怎么变化

利用一个较小的值就可以约束目标函数的变化,就判断为收敛,比如设置一个阈值tolerance=1e-6

复制代码
# 检查是否收敛
        if abs(prev_loss - current_loss) < tolerance:
            no_improvement_count += 1
        else:
            no_improvement_count = 0
相关推荐
Jing_Rainbow2 分钟前
【AI-9/Lesson30(2025-11-12)】AI + Vibe Coding:Hulk 浏览器扩展开发全解析 —— 从需求文档到实战的完整指南🌈
前端·人工智能·程序员
Cisyam^5 分钟前
Bright Data AI Scraper Studio:一句话生成企业级爬虫
人工智能·爬虫
EasyCVR17 分钟前
视频汇聚平台EasyCVR助力农场实现全场景可视化管理
大数据·人工智能·音视频
阿里云大数据AI技术21 分钟前
Fusion 引擎赋能:七猫如何使用阿里云 EMR Serverless Spark 实现数仓加速
人工智能
fengfuyao98522 分钟前
MATLAB实现全景拼接
人工智能·计算机视觉·matlab
好游科技26 分钟前
语音语聊系统开发深度解析:WebRTC与AI降噪技术如何重塑
人工智能·webrtc·交友·im即时通讯·社交软件·社交语音视频软件
西格电力科技30 分钟前
源网荷储与碳中和:推动能源清洁转型的关键路径
大数据·人工智能·分布式·系统架构·能源
HyperAI超神经30 分钟前
在线教程丨30毫秒处理100个检测对象,SAM 3实现可提示概念分割,性能提升2倍
人工智能·计算机视觉·ai·图像分割·sam 3
Study9961 小时前
科普专栏|大语言模型:理解与生成语言的人工智能
人工智能·深度学习·机器学习·大模型·agent·大模型微调·大模型应用开发
xixixi777771 小时前
CRNN(CNN + RNN + CTC):OCR识别的经典之作
人工智能·rnn·学习·架构·cnn·ocr·图像识别