【无标题】

1. 【机器学习】机器学习笔记(吴恩达)-CSDN博客

  1. 误差平方代价函数,对于大多数问题,特别是回归问题,都是一个合理的选择。

  2. 梯度下降会自动采取更小的步骤,所以不需要随时间减小学习率a。

  3. 在梯度下降算法中,如果学习率太大,loss不是来回震荡,而是爆炸。如下图:在第二种情况中,如果学习率太大,参数更新超过了最小值点,由于学习率的放大作用,loss到了更高的一点,基于这点的偏导数,乘以放大的学习率,会反向跳到更大的loss处。所以,学习率太大,最终的loss不是震荡,而是爆炸。


4. 解决过拟合问题

降低特征数量:手动选择或者模型自动选择特征

正则化:保留特征,但是降低参数的幅值。

相关推荐
DisonTangor30 分钟前
【小红书拥抱开源】小红书开源大规模混合专家模型——dots.llm1
人工智能·计算机视觉·开源·aigc
浠寒AI2 小时前
智能体模式篇(上)- 深入 ReAct:LangGraph构建能自主思考与行动的 AI
人工智能·python
weixin_505154463 小时前
数字孪生在建设智慧城市中可以起到哪些作用或帮助?
大数据·人工智能·智慧城市·数字孪生·数据可视化
Best_Me073 小时前
深度学习模块缝合
人工智能·深度学习
YuTaoShao3 小时前
【论文阅读】YOLOv8在单目下视多车目标检测中的应用
人工智能·yolo·目标检测
算家计算3 小时前
字节开源代码模型——Seed-Coder 本地部署教程,模型自驱动数据筛选,让每行代码都精准落位!
人工智能·开源
伪_装3 小时前
大语言模型(LLM)面试问题集
人工智能·语言模型·自然语言处理
gs801404 小时前
Tavily 技术详解:为大模型提供实时搜索增强的利器
人工智能·rag
music&movie4 小时前
算法工程师认知水平要求总结
人工智能·算法
量子位4 小时前
苹果炮轰推理模型全是假思考!4 个游戏戳破神话,o3/DeepSeek 高难度全崩溃
人工智能·deepseek