Deep Learning(wu--46)

文章目录

Contents

Begin

Basic

逻辑回归





SGD


导数



计算图(反向传播)




向量化



广播



numpy

Neural Network



1\]上标表示第几层 (i)上标表示第几个样本![](https://file.jishuzhan.net/article/1728961347351220225/8b3af677bfcb1fc0815270ab7b9dfed8.webp) ![](https://file.jishuzhan.net/article/1728961347351220225/df0ed50ceb2ec227cc8569143799d02c.webp) ![](https://file.jishuzhan.net/article/1728961347351220225/2ce322d43de0cd8474c2477f1866aeb5.webp) ![](https://file.jishuzhan.net/article/1728961347351220225/748f6780bbe7100bc750c0004c54f921.webp) ### 向量化 ![](https://file.jishuzhan.net/article/1728961347351220225/faa78dd646bea9f43587c5b63d6998dc.webp) ![](https://file.jishuzhan.net/article/1728961347351220225/ef33433e05af791bedfc4425e68e59bd.webp) ![](https://file.jishuzhan.net/article/1728961347351220225/7ed25cd2ff2f11cda57e783e826ec087.webp) ### 激活函数 ![](https://file.jishuzhan.net/article/1728961347351220225/8e7feacc0aecd473268576affb6f108c.webp) ![](https://file.jishuzhan.net/article/1728961347351220225/aaab212a2a80dfffc61d42d16e3c58d5.webp) ![](https://file.jishuzhan.net/article/1728961347351220225/4ae0765d2d17add425e28fb5cdd7fc40.webp) 隐层使用的激活函数必须是非线性的(除机器学习中的回归问题),否则毫无意义,因为多层线性操作等价于一层线性操作 ![](https://file.jishuzhan.net/article/1728961347351220225/f48a7efc3b4fe1b65b77f60cfe0754ae.webp) ![](https://file.jishuzhan.net/article/1728961347351220225/e60121616c0c7c17327d4afa34a2e6cb.webp) ![](https://file.jishuzhan.net/article/1728961347351220225/5a551357961808859eb18bea032f07d6.webp) ### 梯度下降 ![](https://file.jishuzhan.net/article/1728961347351220225/d66bc8f6e309e33a1a02fd69555664e0.webp) ![](https://file.jishuzhan.net/article/1728961347351220225/97b6ea42407eb0527b96ad6418958990.webp) ![](https://file.jishuzhan.net/article/1728961347351220225/edc89f983e5645da324d042e48f09656.webp) ![](https://file.jishuzhan.net/article/1728961347351220225/2c6d62b90f007292be8b7b687adfe5f2.webp) ![](https://file.jishuzhan.net/article/1728961347351220225/caa48b636056585fd182935f799cb10f.webp) ![](https://file.jishuzhan.net/article/1728961347351220225/357789f85e99474af22d5ff2c01c7ef2.webp) ![](https://file.jishuzhan.net/article/1728961347351220225/b36a30bb425ac91ef07e996dc5b901d7.webp) ### 深层表示 ![](https://file.jishuzhan.net/article/1728961347351220225/1025cbee874088a8d6a59f009e4e716b.webp) ### 反向传播 ![](https://file.jishuzhan.net/article/1728961347351220225/a1746613db93a98bbab3ca2b5c947d47.webp) ![](https://file.jishuzhan.net/article/1728961347351220225/920e8eda87df0ca6fb59c5953218edb4.webp)

相关推荐
Jackilina_Stone2 小时前
transformers:打造的先进的自然语言处理
人工智能·自然语言处理·transformers
2401_897930062 小时前
BERT 模型是什么
人工智能·深度学习·bert
风筝超冷3 小时前
GPT - 多头注意力机制(Multi-Head Attention)模块
gpt·深度学习·attention
最新快讯4 小时前
科技快讯 | 阿里云百炼MCP服务上线;英伟达官宣:CUDA 工具链将全面原生支持 Python
人工智能
__Benco5 小时前
OpenHarmony子系统开发 - 热管理(一)
人工智能·harmonyos
吴法刚6 小时前
14-Hugging Face 模型微调训练(基于 BERT 的中文评价情感分析(二分类))
人工智能·深度学习·自然语言处理·分类·langchain·bert·langgraph
碳基学AI6 小时前
北京大学DeepSeek内部研讨系列:AI在新媒体运营中的应用与挑战|122页PPT下载方法
大数据·人工智能·python·算法·ai·新媒体运营·产品运营
是店小二呀6 小时前
Llama 4革命性发布与绿色AI前沿研究
人工智能·llama
2301_799755346 小时前
文件内容课堂总结
人工智能
杰克逊的日记7 小时前
AI集群设计
人工智能·ai·gpu·ai集群·pytorach