实践-传统深度学习

简介与安装

  • [2 训练自己的数据集整体流程](#2 训练自己的数据集整体流程)
  • [3 数据加载与预处理](#3 数据加载与预处理)
  • [4 搭建网络模型](#4 搭建网络模型)
  • [5 学习率对结果的影响](#5 学习率对结果的影响)
  • [6 Drop-out操作](#6 Drop-out操作)
  • [7 权重初始化方法对比](#7 权重初始化方法对比)
  • [8 初始化标准差对结果的影响](#8 初始化标准差对结果的影响)
  • [9 正则化对结果的影响](#9 正则化对结果的影响)
  • [10 加载模型进行测试](#10 加载模型进行测试)

TensorFlow:每一步都需要自己做。

Keras:做起来更轻松。任务简单化。

构建代码中使用起来是不一样的。

Caffe适合做图像识别,只有卷积网络,不适合自然语言处理,更新的慢,很多网络没有。

TensorFlow:所有的东西亲力亲为。

Keras:用起来简单,上手非常快。用TensorFlow当做他执行的一个后端。

2 训练自己的数据集整体流程

3 数据加载与预处理

4 搭建网络模型

5 学习率对结果的影响

6 Drop-out操作

7 权重初始化方法对比

用截断高斯分布

8 初始化标准差对结果的影响

9 正则化对结果的影响


10 加载模型进行测试

目前迭代了200次

相关推荐
边缘计算社区1 小时前
英伟达 GTC 2025观察:边缘计算的新机遇与AI革命的下一个十年
人工智能·边缘计算
努力犯错1 小时前
开源视觉语言模型MiniMax-VL-01:动态分辨率+4M超长文本,性能比肩GPT-4o
人工智能·语言模型·自然语言处理
量子位1 小时前
AMD 跑 DeepSeek 性能超 H200!128 并发 Token 间延迟不超 50ms,吞吐量达 H200 五倍
人工智能·deepseek
K线引力场1 小时前
如何通过 iTick 外汇数据 API 与 Cursor AI 实现量化策略开发
人工智能·开源
寻丶幽风1 小时前
论文阅读笔记——MTGS: Multi-Traversal Gaussian Splatting
论文阅读·人工智能·笔记·自动驾驶·模拟器·多轨迹驾驶场景
量子位1 小时前
DeepSeek V3“小版本升级” 实测堪比 V3.5,非推理模型也有 “啊哈时刻”,7 米甘蔗过 2 米门想通了
人工智能·deepseek
Chaos_Wang_2 小时前
NLP高频面试题(十一)——RLHF的流程有哪些
人工智能·深度学习·自然语言处理
机器之心2 小时前
Uni-3DAR用自回归统一微观与宏观的3D世界,性能超扩散模型256%,推理快21.8倍
人工智能
不加冰的红茶要热的2 小时前
【机器学习】什么是逻辑回归?
人工智能·机器学习·逻辑回归
即安莉2 小时前
OPENCV数字识别(非手写数字/采用模板匹配)
人工智能·opencv·计算机视觉