【ESP32】手势识别实现笔记：红外温度阵列 | 双三次插值 | 神经网络 | TensorFlow

一、开发环境搭建与新建工程模板
二、驱动移植与应用开发
- 2.1、I2C驱动移植与AMG8833应用开发
- 2.2、SPI驱动移植与LCD应用开发
- 2.3、绘制温度云图
- 2.4、启用PSRAM（可选）
- 2.5、画面动静和距离检测
- [2.6、图像放大之双三次插值法：权重计算 | 插值计算 | 程序设计](#2.6、图像放大之双三次插值法：权重计算 | 插值计算 | 程序设计)
四、数据集获取
五、CNN模型训练
- [5.1、环境配置：Anconda3 | TF2.1.0 | Pycharm](#5.1、环境配置：Anconda3 | TF2.1.0 | Pycharm)
- [5.2、生成数据集 | 预处理](#5.2、生成数据集 | 预处理)
- - [5.2.1、生成数据集：统计数据集 | 数据集随机化 | 数据集划分](#5.2.1、生成数据集：统计数据集 | 数据集随机化 | 数据集划分)
  - [5.2.2、预处理：string类型转换为float | 数据标准化 | one-hot encoding](#5.2.2、预处理：string类型转换为float | 数据标准化 | one-hot encoding)
- 5.3、构建训练模型
- 5.4、训练结果保存和准确率
- 5.5、ONNX模型转换和校准集导出
六、模型量化与部署
- 6.1、模型量化
- 6.2、ESP-DL组件添加
- [6.3、ESP 数据标准化（网络输入）](#6.3、ESP 数据标准化（网络输入）)
- 6.4、构建模型与优化
- 6.5、ESP硬件加速：修改sdkconfig配置
七、应用逻辑设计
- [7.1、获取静止状态手势 | 定时器引入](#7.1、获取静止状态手势 | 定时器引入)
- 7.2、交互方式选择：交互方式1
- 7.3、交互方式选择：交互方式2
八、others
- 8.1、跑一下示例程序（MNIST）
- 8.2、数据集补充程序

开发板 ：ESP32-S3-DevKitC-1（ESP32-S3-WROOM-1-N16R8模块）
开发软件 ：VS Code(Espressif IDF插件) + Anaconda3 + PyCharm
开发框架 ：ESP-IDF (版本v5.0.4)
训练框架 ：TensorFlow 2.1.0
部署框架 ：ESP-DL

💡💡💡💡：在STM32上跑神经网络做手势识别 🚀

🌎 仓库：https://gitee.com/npc-gitee/esp_dl_for_bixin 🚀

🔍 如理解有误，望不吝指正，感谢。

📍说明：

不同手势姿态之间需要具有明显的不同，在使用过程中，手势姿态需要做到位；（可能数据集不足）
影响体表温度的因素比较多，由于影响因素的变化，存在部分位置接近环境温度情况，所以即使加入了数据标准化，依然存在推理不准问题；（可能数据集不足）
在使用测试中，某个动作出现判断出错，可以将该动作添加到数据集中，在上一次权重文件基础上再训练，修修补补；
距离传感器较远，细节难以捕捉，不同手势差异较小，已经无法通过增加数据集来提高预测正确率；
该数据集动作主要在中心位置，所以使用过程中动作保持在中心；
本示例通过分类任务实现手势识别，如果出现新的手势类别，预测结果就很迷，采用RNN、LSTM等的方式，使用效果应该会较好。

一、开发环境搭建与新建工程模板

1.1、开发环境搭建与卸载

考虑 ESP-DL 库所支持的版本为 ESP-IDF v5.0，所以这里安装的不是最新版本。

在安装 VS Code插件 (Espressif IDF) 后，可以选择两种安装方式：

在线安装+自动配置 🚀
离线安装+手动配置 🚀 （该教程使用的编译操作为 cmd 的方式）

这里采用离线安装+手动配置（VS Code下完成程序编辑和编译操作） 💡。

① ESP-IDF 开发环境搭建：

下载ESP-IDF离线版本：ESP-IDF Windows Installer Download 🚀
离线安装 ESP-IDF，安装完成后，安装路径下有三个重要的目录；
- frameworks/esp-idf-v5.0.4：内含示例代码和组件源代码等；
- tools：编译器等程序；
- python_env/idf5.0_py3.11_env：python虚拟运行环境，内含python.exe、pip.exe以及依赖的库等。
打开 VS Code，安装插件 Espressif IDF;
VS Code 手动配置；
a) 打开vscode左侧的插件管理页 => 找到espressif idf => 点击该插件旁边的小齿轮 => 扩展设置，就能看到 ESP-IDF 的配置属性；
b) 将路径信息添加到这些变量中：Custom Extra Paths、Custom Extra Vars、Esp Idf Path Win、Esp Idf Path Win、Git Path、Python Bin Path、Tools Path Win；（参考：esp32 开发环境：windows10 + esp-idf v4.4 + vscode + 插件 espressif idf 搭建踩坑 🚀）
重启一下VS Code。

② 打开一个Example进行测试：

按住Ctrl+Shift+p打开命令行，这里输入ESP-IDF show ，点击 ESP-IDF: Show Eaxmples Projects，点击需要使用的 ESP-IDF 路径；
左边栏中选择 hello word 工程，点击 Create project using example hello_world。

选择这个项目的保存路径，任意路径均可；
烧录过程配置；

COM 口的配置，选择对应的COM口；

ESP32芯片选择，这里选ESP32s3；

烧录方式选择串口转USB： ESP32-S3 chip(via ESP-PROG)

设置波特率：File => Preferences => Settings => 输入ESP-IDF，然后往下滑找到 Flash Baud Rate，输入115200。（波特率不同，会导致终端输出乱码）

点击编译，成功后就可以进行烧录了。

③ 卸载ESP-IDF： 控制面板 => 卸载程序 => ESP-IDF Tools Offline 5.0.4 右键卸载。（VS Code 下的配置直接重置就好）

1.2、新建工程目录

打开VS Code，此时界面可能是很干净，没有打开项目；这里需要随便打开一个目录（不然第二步操作完发现没响应）；
按住Ctrl+Shift+p打开命令行，输入ESP-IDF: Create project from extension template，点击；然后就按照提示操作就可以了；
选择项目保存目录；
这里选择template-app，接着就弹出了一个新的VS Code界面，关掉前一个VS Code界面；
这时候指定目录下就有一个生成的文件夹，修改文件夹名称，方便以后管理（该操作不影响编译）；
打开该目录根目录下的 CmakeLists.txt，将 project(template-app) 修改为 project(xxx)，这样之后生成的可执行文件的名称就是xxx.bin，而不是 template-app.bin。点击一下编译查看是否有问题。

1.3、自定义组件

到这一步就可以开发了，为了项目条理更加清晰，还需要引入【自定义组件】。

一般而言，自定义组件可以简单理解为一个目录，里面存放一些功能函数，提供给main函数进行调用。

打开 ESP-IDF 5.0 CMD 终端，切换到待创建的目录，输入idf.py -C components create-component led；（当然可以手动创建目录和文件）

components ：创建的组件(目录)，位于那个目录下，如果没有这个目录就创建，Cmake管理默认的目录名称叫 components，如果起了其它名称，需要用 EXTRA_COMPONENT_DIRS 变量进行说明。

在所在项目根目录下的CmakeLists.txt 中加入这条语句：set(EXTRA_COMPONENT_DIRS ./新名字)

led：组件的名称。

生成后项目目录树如下：

c 复制代码

---Test
    |---.devcontainer
    |---.vscode
    |---build
    |---CMakeLists.txt
    |---sdkconfig
    |---components
            |---led
                 |---include
                        |---led.h
                 |---CmakeLists.txt
                 |---led.c
            |---key
                 |---include
                        |---key.h
                 |---CmakeLists.txt
                 |---key.c
     |---main
           |---CmakeLists.txt
           |---main.c

将组件中的头文件添加到main.c中，这样就可以进行编译了。
如果led组件需要key组件的函数，则：
- led.h 中加入 #include "key.h"
- 方式一：led 组件中的 CmakeLists.txt 中加入头文件路径：INCLUDE_DIRS "include" "../key/include"（注意这里可是没指定链接路径，但还是能找到）
- 方式二：led 组件中的 CmakeLists.txt 中加入依赖组件：REQUIRES driver key（这里led依赖两个组件：driver和key）
在 IDF 5.0 的版本之后，driver 组件不作为公共依赖项，所以使用的时候，必须在 CmakeLists.txt 中声明依赖 driver 组件后才能使用：

c 复制代码

idf_component_register(SRCS "led.c"
                    INCLUDE_DIRS "include"
                    REQUIRES driver)

如果没有添加这个组件，则会报错：driver/gpio.h: No such file or directory 🚀
REQUIRES 和 PRIV_REQUIRES 的区别：组件依赖示例 🚀

参考：

Conv2d的输入需要 4 维数据，所以预处理数据导出为[24, 24, 1]，当训练的时候，经过数据集batch，Conv2d输入的数据为[b, 24, 24, 1]，其中 b 就是 batch 的值。

参考：卷积计算输入要求 🚀

5.3、构建训练模型

模型参考：我复现了稚晖君的热成像手！语！识！别！ 🚀

python 复制代码

conv_layers = [
    # kernel_size:3x3, 卷积核个数:4
    layers.Conv2D(4, input_shape=(24, 24, 1), kernel_size=[3, 3], padding="valid", activation=tf.nn.relu),  # [b, 24, 24, 1] => [b, 22, 22, 4]
    layers.MaxPool2D(pool_size=[2, 2], strides=2, padding='valid'),  # [b, 22, 22, 4] => [b, 11, 11, 4]
    layers.Flatten(),  # [b, 11, 11, 4] => [b, 484]
    layers.Dense(128, activation=tf.nn.relu),  # [b, 484] => [b, 128]
    layers.Dense(64, activation=tf.nn.relu),  # [b, 128] => [b, 64]
    layers.Dense(4, activation=tf.nn.softmax),  # [b, 64] => [b, 4]
]

def main():
    print(tf.__version__)
    train_images, train_labels, train_table = load_gesture('.\\dataset', 'train')
    val_images, val_labels, val_table = load_gesture('.\\dataset', 'val')

    train_db = tf.data.Dataset.from_tensor_slices((train_images, train_labels))
    train_db = train_db.map(preprocess).batch(300)

    val_db = tf.data.Dataset.from_tensor_slices((val_images, val_labels))
    val_db = val_db.map(preprocess).batch(300)

    # [b, 24, 24, 1] => [b, 4]
    network = Sequential(conv_layers)

    # network.build(input_shape=[None, 24, 24, 1])
    network.compile(optimizer=optimizers.Adam(lr=1e-4), # Adam优化器配置
                    loss=tf.losses.CategoricalCrossentropy(from_logits=False),  # 损失函数: 交叉熵
                    metrics=['accuracy'])  #  准确率计算

	# 打印网络信息
    network.summary()

	# 模型训练和验证
    network.fit(train_db, epochs=200, validation_data=val_db, validation_freq=1)

构建模型的时候，输入张量设置方式有多种，上面的是直接在模型conv_layers 中添加，或者可以使用model.build(input_shape=[None, 24, 24, 1])，这两种方式存在一定的差异，至少在ONNX模型转换的时候，第二种方式会报错：'Sequential' object has no attribute 'output_names'；并且二者的ckpt权值文件也是不通用的，提示：Shapes (128,) and (64,) are incompatible。

5.4、训练结果保存和准确率

在构建模型的基础上，添加权值保存语句：