Linux52：ROCKX+RV1126实现1-＞N人脸识别功能

1．Rockx+Rv1126实现1->N 人脸识别功能大体流程

上图是实现1->N人脸识别流程，首先要初始化RV1126模块初始化，包括VI模块、VENC模块、人脸检测rockx模块、人脸识别rockx模块，初始化模块之后，就要分两个线程做处理。

主流程是先读取单张图片的图像并提取人脸特征值，然后死循环获取VI的码流数据，然后用rockx的人脸检测模块RV1126的VI数据是否有人脸，如果有人脸则调用rockx的人脸识别模块识别出RV1126视频流的人脸数据并且提取出来。然后对比两个人脸的阈值，如果<=1.0，则认定单张人脸图片和RV1126检测的人脸是同一个，否则就不是同一个人，并把数据通过Opencv显示到VI数据，最后把识别后的VI数据传输到VENC编码器里面

get_rockx_face_recg_venc_thread线程主要是获取每一帧的VENC码流数据，并且保存起来。

2.Rockx+Rv1126实现1->N 人脸识别功能代码截图

2.1. RV1126 模块的初始化并启动 VI 工作

上图是RV1126模块的初始化，这里需要初始化RV1126的VI模块、VENC模块、并调用RK_MPI_VI_StartStream启动VI模块采集摄像头数据。具体的API不讲解了，因为之前已经讲了很多次。

2.1. 初始化人脸检测和人脸识别的 rockx 模块

上图是rockx模块的初始化，这里我们要初始化两个rockx模块，分别是人脸检测rockx模块和人脸识别rockx模块。首先要使用rockx_create_config 分配rockx_config_t结构体，并使用rockx_add_config 把对应的rockx路径配置进去，在我们的板子里面在**/userdata/rockx_data**里面。

使用rockx_create创建人脸检测rockx_handle_t句柄。rockx_create的传参第一个参数rockx_handle_t结构体指针、第二个参数rockx_module_t是ROCKX_MODULE_FACE_DETECTION_V2 ， ROCKX_MODULE_FACE_DETECTION_V2是人脸检测的Version2模块、第三个参数是rockx_config_t结构体指针、第四个参数默认是0。

使用rockx_create创建人脸识别rockx_handle_t句柄。rockx_create的传参第一个参数rockx_handle_t结构体指针、第二个参数rockx_module_t是ROCKX_MODULE_FACE_RECOGNIZE ， ROCKX_MODULE_FACE_RECOGNIZE是人脸识别模块、第三个参数是rockx_config_t结构体指针、第四个参数默认是0。

2.2. 读取单张人脸的图像并提取特征值

用rockx_image_read 读取单张人脸图像，face_02.jpg这张图片是我上节课拍照的图片，并且用rockx_face_recognize 提取单张图片的人脸特征值，第一个参数传值：人脸识别的句柄(face_reco_handle )，第二个参数传值：单张人脸的rockx_image_t数据地址(&single_face_image )，第三个参数传值：获取单张人脸的人脸特征(&single_face_feature )。

2.3. 获取每一帧 VI 视频数据并提取 VI 数据的人脸特征值

首先初始化rockx_image_t结构体，包括

width(WIDTH=1920),height(HEIGHT=1080),pixel_format(ROCKX_PIXEL_FORMAT_YUV420SP_NV12)。使用RK_MPI_SYS_GetMediaBuffer 获取每一帧VI数据，并且把每一帧VI数据赋值到rockx_image_t **，**这里关键要赋值的是data(data =(uint8_t *)RK_MPI_MB_GetPtr(mb) )和size(size = RK_MPI_MB_GetSize(mb))。

赋值后，就调用rockx_face_detect 对每一帧的视频数据进行人脸检测，如果rockx_object_array_t 的count大于0**(face_detect_array.count)** ，则说明检测到人脸。若检测到人脸则调用rockx_face_recognize提取VI摄像头的人脸特征值，第一个参数传值：人脸识别的句柄(face_reco_handle )，第二个参数传值：rv1126的图像数据地址(&rv1126_video_image )，第三个参数传值：获取rv1126视频流的人脸特征(&rv1126_face_feature)

2.4. 对比单张图片的人脸特征值和 VI 数据的人脸特征值

提取完单张图片特征值和RV1126视频流的人脸特征值后就要对比两个特征值的相似度了，在rockx框架提供了rockx_face_feature_similarity 去对比两个脸特征值。第一个参数传值：单张人脸的特征结构体指针(&single_face_feature ), 第二个参数：rv1126视频流人脸特征结构体指针(&rv1126_face_feature )，第三个参数：两个人脸对比输出的相似度阈值similarity(&similarity)。

如果输出的人脸相似度值<=1.0(1.0是rockx比较经典的人脸识别阈值, 值越小相似度越高)，则说明单张人脸和视频流的人脸是同一个人，然后把"Harry"输出到string , 否则就不输出。

2.5. 把识别的人脸名称输出到 opencv 的 Text

上述步骤已经得到了对比的人脸名称，这一步则需要把人脸的名称输出到OPENCV里面，并显示到视频上。首先要创建OPENCV的矩阵Mat rv1126_mat = Mat(HEIGHT,WIDTH,CV_8UC1,rv1126_video_image.data), 第一个参数： HEIGHT(1080), 第二个参数 HEIGHT(1920), 第三个参数： CV_8UC1( 单通道 ), 第四个参数： rv1126_video_image.data( 每一帧的 rv1126 的 VI 数据 ).

创建完矩阵后，则需要调用OPENCV的putText把人脸名称输出到Mat矩阵里面。具体的如下：putText(rv1126_mat,reco_name,text_point,FONT_HERSHEY_COMPLEX,1.0,Scalar(255,0,255),1) ，第一个参数： rv1126_mat(Mat 矩阵数据 ) ，第二个参数： reco_name( 人脸名称的 string 字符串 ) ，第三个参数： text_point( 坐标信息 ,x 轴 =300,y 轴 -300), 第四个参数： FONT_HERSHEY_COMPLEX( 字体类型 ) ，第五个参数： 1.0( 字体大小是 1.0) ，第六个参数： Scalar(255,0,255)( 颜色标量 ) ，第七个参数： 1( 粗细程度是 1)

2.6. 把处理后的数据传输到 VENC 编码器

上述识别工作完成之后，就需要把VI数据传输到VENC编码器里面。这里直接调用**RK_MPI_SYS_SendMediaBuffer(RK_ID_VENC, VENC_CHN, mb)**去发送。

2.7. 开启 get_rockx_face_recg_venc_thread 线程获取每一帧 VENC 数据并且保存到 H264

上图是创建一个get_rockx_face_recg_venc_thread 线程，在这个线程里面通过**RK_MPI_SYS_GetMediaBuffer(RK_ID_VENC, VENC_CHN, -1)**获取每一帧VENC码流，并且用fwrite写到face_reco.h264文件里面。

最终的运行效果：

上图就是程序运行的效果，在这个H264里面，可以识别到我的人脸名称，并且显示出来。

3.代码

cs 复制代码

/****************************************************************************
 *
 *    Copyright (c) 2017 - 2019 by Rockchip Corp.  All rights reserved.
 *
 *    The material in this file is confidential and contains trade secrets
 *    of Rockchip Corporation. This is proprietary information owned by
 *    Rockchip Corporation. No part of this work may be disclosed,
 *    reproduced, copied, transmitted, or used in any way for any purpose,
 *    without the express written permission of Rockchip Corporation.
 *
 *****************************************************************************/
#include <assert.h>
#include <fcntl.h>
#include <getopt.h>
#include <opencv2/core/hal/interface.h>
#include <opencv2/imgproc.hpp>
#include <opencv2/imgproc/imgproc_c.h>
#include <pthread.h>
#include <signal.h>
#include <stdbool.h>
#include <stdio.h>
#include <stdlib.h>
#include <time.h>
#include <unistd.h>
#include <string>

// #include "common/sample_common.h"
#include "rkmedia_api.h"
#include "rockx.h"
#include <opencv2/core.hpp>
// #include <opencv2/imgoroc.hpp>
#include <opencv2/highgui.hpp>
#include <opencv2/opencv.hpp>

#define CAMERA_PATH "rkispp_scale0"
#define CAMERA_ID 0
#define CAMERA_CHN 0
#define VENC_CHN 0
#define WIDTH 1920
#define HEIGHT 1080

using namespace std;
using namespace cv;

string reco_name;

void * get_rockx_face_recg_venc_thread(void * args)
{
    pthread_detach(pthread_self());
    MEDIA_BUFFER mb = NULL;

    FILE * face_reco_venc_h264 = fopen("face_reco.h264", "w+");

    while (1)
    {
        mb = RK_MPI_SYS_GetMediaBuffer(RK_ID_VENC, VENC_CHN, -1);
        if(!mb)
        {
            printf("Get Venc Stream break...\n");
            break;
        }

        fwrite(RK_MPI_MB_GetPtr(mb), RK_MPI_MB_GetSize(mb), 1, face_reco_venc_h264);
        RK_MPI_MB_ReleaseBuffer(mb);
    }

    return NULL;
}



int main(int argc, char **argv)
{
    int ret;
    VI_CHN_ATTR_S vi_chn_attr;
    vi_chn_attr.pcVideoNode = CAMERA_PATH;        // Path
    vi_chn_attr.u32Width = 1920;                  // Width
    vi_chn_attr.u32Height = 1080;                 // Height
    vi_chn_attr.enPixFmt = IMAGE_TYPE_NV12;       // ImageType
    vi_chn_attr.enBufType = VI_CHN_BUF_TYPE_MMAP; // BufType
    vi_chn_attr.u32BufCnt = 3;                    // Cnt
    vi_chn_attr.enWorkMode = VI_WORK_MODE_NORMAL; // Mode
    ret = RK_MPI_VI_SetChnAttr(CAMERA_ID, CAMERA_CHN, &vi_chn_attr);
    if (ret)
    {
        printf("Vi Set Attr Failed.....\n");
        return 0;
    }
    else
    {
        printf("Vi Set Attr Success.....\n");
    }

    ret = RK_MPI_VI_EnableChn(CAMERA_ID, CAMERA_CHN);
    if (ret)
    {
        printf("Vi Enable Attr Failed.....\n");
        return 0;
    }
    else
    {
        printf("Vi Enable Attr Success.....\n");
    }

    VENC_CHN_ATTR_S venc_chn_attr;
    memset(&venc_chn_attr, 0, sizeof(VENC_CHN_ATTR_S));
    venc_chn_attr.stVencAttr.u32PicWidth = 1920;
    venc_chn_attr.stVencAttr.u32PicHeight = 1080;
    venc_chn_attr.stVencAttr.u32VirWidth = 1920;
    venc_chn_attr.stVencAttr.u32VirHeight = 1080;
    venc_chn_attr.stVencAttr.imageType = IMAGE_TYPE_NV12;
    venc_chn_attr.stVencAttr.enType = RK_CODEC_TYPE_H264;
    venc_chn_attr.stVencAttr.u32Profile = 66;
    venc_chn_attr.stRcAttr.enRcMode = VENC_RC_MODE_H264CBR;
    venc_chn_attr.stRcAttr.stH264Cbr.u32Gop = 25;
    venc_chn_attr.stRcAttr.stH264Cbr.u32BitRate = 1920 * 1080 * 3;
    venc_chn_attr.stRcAttr.stH264Cbr.fr32DstFrameRateDen = 1;
    venc_chn_attr.stRcAttr.stH264Cbr.fr32DstFrameRateNum = 25;
    venc_chn_attr.stRcAttr.stH264Cbr.u32SrcFrameRateDen = 1;
    venc_chn_attr.stRcAttr.stH264Cbr.u32SrcFrameRateNum = 25;
    ret = RK_MPI_VENC_CreateChn(0, &venc_chn_attr);
    if (ret)
    {
        printf("ERROR: Create venc failed!\n");
        exit(0);
    }

    ret = RK_MPI_VI_StartStream(CAMERA_ID, CAMERA_CHN);
    if (ret)
    {
        printf("ERROR: RK_MPI_VI_StartStream failed!\n");
        exit(0);
    }

    

    rockx_config_t * face_config = rockx_create_config();
    rockx_add_config(face_config, ROCKX_CONFIG_DATA_PATH, "/userdata/rockx_data");

    rockx_handle_t face_det_handle;
    rockx_module_t face_det_module = ROCKX_MODULE_FACE_DETECTION_V2;
    rockx_ret_t face_det_ret;
    face_det_ret = rockx_create(&face_det_handle, face_det_module, face_config, 0);
    if(face_det_ret != ROCKX_RET_SUCCESS)
    {
        printf("rockx_create face_detect_handle failed!\n");
        return -1;
    }

    rockx_handle_t face_reco_handle;
    rockx_module_t face_reco_module = ROCKX_MODULE_FACE_RECOGNIZE;
    rockx_ret_t face_recg_ret;
    face_recg_ret = rockx_create(&face_reco_handle, face_reco_module, face_config, 0);
    if(face_recg_ret != ROCKX_RET_SUCCESS)
    {
        printf("rockx_create face_recognize_handle failed!\n");
        return -1;
    }
    

    char * image_path = "face_02.jpg";
    rockx_image_t single_face_image;
    rockx_image_read(image_path, &single_face_image, 1);
    rockx_face_feature_t single_face_feature;
    rockx_face_recognize(face_reco_handle, &single_face_image,&single_face_feature);

    pthread_t pid;
    pthread_create(&pid, NULL, get_rockx_face_recg_venc_thread, NULL);


    MEDIA_BUFFER mb = NULL;
    rockx_image_t rv1126_video_image;
    rv1126_video_image.width = WIDTH;
    rv1126_video_image.height = HEIGHT;
    rv1126_video_image.pixel_format = ROCKX_PIXEL_FORMAT_YUV420SP_NV12;

    rockx_ret_t sim_ret;
    Point text_point;
    text_point.x = 300;
    text_point.y = 300;

    while (1)
    {
        mb = RK_MPI_SYS_GetMediaBuffer(RK_ID_VI, CAMERA_CHN, -1);
        if(!mb)
        {
            printf("Get vi data break....\n");
            break;
        }

        rv1126_video_image.data = (uint8_t  *)RK_MPI_MB_GetPtr(mb);
        rv1126_video_image.size = RK_MPI_MB_GetSize(mb);

        Mat rv1126_mat = Mat(HEIGHT,WIDTH,CV_8UC1,rv1126_video_image.data);

        rockx_object_array_t face_detect_array;
        face_det_ret = rockx_face_detect(face_det_handle,&rv1126_video_image,&face_detect_array,NULL);
        if(face_det_ret != ROCKX_RET_SUCCESS)
        {
            printf("rockx_face_detect failed!.....\n");
        }

        rockx_face_feature_t rv1126_face_feature;

        if(face_detect_array.count > 0)
        {
            face_recg_ret =  rockx_face_recognize(face_reco_handle,&rv1126_video_image,&rv1126_face_feature);
            if(face_recg_ret != ROCKX_RET_SUCCESS)
            {
                printf("rockx_face_recognize failed....\n");
            }

            float similarity;
            sim_ret = rockx_face_feature_similarity(&single_face_feature, &rv1126_face_feature, &similarity);
            if(sim_ret != ROCKX_RET_SUCCESS)
            {
                printf("rockx_face_feature_similarity failed....\n");
            }

            if(similarity <= 1.0)
            {
                reco_name = "Harry";
                printf("This is Harry...\n");
            }
            else
            {
                reco_name = "";
                printf("Can not recognize...\n");
            }

            putText(rv1126_mat,reco_name,text_point,FONT_HERSHEY_COMPLEX,1.0,Scalar(255,0,255),1);
        }

        RK_MPI_SYS_SendMediaBuffer(RK_ID_VENC, VENC_CHN, mb);
        RK_MPI_MB_ReleaseBuffer(mb);
    }

    RK_MPI_VI_DisableChn(CAMERA_ID,CAMERA_CHN);
    RK_MPI_VENC_DestroyChn(VENC_CHN);
    
    return 0;
}