【深度学习图片】图片清洗,只留下图像中只有一张人脸的,而且人脸是全的

环境:

bash 复制代码
conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia -y

pip install onnx==1.15 onnxruntime-gpu==1.17

pip install insightface==0.7.3

pip install opencv-python

pip install gradio

图片清洗,只留下图像中只有一张人脸的,而且人脸是全的。

bash 复制代码
import os
import shutil

import cv2
import numpy as np
from insightface.app import FaceAnalysis


def is_full_face(facedata, img_shape, threshold=0.5):
    """
    判断是否为整张脸
    :param facedata: 人脸数据
    :param img_shape: 图片尺寸
    :param threshold: 阈值
    :return: 布尔值,True 表示整张脸,False 表示部分脸
    """
    img_width, img_height = img_shape[1], img_shape[0]

    # 检查人脸关键点是否在图片内部
    kps = facedata['kps']
    if np.all(kps >= 10) and np.all(kps[:, 0] <= img_width - 10) and np.all(kps[:, 1] <= img_height - 10):
        keypoints_inside = True
    else:
        keypoints_inside = False

    # 满足阈值并且关键点在图片内部
    return keypoints_inside


def listPathAllfiles(dirname):
    result = []
    for maindir, subdir, file_name_list in os.walk(dirname):
        for filename in file_name_list:
            apath = os.path.join(maindir, filename)
            result.append(apath)
    return result


# 使用的检测模型名为 buffalo_sc
app = FaceAnalysis(name='buffalo_sc', providers=['CUDAExecutionProvider'])
app.prepare(ctx_id=0, det_size=(640, 640))  # ctx_id 小于0 表示用 CPU 预测,det_size 表示 resize 后的图片分辨率

src = r"C:\Users\Administrator\Pictures\girl_no_train\mangguo_dst"
dst = r"C:\Users\Administrator\Pictures\girl_no_train\mangguo_dst2"
os.makedirs(dst, exist_ok=True)

files = listPathAllfiles(src)
for file in files:
    img = cv2.imread(file)  # 读取图片
    faces = app.get(img)  # 得到人脸信息
    if len(faces) == 0:
        continue
    if len(faces) > 1:
        continue
    for facedata in faces:
        if is_full_face(facedata, img.shape):
            # print("This is a full face.")
            shutil.copy(file, dst)
相关推荐
测试员周周5 分钟前
【Appium 系列】第18节-重试与容错 — 移动端测试的稳定性保障
人工智能·python·功能测试·ui·单元测试·appium·测试用例
灰灰勇闯IT25 分钟前
DeepSeek-R1 在 CANN 上的推理部署
pytorch·python·深度学习
l1t26 分钟前
Hy-MT2-1.8B总结的pgvector 0.8.2解决了并行HNSW索引构建漏洞
数据库·人工智能·postgresql
太华27 分钟前
学习AI Agent编程-第二天-LangGraph ReAct模式实现
人工智能
dayuOK630729 分钟前
从“爆款复刻”到“个性化创作”:AI辅助写作的技术挑战与演进方向
人工智能·职场和发展·自动化·新媒体运营·媒体
努力学习_小白38 分钟前
Inception V1——学习记录
pytorch·深度学习·inception v1
Raink老师38 分钟前
【AI面试临阵磨枪-58】AI 生成内容合规、版权、审核机制设计
人工智能·面试·职场和发展
lizhihai_9939 分钟前
股市学习心得-与英伟达核心 PCB 相关的八家关联企业
大数据·人工智能·学习
嗝o゚1 小时前
昇腾CANN ops-nn 仓的 Activation 算子:不只是 ReLU
人工智能·cann·ops-nn
thubier(段新建)1 小时前
从需求到上线:需求→业务→架构→功能→实现 全链路落地方法论
人工智能·架构