【深度学习图片】图片清洗,只留下图像中只有一张人脸的,而且人脸是全的

环境:

bash 复制代码
conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia -y

pip install onnx==1.15 onnxruntime-gpu==1.17

pip install insightface==0.7.3

pip install opencv-python

pip install gradio

图片清洗,只留下图像中只有一张人脸的,而且人脸是全的。

bash 复制代码
import os
import shutil

import cv2
import numpy as np
from insightface.app import FaceAnalysis


def is_full_face(facedata, img_shape, threshold=0.5):
    """
    判断是否为整张脸
    :param facedata: 人脸数据
    :param img_shape: 图片尺寸
    :param threshold: 阈值
    :return: 布尔值,True 表示整张脸,False 表示部分脸
    """
    img_width, img_height = img_shape[1], img_shape[0]

    # 检查人脸关键点是否在图片内部
    kps = facedata['kps']
    if np.all(kps >= 10) and np.all(kps[:, 0] <= img_width - 10) and np.all(kps[:, 1] <= img_height - 10):
        keypoints_inside = True
    else:
        keypoints_inside = False

    # 满足阈值并且关键点在图片内部
    return keypoints_inside


def listPathAllfiles(dirname):
    result = []
    for maindir, subdir, file_name_list in os.walk(dirname):
        for filename in file_name_list:
            apath = os.path.join(maindir, filename)
            result.append(apath)
    return result


# 使用的检测模型名为 buffalo_sc
app = FaceAnalysis(name='buffalo_sc', providers=['CUDAExecutionProvider'])
app.prepare(ctx_id=0, det_size=(640, 640))  # ctx_id 小于0 表示用 CPU 预测,det_size 表示 resize 后的图片分辨率

src = r"C:\Users\Administrator\Pictures\girl_no_train\mangguo_dst"
dst = r"C:\Users\Administrator\Pictures\girl_no_train\mangguo_dst2"
os.makedirs(dst, exist_ok=True)

files = listPathAllfiles(src)
for file in files:
    img = cv2.imread(file)  # 读取图片
    faces = app.get(img)  # 得到人脸信息
    if len(faces) == 0:
        continue
    if len(faces) > 1:
        continue
    for facedata in faces:
        if is_full_face(facedata, img.shape):
            # print("This is a full face.")
            shutil.copy(file, dst)
相关推荐
巫山老妖4 分钟前
2026 年 AI 趋势深度研究报告
人工智能
CodeLove·逻辑情感实验室15 分钟前
深度解析:当 NLP 试图解构爱情——情感计算(Affective Computing)的伦理边界与技术瓶颈
人工智能·深度学习·自然语言处理·赛朋克
少林码僧36 分钟前
2.9 字段分箱技术详解:连续变量离散化,提升模型效果的关键步骤
人工智能·ai·数据分析·大模型
互联网工匠38 分钟前
从冯·诺依曼架构看CPU和GPU计算的区别
人工智能·gpu算力
爱笑的眼睛1139 分钟前
超越可视化:降维算法组件的深度解析与工程实践
java·人工智能·python·ai
GISer_Jing1 小时前
AI Agent 目标设定与异常处理
人工智能·设计模式·aigc
Fnetlink11 小时前
AI+零信任:关键基础设施安全防护新范式
人工智能·安全
njsgcs1 小时前
SIMA2 论文阅读 Google 任务设定器、智能体、奖励模型
人工智能·笔记
机器之心1 小时前
2026年,大模型训练的下半场属于「强化学习云」
人工智能·openai
ai_top_trends1 小时前
2026 年工作计划 PPT 横评:AI 自动生成的优劣分析
人工智能·python·powerpoint