【数据集】CelebA Dataset

CelebA:CelebFaces Attribute,名人人脸属性数据集,包含10,177个名人身份的202,599张人脸图片,每张图片都做好了特征标记,包含人脸bbox标注框、5个人脸特征点坐标以及40个属性标记。

官网:

CelebA Dataset

CelebA数据集详细介绍及其属性提取源代码:CelebA数据集详细介绍及其属性提取源代码 - 知乎

CelebA的40个属性:

  1. 5_o_Clock_Shadow:刚长出的双颊胡须
  2. Arched_Eyebrows:柳叶眉
  3. Attractive:吸引人的
  4. Bags_Under_Eyes:眼袋
  5. Bald:秃头
  6. Bangs:刘海
  7. Big_Lips:大嘴唇
  8. Big_Nose:大鼻子
  9. Black_Hair:黑发
  10. Blond_Hair:金发
  11. Blurry:模糊的
  12. Brown_Hair:棕发
  13. Bushy_Eyebrows:浓眉
  14. Chubby:圆胖的
  15. Double_Chin:双下巴
  16. Eyeglasses:眼镜
  17. Goatee:山羊胡子
  18. Gray_Hair:灰发或白发
  19. Heavy_Makeup:浓妆
  20. High_Cheekbones:高颧骨
  21. Male:男性
  22. Mouth_Slightly_Open:微微张开嘴巴
  23. Mustache:胡子,髭
  24. Narrow_Eyes:细长的眼睛
  25. No_Beard:无胡子
  26. Oval_Face:椭圆形的脸
  27. Pale_Skin:苍白的皮肤
  28. Pointy_Nose:尖鼻子
  29. Receding_Hairline:发际线后移
  30. Rosy_Cheeks:红润的双颊
  31. Sideburns:连鬓胡子
  32. Smiling:微笑
  33. Straight_Hair:直发
  34. Wavy_Hair:卷发
  35. Wearing_Earrings:戴着耳环
  36. Wearing_Hat:戴着帽子
  37. Wearing_Lipstick:涂了唇膏
  38. Wearing_Necklace:戴着项链
  39. Wearing_Necktie:戴着领带
  40. Young:年轻人

其他衍生数据集:

CelebA-Dialog Dataset

出处:GitHub - ziqihuangg/CelebA-Dialog: A large-scale visual-language face dataset with fine-grained annotations (ICCV 2021)

官网:CelebA-Dialog Dataset

CelebA-HQ

GitHub - tkarras/progressive_growing_of_gans: Progressive Growing of GANs for Improved Quality, Stability, and Variation

google云下载:

celeba-hq-deltas - Google 云端硬盘

下载方法:如何生成CelebA-HQ数据集 - 知乎

也可以从这里直接下载:生成高质量人脸图像celebA-HQ_数据集-飞桨AI Studio星河社区

对比:

数据集名称 图像数量 图像分辨率 数据集大小 特点
CelebA 202,599 张 178×218 像素 约 2.5 GB 人脸属性识别和面部检测
CelebA-HQ 30,000 张 1024×1024 像素 约 20 GB 高分辨率,适用于生成任务
CelebA-Dialog 162,000 张 178×218 像素 约 6 GB 结合图像与对话生成的任务
相关推荐
代码里程碑6 分钟前
Gemini CLI 自定义命令的妙用
人工智能·程序员
GoodTime15 分钟前
Datawhale AI夏令营 -「多模态RAG图文问答挑战赛」
人工智能·python·算法
柠檬味拥抱15 分钟前
基于YOLOv8的矿井内煤炭图像智能识别|完整源码数据集+PyQt5界面+完整训练流程+开箱即用!
人工智能
2401_8318960323 分钟前
深度学习(1):pytorch
人工智能·pytorch·深度学习
数据知道42 分钟前
将英文PDF文件完整地翻译成中文的4类方式
人工智能·学习·自然语言处理·pdf·机器翻译
大千AI助手43 分钟前
RAGFoundry:面向检索增强生成的模块化增强框架
人工智能·大模型·llm·微调·rag·检索·ragfoundry
dxnb221 小时前
Datawhale+AI夏令营_让AI读懂财报PDF task2深入赛题笔记
人工智能·笔记·pdf
那就摆吧1 小时前
AI赋能6G网络安全研究:智能威胁检测与自动化防御
人工智能·web安全·ai·自动化·6g
产品经理独孤虾1 小时前
流程优化点识别与分析:从混沌到清晰的产品体验突破法
人工智能·产品经理·需求分析·产品设计·提示词工程·deepseek·业务流程优化
2501_924747451 小时前
强光干扰下误报率↓82%!陌讯多模态算法在睡岗检测的落地优化
人工智能·深度学习·算法·目标检测·计算机视觉