前書き

顔画像研究に使えるデータセットのまとめです。

顔検出

FDDB
http://vis-www.cs.umass.edu/fddb/index.html
制限なし(表情、尺度、姿、外観などが大きい可変性がある)、自然環境に取った写真。
サイズ:2845枚

WIDER Face
http://shuoyang1213.me/WIDERFACE/
FDDBは数千枚画像しかないので、多様性においては欠けています。
サイズ:32203枚

MALF
http://www.cbsr.ia.ac.cn/faceevaluation/
もっと細かめに自然環境の顔検出をするためにつくられたデータセットです。性別、眼鏡、隠されるなどのデータを含めています。
サイズ:5250枚

特徴点検出

XM2VTS
http://www.ee.surrey.ac.uk/CVSSP/xm2vtsdb/
68個特徴点、同じ照射条件、無表情です。
サイズ:2360枚真正面、295人

AR Face Database
http://www2.ece.ohio-state.edu/~aleix/ARdatabase.html
22個特徴点
サイズ:4000枚、126人

FGVC-V2
https://www.nist.gov/programs-projects/face-recognition-grand-challenge-frgc
均一照射条件での高質画像と均一でない照射条件での低質画像を含めています。
タグ:5つ 特徴点
サイズ:4950枚、466人

AFLW
https://www.tugraz.at/institute/icg/research/team-bischof/lrs/downloads/aflw/
多種類姿、視角の大規模顔データベース。顔ごとに21個特徴点、計380k個特徴点を持っています。
サイズ:21997枚、25993人

300W
https://ibug.doc.ic.ac.uk/resources/300-W/
ビデオ版
https://ibug.doc.ic.ac.uk/resources/300-VW/
データセット内部の表情、照射条件、姿、顔サイズなどの変動が大きい、68個特徴点を持っています。
サイズ:600枚

MTFL/MAFL
http://mmlab.ie.cuhk.edu.hk/projects/TCDCN.html
MTFLは12995人、5個特徴点、ほかに性別、笑顔かどうか、眼鏡かどうかおよび頭姿勢の情報を持っています。
MAFLは20000人、5個特徴点と40個顔属性を持っています。

WFLW
https://wywu.github.io/projects/LAB/WFLW.html
98個特徴点、姿、メーク、照射条件、表情などの情報を持っています。
サイズ:10000枚

顔識別

CAS-PEAL
http://www.jdl.ac.cn/peal/
中国人顔データセット、グレースケールとカラー2つのバージョンがあります。特定の環境に、異なる姿勢、表情、照明条件、眼鏡などの情報を持っています。
サイズ:99594枚、、1040人

LFW
http://vis-www.cs.umass.edu/lfw/index.html#download
自然環境に取ったもの、異なる背景、向き、表情情報を持っています。
サイズ:13233枚、5749人

Multi-PIE
http://www.cs.cmu.edu/afs/cs/project/PIE/MultiPie/Multi-Pie/Home.html
15個角度、19個照明条件と異なる表情情報を持っています。オリジナル画像が300GBを超えています。有料です。
サイズ:750000枚、337人

Pubfig
https://www.cs.columbia.edu/CAVE/databases/pubfig/
制限なし顔識別用
サイズ:58797枚、200人

Celeba
http://mmlab.ie.cuhk.edu.hk/projects/CelebA.html
顔属性識別用、顔属性は40+種類
サイズ:202599枚、10177人

FaceScrub
http://vintage.winklerbros.net/facescrub.html
サイズ:10686枚、530人(男女各265人)

MegaFace
http://megaface.cs.washington.edu/dataset/download.html
百万規模データセット
サイズ:1000000枚、690000人

VGG Face
http://www.robots.ox.ac.uk/~vgg/data/vgg_face2/
異なる姿、年齢、人種。身分情報以外、5つキーポイントと予測年齢と姿データを持っています。
サイズ:3.31百万枚、9131人

IMDB-Face
https://github.com/fwang91/IMDb-Face#data-download
顔画像が一番多いデータセット
サイズ:17000000枚、590000人

YouTube Faces
http://www.cs.tau.ac.il/~wolf/ytfaces/results.html
ビデオデータセット
サイズ:3425個ビデオ、1595人

IARPA Janus
https://www.iarpa.gov/index.php/research-programs/janus
制限なし自然環境
サイズ:138000人顔画像、11000ビデオ、10000人でない顔画像

顔表情識別

KDEF
https://www.emotionlab.se/kdef/
ひげなし、眼鏡とピアスなし、メークなし、7種類表情、表情ごとに5つの角度。
サイズ:4900枚、70人

GENKI
https://inc.ucsd.edu/mplab/index.php
笑う、笑わない二種類。背景、位置、身分と人種が異なります。
サイズ:15000枚ぐらい

RaFD
http://www.socsci.ru.nl:8180/RaFD2/RaFD?p=main
8種類の表情
サイズ:8040枚、67人(白人男性20人、白人女性19人、白人少年4人、白人少女6人、モロッコ人男性18人)

CK
http://www.pitt.edu/~emotion/ck-spread.htm
137人のそれぞれの顔表情のビデオフレーム
タグ:表情、基本動き

Fer2013
https://www.kaggle.com/c/challenges-in-representation-learning-facial-expression-recognition-challenge/data
解像度が低いグレースケール、6種類の表情
サイズ:26190枚

RAF
http://www.whdeng.cn/RAF/model1.html
7種類基本表情、12個混合表情
タグ:5つキーポイント、年齢範囲、性別
サイズ:29672枚

EmotionNet
http://cbcsl.ece.ohio-state.edu/EmotionNetChallenge/
タグ:基本表情、混合表情、表情ユニット
サイズ:950000枚

年齢と性別推定

FG-NET
https://www.researchgate.net/figure/Sample-images-from-the-FG-NET-Aging-database_fig1_220057621
タグ:年齢(0~69)
サイズ:1002枚、82人

CACD2000
http://bcsiriuschen.github.io/CARC/
タグ:年齢(16~62)
サイズ:163446枚有名人、2000人

Adience
https://talhassner.github.io/home/projects/Adience/Adience-data.html#frontalized
タグ:年齢区間(0~2,4~6,8~13,15~20,25~32, 38~43, 48~53, 60+)
サイズ:26580枚、2284人

The IMDB-WIKI dataset
https://data.vision.ee.ethz.ch/cvl/rrothe/imdb-wiki/
一番大きい年齢と性別のデータセット
タグ:年齢と性別
サイズ:523,051枚

Looking at People(LAP)
http://chalearnlap.cvc.uab.es/dataset/18/description/
最大の見かけの年齢データセット、年齢ごとに10人以上主観的予測年齢情報を持っています。
タグ:年齢(0~100)
サイズ:7591枚

APPA-REAL
http://chalearnlap.cvc.uab.es/dataset/26/description/
LAPと比べると、APPA-REALの画像ごとに平均38人 タグ: 実際の年齢と見かけ年齢、年齢範囲(0-95)
サイズ:7591枚

顔状態(姿)

3DMM
https://faces.dmi.unibas.ch/bfm/
処理される前のモデルごとに70000個ポイント、処理後53490個ポイント、3D顔一番大きいデータセット
タグ:表情係数、テクスチャ係数、68のキーポイントの座標、およびカメラの7個座標
サイズ:100人男性、100人女性の3Dスキャンデータ

Bosphorus
http://bosphorus.ee.boun.edu.tr/default.aspx
3D顔研究用、一人35種類の表情と異なる姿を持つ
サイズ:4666枚、105人

HPD
http://www-prima.inrialpes.fr/perso/Gourier/Faces/HPDatabase.html
グレースケールデータセット
タグ:垂直角度、水平角度
サイズ:5580枚、372人

FaceWarehouse
http://www.kunzhou.net/#facewarehouse
中国人3D顔データセット、一人20弱種類の表情を持つ。
タグ:年齢(7-80)
サイズ:150人

300W-LP
http://www.cbsr.ia.ac.cn/users/xiangyuzhu/projects/3DDFA/main.htm
3D分野に一番大きい、よく使われているシミュレーションデータセット。
タグ:68個キーポイント、カメラパラメータ、3DMMモデル係数

その他

SCUT-FBP
https://github.com/HCIILAB/SCUT-FBP5500-Database-Release
自然顔、異なる性別分布と人種分布(2000人のアジア女性、2000人のアジア人男性、750人の白人男性、750人の白人女性)apperance/shapeなどに基づくモデル研究に適しています。
タグ:年齢(18~27)、画像ごと86個キーポイント

MakeUp
http://www.antitza.com/makeup-datasets.html
女性メークデータセット、メークが顔検知に与える影響の研究など。

参考文献

  • https://zhuanlan.zhihu.com/p/48347016
  • Zhang K,Wang X S,Guo Y R,Su Y K,He Y X. Survey of deep learning methods for face age estimation[J]. Journal of Image and Graphics,2019,24( 08) : 1215-1230.[DOI: 10. 11834 /jig. 180653]

(著:Hu

関連記事

Deepblueでは統計やAIの平和的活用を一緒に取り組んでいただける方を募集してます。詳しくはRecruitをご覧ください。