A Discriminative Feature Learning Approach for Deep Face Recognition

1. どんなもの？

特徴空間上で効果的に各クラスを分離するよう学習を行う，「Center Loss」を提案．

2. 先行研究と比べてどこがすごいの？

Convolutional Neural Networks(CNN)を用いた一般的な画像認識ではSoftmax Lossを用いたクラスラベルの予測を行うことが多い．この方法は最後の全結合層で線形分類器のような振る舞いでDeep Featureを分類している．

顔認識の場合，Deep Featureを単純に分離するのではなく，より際立って区別する必要がある．しかしながらSoftmax Lossのみでは単純に区別するだけである．

より効果的に分離するよう学習を行うContrastive LossやTriplet Lossなどが提案されている．これらは画像のペアを用いて学習するものであるが，学習データが劇的に増えてしまう問題点などがある．

本研究では簡単に実装ができ，先行研究の問題点を解決したCenter Lossを提案している．

3. 技術や手法の”キモ”はどこにある？

Center Loss
- 異なるクラスの特徴を分離可能に保ちながら、クラス内の変動を最小にする
  - $m$ : ミニバッチのサイズ
  - $c_{y_i} \in \mathbb{R}$ : クラス $y_i$ のDeep Featureの中心
- 勾配計算や中心点の更新が容易

4. どうやって有効だと検証した？

顔認識のデータセットであるLabeled Faces in the Wild(YFW)，Youtube Faces(YTF)，MegaFace Challengeを使っている．LeNetをベースとしたモデルにSoftmax Lossのみを用いた場合と，Softmax LossとCenter Loss両方を用いた場合で効果を検証している．

これらのデータセットを用いた画像認識タスクにおいて最先端の結果を出していることが分かる．