1. どんなもの?

特徴空間上で効果的に各クラスを分離するよう学習を行う,「Center Loss」を提案.

2. 先行研究と比べてどこがすごいの?

Figure 1

Convolutional Neural Networks(CNN)を用いた一般的な画像認識ではSoftmax Lossを用いたクラスラベルの予測を行うことが多い.この方法は最後の全結合層で線形分類器のような振る舞いでDeep Featureを分類している.

顔認識の場合,Deep Featureを単純に分離するのではなく,より際立って区別する必要がある.しかしながらSoftmax Lossのみでは単純に区別するだけである.

より効果的に分離するよう学習を行うContrastive LossやTriplet Lossなどが提案されている.これらは画像のペアを用いて学習するものであるが,学習データが劇的に増えてしまう問題点などがある.

本研究では簡単に実装ができ,先行研究の問題点を解決したCenter Lossを提案している.

3. 技術や手法の”キモ”はどこにある?

  • Center Loss
    • 異なるクラスの特徴を分離可能に保ちながら、クラス内の変動を最小にする
      • : ミニバッチのサイズ
      • : クラス のDeep Featureの中心
    • 勾配計算や中心点の更新が容易

4. どうやって有効だと検証した?

顔認識のデータセットであるLabeled Faces in the Wild(YFW),Youtube Faces(YTF),MegaFace Challengeを使っている.LeNetをベースとしたモデルにSoftmax Lossのみを用いた場合と,Softmax LossとCenter Loss両方を用いた場合で効果を検証している.

これらのデータセットを用いた画像認識タスクにおいて最先端の結果を出していることが分かる.

5. 議論はあるか?

Softmax Lossの場合,特徴空間では単純に線形分離が可能な形で学習されている.

Figure 2

Softmax LossにCenter Lossを加えた場合,クラスの特徴を線形に分離する状態を保ちつつ,クラス内の変動が小さくなっていることが分かる.またCenter Lossの効果を調整するハイパーパラメータλの値を変えることで,クラス内の変動の度合いを制限することができる.

Figure 3

6. 次に読むべき論文はあるか?

Constrastive Lossについて

Triplet Lossについて

論文情報・リンク