Dropout Training as Adaptive Regularization
1. どんなもの?
- Dropoutは学習データに対して人工的にノイズを加えることで過学習を抑える働きがある.
- 一般化線形モデル(GLM)の場合,Dropoutは適応的な正則化の働きをする.
- この観点を利用して,Dropout機構はフィッシャー情報行列の逆行列の推定値によって特徴量をスケールした後に適応したL2正則化機構と等価であることを示している.
- 適応的なDropoutとAdaGradとの関係性について言及している.
- Dropoutを用いて適応的な正則化を行う,半教師ありのフレームワークを提案している.
- IMDBレビューデータセットを用いた文書分類タスクに適用している.