Contextual Augmentation: Data Augmentation by Words with Paradigmatic Relations

May 27, 2018 in NIP

1. どんなもの？

文脈および感情値などの条件を考慮した単語置き換えでdata augmentationを実現するContextual Augmentationを提案

2. 先行研究と比べてどこがすごいの？

ニューラルネットベースのモデルは高い精度を示すが過学習しやすい。 Data augmentationは汎化性能を向上させるテクニックであり、画像認識分野では回転やフリップなどを用いてデータのかさ増しを行っている。

しかしながら自然言語処理に対するdata augmentationの適用法は限られている。一般的にはWordNetなどを用いた単語の置き換えやルールベースの手法が用いられるが、ドメインに特化している場合も多く、一般性が失われたものとなっている。

本研究ではbi-directional言語モデル(LM)を用いて、文脈を考慮した単語置き換えでdata augmentationを実現するContextual Augmentationを提案している。

3. 技術や手法の”キモ”はどこにある？

文脈を考慮した単語予測
- bi-directional LSTMを用いて、文脈に基づいて文中の位置 $i$ におけるword probabilityを計算
- オンラインでdata augmentationするための単語をサンプリングする
- data augmentationを制御するパラメータとしてtemperature $\tau$ を導入する
感情値などの条件を考慮
- LMにおいて good と bad は近い表現になりやすく、反義語がdata augmentationに使われてしまう場合がある
  - label-conditional LMを用いてpositive/negativeなどのラベルを考慮し、反義語を制御する

4. どうやって有効だと検証した？

SST(SST2, SST5)、Subj、MPQA、RT、TRECの各データセットを用いている。モデルはLSTM、CNNをそれぞれ利用し、提案手法であるContextual Augmentationの効果を確認している。

5. 議論はあるか？

LMによって予測された単語は必ずしもシノニムになっていない
label-conditional LMを用いると、ラベルの性質に沿った単語の予測がなされている

6. 次に読むべき論文はあるか？

論文情報・リンク

Kobayashi, Sosuke. “Contextual Augmentation: Data Augmentation by Words with Paradigmatic Relations.” arXiv preprint arXiv:1805.06201 (2018).

← Previous post Next post →