1. どんなもの?

文脈および感情値などの条件を考慮した単語置き換えでdata augmentationを実現するContextual Augmentationを提案

2. 先行研究と比べてどこがすごいの?

ニューラルネットベースのモデルは高い精度を示すが過学習しやすい。 Data augmentationは汎化性能を向上させるテクニックであり、画像認識分野では回転やフリップなどを用いてデータのかさ増しを行っている。

しかしながら自然言語処理に対するdata augmentationの適用法は限られている。 一般的にはWordNetなどを用いた単語の置き換えやルールベースの手法が用いられるが、ドメインに特化している場合も多く、一般性が失われたものとなっている。

本研究ではbi-directional言語モデル(LM)を用いて、文脈を考慮した単語置き換えでdata augmentationを実現するContextual Augmentationを提案している。

3. 技術や手法の”キモ”はどこにある?

Figure 1

  • 文脈を考慮した単語予測
    • bi-directional LSTMを用いて、文脈に基づいて文中の位置 におけるword probabilityを計算
    • オンラインでdata augmentationするための単語をサンプリングする
    • data augmentationを制御するパラメータとしてtemperature を導入する
  • 感情値などの条件を考慮
    • LMにおいて goodbad は近い表現になりやすく、反義語がdata augmentationに使われてしまう場合がある
      • label-conditional LMを用いてpositive/negativeなどのラベルを考慮し、反義語を制御する

4. どうやって有効だと検証した?

SST(SST2, SST5)、Subj、MPQA、RT、TRECの各データセットを用いている。モデルはLSTM、CNNをそれぞれ利用し、提案手法であるContextual Augmentationの効果を確認している。

5. 議論はあるか?

Figure 2

  • LMによって予測された単語は必ずしもシノニムになっていない
  • label-conditional LMを用いると、ラベルの性質に沿った単語の予測がなされている

6. 次に読むべき論文はあるか?

論文情報・リンク