1. どんなもの?

可変長である文を扱うことができるDynamic Convolutional Neural Network(DCNN)を用いて感情分析や質問応答分類などを行う。

2. 先行研究と比べてどこがすごいの?

画像認識で素晴らしい結果を残しているConvolutional Neural Network(CNN)は固定長である画像の入力を想定している。自然言語処理においては、入力となる文を構成している単語数は可変であり、可変長のベクトルをCNNに入力することはできない。 先行研究ではこうした可変長の文を入力することができるMax-Time-Delay Neural Network(Max-TDNN)という手法が提案されている。これは文中の単語の中から特徴が最大となるような単語を定数個取得することで、固定長のベクトルを畳み込み層の入力としている。また先行研究と比べてWide Convolutionを用いることで、幅や文の長さに関係なく常に有効な結果を算出することができる。

3. 技術や手法の”キモ”はどこにある?

  • Max-TDNNアーキテクチャを利用した可変長文への対応
  • Zero-paddingを用いることでベクトルの端や文の長さに関係なく有効に動作するWide Convolution
  • 幅広い範囲から高次の特徴を得ることができるDynamic k-Max poolingの適用

4. どうやって有効だと検証した?

まず初めに映画レビューのデータセットであるStanford Sentiment Treebankの付与されている感情ラベルを持ちに2クラス及び5クラス分類の実験を行った。その後TREC question datasetを用いて質問応答の分類問題の実験を行った。最後にTwitterのデータを用いた感情分析を行った。従来の感情分析や質問応答分類は多種多様な特徴量を用いてモデルを構築するものが多かったが、提案手法であるDCNNはそれらのモデルより優れたパフォーマンスを出している。

5. 議論はあるか?

DCNNの第1層目については、入力文のような連続的なn-gramを表していて、より後段の層では別個のn-gramを複数合わせたような特徴を表していた。

6. 次に読むべき論文はあるか?

CNNをベースとしたTDNNを用いた先行研究。

TDNNの先行研究。

論文情報・リンク