-
Contextual Augmentation: Data Augmentation by Words with Paradigmatic Relations
1. どんなもの?文脈および感情値などの条件を考慮した単語置き換えでdata augmentationを実現するContextual Augmentationを提案2. 先行研究と比べてどこがすごいの?ニューラルネットベースのモデルは高い精度を示すが過学習しやすい。Data augmentationは汎化性能を向上させるテクニックであり、画像認識分野では回転やフリップなどを用いてデータのかさ増しを行っている。しかしながら自然言語処理に対するdata augmentationの適用法は限られ...
-
Hierarchical Attention Networks for Document Classification
1. どんなもの?Attentionを用いてより重要な単語・文に注目させ、同時に文書の階層的構造を捉えることができるHierarchal Attention Network (HAN) を提案2. 先行研究と比べてどこがすごいの?一般的にテキスト分類をする場合、全ての単語が文書の意味を捉えるのに重要であるとは限らない。本研究では単語レベル、文レベルでAttentionを適用することにより重要な単語および文を抽出し、同時に文書の階層的な構造を捉えることができるHierarchal Atten...
-
Utilizing Visual Forms of Japanese Characters for Neural Review Classification
1. どんなもの?文字の見た目を考慮した文字embeddingを用いて日本語の評判分析を行う2. 先行研究と比べてどこがすごいの?日本語や中国語の文字は表意文字であり、文字自身が意味を持っている。通常の自然言語処理の手法では、文字の見た目の情報は無視し、文字IDの羅列として扱う。本研究では表意文字や記号の形状を考慮した日本語の評判分析を行うモデルを提案している。3. 技術や手法の”キモ”はどこにある? Character-based Hierarchal Attention Networ...