Character-level Convolutional Neural Networks における Wildcard Training の基礎検討

Abstract

文書を分かち書きせず文字単位で扱う Character-level Convolutional Neural Networks(CLCNN) は,その表現能力ゆえに学習データに対して過学習を引き起こしてしまう. 本研究では,文字画像による Character-level Embeddig を CLCNN で学習させる際に,入力文字表現の一部をランダムにワイルドカードとして入力させる「Wildcard Training」についてより詳細に検討し,過学習を抑制する手法を模索する.

Publication
NLP 若手の会 (YANS) 第 12 回シンポジウム,2017.
北田 俊輔
北田 俊輔
深層学習による Vision & Language を研究するリサーチサイエンティスト

研究テーマは、ディープラーニングを用いた自然言語処理、コンピュータビジョン、医療画像処理、計算広告などです