文書を分かち書きせず文字単位で扱う Character-level Convolutional Neural Networks(CLCNN) は,その表現能力ゆえに学習データに対して過学習を引き起こしてしまう. 本研究では,文字画像による Character-level Embeddig を CLCNN で学習させる際に,入力文字表現の一部をランダムにワイルドカードとして入力させる「Wildcard Training」についてより詳細に検討し,過学習を抑制する手法を模索する.
研究テーマは、ディープラーニングを用いた自然言語処理、コンピュータビジョン、医療画像処理、計算広告などです