-
Grad-CAM: Why did you say that? Visual Explanations from Deep Networks via Gradient-based Localization
1. どんなもの?Convolutional Neural Network(CNN)の予測結果を視覚的に説明する,Gradient-weighted Class Activation Mapping(Grad-CAM)を提案.2. 先行研究と比べてどこがすごいの?CNNを始めとしたDeep modelを使う場合,抽象度の高い学習により予測結果の解釈が難しくなる.信頼できる知的システムを構築するためには,システムが「なぜそのように判断したのか」を解釈できるような透過的なモデルでなければならな...
-
Learning Character-level Compositionality with Visual Features
1. どんなもの?中国語や日本語、韓国語の文字画像情報から埋め込み表現を獲得し、文書分類に利用する。2. 先行研究と比べてどこがすごいの?近年の自然言語処理においては、単語レベルや文字レベルの特徴を利用してタスクを解く先行研究がある。本研究ではConvolutional Neural Network(CNN)で文字画像から視覚的な特徴を取り出し、その特徴を用いてRecurrent Neural Network(RNN)で文書分類を行うものとなっている。本研究のモデルの特性上、視覚的に似てい...
-
Neural Machine Translation using Bitmap Fonts
1. どんなもの?ビットマップフォントにした漢字や単語を入力として、中国語からスペイン語に変換する翻訳システムを提案する。2. 先行研究と比べてどこがすごいの?Deep Learningにおける文章の翻訳はAutoencoder構造を主に使用している。通常、入力されるセンテンスの各々の単語を1-of-K表現で表しモデルに入力をする。本研究では、アルファベット1文字に比べてより情報量が多い中国語1文字をビットマップ画像化することで、より多くの情報を翻訳システムに供給できるのではないかと考えら...