-
Component-Enhanced Chinese Character Embeddings
1. どんなもの?中国語における漢字の部首を元に、文字単位の埋め込み表現を学習する。2. 先行研究と比べてどこがすごいの?先行研究では単語単位で埋め込み表現を学習するContinuous Bag-of-Words(CBOW)モデルやSkip-gramモデルが有名である。英語と異なり「漢字」は表意文字であり、「1文字」が意味をなす最小の意味単位であることに注目し、漢字の文字構成から意味表現を獲得しよう考えたのが本研究である。3. 技術や手法の”キモ”はどこにある? CBOWやSkip-gr...
-
A Comprehensive Survey on Cross-Modal Retrieval
1. どんなもの?画像やテキストといった複数の要素を用いた「クロスモーダル検索」について、最新の研究にフォーカスをして調査を行っている。2. 先行研究と比べてどこがすごいの?近年の携帯端末やSNSの発展により、写真を中心とした画像やテキスト、動画といったマルチモーダルなデータが多数生成されている。こういったデータを検索する方法は、ほとんどが「テキストからテキストを検索する」「画像から画像を検索する」といった同じタイプのデータに対してのみに行われてきている。本調査では違うタイプのメディア同士...
-
Annealed Dropout Training of Deep Networks
1. どんなもの?学習が進むに連れてネットワーク内ノードのDropout率を徐々に減少させる「Annealed Dropout」を提案.2. 先行研究と比べてどこがすごいの?Dropoutを用いた学習は,複数のニューロンが繰り返し同じ特徴を識別してしまう「co-adapting」を抑制する.またネットワークの表現能力を制限することで過学習を避けることができる.本研究ではデータ量が豊富な場合の学習において,高いDropout率(e.g. 0.5)からゼロまで徐々に減少させることで,予測精度を...