-
Deep Learning
1. どんなもの? 複数のレイヤーで構成された計算モデルを使用して、複数レベルの抽象化を行い、入力されたデータの表現を学習することができる。 各層の前の層からパラメータを機械的に決定するbackpropagationを利用して、大きなデータの集合から複雑な構造を見つける。 これらの方法は、音声認識における最先端技術を劇的に改善し、視覚的物体認識、物体検出、および創薬およびゲノミクスのような多くの他の領域においても素晴らしい結果を出している。2. 先行研究と比べてどこがすごいの? 従...
-
A statistical interpretation of term specificity and its application in retrieval
1. どんなもの? IDF(inverse document frequency)の原典。 文書の記述の網羅性と索引用語の特異性は、通常独立していると考えられている。 特異性は、用語の意味ではなく、用語の使用法に応じて統計的に解釈されるべき。 頻繁に出現する用語は、全体的な成果を上げるために必要である。 用語というのは、観測された頻度に応じて重み付けされる。2. 先行研究と比べてどこがすごいの?これらのとてもシンプルなルールに従ってテストデータを検証した結果、よりよいパフォーマン...
-
Text Categorization with Support Vector Machines: Learning with Many Relavant Features
1. どんなもの?Support Vector Machines(SVMs)を用いてテキストのカテゴリ分類を行なった。2. 先行研究と比べてどこがすごいの?テキスト分類というタスクは「入力が高次元」、「関連性の少ない特徴量」、「スパースな文書ベクトル」、「線形分離不可能」といった性質を持つが、先行研究に比べてこういった性質により適した結果を出すことができた。3. 技術や手法の”キモ”はどこにある? ストップワードを取り除く information gainを基準とした文書ベクトルの作成...