ryok note

Dynamic-Routing-Between-Capsules

  

1. どんなもの?

CNN(畳み込みニューラルネットワーク)の欠点を克服し、より頑強(ロバスト)になったカプセルネットワーク構造の提案。

2. 先行研究と比べてどこがすごいの?

Convolutional Neural Networksには以下の欠点がある。

  • プーリング層は位置普遍性を獲得できるが、その反面空間的な構造の情報を喪失している。
  • 回転や比率が変わった画像認識を行うためには膨大な訓練データを必要とする。
    カプセルネットワークでは上記の欠点を克服している。
    本研究では計算効率の良いカプセル構造を採用し、非線形変換である「squash」,およびプーリング操作に変わりアフィン変換にロバストな「routing」からなるCapsule Networkを提案している.

3. 技術や手法の”キモ”はどこにある?

カプセルネットワークでは、通常のニューラルネットワークに対し、以下の点が特徴。

  • 入力/出力がともにベクトルである(ベクトルを扱うことで、高レベルの特徴と次の特徴の位置情報を保持し、空間情報の保持を実現する。)
  • アフィン変換のステップが加えられている
  • 活性化関数がsquah関数(後述)で置換されている
  • バイアスがない
  • dynamic routing”と呼ばれる手法を用いて学習。前の層のカプセルから次の層のどのカプセルへどれだけの重みを配分するかを決定。

4. どうやって有効だと検証した?

複数の手書き文字を重ね合わせたMultiMNISTデータセットに対して、有効性を確認。

5. 議論はあるか?

6. 次に読むべき論文はあるか?

論文情報・リンク

  • Sara Sabour, Nicholas Frosst, Geoffrey E Hinton,”Dynamic Routing Between Capsules” arXiv,2017年 論文リンク

ryok

A designer, developer and entrepreneur. Spends his time travelling the world with a bag of kites. Likes journalism and publishing platforms.

Comments