Titel:Dynamisches Routing zwischen Kapseln
PDF herunterladen
Zusammenfassung: Eine Kapsel ist eine Gruppe von Neuronen, deren Aktivitätsvektor die Instanziierungsparameter eines bestimmten Entitätstyps wie eines Objekts oder eines Objektteils darstellt. Wir verwenden die Länge des Aktivitätsvektors, um die Wahrscheinlichkeit darzustellen, dass die Entität existiert, und seine Ausrichtung, um die Instanziierungsparameter darzustellen. Aktive Kapseln auf einer Ebene machen über Transformationsmatrizen Vorhersagen für die Instanziierungsparameter von übergeordneten Kapseln. Wenn mehrere Vorhersagen übereinstimmen, wird eine Kapsel auf höherer Ebene aktiv. Wir zeigen, dass ein diskriminierend trainiertes, mehrschichtiges Kapselsystem State-of-the-Art-Performance auf MNIST erreicht und deutlich besser als ein Faltungsnetz bei der Erkennung stark überlappender Ziffern ist. Um diese Ergebnisse zu erzielen, verwenden wir einen iterativen Routing-by-Agreement-Mechanismus: Eine Kapsel auf niedrigerer Ebene zieht es vor, ihre Ausgabe an Kapseln auf höherer Ebene zu senden, deren Aktivitätsvektoren ein großes Skalarprodukt aufweisen, wobei die Vorhersage von der Kapsel auf niedrigerer Ebene kommt.
Themen: | Computer Vision und Mustererkennung (cs.CV) |
Zitieren als: | arXiv:1710.09829 |
( oder arXiv: 1710.09829v2 für diese version) |