Titre: Routage dynamique Entre Capsules
Télécharger le PDF
Résumé: Une capsule est un groupe de neurones dont le vecteur d’activité représente les paramètres d’initialisation d’un type spécifique d’entité tel qu’un objet ou une partie d’objet. Nous utilisons la longueur du vecteur d’activité pour représenter la probabilité que l’entité existe et son orientation pour représenter les paramètres d’initialisation. Les capsules actives à un niveau font des prédictions, via des matrices de transformation, pour les paramètres d’instanciation des capsules de niveau supérieur. Lorsque plusieurs prédictions s’accordent, une capsule de niveau supérieur devientactif. Nous montrons qu’un système de capsule multicouche entraîné de manière discriminante offre des performances de pointe sur MNIST et est considérablement meilleur qu’un réseau convolutif pour reconnaître les chiffres qui se chevauchent fortement. Pour atteindre ces résultats, nous utilisons un mécanisme de routage itératif par accord: Une capsule de niveau inférieur préfère envoyer sa sortie à des capsules de niveau supérieur dont les vecteurs d’activité ont un gros produit scalaire avec la prédiction provenant de la capsule de niveau inférieur.
Sujets: | Vision par ordinateur et Reconnaissance de Formes (cs.CV) |
Citer comme: | arXiv:1710.09829 |
( ou arXiv: 1710.09829v2 pour cette version) |