Título: Enrutamiento dinámico Entre Cápsulas
Descargar PDF
Resumen: Una cápsula es un grupo de neuronas cuyo vector de actividad representa los parámetros de cuantificación de un tipo específico de entidad, como un objeto o una parte de objeto. Utilizamos la longitud del vector de actividad para representar la probabilidad de que existe la entidad y su orientación para representar los parámetros de sustanciación. Las cápsulas activas de un nivel hacen predicciones, matrices de viatransformación, para los parámetros de instanciación de cápsulas de nivel superior. Cuando múltiples predicciones están de acuerdo, una cápsula de nivel superior se vuelve activa. Mostramos que un sistema de cápsulas multicapa entrenado de forma discriminativa logra un rendimiento de vanguardia en MNIST y es considerablemente mejor que una red convolucional para reconocer dígitos altamente superpuestos. Para lograr estos resultados, utilizamos un mecanismo iterativo de enrutamiento por acuerdo: Una cápsula de nivel inferior prefiere enviar su salida a cápsulas de nivel superior cuyos inyectores de actividad tienen un producto escalar grande con la predicción proveniente de la cápsula de nivel inferior.
Temas: | Visión por Computador y Reconocimiento de patrones (cs.CV) |
Citar como: | arXiv:1710.09829 |
(o arXiv:1710.09829v2 para esta versión) |