Název: Dynamické směrování mezi kapslemi
Stáhnout PDF
Abstrakt: kapsle je skupina neuronů, jejichž vektor aktivity představuje parametry instantiace konkrétního typu entity, jako je objekt nebo část anobjektu. Délku vektoru aktivity používáme k reprezentaci pravděpodobnosti, že entita existuje, a její orientaci k reprezentaci parametrů instance. Aktivní kapsle na jedné úrovni předpovídají, viatransformační matice, pro instanční parametry vyšší úrovněkapsle. Když se shodne více předpovědí, stane se kapsle vyšší úrovněaktivní. Ukazujeme, že diskriminačně vyškolený vícevrstvý systém kapslí dosahuje nejmodernějšího výkonu na MNIST a je podstatně lepší než konvoluční síť při rozpoznávání vysoce překrývajících se číslic. K dosažení těchto výsledků používáme iterativní mechanismus směrování podle dohody: Nižší levelcapsule preferuje poslat svůj výstup na vyšší úrovni kapslí, jejichž activityvectors mají velký skalární produkt s predikcí přicházející z tobolky nižší úrovně.
předměty: | počítačové vidění a rozpoznávání vzorů (cs.CV) |
citujte jako: | arXiv:1710.09829 |
(nebo arXiv: 1710. 09829v2 pro tuto verzi) |