컨볼루션 신경망에 대한 간략한 안내서)

소개:

마난 파렉
마난 파렉

팔로우

2019 년 7 월 16 일·5 분 읽기

이미지 인식,이미지 분류,물체 감지 등을 수행하는 데 주로 사용되는 심층 신경망 클래스입니다.

딥 러닝을 통한 컴퓨터 비전의 발전은 주로 하나의 특정 알고리즘 인 컨볼 루션 신경망을 통해 시간과 함께 구축되고 완성되었습니다.

구글은 사진 검색,자동 태그 지정 알고리즘,아마존 제품 추천에 대 한 페이스 북에 대 한 그것을 사용 하 고 목록에 간다…

현지N,당신은 많은 멋진 물건을 할 수 있습니다.,내가 만든 98 이미지의 숫자를 예측 하는 손으로 쓴 숫자 인식 모델.82%정확도.

보너스:

코드-> https://github.com/UPPERCASEGUY/CNN-implementation

또한 현지 관한 개념에 약간의 도움으로 멋진 모델을 만들 수 있습니다. 이 블로그는 현지 언론에 대한 개념을 구축하기 시작하고 당신은 갈 수 있습니다!

컨볼루션 신경망:

이미지 분류는 입력 이미지를 가져 와서 이미지를 가장 잘 설명하는 클래스 또는 클래스의 확률을 출력하는 작업입니다. 현지에서는 이미지를 입력으로 사용하고 이미지의 다양한 측면/기능에 중요성을 부여하며 서로 차별화 할 수 있습니다. 현지에 필요한 사전 처리는 다른 분류 알고리즘에 비해 훨씬 적습니다.

개와 고양이 사이를 분류하는 고전적인 현지

아키텍처:

그림의 행렬 표현.

컴퓨터는 우리처럼 사물을 볼 수 없다.

일반적으로 컨볼루션 레이어,풀링 레이어 및 완전히 연결된 레이어의 세 가지 레이어가 있습니다.

나는 당신이 전에 당신의 인생에서’회선’이라는 단어를 우연히 발견했다고 확신합니다. 그래! 당신 말이 맞아요,이 레이어는 서로 물체를 뒤엎는 것에 관한 것입니다. 컨볼루션 레이어는 현지 지역의 핵심 빌딩 블록입니다. 그것은 네트워크의 계산 부하의 주요 부분을 운반합니다.

컨볼루션의 주요 목적은 입력에서 모서리,색상,모서리와 같은 기능을 추출하는 것입니다. 우리가 네트워크 내부에 깊이 갈 때,네트워크는 모양,숫자,얼굴 부분뿐만 아니라 같은 더 복잡한 기능을 식별하기 시작합니다.

여기서 하나의 행렬(필터/커널이라고 함)은 학습 가능한 매개 변수 집합이고 다른 행렬은 이미지의 제한된 부분입니다.

이 경우 필터는 이미지에 비해 높이와 너비가 작지만이미지와 동일한 깊이(높이 엑스 너비 엑스 3)를 갖습니다.

:

컨볼루션 프로세스의 끝에는 실제 이미지보다 매개 변수(치수)가 적고 실제 이미지보다 명확한 기능이 있는 추천 행렬이 있습니다. 그래서,지금 우리는 지금부터 우리의 기능을 갖춘 매트릭스와 함께 작동합니다.

풀링 레이어:

이 계층은 데이터를 처리하는 데 필요한 계산 능력을 감소시키기위한 것입니다. 이 기능을 갖춘 행렬의 치수를 더욱 감소시킴으로써 수행된다. 이 계층에서 우리는 제한된 양의 이웃에서 지배적 인 특징을 추출하려고합니다. 우리가 예를 복용 하 여 명확 하 게 하자.

풀링 레이어

주황색 행렬은 우리의 추천 행렬이고 갈색 행렬은 풀링 커널이며 풀링이 완료된 후 파란색 행렬을 출력으로 얻습니다. 그래서,여기서 우리가 하는 것은 풀링 영역에 있는 모든 숫자 중에서 최대를 취하고 매번 풀링 영역을 이동하여 행렬의 다른 영역을 처리하는 것입니다.

풀링 기술에는 평균 풀링과 최대 풀링의 두 가지 유형이 있습니다.

이 둘의 차이는 평균 풀링에서 풀링 영역의 모든 값의 평균을 취하고 최대 풀링에서는 풀링 영역 내부에 있는 모든 값 중에서 최대 값을 취한다는 것입니다.

따라서 레이어를 풀링 한 후에는 이미지의 주요 기능을 포함하는 행렬이 있으며이 행렬은 더 작은 치수를 가지므로 다음 단계에서 많은 도움이됩니다.

완전히 연결된 레이어:

지금까지 우리는 다른 이미지를 분류하는 것에 대해 아무 것도하지 않았으며,우리가 한 일은 이미지의 일부 기능을 강조 표시하고 이미지의 크기를 크게 줄입니다.

여기에서 우리는 실제로 분류 과정을 수행 할 것입니다.

이제 우리는 우리의 멀티 레벨 완전히 연결된 아키텍처에 적합한 형태로 우리의 입력 이미지를 변환 한 것을,우리는 하나의 열 벡터로 이미지를 평탄화한다. 평평한 출력은 피드 포워드 신경망에 공급되고 모든 훈련 반복에 적용되는 역 전파입니다. 일련의 신기원을 통해 모델은 이미지의 지배 및 특정 저수준 기능을 구별하고 분류 할 수 있습니다.

요약:

  1. 입력 이미지를 컨볼루션 레이어에 제공합니다.
  2. 추천 커널/필터와 회선을 가져 가라.
  3. 풀링 레이어를 적용하여 치수를 줄입니다.
  4. 이 레이어를 여러 번 추가하십시오.
  5. 출력을 평평하게하고 완전히 연결된 층으로 공급하십시오.
  6. 이제 로지스틱 회귀를 사용하여 역 전파로 모델을 학습합니다.

그리고 당신은 당신의 컨볼 루션 신경망을 만들었습니다.

답글 남기기

이메일 주소는 공개되지 않습니다.