학술논문

CNN의 커버리지와 정확도 상관관계 / CNN Coverage and Accuracy Correlation
Document Type
Dissertation/ Thesis
Source
Subject
Language
Korean
Abstract
본 연구에서는 심층 신경망 모델의 성능을 높이기 위해 심층 신경망의 커버리지와 성능간의 상관 분석을 통하여 효율적인 재학습 데이터를 선택하는 방법을 소개한다. 커버리지와 성능간의 상관 분석을 위해 ResNet-32 모델을 생성하여 수행하였으며, 실험 대상 데이터로는 CIFAR-10, CIFAR-100, STL-10 데이터 세트를 사용하였다. 재학습할 데이터를 생성하기 위해 7가지 데이터 증강 기법을 이용하였으며, 사례 연구는 뉴런 커버리지, k-multisection 뉴런 커버리지, 뉴런 경계 커버리지, Strong 뉴런 활성화 커버리지 및 Top-k 뉴런 커버리지 방법의 5가지의 커버리지 기법을 이용하여 정확도 증가량을 측정하고 측정된 커버리지 값과 상관관계 분석을 수행하였다.각 커버리지 방법에 대해 피어슨 상관 계수를 측정한 결과 k-multisection 뉴런 커버리지 방법이 높은 상관관계를 보였다. 따라서 k-multisection 뉴런 커버리지 방법을 이용하여 재학습 데이터를 선택하면 효율적으로 모델의 성능을 높일 수 있음을 알 수 있었으며, 재학습 데이터를 선택할 때는 각 뉴런의 활성 값이 작거나 크거나 상관없이 다양한 크기의 활성 값을 가지고 있는 커버리지 방법을 적용하여 재학습 데이터를 선택하는 것이 바람직함을 알 수 있었다.