학술논문

딸기 질병에 대한 주의 메커니즘 기반 인스턴스 분할 모델 / Attention mechanism based instance segmentation model for strawberry diseases
Document Type
Dissertation/ Thesis
Source
Subject
instance segmentation
smart farming
convolutional neural network
strawberry disease detection
Mask R-CNN
attention mechanism
Language
English
Abstract
식물의 질병은 적절한 치료 절차를 추구하고 경제적 및 품질 손실을 줄이기 위해 초기 단계에서 식별되어야 합니다. 식물 질병을 진단하기 위해서는 비용이 적게 들고 매우 정확한 접근 방식이 필수 불가결합니다. 심층 신경망은 농업 부문을 포함하여 인간 생활의 다양한 측면에서 최첨단 성능을 달성했습니다. 문헌의 현재 상태는 픽셀 수준 인스턴스 세분화를 허용하는 자율 딸기 질병 및 해충 탐지에 사용할 수 있는 데이터 세트의 수가 제한되어 있음을 나타냅니다. 이를 위해 7가지 종류의 딸기 질병에 대한 2500개의 이미지로 구성된 새로운 데이터 세트를 소개합니다. 이를 통해 복잡한 배경 조건에서 딸기 질병을 분류하는 딥 러닝 기반 자율 감지 시스템을 개발할 수 있습니다. 이 7가지 질병에 대한 인스턴스 분할을 효과적으로 수행하는 Mask R-CNN 아키텍처 기반 모델을 제안합니다. 채널 및 공간 주의 블록을 사용하여 네트워크를 더욱 강화합니다. 우리는 이러한 블록을 CSA(Channel Spatial Attention) 모듈의 형태로 네트워크에 통합합니다. 우리는 ResNet 백본을 사용하여 복잡한 환경 조건에서 대상 질병의 세분화를 허용하는 데이터 증강에 대한 체계적인 접근 방식을 따라 0.50의 IoU에 대해 84.62% 및 61.64% 의 최종 평균 평균 정밀도를 달성했습니다. 및 각각 0.50:0.95.
Plant diseases must be identified at the earliest stage for pursuing appropriate treatment procedures and reducing economic and quality losses. There is an indispensable need for low-cost and highly accurate approaches for diagnosing plant diseases. Deep neural networks have achieved state-of-the-art performance in numerous aspects of human life including the agriculture sector. The current state of the literature indicates that there are a limited number of datasets available for autonomous strawberry disease and pest detection that allow pixel-level instance segmentation. To this end, we introduce a novel dataset comprised of 2500 images of seven kinds of strawberry diseases, which allows developing deep learning-based autonomous detection systems to segment strawberry diseases under complex background conditions. We propose a model based on the Mask R-CNN architecture that effectively performs instance segmentation for these seven diseases. We further augment the network using Channel and Spatial attention blocks. We integrate these blocks into the network in the form of a Channel Spatial Attention (CSA) module. We use a ResNet backbone along with following a systematic approach to data augmentation that allows for segmentation of the target diseases under complex environmental conditions, achieving a final mean average precision of 84.62% and 61.64% for an IoU of 0.50 and 0.50:0.95, respectively.