서 론
재료 및 방법
1. 실험 작물 및 장소
2. 초분광 영상데이터 취득
3. 복숭아 과실 품질 데이터 취득
4. 데이터 전처리
5. 복숭아 품질 예측 모델 구축
6. 품질 예측을 위한 주요 파장대 선별
7. 품질 예측을 위한 주요 식생지수 선별
결과 및 고찰
1. 생육 시기별 복숭아 과실 품질 변화
2. 생육 시기별 복숭아 과실 초분광 스펙트럼 변화
3. 복숭아 품질 예측 모델 성능 평가
4. 복숭아 품질 예측을 위한 주요 파장대 선별 및 성능 평가
5. 복숭아 품질 예측을 위한 주요 식생지수 선별 및 성능 평가
서 론
복숭아(Prunus persica)는 쌍떡잎식물 장미목 장미과 벚나무 속에 속하는 관속식물로, 우리나라 주요 과수 중 하나이며 국내에서 매년 약 20만 톤이 생산되고 있다(Mnistry of Ariculture, Food and Rural Affairs, 2023). 농촌진흥청 개발 품종인 ‘미홍’은 6월 하순에서 7월 상순에 수확이 집중되는 극조생 품종으로, 산미가 적고 육질이 부드러워 가격 경쟁력이 높다.
과실의 수확 시기 결정은 과실의 품질을 유지하고 상품성을 높이기 위한 주요 요인 중 하나이다. 일반적인 과실의 수확 시기는 만개 후 일수를 기준으로 결정한다. 하지만 과실 착과 부위와 기상 조건에 따라 변동할 수 있으므로, 복숭아의 착색도, 가용성 고형물 함량, 경도, 산도와 같은 품질 인자 조사를 통하여 수확 시기를 보다 정확하게 판단하는 것이 필요하다. 최근 농업 생산 인구 감소와 고령화, 기후변화, 병해충 등 다양한 문제로 인해 과수의 안정적인 재배 및 생산이 위협받고 있으며, 전통적인 방식은 여전히 시간 소모가 크고, 노동 집약적이다(Busemeyer 등, 2013). 따라서 빠르고 노동력 절감 효과가 크며 비파괴적인 기술에 대한 필요성이 대두되면서(Li 등, 2014) 최근 작물의 생육 모니터링을 위한 영상처리 기술과 인공지능(Artificial Intelligence) 기술에 기반한 스마트 과수원 시스템의 연구가 활발히 이루어지고 있다(Seo 등, 2021).
영상처리 기술은 RGB 카메라, 열화상 카메라, 다분광 카메라, 초분광 카메라, Depth 카메라, LiDAR 등 다양한 비정형데이터 취득 장치를 활용하여 작물의 형태, 분광 정보, 비대 정보, 표현형 데이터 등을 취득하여 작물의 내적/외적 소질을 분석하는 것을 목표로 한다(Costa 등, 2011). 이러한 기술은 농업의 자동화, 기계화, 지능화, 무인화를 실현하고 비파괴적인 과실 품질 측정을 가능하게 한다는 특징이 있다.
영상 취득 장치는 식물과 빛의 상호작용을 기반으로 데이터를 수집한다. 일반적으로 빛은 식물과 반사, 산란, 흡수 및 투과와 같은 방식으로 상호작용을 하며, 카메라는 식물에 반사된 빛을 인식하여 디지털 정보로 저장한다. 이때 빛의 반사 특성은 빛의 파장대와 식물의 생화학적 화합물에 의해 결정된다. 생화학적 성분은 주로 수소(H), 탄소(C), 산소(O), 질소(N)로 구성되며, 이들의 결합(C-O, O-H, C-H, N-H)에 의해 반사 값이 결정된다(Jacquemoud와 Baret, 1990). 이러한 원리를 바탕으로 분광스펙트럼을 이용하여 과실의 품질을 추정하려는 연구가 활발히 이루어지고 있다.
초분광영상(Hyperspectral image)은 자외선(UV), 가시광선(VIS), 근적외선(NIR), 단파장 적외선(SWIR) 등 광범위한 스펙트럼의 반사 값을 기록하는 디지털 센서로 공간정보와 분광 정보를 통합하여 제공한다. 광도계를 이용한 기존의 연구들은 식물의 생화학적인 특성을 이해하기 위해 한 점(point)에서 측정이 이루어졌다. 또한, 영상처리 기술은 RGB영상의 공간정보만을 이용하여 주로 식물의 형태나 색도를 파악하기 위해 수행되었다(Mishra 등, 2017). 초분광영상은 이 두 가지를 결합하여 식물의 구조와 생화학적인 정보에 대한 측정 가능성을 제시함으로써 보다 정확한 생육 모니터링, 수확기 판별, 병충해 탐지가 가능하다는 장점이 있다(Kim 등, 2019). 하지만 대상체와 센서 간의 거리가 멀어짐에 따라 광 간섭, 습도, 오염물질, 센서의 감도, 렌즈 왜곡 등 다양한 외부 요인으로 인한 오차 발생 가능성을 내포하고 있으며, 촬영 모듈의 높은 가격과 이동성 문제는 여전히 해결해야 할 과제로 남아 있다(Mishra 등, 2017).
초분광영상에 기반한 대부분의 기존 연구는 광 환경의 변화와 촬영 조건의 일관성을 위해, 실내 환경이나(Dong와 Guo, 2015), 외부 환경에서 과실을 수확한 후 촬영을 수행하였다(Song 등, 2017). 노지 환경에서 연구된 사례로는 초분광영상을 이용하여 사과의 가용성 고형물 함량, 경도, 전분 함량 등을 예측하여 사과의 성숙도를 나타내는 지표인 Strief 지수를 측정하거나(Wang 등, 2022) 노지 환경에서 무인 지상 차량(UGV)과 초분광 카메라를 활용하여 망고의 성숙도를 예측하는 연구가 있다(Wendel 등, 2018). Wendel 등(2017)은 무인 구동체에 White reference를 설치하여 노지 환경에서 광 변수에 대한 보정을 자동화하는 연구를 수행하였다.
이에 반해, 국내에서는 노지 환경에서의 과실 분광 연구가 아직 시작 단계에 있다. 다양한 광 조건과 기상 조건이 존재하는 노지 환경에서 초분광 영상 데이터를 취득하는 것은 도전적인 작업이다. 그러나 최근 컴퓨터 비전, 인공지능, 초분광 기술의 발전이 이러한 문제를 해결할 가능성을 제시하고 있어, 이 분야에 대한 연구가 활발히 진행되고 있다. 초분광 영상을 통해 복숭아의 품질을 비파괴적으로 측정할 수 있다면, 향후 로봇팔과 카메라가 탑재된 무인 구동체를 활용하여 복숭아의 탐지, 품질 판별 및 수확 과정을 자동화하는 기술의 기초자료로 활용될 수 있을 것이다.
따라서 본 연구는 노지 재배 환경에서 초분광 영상을 이용하여 복숭아 과실의 수확기 품질 예측 모델을 구축하고, 품질 예측에 영향을 미치는 주요 파장대 및 식생지수를 산출하여 추후 장비의 경량화 및 실용화를 위한 기초 자료를 구축하고자 실시하였다.
재료 및 방법
1. 실험 작물 및 장소
본 연구는 경상남도 진주시 문산면 소재 복숭아 과원에서 수행되었다. 해당 과원은 무봉지 재배 방식으로 관리되었다. 연구에 사용된 복숭아는 ‘미홍’ 품종으로, 총 120개의 과실이 연구에 활용되었다. 만개 후 일수를 고려하여 미숙, 적숙, 과숙 단계의 과실을 포함하도록 측정 시기를 조정하였고, 서로 다른 생육 단계의 영상 및 실측데이터를 확보하였다. 매 회마다 20개의 복숭아 과실을 촬영하였고, 촬영한 과실은 다음 날 파괴조사하여 품질 지표(가용성 고형물 함량, 경도, 산도, 색도)를 측정하였다. 이렇게 수집된 초분광 영상데이터와 생육 데이터는 수확기 품질 예측 모델을 구축하기 위한 데이터로 활용되었다.
2. 초분광 영상데이터 취득
복숭아 과실에 대한 초분광 영상데이터 취득은 2023년과 2024년에 걸쳐 복숭아 생육 기간 동안 이루어졌다. 과실의 미숙, 적숙, 과숙 데이터를 비교하기 위해, 2023년에는 만개 후 70일, 77일, 84일에 해당하는 6월 8일, 6월 15일, 6월 22일에 촬영을 진행하였고, 2024년에는 만개 후 68일, 75일, 82일에 해당하는 6월 11일, 6월 18일, 6월 25일에 촬영하였다. ‘미홍’의 일반적인 수확기는 만개 후 65-75일이며, 매년 작물의 생육 상태와 기상 조건을 고려하여 적숙기를 결정한 후, 적숙기 전후 1주일 간격으로 영상데이터를 수집하였다. 촬영은 주로 광원이 충분한 오전 10시부터 오후 1시 사이에 진행하였고, 과실과 센서 간의 촬영 거리는 50cm에서 이루어졌다. 초분광 카메라(FX10, Specim, Oulu, Finland)는 400-1000nm 범위의 파장대를 포함하며, 총 224개의 채널로 구성된 초분광영상을 라인 스캔 방식으로 취득한다. 공간해상도는 1024pixel이며 분광 반치폭(Full Width at Half Maximum, FWHM)은 5.5nm이다. FWHM은 장비가 분별할 수 있는 최소 파장의 간격을 의미한다. 광 보정을 위해 White reference를 과실 옆에 배치하여 같이 촬영하였다. White reference는 99%의 반사율을 갖는 SpectralonⓇ Targets(Labsphere, New Hampshire, USA)을 이용하였다. 암전류 보정을 위한 Dark reference는 촬영 전 카메라 셔터를 닫고 촬영하였다(Fig. 1).
3. 복숭아 과실 품질 데이터 취득
2023년 6월 9일, 6월 16일, 6월 23일과 2024년 6월 12일, 6월 19일, 6월 26일 등 총 6회에 걸쳐 촬영한 과실에 대한 품질 인자들의 실측 데이터를 취득하였다. 측정 항목은 가용성 고형물 함량(Soluble Solids Content, SSC), 산도(Titratable Acidity, TA), 경도(Firmness), 색도이다. 가용성 고형물 함량은 과실의 즙을 낸 후 휴대용 당도계(Pocket Refractometer PAL-1, Atago, Japan)를 이용하여 측정하였다. 산도는 과즙 1mL를 증류수 75mL와 혼합한 뒤 pH 8.3이 될 때까지 0.1N NaOH로 적정하여 말릭산으로 환산하였다. 복숭아 과피의 색도는 과실의 봉합선을 기준으로 적도면 좌우를 색차계(Minolta CR-200, Osaka, Japan)를 이용하여 L*, a*, b* Value를 측정하였다. 복숭아 과실의 경도는 과피를 2-3mm 벗긴 후 지름 8mm 크기의 평면형 막대 형태의 probe를 장착한 RHED TEX SD-700(Sun Scientific Inc., Tokyo, Japan)을 사용하여 깊이 5mm로 측정 후 침투압 경도를 N 단위로 표기하였다.
4. 데이터 전처리
광 환경의 변수, 암 전류에 따른 오차를 보정하기 위하여 모든 픽셀에 다음 Eq. (1)과 같은 반사율 보정(Reflectance calibration) 과정을 진행하였다.
위 수식에서, PCalibration는 0부터 1까지의 값으로 나타나는 반사율을 의미한다. PImage는 촬영한 이미지 내 픽셀 값이다. PDarkref.는 Dark reference 영상에서의 픽셀 값이다. PWhiteref. White reference의 픽셀 값이다. WReflectance는 White reference의 고유 반사율 값을 의미하며, 본 연구에서는 99%의 반사율을 갖는 Reference를 사용하였기 때문에 0.99를 기입하였다. 반사율 보정 후, 분석하고자 하는 영역의 분광 정보 값을 추출하기 위하여 Region of Interest(ROI)를 지정하고, 지정 영역의 모든 픽셀에 해당하는 초분광 스펙트럼을 추출하였다. 복숭아의 경우, 원 형태로 ROI를 지정하여 추출하였고, White reference의 경우 사각형의 형태로 ROI를 지정하여 추출하였다. 이때, 복숭아의 가장자리와 White reference에 음영이 진 부분은 제외하고 ROI를 지정하였다(Fig. 2).
추출한 초분광스펙트럼에서 광학적 노이즈를 제거하기 위하여 처음과 마지막의 5개 밴드를 제외하였고, 이상치 제거를 위해 Interquartile Range(IQR) 방식을 이용하여 다른 데이터들과 큰 차이를 보이는 스펙트럼을 이상치로 규정하여 제거하였다.
이상치 제거 후 기상 조건, 광 조건에 따른 잡음을 줄이기 위하여, Savitzky-Golay(SG) 필터를 적용하여 스무딩을 수행하였고, 윈도우 길이는 11, 다항식 차수는 2로 적용하였다. 그리고 초분광스펙트럼의 평균을 0, 표준편차를 1로 맞추는 Standard Normal Variate(SNV)기법을 적용함으로서 샘플의 분광특성을 비교하고 특정 파장 범위에서의 변화 추세를 파악하기 용이하도록 하였다.
5. 복숭아 품질 예측 모델 구축
본 연구에서 복숭아 품질 예측 모델 구축을 위해 사용된 소프트웨어는 Python 3.9.1로, 사용된 주요 라이브러리는 Pandas, Numpy, Sklearn, Xgboost, Spicy이다.
본 연구에서는 PLSR, RF, XGB 세 가지의 알고리즘을 이용하여 회귀모델을 구축하여 성능을 비교하였다. 부분 최소 제곱 회귀(Partial Least Squares Regression, PLSR)는 독립 변수와 종속 변수 간의 상관관계를 최대화하면서 데이터를 변환하는 회귀 분석 기법으로, 고차원 데이터 분석에 유리한 알고리즘이다. Random Forest(RF)는 여러 개의 결정 트리를 구성하고 그 예측을 결합하여 최종 예측을 수행하는 앙상블 학습 기법으로, 높은 정확도와 안정성을 제공한다. Extreme Gradient Boosting(XGB)은 경사 부스팅(Gradient Boosting) 알고리즘을 기반으로 한 기법으로, 예측 성능이 뛰어나고 계산 효율성이 높은 것이 특징이다. 본 연구에서 활용된 데이터 셋의 경우, 이미지 기반의 대규모 데이터 셋에 적합한 딥러닝 알고리즘 보다는 정형 데이터 기반 중규모 데이터 셋에 적합한 머신러닝 알고리즘을 적용하는 것이 적합하다고 판단하여 위와 같은 알고리즘을 사용하였다.
초분광영상 기반 예측 모델뿐만 아니라, 주요 파장대와 식생지수를 기반으로 구축한 모델의 정확도를 알아 보기 위하여 모델의 독립 변수를 214개의 모든 초분광 스펙트럼(Hyperspectral spectrum, HSS), 주요 파장대(Important Feature, IF), 주요 식생지수(Vegetation Index, VI)로 나누어 구축하였다.
앞서 언급한 세 가지의 독립 변수와 세 가지의 알고리즘을 활용하여 복숭아의 가용성 고형물 함량(SSC), 산도(TA), 경도(Firmness)를 예측하는 모델을 구축하였고, 총 27개의 모델을 개발하여 성능을 검증하였다. 예측 모델을 구축하기 위하여 데이터의 80%인 96개의 초분광 영상 데이터는 Train data로 활용하였고, 20%인 24개는 검증을 위한 Test data로 활용하였다. 제한된 데이터 개수 내에서 평가 지표의 신뢰성을 확보하고자 5 Cross-Validation 기법을 이용하여 모델 성능 평가를 수행하였고, 지표는 결정 계수(R2, Coefficient of Determination)와 평균 제곱근 오차(RMSE, Root Mean Squared Error)를 기준으로 평가하였다.
6. 품질 예측을 위한 주요 파장대 선별
주요 파장대를 선별하기 위해 중요도 분석을 수행하였으며, 예측 모델 중 가장 높은 성능을 보인 RF와 같은 Tree기반 기법인 Random Forest Importance Analysis(RFIA)를 사용하였다. 중요도 분석은 RF모델에 의해 산출된 Gini decrease를 기반으로 계산되었으며, 중요도가 높은 파장대일수록 예측 성능에 기여하는 정도가 큰 것으로 간주하였다. 초분광 영상 데이터를 기반으로 9개의 예측 모델을 구축한 후, 각 모델에서 RFIA기법을 적용하여 214개 파장대 각각의 중요도를 산출하였다. 그리고 중요도가 높은 파장대 중 1개부터 10개 이하의 파장대를 선택하여, 각각의 경우에 대해 예측 모델을 구축하고 성능을 비교하였다. 그 결과, 파장대의 개수에 따른 모델의 예측 정확도를 평가하여 가장 높은 정확도를 보이는 최적의 파장대 개수를 도출하였다.
7. 품질 예측을 위한 주요 식생지수 선별
식생지수(Vegetation Index)는 주로 가시광선과 적외선의 반사율을 이용하여 식물의 건강 상태, 생리적 변화 및 스트레스 분석에 이용된다(Jin와 Eklundh, 2014). 광합성 색소인 엽록소는 청색(400-500nm)과 적색(600-700nm)의 빛을 흡수하고, 녹색(500-600nm)과 근적외선(700-1000nm)의 빛을 반사하는 성질을 갖고 있다. 이러한 성질을 이용하여 식생지수를 산출하고 식물의 생육을 모니터링할 수 있다(Shin 등, 2003; Kim 등, 2021). 식생지수는 오랫동안 전문가들의 연구에 의해 개발되어 왔으며, 현재까지 150여 종류가 보고되었다. 대표적으로 식물 내 엽록소의 함량을 추정하는 정규화된 식생지수(Normalized Difference Vegetation Index, NDVI)가 있다. 식물의 녹색 정도를 파악하는 식생지수인 NDVI와 SRI(Simple Ratio)는 식물이 스트레스를 받아 녹색과 근적외선 파장대의 반사율이 감소하고 적색 파장대가 높아지는 것을 이용하여 산출한다(Shin 등, 2003). SIPI(Structure Insensitive Pigment Index)는 주로 식물체 내 카로티노이드의 비율을 계산함으로써 산출되는데, NIR파장대에서 청색(R445)과 적색(R680)의 반사율을 뺀 값들의 비율을 통해 산출된다. PRI (Photochemical Reflectance Index)는 엽록소형광에 의해 결정되는 NPQ(Non-Photo-chemical Quenching)과 높은 상관성이 있다. 식물은 강한 빛에 의해 광합성 기구가 손상될 경우, 크산토필 회로를 통해 빛 에너지를 열에너지로 전환한다. 이 과정에서 비올라크산틴의 농도는 감소하고 제아크산틴의 농도는 증가한다. 531nm와 570nm 파장에서의 반사 값은 이 색소들의 농도 변화와 관련이 있으며, 이를 통해 PRI 지수를 산출한다(Ryu 등, 2018; Na 등, 2019). 안토시아닌류 색소들은 530nm 파장대에서 강한 흡수 피크를 갖고(Forkmann와 Martens, 2001; Kim 등, 2014), 카로티노이드 계열 색소들은 510nm 파장대에서 방출 피크를 갖는다. 하지만 이러한 파장대역에서는 엽록소에 의한 반사 값도 중첩되어 있기 때문에 엽록소에 의한 전자기파 반사효과를 제거해 주기 위하여, 550 nm의 반사값을 활용하여 엽록소에 의한 반사 효과를 제거해 준 후 산출한다(Yoon 등, 2021). 본 연구에서는 14개의 식생지수를 이용하여 모델을 구축하고(Table 1), 주요 식생지수를 산출하였다. 산출된 주요 파장대와 식생지수는 추후 촬영 모듈 경량화 및 가격 절감을 위한 다분광 카메라 기반 과실 품질 예측 시스템 구축에 기초자료로 활용될 수 있다.
Table 1.
결과 및 고찰
1. 생육 시기별 복숭아 과실 품질 변화
본 연구에서는 복숭아 과원에서 수확기 판별을 위한 모델을 구축하기 위하여 복숭아 ‘미홍’ 품종을 대상으로 2023년, 2024년에 총 6회의 초분광영상 취득과 개별 과실의 품질 조사를 하였다. 미숙 과실과 적숙/과숙 단계의 과실간의 차이를 알아보기 위하여 가용성 고형물 함량, 경도, 산도, 색도를 분석하여 과실의 품질 변화를 조사하였다(Fig. 4).
과실의 가용성 고형물 함량, a* Value는 생육기간이 지날수록 값이 증가하는 경향을 보였으나, 경도, 산도는 지속적으로 감소하는 경향을 보였다. 다만 강우 조건에 영향을 많이 받는 가용성 고형물 함량의 경우, 경도와 산도에 비하여 뚜렷한 변화 양상을 나타내지는 않았다. 복숭아 ‘미황’ 품종을 대상으로 한 연구 결과에 따르면, 생육기간이 지남에 따라 a* Value는 증가하는 반면, 산도와 경도는 감소하는 것으로 나타났다. 또한, 가용성 고형물 함량은 강우로 인한 토양 내 수분 함량 증가에 따라 저하될 가능성이 있어 품질 지표로 부적합한 것으로 보고되었다(Shin 등, 2022).
2. 생육 시기별 복숭아 과실 초분광 스펙트럼 변화
본 연구에서는 전체 밴드에서 앞뒤 5개의 밴드를 제외한 214개의 밴드를 갖는 초분광 스펙트럼을 복숭아의 생육 기간별로 나누어 비교하였다. 초분광 스펙트럼을 비교한 결과, 가시광선에서는 비교적 일관적인 변화 양상을 보였으나 근적외선 영역에서는 2023년과 2024년의 변화 양상이 다르게 나타났다(Fig. 5). 이는 복숭아의 작기별 분광 스펙트럼, 기상 조건, 광학 기기의 노이즈 등 다양한 요인으로 나타난 결과로 판단된다. 과실의 고유 특성 외에 다른 요인들의 영향을 최소화하기 위해 SG 및 SNV 기법을 적용하여 분석에 활용하였다(Fig. 6).
SG 및 SNV기법을 적용한 후, 초분광 스펙트럼은 복숭아의 생육 시기에 따라 일관된 변화 양상을 나타냈다. 복숭아의 생육 시기가 지남에 따라, 복숭아 과실의 초분광 스펙트럼은 녹색 파장대(500-600nm)와 근적외선(700-1000nm)에서 반사율이 감소하는 경향을 보였고, 적색 파장대(600-700 nm)에서 반사율이 증가하는 경향을 보였다. 청색 파장대(400-500nm)에서는 생육 시기에 따른 유의미한 차이는 발견되지 않았다. 이는 복숭아가 숙성되면서 녹색과 근적외선에서 높은 반사 특성을 갖는 엽록소(Chlorophyll a, b)가 분해되고, 적색 파장대에서 높은 반사 특성을 갖는 안토시아닌(Anthocyanin)의 합성이 촉진되었기 때문으로 판단된다. 포도나무 잎의 안토시아닌 함량에 따른 분광 특성을 조사한 연구에 따르면, 안토시아닌 함량이 높은 처리구에서 녹색 파장대(540-560nm)와 근적외선(760-800nm)의 반사율이 감소하며, 적색 파장대(660-680nm)에서 증가하는 경향을 보였다(Steele 등, 2009). 또한 복숭아 ‘마도카’의 경우 680, 970nm파장대에서 높은 흡수스펙트럼이 나타났으며, 생육기간이 지날수록 녹색 파장대에서 감소하였고, 적색 파장대에서 증가하는 경향을 보였다(Jang 등, 2022).
3. 복숭아 품질 예측 모델 성능 평가
214개의 초분광 밴드를 독립 변수로 하여, PLSR, RF, XGB알고리즘을 기반으로 가용성 고형물 함량(SSC), 산도(TA), 경도(Firmness)를 예측하는 회귀모델을 구축하였다(Table 2). 가용성 고형물 함량의 경우 PLSR, RF, XGB의 알고리즘 모두에서 낮은 정확도를 보였다. RF-TA모델의 경우 Train data의 R2은 0.8297, RMSE는 0.0924으로 나타났고 Test data의 R2은 0.8084, RMSE는 0.1167으로 나타났다. RF-Firmness모델의 경우 Train data의 R2은 0.9430, RMSE는 5.7793으로 나타났고 Test data의 R2은 0.9202, RMSE는 7.8058으로 나타났다. PLSR모델의 경우 RF보다 정확도가 낮았고, XGB알고리즘의 경우 Train data에서는 높은 정확도를 나타내지만 Test data에서 정확도가 급격하게 감소하여 과적합이 의심된다. 따라서 초분광 영상 기반 TA, Firmness를 예측하기 적합한 모델은 RF모델로 판단된다. Mo 등(2017)은 사과 ‘후지’ 품종의 초분광영상을 취득하여 당도 예측 모델을 구축하는 연구를 진행하였다. 모델의 정확도 비교 결과 SNV를 적용한 스펙트럼을 기반으로 예측한 모델에서 정확도(R2)가 0.8638로 나타났으며, 주요 파장대는 620-680nm, 958nm, 970-990nm로 나타났다. 이는 사과의 색소와(Stellacci 등, 2016) 수분 함량이 작용하였기 때문으로 판단된다. 망고를 대상으로 초분광 영상 기반 건중량(dry matter) 예측 모델을 구축한 Wendel 등(2018)의 경우, PLSR알고리즘을 이용한 모델의 경우 R2이 0.58, CNN을 이용한 모델의 경우 0.64로 나타났다(Wendel 등, 2018).
Table 2.
4. 복숭아 품질 예측을 위한 주요 파장대 선별 및 성능 평가
구축한 초분광영상 기반 예측 모델에서, 주요 파장대를 산출하기 위하여 10개 이하의 파장대를 이용하여 모델을 구축하였을 때, 가장 정확도가 높은 모델의 파장대를 산출하였다(Table 3). 가용성 고형물 함량의 경우, 505-508nm, 701 nm, 742-770nm, 797nm 파장대가 주요 파장대로 나타났으며, 산도의 경우 503-510nm, 661-669nm 파장대가 주요 파장대로 나타났다. 경도의 경우 500-518nm, 532nm, 745-756nm 파장대가 주요 파장대로 나타났다. Kim 등(2024)은 촬영 챔버에서 취득한 감귤의 초분광 스펙트럼에 SNV와 SG 1차 미분필터를 적용하여 비교하였다. 그 결과, 감귤의 가용성 고형물 함량이 증가할수록 460nm 이하 파장대에서의 흡수 피크(Negative peak)가 증대되었고, 640nm와 900nm의 강한 흡수 피크가 감소하여 평탄해졌으며 근적외선 파장대(700-900nm)에서 전체적으로 반사율이 감소하였다. 또한 Savitzky-Golay 1차 미분을 적용했을 때, 521, 620, 672, 792, 880, 900, 955nm에서 강한 스펙트럼 흡수 피크가 나타났다고 보고하였다.
일부 모델(PLSR-SSC, PLSR-Firmness, XGB-SSC, XGB-TA)에서 모든 파장대(HSS)를 기반으로 모델을 구축하였을 때보다 높은 정확도를 보였으며 대부분의 모델에서는 정확도가 소폭 감소하였다. 성능이 향상된 원인은 상대적으로 불필요한 특징을 분석에서 제외함으로서 발생하는 노이즈 감소, 다중공선성 감소, 모델 복잡도 감소, 주요 특징 강조 등이 작용한 것으로 판단된다(Jia 등, 2022). 또한 정확도가 소폭 감소하였어도, 주요 파장대를 선별하여 모델의 복잡도를 줄이는 것은 하드웨어의 자원을 절약할 뿐만 아니라 추후 다분광 카메라 등 기술의 실용화와 경량화를 위하여 활용될 수 있을 것으로 보인다.
Table 3.
5. 복숭아 품질 예측을 위한 주요 식생지수 선별 및 성능 평가
여러 식생지수 중에서, 연구에 자주 활용되거나 복숭아의 숙도와 연관성이 높은 14개의 식생지수(Yoon 등, 2021)를 선정하여 생육기간에 따른 변화를 비교하였다(Fig. 7). 또한 식생지수를 독립 변수로 하여 복숭아 품질 예측 회귀모델을 구축하고 정확도를 비교하였으며(Table 4), 각 모델마다 식생지수의 중요도를 분석하여 나타내었다(Fig. 8).
Table 4.
복숭아의 생육기간이 길어질수록 EVI, GLI, IPVI, WV-VI, NDVI, SRI, PRI에서 감소하는 것으로 나타났고, SIPI, ARI1, ARI2에서 증가하는 것으로 나타났다. 이는 복숭아 과실이 성숙할수록 엽록소 함량이 감소하고 안토시아닌 함량이 증가하기 때문으로 판단된다(Giovos 등, 2021).
식생지수 기반 복숭아 품질 예측 모델을 구축한 결과, PLSR-TA모델의 경우 Train data의 R2은 0.6392, RMSE는 0.1488로 나타났고, Test data의 R2은 0.8121, RMSE는 0.1156으로 나타났다. RF-Firmness모델의 경우 Train data의 R2은 0.9495, RMSE는 6.1983으로 나타났고, Test data의 R2은 0.9108, RMSE는 8.2512로 나타났다. 브롬그래스(Bromus inermis) 종자를 대상으로 한 연구에 따르면, 식생지수 RVI, NDVI, LNC, LAI를 이용하여 수확량 예측 모델을 구축하였을 때, RF알고리즘을 사용한 모델에서 예측 정확도(R2)가 0.75로 나타났다(Ou 등, 2024).
식생지수 중요도 분석 결과, 공통으로 PRI, GLI, EVI, SIPI등이 예측 모델에서 높은 중요도를 나타내었다.