©The Korean Society for Bio-Environment Control, All rights reserved.
ABSTRACT
서 론
재료 및 방법
1. 데이터 선정 및 전처리
2. 생산량 기반 농가 분류
3. 작물 생육 지표 분석
4. 환경관리 전략 분석
5. 통계 분석 및 그래프
결과 및 고찰
1. 농가별 생산량
2. 작물 생육 단계별 지표
3. 생육 단계별 환경관리
4. 결론
서 론
최근 스마트 농업은 생산성과 자원 이용 효율성을 높이기 위한 중요한 혁신으로 자리잡고 있다. 특히 센서 기술과 데이터 분석 기법의 진보로 농업 현장의 빅데이터 수집과 이용이 가능해졌으며, 빅데이터의 활용은 농업 분야에서 새로운 가능성을 열고 있다. 스마트 농업 기술을 이용해 농업인들은 실시간으로 작물 상태를 모니터링하고 데이터에 기반해 최적 환경을 조성할 수 있게 되었다(Steeneken 등, 2023). 데이터 기반 재배는 과학적 근거에 따른 관리로 작물 생산량을 늘릴 수 있을 뿐만 아니라, 환경제어 자동화, 생산량 예측 등의 기반이 된다(Li 등, 2021). 또한, 재배자의 경험적 지식을 수치화함으로써 재배 경험이 적은 농업인도 성공적인 경영이 가능한 길을 열고 있다.
데이터 기반 재배를 위해서는 특정 시점 작물 생육 상황을 판단하고 환경관리 방향을 결정할 기준값이 필요하다. 농촌진흥청은 스마트팜 생산성 향상을 위해 시설 채소 우수 농가에서 공공 빅데이터를 수집 및 분석하고, 적정 환경제어 기준값을 제시하고 있으나, 일일 주야간 평균값을 제시하는 등 여전히 개략적이기 때문에 농업 현장에서 이용에 어려움이 있다(Lee, 2021; RDA, 2024).
온실 환경 제어에 있어 시간대별 환경 설정은 효율적인 작물 관리를 위해 필수적이다. 일사량, 온도, 습도 등 환경 조건에 따라 작물의 생리 반응이 달라지기 때문에, 시간대별 변화를 고려한 정밀한 환경 설정이 필요하다(Van Straten 등, 2000). 또한, 작물의 각 생육 단계에서 생산량 증대를 위한 최적 상태를 파악하고 이를 기준으로 한 관리 전략이 필요하다(Körner and van Straten, 2008; Van Straten 등, 2002). 현재 일반적으로 사용하는 온실 환경 제어 시스템에서는 사용자가 하루를 여러 주기로 나누고, 각 주기마다 다른 제어 전략을 설정할 수 있다. 따라서 환경제어 시스템의 생육 단계별, 주기별 최적 제어값 결정의 기초가 될 수 있는 우수농가의 시간대별 환경관리 전략 분석 및 제시가 필요하다.
본 연구의 목적은 재배 현장에 적용 가능한 온실 환경 및 작물 생육 관리의 실질적 지침을 제공함으로써 데이터 기반 재배 기술을 고도화하는 데 있다. 따라서 본 연구에서는 농촌진흥청에서 수집한 시설 딸기 농가 공공 빅데이터의 생산량, 생육, 환경 데이터를 이용하여 (1) 생산량 백분위에 따라 농가를 분류하고, (2) 계절, 날씨별 시간 단위 온실 환경관리 전략과 (3) 생육 단계별 적정 작물 생육 상태를 판단할 수 있는 기준을 도출하였다.
재료 및 방법
1. 데이터 선정 및 전처리
농가 빅데이터를 이용한 분석을 위해 농촌진흥청 “농업빅데이터 수집 및 생산성향상모델 개발” 사업에서 수집한 시설채소 농가 데이터 중 2018년 작기 딸기(Fragaria x ananassa Duch.) 농가에서 수집된 데이터를 대상으로 분석하였다(Lee, 2021). 해당 데이터는 농가 정보, 시간단위 온실 내외부 기상환경, 주단위 작물 생육, 일단위 생산물 정보를 포함하고 있다(Table 1). 국내 재배면적이 가장 넓은 ‘설향’ 품종을 재배하는 농가를 분석 대상으로 하였으며, 생산물 정보가 없는 농가는 분석에서 제외하고, 총 48개 농가를 대상으로 분석하였다(RDA, 2020).
Table 1.
The original variables selected for analysis from the dataset collected by RDA (see Methods for detailed information). Additional derived variables analyzed in this study are not included here.
Category
|
Variable
|
Frequency
|
Unit
|
Farm information
|
Farm ID
|
-
|
-
|
Planting area
|
-
|
m2 |
Production
|
Production
|
day
|
kg
|
Crop growth
|
Crown diameter
|
week
|
mm
|
Plant height
|
week
|
cm
|
Number of leaves
|
week
|
-
|
Leaf width
|
week
|
cm
|
Leaf length
|
week
|
cm
|
Truss ID
|
week
|
-
|
Number of fruits (per truss)
|
week
|
-
|
Climate
|
Temperature (outdoor)
|
hour
|
℃
|
Temperature (indoor)
|
hour
|
℃
|
Relative Humidity (indoor)
|
hour
|
%
|
2. 생산량 기반 농가 분류
생산량 상위 농가의 생육 및 환경 관리 전략을 분석하기 위해, 단위면적당 생산량(kg·m-2)에 따라 농가를 33.3%씩 3개의 백분위 구간으로 나눈 뒤 (1) 상위, (2) 중위, (3) 하위 생산량 집단으로 분류해 분석하였다. 농가별 단위면적당 생산량은 작기(정식일-2019년 4월 15일) 누적 출하량을 식재면적으로 나누어 구하였다. 생산량이 전체 농가 생산량 분포의 사분위수 범위(Interquartile Range, IQR)의 1.5배 이상을 벗어난 경우 이상치로 판단해 해당 농가를 분석에서 제외하였다.
3. 작물 생육 지표 분석
생육 단계별 생육 지표를 분석하기 위해, 작기 전체(2018년 9월 11일-2019년 4월 15일)의 생육 데이터를 이용하였다. 생육 데이터는 약 7일 간격으로 측정되었으나 농가별 측정일에 차이가 있어, 최초 측정일(2018년 9월 11일)부터 7일 간격으로 구분하여 분석에 이용하였으며, 각 농가별로 측정한 모든 개체의 평균값을 분석하였다(n = 3-4). 딸기의 주요 영양생장 지표로 관부직경, 초장, 잎수를, 생식생장 지표로 화방별 착과시기, 화방별 착과 수를 분석하였다. 화방별 착과수는 분석 종료 시기의 일반적 발달 단계를 고려하여 5화방까지의 데이터를 분석에 이용하였다(RDA, 2020). 또한 작물 생육 단계별 주요 생육 지표, 환경, 생산량의 관계를 분석하기 위해, 생육 단계를 6구간으로 구분하였다. 시설 딸기 농가에서는 일반적으로 화방의 착과기에 맞추어 작물과 환경 관리가 달라지는 점을 고려하여, 1-5 화방에서 첫 과실의 착과가 전체 농가의 3분의 1 이상에서 완료된 날짜를 기준으로 생육 단계를 구분하였다(RDA, 2020).
4. 환경관리 전략 분석
생육 단계 및 시간대별 환경관리 전략을 분석하기 위해, 작기 전체(2018년 9월 1일-2019년 4월 15일)의 환경 데이터를 이용하였다. 국내 딸기 재배에서는 주로 온도 위주 환경관리가 이루어지므로(Jeong 등, 2018; Lee 등, 2019; RDA, 2020), 온실 내부 온도 관련 주요 지표를 선정하여 생육 단계별로 분석하였다. 일 평균기온(Tmean), 일 최고기온(Tmax), 일 최저기온(Tmin)을 생산량 집단별로 비교하였다. 그리고 시간대별 온실 내부 온도가 생산량에 주는 영향을 확인하기 위해, 생육 단계별 일간 온도변화 패턴과 생산량의 관계를 분석하였다.
5. 통계 분석 및 그래프
데이터 가공 및 시각화에 Python v3.11.4의 numpy, pandas, matplotlib, seaborn API를 사용하였으며, 데이터 분석 대상은 생산량 집단별 딸기 생육 단계에 따른 생육, 온도, 생산량 관련 지표였다.
결과 및 고찰
1. 농가별 생산량
농촌진흥청에서 수집한 2018년 작기(2018년 9월 11일-2019년 4월 15일) 시설 딸기 농가 48곳의 공공데이터를 분석한 결과, 농가별 단위면적당 생산량(kg·m-2) 분포는 평균 3.49, 표준편차 1.399, 1사분위수 2.49, 중앙값 3.74, 3사분위수 4.40이었다(Fig. 1). 2018, 2019년 전국 시설 딸기 평균 단위면적당 생산량은 각 3.05, 3.63kg·m-2로 조사되어, 본 데이터의 평균값과 유사하였다(MAFRA, 2023). 본 연구에서는 단위면적당 생산량에 따라 농가를 3개의 백분위 구간으로 나눈 뒤 (1) 상위, (2) 중위, (3) 하위 생산량 집단으로 분류하였다(Fig. 2). 상위, 중위, 하위 집단의 평균 생산량은 각 4.96, 3.63, 1.91kg/m2였다.
Fig. 1
The density distribution of yield of strawberry farms (n = 48). Brown line was fitted with Kernel Density Estimate (KDE), and the dotted line indicates the mean yield.
Fig. 2
The distribution of yield across farm yield groups. Farms were grouped based on yield percentile rankings. Estimated means are accompanied by 95% confidence intervals.
시기별 누적 생산량을 비교한 결과, 11월까지의 1화방 초기 생산량에는 집단간 차이가 없었으나, 12월 전체에 걸쳐 상위, 중위 농가의 월간 생산량 증가율이 0.7kg·m-2, 0.6kg·m-2로 늘어나 하위 농가의 0.4kg·m-2와 구분되었으며, 1월 월간 생산량 증가율은 상위, 중위, 하위 농가에서 1.3kg·m-2, 0.8kg·m-2, 0.5kg·m-2로 상위 농가에서 상대적으로 큰 폭으로 늘어났다(Fig. 3). 반면 하위 농가의 생산량 증가율은 전 작기에 걸쳐 비교적 일정하여, 0.3-0.5kg·m-2 범위를 유지하였다.
Fig. 3
Cumulative yields over time across farm yield groups, divided into three categories by yield percentile rankings. Blue line, high yield (top third); orange line, medium yield (middle third); green line, low yield (bottom third).
2. 작물 생육 단계별 지표
작물 생육 단계별 주요 생육 지표와 생산량의 관계를 분석하기 위해, 생육 단계를 6구간으로 구분하였다(Fig. 4). 생육 단계는 각 화방에서 첫 과실의 착과가 전체 농가의 3분의 1 이상에서 완료된 날짜를 기준으로 정의하였으며, 1-5화방 대상 기준일은 각각 2018년 10월 16일, 2018년 12월 4일, 2019년 1월 1일, 2019년 1월 29일, 2019년 2월 26일이었다.
Fig. 4
Number of fruits counted on different trusses (truss 1 to 5) over time across farm yield groups. Blue line, high yield (top third); orange line, medium yield (middle third); green line, low yield (bottom third). Vertical dashed lines indicate key dates when over one-third of the farms reached the fruit-setting stage for each truss. The error bands represent 95% confidence interval (CI) for the average values.
영양생장 분석 결과, 각 시점에서 관부 직경, 초장, 엽수에는 생산량 집단 간에 유의한 차이가 없었다(Fig. 5). 전체 농가에서 관부 직경 및 초장은 정식 후 2구간 끝까지 증가하다가 약 12월 초부터 수렴하였다. 엽폭 및 엽장은 정식 후 증가하여 2구간 중-후반부에 최대값에 도달 후 2월 초까지 감소하여, 겨울철에 잎 크기가 감소하는 경향을 확인하였다. 생육 단계별 상위 농가의 생육 평균값을 Table 2에 제시하였다.
Fig. 5
Crown diameter, plant height, number of leaves measured over time across farm yield groups. Blue line, high yield (top third); orange line, medium yield (middle third); green line, low yield(bottom third). Vertical dashed lines indicate key dates when the fruit-setting stage is reached for each truss (truss 1 to 5), which divide the timeline into six growth phases. The error bands represent 95% confidence interval (CI) for the average values.
Table 2.
Strawberry growth indicators from the high-yielding group at different growth phases. Each growth phase is defined by key dates when the fruit-setting stage was reached for each of truss 1 to 5 (see Fig. 4 for detailed method of phase segmentation).
Growth phase
|
Crown diameter
(mm)
|
Plant height
(cm)
|
Number of leaves
|
Leaf width
(cm)
|
Leaf length
(cm)
|
1
|
12.9
|
19.5
|
5.6
|
7.8
|
9.2
|
2
|
16.3
|
28.9
|
6.8
|
10.0
|
12.0
|
3
|
17.5
|
32.7
|
8.1
|
8.6
|
10.7
|
4
|
17.7
|
32.7
|
8.9
|
6.8
|
8.3
|
5
|
17.8
|
31.6
|
9.3
|
6.3
|
7.5
|
6
|
17.4
|
29.5
|
9.4
|
6.7
|
7.9
|
3. 생육 단계별 환경관리
적정 환경관리 전략을 제시하기 위해, 생육 단계별 온실 내부 온도를 분석하였다. 시간대별 온실 내부 온도가 생산량에 주는 영향을 확인하기 위해, 생육 단계 및 생산량 집단별 일간 온도변화 패턴을 분석하였다(Fig. 6). 12-2월 저온기에 해당하는 생육 단계 3-5구간의 평균 주간 최고기온은 상위, 중위, 하위 농가에서 각 21.8℃, 19.7℃, 18.2℃로 상위 농가에서 가장 높고 하위 농가에서 낮았다. 또한, 하위 농가에서는 상위 및 중위 농가와 비교했을 때 온도의 최고점이 빠르게 나타났고, 온도 감소 또한 14시경부터 더 빠르게 시작되었다. 야간 최저온도는 전 생육구간에서 상위 농가에서 상대적으로 높았으며, 중위 농가 및 하위 농가에 비하여 각각 평균 1.0℃, 2.0℃ 높았다. 또한 생육 3-5구간에서 상위 농가의 일몰 후 18시 평균 온도는 13.0℃로 중위 농가의 12.0℃, 하위 농가의 10.8℃에 비하여 상대적으로 높게 나타났다. 12월부터 하위 농가 대비 상위·중위 농가의 생산량 증가율이 커지고, 1월부터 상위 농가에서 높은 생산량 증가율을 보여 중위 농가와 구분되는 경향을 보였으므로, 겨울철 초저녁 온도 관리가 생산량 증가율에 영향을 준 것으로 보인다. 따라서 초저녁 온도 관리와 생산성 간 관계에 대한 구체적인 추가 연구가 필요할 것으로 판단된다. 상위 농가의 생육 단계에 따른 시간대별 온실 내부 온도 평균값을 Table 3에 제시하였다.
Fig. 6
Hourly average temperature inside greenhouse across different farm yield groups, segmented by growth phases. Blue line, high yield (top third); orange line, medium yield (middle third); green line, low yield (bottom third). The error bands represent 95% confidence interval (CI) for the average values.
Table 3.
Hourly temperature (℃) inside the greenhouse from the high-yielding group at different growth phases. Each growth phase is defined by key dates when the fruit-setting stage was reached for each of truss 1 to 5 (see Fig. 4 for detailed method of phase segmentation).
Growth
phase
|
Hourly temperature (℃)
|
0
|
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
11
|
12
|
13
|
14
|
15
|
16
|
17
|
18
|
19
|
20
|
21
|
22
|
23
|
1
|
16.6
|
16.3
|
16.0
|
15.8
|
15.7
|
15.6
|
15.4
|
15.8
|
18.0
|
21.3
|
24.1
|
25.8
|
26.6
|
27.0
|
27.1
|
26.7
|
25.8
|
23.8
|
21.0
|
19.1
|
18.2
|
17.6
|
17.2
|
16.8
|
2
|
11.7
|
11.5
|
11.3
|
11.2
|
11.1
|
11.0
|
11.0
|
11.1
|
12.1
|
15.3
|
18.9
|
21.5
|
22.7
|
23.4
|
23.6
|
23.0
|
21.1
|
18.1
|
15.0
|
13.5
|
12.8
|
12.4
|
12.3
|
11.9
|
3
|
9.6
|
9.7
|
9.6
|
9.6
|
9.6
|
9.7
|
9.8
|
10.0
|
10.5
|
11.2
|
13.8
|
17.6
|
19.8
|
21.0
|
20.8
|
19.5
|
16.7
|
13.2
|
11.5
|
10.8
|
10.3
|
10.1
|
9.7
|
9.7
|
4
|
9.5
|
9.3
|
9.3
|
9.2
|
9.4
|
9.5
|
9.6
|
9.8
|
10.5
|
11.1
|
14.0
|
19.0
|
21.6
|
22.1
|
22.2
|
21.3
|
18.9
|
14.9
|
12.4
|
11.3
|
10.6
|
10.2
|
10.0
|
9.6
|
5
|
10.1
|
9.8
|
9.7
|
9.6
|
9.5
|
9.6
|
9.7
|
9.9
|
10.5
|
11.8
|
15.7
|
19.2
|
21.0
|
21.9
|
22.3
|
21.9
|
20.5
|
16.9
|
13.7
|
12.1
|
11.4
|
11.0
|
10.6
|
10.3
|
6
|
11.5
|
11.2
|
11.0
|
10.9
|
10.8
|
10.6
|
10.6
|
11.1
|
13.2
|
16.8
|
19.9
|
21.9
|
22.9
|
23.4
|
23.4
|
23.3
|
22.3
|
20.5
|
17.3
|
14.4
|
13.0
|
12.4
|
12.0
|
11.7
|
4. 결론
본 연구는 농촌진흥청에서 수집한 농가 데이터를 바탕으로 시설 딸기 농가의 생산량에 따른 환경 및 생육을 비교 분석할 수 있었다. 분석 결과, 상위 농가에서 12-2월의 저온기의 일몰 후 온도가 비교적 높게 유지되고, 생산량이 12-1월에 높은 증가율을 보이는 경향을 보여, 일몰 후 보온·난방이 생산량 증가에 긍정적 영향을 미칠 가능성을 시사하였다. 또한 본 연구에서는 빅데이터 분석을 통하여 상위 농가의 생육 단계에 따른 시간대별 온도와 작물 생육 기준의 평균값을 확인하였으며, 이를 현장 환경제어 시스템의 주기별 설정값을 결정할 때 기초로 활용할 수 있을 것으로 기대된다. 그러나 상위 농가의 환경, 생육, 생산량 간 상관관계는 데이터의 한계로 인해 분석에 제한이 있었다.
본 연구에서 사용된 농가 데이터의 한계점은 다음과 같다. 첫째, 환경 데이터의 수집 간격이 1시간이기 때문에, 분 단위의 일사량 변화, 일출·일몰 시간대의 세밀한 온도 변화 등을 분석하는 데 어려움이 있었다. 둘째, 작물 생산성에 직접적인 영향을 미치는 양액 공급, 적엽, 적화 등의 농작업 관련 데이터가 수집되지 않아 정확도에 제한이 있었다(RDA, 2020). 셋째, 농업 현장의 의사결정에는 노동력 공급, 에너지 가격 등의 외부 요인도 중요한 역할을 하므로, 관련 지표를 고려한다면 생산성 향상에 기여할 수 있을 것이다. 따라서 향후 연구에서는 데이터 수집 항목 및 빈도 확대를 통하여, 복합적 요인을 고려한 보다 실용적인 분석 결과를 제시할 수 있을 것이다.
Acknowledgements
본 연구는 농촌진흥청 고유연구개발사업(과제번호: PJ01736304)의 지원에 의해 이루어진 것임.
References
Jeong, Y.K., J.G. Lee, S.W. Yun, H.T. Kim, and Y.C. Yoon 2018, Field survey of greenhouse for strawberry culture: case study based on Western Gyeongnam area. Protected Horticulture and Plant Factory 27:253-259. (in Korean)
10.12791/KSBEC.2018.27.3.253Körner, O.S.G.V., and G. van Straten 2008, Decision support for dynamic greenhouse climate control strategies. Computers and Electronics in Agriculture 60:18-30.
10.1016/j.compag.2007.05.005Lee H.R 2021, A study on productivity improvement model and gathering big data of smart farm in vegetable grown in facilities. Rural Development Administration. (in Korean) doi:10.23000/TRKO201900016054
Lee, G., J. Lee, B. Je, Y. Lee, Y. Park, Y. Choi, B. Son, N. Kang, and J. Kang 2019, Influence of abnormally high temperatures on growth, yield and physiological active substances of strawberry. Journal of Environmental Science International 28:147-158. (in Korean)
10.5322/JESI.2019.28.1.147Li H., Y. Guo, H. Zhao, Y. Wang, and D. Chow 2021, Towards automated greenhouse: A state of the art review on greenhouse monitoring methods and technologies based on internet of things. Computers and Electronics in Agriculture 191:106558.
10.1016/j.compag.2021.106558Ministry of Agriculture, Food and Rural Affairs (MAFRA) 2023, Statistics Yearbook of Agriculture, Food and Rural Affairs. MAFRA, Sejong, Korea, pp 88. (in Korean)
Rural Development Administration (RDA) 2024, Smartfarm productivity improvement service. Available via https://smartfarm.rda.go.kr Accessed 22 August 2024.
Rural Development Administration (RDA) 2020, Strawberry. Ed 1. Jinhan M&B, Seoul, Korea, pp 64-68. (in Korean)
Steeneken, P.G., E. Kaiser, G.J. Verbiest, and M.C. ten Veldhuis 2023, Sensors in agriculture: towards an Internet of Plants. Nature Reviews Methods Primers 3:60.
10.1038/s43586-023-00250-xVan Straten, G., H. Challa, and F. Buwalda 2000, Towards user accepted optimal control of greenhouse climate. Computers and Electronics in Agriculture 26:221-238.
10.1016/S0168-1699(00)00077-6Van Straten, G., L.G. van Willigenburg, and R.F. Tap 2002, The significance of crop co-states for receding horizon optimal control of greenhouse climate. Control Engineering Practice 10:625-632.
10.1016/S0967-0661(02)00023-0