Journal Search Engine
Search Advanced Search Adode Reader(link)
Download PDF Export Citaion korean bibliography PMC previewer
ISSN : 1225-6692(Print)
ISSN : 2287-4518(Online)
Journal of the Korean earth science society Vol.40 No.6 pp.606-612
DOI : https://doi.org/10.5467/JKESS.2019.40.6.606

A Study on Frost Occurrence Estimation Model in Main Production Areas of Vegetables

Yongseok Kim*, Jina Hur, Kyo-Moon Shim, Kee-Kyung Kang
Climate Change & Agroecology Division, Department of Agricultural Environment, National Institute of Agricultural Science, Wanju 55365, Korea
Corresponding author: cyberdoli@korea.kr Tel: +82-63-238-2519
November 27, 2019 December 8, 2019 December 30, 2019

Abstract


In this study, to estimate the occurrence of frost that has a negative effect on th growth of crops, we constructed to the statistical model. We factored such various meteorological elements as the minimum temperature, temperature at 18:00, temperature at 21:00, temperature at 24:00, average wind speed, wind speed at 18:00, wind speed at 21:00, amount of cloud, amount of precipitation within 5 days, amount of precipitation within 3 days, relative humidity, dew point temperature, minimum grass temperature and ground temperature. Among the diverse variables, the several weather factors were selected for frost occurrence estimation model using statistical methods: T-test, Variable importance plot of Random Forest, Multicollinearity test, Akaike Informaiton Criteria, and Wilk’s Lambda values. As a result, the selected meteorological factors were the amount of cloud, temperature at 24:00, dew point temperature, wind speed at 21:00. The accuracy of the frost occurrence estimation model using Random Forest was 70.6%. When it applied to the main production areas of vegetables, a estimation accuracy of the model was 65.2 and 78.6%.



채소 주산지에 대한 서리발생예측 연구

김 용석*, 허 지나, 심 교문, 강 기경
국립농업과학원 농업환경부 기후변화생태과, 55365, 전라북도 완주군 이서면 농생명로 166

초록


채소작물과 과수작물의 생육에 악영향을 미치는 서리발생을 미리 예측하기 위해 모형을 구축하고 채소 주산지 에 적용해 보았다. 서리 발생 전날에 관측되는 다양한 기상인자들(최저기온, 18시 기온, 21시 기온, 24시 기온, 평균풍 속, 18시 풍속, 21시 풍속, 구름량, 5일간 강수량, 3일간 강수량, 상대습도, 이슬점온도, 초상최저기온, 지면온도)을 수집 하고, 그 중에서 서리발생에 유의한 영향이 있다고 판단되는 변수들을 통계적 방법(T-test, Random Forest, Multicollinearity test, Akaike Informaiton Criteria, 그리고 Wilk’s lambda values)을 통해 선택하였다. 여러 통계적 방법을 통해 선택된 유의한 기상 인자는 24시 기온, 구름량, 이슬점온도, 21시 풍속 이였으며, 이 기상인자를 기계학습법의 한 종류인 랜덤 포레스트에 적용하여 서리 발생 예측 모형을 구축하였다. 이렇게 구축 된 서리 발생예측 모형의 정확도는 70.6%로 나 타났으며, 이 모형을 가을배추와 가을무의 주산지인 홍성과 서산에 적용하였을 때 65.2%와 78.6%로 나타났다.



    Rural Development Administration
    PJ01185804

    서 론

    일반적으로 서리는 날씨가 맑으면서 춥고 바람이 잘 불지 않는 날에 많이 발생한다. 좀 더 구체적으로 Kwon et al. (2008)은 서리는 이동성 고기압의 영향 을 받고 있을 때처럼 맑고 바람이 없는 날의 야간에 복사 냉각이 진행되면서 접지층의 대기가 안정되고 기온이 0 °C 이하로 하강한 경우에 수증기가 승화하 여 발생한다고 하였고, Temeyer et al. (2003)은 복사 냉각에 의해 역전층이 형성되었을 때 지표층이 상층 부보다 차가워 진 상태서 수증기가 유입되면서 발생 하거나 대류현상에 의해 습윤한 기단에 차가운 공기 가 유입되면서 서리가 발생한다고 하였다.

    서리는 보통 가을부터 봄까지 발생하는데 많은 채 소작물과 과수작물의 잎이나 꽃, 과실 등에 발생하여 작물을 얼거나 시들게 만들어 많은 피해를 입히고 있다. 특히, 가을배추와 무가 생산되는 주산지의 경 우 서리 발생으로 인해 작물의 생육에 지장을 받는 사례가 자주 발생한다. 가을배추는 서리에 비교적 강 하지만 서리가 내리기 전에 미리 끈으로 배추를 묶 어 서리가 배추 속으로 내리지 않게 조치를 취하지 않으면 잎이 벌어져 내부에 알이 차는데 영향을 받 고, 가을무는 서리에 약해 서리가 발생하면 생육에 영향을 받는다. 그래서 서리가 발생하였을 때 피해를 경감하기 위해 송풍법, 연소법, 미세살수법 등의 대 처법이 이용되고는 있지만, 정작 중요한 서리 발생에 대해 미리 경고해주는 시스템이 부족한 실정이다. 이 러한 문제를 해결하기 위해 서리발생을 알려주기 위 한 연구가 수행된 바 있는데, 서리발생 전날의 기상 특성을 분석하여 서리발생 전날의 24시 기온, 구름량, 5일간의 강수량 등을 이용한 판별분석(DA, Discriminant Analysis)을 통해 서리발생을 예측한 연구와 최저기 온의 공간단위의 상세화를 통해 3 °C 기준으로 지역 별 서리피해 경보의 가능성에 대한 연구 등이다(Han et al., 2009;Chung et al., 2004). 하지만 이러한 연 구는 일부 지역에 한정되어 연구 되었거나 단순히 기온만을 고려하여 서리의 발생에 대한 정보를 제공 해 주기 때문에 정확한 서리발생을 알리기에는 한계 가 있을 것으로 생각된다. 이러한 문제점을 극복하고 자 본 연구에서는 전국의 서리 발생자료를 바탕으로 서리 발생을 전날의 기상값으로 예측하는 것을 목표 로 서리발생과 밀접한 서리발생 전날의 기상요인을 분석하고 그것을 바탕으로 기계학습법의 하나인 랜덤 포레스트(Random Forest)를 이용하여 서리발생예측 모형을 구축하는 실험을 수행하였다. 그리고 이 모형 을 가을배추와 가을무의 주산지에 적용해 보았다.

    연구 방법

    기상데이터 수집

    전날의 기상을 분석하여 다음날에 서리가 발생할지 여부를 판단하는 모형을 구축하기 위해 기상청 기상 연보에서 제공하는 30지점에 대한 2004년부터 2013 년까지의 초상일 자료를 수집하였다(Table 1). 서리가 발생한 날의 전날에 대한 기상특징을 분석하기 위해 초상일 전날의 기상자료를 수집하였고, 서리가 발생 하지 않은 날의 전날에 대한 기상특징을 분석하기 위해 초상일의 이틀 전날의 기상자료를 수집하였다. 기존 문헌을 통해 서리발생에 영향을 미칠 수 있다 고 예상되는 기상인자로서 최저기온, 18시 기온, 21 시 기온, 24시 기온, 평균풍속, 18시 풍속, 21시 풍속, 구름량, 5일간 강수량, 3일간 강수량, 상대습도, 이슬 점온도, 초상최저기온, 지면온도로 정하여 분석하였다 (Han et al., 2009;Robinson and Mort, 1996;Temeyer et al., 2003).

    기상인자 선택

    서리발생 예측 모형의 과적합을 방지하기 위해 앞 에서 고려한 기상인자 중 서리발생과 관련성이 다른 인자들보다 높다고 판단되는 일부만 사용하여 모형을 구축하였다. 기상인자의 선정을 위해 T-검정과 랜덤 포레스트(Random Forest)의 인자중요도분석, 인자에 대한 다중공선성 검정을 통해 우선 일부의 기상인자 를 제외시켰고, 남은 기상인자들을 다시 아카이케 정 보기준(AIC, Akaike Informaiton Criteria)과 Wilk’s lambda 값을 기준으로 최종 인자를 결정하였다.

    T-검정은 두 집단의 평균이 유의한 차이가 있는지 를 검정하는 것으로 각 기상인자들이 서리가 발생한 날의 전날과 서리가 발생하지 않은 날의 전날에 유 의한 차이가 있는지 알아보고 유의한 차이가 없는 기상인자는 제외시키기 위해 수행하였다. 다중공선성 검정은 일반적으로 회귀분석 시 다중공선성이 독립변 수의 회귀계수 추정에 문제가 되기 때문에 수행되는 데 독립변수들 간의 상관관계를 분석하여 높은 상관 관계의 기상인자들은 대표적인 인자만을 선택하기 위 해 수행하였다. 랜덤포레스트의 인자중요도 분석은 각 인자가 결과의 정확도와 불순도 개선에 얼마만큼 기여하는지를 나타내는 지표로서 중요도가 높은 인자 를 선택하기 위해 수행하였다. AIC는 모형의 설명능 력을 우도(Likelihood)와 독립변수의 수로서 모형의 적합도를 나타내는 값이고, Wilk’s lambda는 전체분 산에서 그룹 내 분산이 차지하는 비율을 나타내는 값으로서 일반적으로 AIC는 로지스틱회귀분석에서, Wilk’s lambda는 판별분석에서 독립변수 선택 시 사 용되고 있으며, 이번 연구에서도 최종적인 모형의 기 상인자를 선택하기 위해 사용되었다.

    서리발생예측 모형 구축

    최종적으로 선택된 기상인자를 기반으로 랜덤포레 스트를 이용하여 서리발생예측 모형을 구축하였다. 랜덤포레스트는 다수의 의사결정 트리모형을 결합하 여 최적의 모형을 형성하는 앙상블기법으로 분류나 회귀모형으로 많이 사용된다. 랜덤포레스트의 기초가 되는 의사결정 트리모형은 노드를 분할할 때 불순도 함수를 이용하여 분류변수와 분류 기준 값을 선택하 며, 이 과정에서 각 노드에 속하는 자료가 분할하며 자라나게 된다. 여기에 랜덤포레스트는 예측변수들을 임의로 추출하고 추출된 변수 내에서 최적의 분할을 수행하는 방법으로 다수의 의사결정 트리모형을 생성 해 나간다.

    각 기상인자별로 수집한 데이터는 서리가 발생한 날의 데이터 248세트와 서리가 발생하지 않은 날의 248세트로 총 496세트였으며, 모형 구축에 326세트, 정확도 검증에 170세트를 사용하였다.

    모형 구축을 위한 프로그램

    모든 과정은 통계프로그램 R(3.5.1)을 이용하였으 며, T-검정은 t.test함수를 이용하였으며, 다중공선성 검정은 “usdm” 패키지의 vif함수를, AIC는 step함수 를 이용하였고, Wilk’s lambda는 “klaR” 패키지의 greedy.wilks 함수를 이용하였다. 그리고, 랜덤포레스 트 인자별 중요도 분석과 모형을 구축하기 위하여 “randomForest” 패키지의 randomForest 함수를 이용 하였다.

    채소 주산지 대상 서리발생 예측

    서리발생 예측모형은 Fig. 1과 같은 과정을 통해 가을배추와 가을무가 생산되는 지역 중 가을배추의 주산지인 충남 홍성과 가을무의 주산지인 충남 서산 에 적용해 보았다. 보통 가을배추와 가을무의 생육기 간 중 서리발생에 영향을 받는 달은 11월이지만 11 월만을 대상으로 모형을 적용하기에는 서리 발생한 날 수가 너무 적어 11월과 12월을 대상으로 실시하 였다.

    서리 발생 날짜에 대한 정보는 기상청으로부터 수 집하였으며, 홍성은 2017년, 서산은 2014-2016년의 자료를 수집하였다. 수집 된 샘플 수는 홍성 46세트, 서산은 70세트이며, 각각 서리가 발생한 날의 전날 50%, 서리가 발생하지 않은 날의 전날 50%로 수집 하였다.

    결 과

    모형을 구축하기 위한 기상인자를 선택하기 위해 서리가 발생한 날의 전날 기상인자와 서리가 발생하 지 않은 날의 전날 기상인자 간에 차이가 있는지 T- 검정을 실시한 결과 0.05의 유의수준에서 최저기온과 18시 기온, 21시 기온, 24시 기온, 평균풍속, 21시 풍 속, 구름량, 상대습도, 이슬점온도, 초상최저온도, 지 면온도는 유의하다는 결과가 나타났지만, 18시 풍속, 5일간 강수량과 3일간 강수량은 유의하지 않는 것으 로 나타났다(Table 2).

    랜덤포레스트의 인자 중요도분석에서는 구름량, 24 시 기온이 상대적으로 중요하게 나타났고, 그 다음으 로 최저초상온도, 이슬점온도, 21시 기온 순으로 높 게 나타났다(Fig. 2).

    다중공선성을 분석한 결과에서는 최저기온, 18시 기온, 21시 기온, 24시 기온, 상대습도, 이슬점온도이 분산팽창계수(VIF, Variance Inflation Factor)가 10이 상으로 높게 나타나 다중공선성이 있는 것으로 나타 났다(Table 3).

    이러한 결과를 바탕으로 T-검정에서 유의하지 않았 던 18시 풍속, 5일간 강수량과 3일간 강수량을 제외 하였고, 다중공선성이 나타난 기온 관련 인자들 중에 서 VIF가 높고 랜덤포레스트에서 인자 중요도가 상 대적으로 낮게 나타났던 최저기온, 18시 기온, 21시 기온을 제외하였다. 그리고 다중공선성이 나타난 또 다른 인자인 상대습도와 이슬점온도 중에서도 랜덤포 레스트의 인자 중요도가 상대적으로 낮게 나왔던 상 대습도를 제외하였다.

    이렇게 결정된 24시 기온, 평균풍속, 21시 풍속, 구름량, 이슬점온도, 최저초상온도, 지면온도를 다시 다중공선성에 대한 분석한 결과 모두 분산팽창계수가 10이하로 나타나 다중공선성이 없는 것으로 나타났다 (Table 4).

    최종적으로 모형 구축을 위해 위의 기상인자를 이 용하여 AIC과 Wilk’s lambda 값을 기준으로 인자를 선택하였으며, 두 기준에서 모두 동일한 기상인자인 구름량, 24시 기온, 이슬점온도, 21시 풍속, 평균풍속 이 선택되었다. 추가로 Fig. 3와 같이 랜덤포레스트 인자중요도를 분석한 결과 24시 기온, 구름량, 이슬 점온도, 21시 풍속, 평균풍속 순으로 나타나 21시 풍 속과 평균풍속 중 중요도가 높은 21시 풍속을 선택 해서 최종적으로 4가지 인자를 이용해 모형을 구축 하였다.

    최종 인자에 대해 서리가 발생한 날의 전날과 서 리가 발생하지 않은 날의 전날에 대한 기상요소별 평균을 비교해 본 결과 구름량은 서리가 발생한 날 의 전날이 3.0할로 서리가 발생하지 않은 날의 전날 인 7.0할보다 4.0할 적었으며, 24시 기온은 서리가 발생한 날의 전날이 −1.0 °C로 서리가 발생하지 않은 날의 전날인 4.1 °C보다 5,1 °C가 낮았다. 이슬점 온도 는 서리가 발생한 날의 전날이 −2.4 °C로 서리가 발 생하지 않은 날의 전날인 2.4 °C보다 4.8 °C가 낮았으 며, 21시 풍속은 서리가 발생한 날의 전날이 1.2ms−1 로 서리가 발생하지 않은 날의 전날이 2.3 m s−1보다 1.1 m s−1 약한 것으로 나타났다(Table 5).

    최종 선택 된 24시 기온, 구름량, 이슬점온도, 21 시 풍속의 기상인자를 기반으로 랜덤포레스트를 이용 한 서리발생예측 모형을 구축하고 모형의 정확도를 분석한 결과 70.6%의 정확도를 나타냈다(Table 6).

    가을배추와 가을무의 주산지에서 서리가 발생한 날 의 전날과 서리가 발생하지 않은 날의 전날에 대한 기상요소별 특징을 비교해 보았을 때, 홍천의 경우 구름량은 서리가 발생한 날의 전날이 3.8할로 서리가 발생하지 않은 날의 전날인 5.2할보다 1.4할 적었으 며, 24시 기온은 서리가 발생한 날의 전날이 −1.1 °C 로 서리가 발생하지 않은 날의 전날인 2.5 °C보다 3.6 °C가 낮았다. 이슬점 온도는 서리가 발생한 날의 전날이 −2.8 °C로 서리가 발생하지 않은 날의 전날인 −2.2 °C보다 0.6 °C가 낮았으며, 21시 풍속은 서리가 발생한 날의 전날이 1.0 m s−1로 서리가 발생하지 않 은 날의 전날이 1.4 m s−1보다 0.4 m s−1 약한 것으로 나타났다. 서산의 경우도 유사한 특징을 나타냈는데, 구름량은 서리가 발생한 날의 전날이 3.8할로 서리가 발생하지 않은 날의 전날인 5.2할보다 1.4할 적었으 며, 24시 기온은 서리가 발생한 날의 전날이 −1.1 °C 로 서리가 발생하지 않은 날의 전날인 2.5 °C보다 3,6 °C가 낮았다. 이슬점 온도는 서리가 발생한 날의 전날이 −2.8 °C로 서리가 발생하지 않은 날의 전날인 −2.2 °C보다 0.6 °C가 낮았으며, 21시 풍속은 서리가 발생한 날의 전날이 1.0 m s−1로 서리가 발생하지 않 은 날의 전날이 1.4 m s−1보다 0.4 m s−1 약한 것으로 나타났다.

    서리 발생 예측모형을 적용한 결과 홍성에서는 46 세트의 샘플 중 30세트를 올바르게 예측해서 65.2% 의 정확도를 나타냈으며(Table 7), 서산에서 수행한 결과 70세트의 샘플 중 55세트를 올바르게 예측하여 78.6%의 정확도를 나타냈다(Table 8). 이러한 결과는 모형을 구축할 때 검정했던 정확도와 유사했지만, 홍 성의 경우 정확도가 다소 낮게 나타났고 서산의 경 우 조금 더 높게 나타났다.

    결론 및 고찰

    이번 연구에서 선택된 기상인자들을 살펴보면 서리 가 발생하지 않은 날의 전날에 비해 서리가 발생한 날의 전날이 기온이 더 낮고 풍속도 약하며 구름의 양도 적은 특징이 나타났다. 이것은 기존에 알려진 것과 같이 날씨가 맑아 구름이 없고 바람이 약하게 불어 복사 냉각이 잘 이루어지는 날에 서리가 많이 발생한다는 기상특징을 잘 나타내며, 이러한 특징은 서리가 발생하는 전날에도 유사하게 나타나기 때문에 이러한 기상요소를 이용해 서리가 발생하는 것을 미 리 예측할 수 있다는 것을 알 수 있었다. 그리고, 이 러한 기상특징을 이용하여 구축한 모형을 가을배추와 가을무의 주산지에 적용한 결과 어느 정도 활용성이 있는 것으로 판단되었다. 이와 더불어 서리 발생을 예측하기 위한 모형을 구축하기 위해 좀 더 많은 기 상데이터를 확보한다면 모형의 정확도는 더 높아질 수 있을 것이라 예상되었다. 특히, 본 연구에서는 초 상일을 기준으로 한 기상 데이터를 이용해 모형을 구축했기 때문에 서리가 연속적으로 발생하는 날에 대한 기상특징을 반영하기에는 한계가 있을 것으로 예상되었으며, 봄에 발생하는 서리에 대한 특징도 반 영하기에 한계가 있을 것으로 예상되었다. 앞으로의 연구에서는 이러한 다양한 환경의 기상상황을 잘 나 타낼 수 있는 추가적인 데이터 수집과 분석이 이루 어진다면 좀 더 정확한 서리발생 예측 모형을 구축 할 수 있을 것이다.

    사 사

    This study was carried out with the support of “Research Program for Agricultural Science & Technology Development (Project No. PJ01185804)”, National Institute of Agricultural Sciences, Rural Development Administration, Republic of Korea.

    Figure

    JKESS-40-6-606_F1.gif

    Processing for frost occurrence estimation.

    JKESS-40-6-606_F2.gif

    Variable importance plot in Random Forest. Tmin: minimum temperature, t18: temperature at 18:00, t21: Temperature at 21:00, t24: Temperature at 24:00, ws1: average wind speed, ws18: wind speed at 18:00, ws21: wind speed at 21:00, clo: amount of cloud, rain5: amount of precipitation within 5 days, rain3: amount of precipitation within 3 days, hu: relative humidity, dp: dew point temperature, gt: minimum grass temperature, st: ground temperature

    JKESS-40-6-606_F3.gif

    Variable importance plot in Random Forest. t24: Temperature at 24:00, ws1: average wind speed, ws21: wind speed at 21:00, clo: amount of cloud, dp: dew point temperature

    Table

    Synoptic weather stations collected the frost data

    T-test result of meteorological factors related to frost occurrence

    Multicollinearity test result of meteorological factors related to frost occurrence

    Multicollinearity test result of selected meteorological factors

    Characteristic of meteorological factors for frost occurrence estimation model

    Accuracy of frost occurrence estimation model

    Accuracy of frost occurrence estimation model in hongseung

    Accuracy of frost occurrence estimation model in seosan

    Reference

    1. Chung, U. , Seo, H.C. , and Yun, J.I. ,2004, Site-specific frost warning based on topoclimatic estimation of daily minimum temperature. Korean Journal of Agricultural and Forest Meteorology 6(3), 164-169. (in Korean)
    2. Han, J.H. , Choi, J.J. , Chung. U. , Cho, K.S. , and Chun, J.P. ,2009, Frostfall forecasting in the naju pear production area based on discriminant analysis of climatic data. Korean Journal of Agricultural and Forest Meteorology 11(4), 135-142. (in Korean)
    3. Kwon, Y.A. , Lee. H.S. , Kwon. W.T. , and Boo, K.O. 2008, The weather characteristics of frost occurrence days for protecting crops against frost damage. Journal of the Korean Geographical Society 43(6), 824-842. (in Korean)
    4. Robinson, C. and Mort, N. ,1996, A neural network solution to the problem of frost prediction. UKACC International Conference on Control. Control ’96, UK, 136-139.
    5. Temeyer, B.R. , W.A. Gallus Jr, K. A. Jungbluth, D. Burkheimer, and D. McCauley,2003, Using an artificial neural network to predict parameters for frost deposition on Iowa bridgeways. Proceedings of the 2003 Mid-Continent Transportation Research Symposium, Iowa State University, Iowa, USA.