Journal Search Engine
Search Advanced Search Adode Reader(link)
Download PDF Export Citaion korean bibliography PMC previewer
ISSN : 1225-6692(Print)
ISSN : 2287-4518(Online)
Journal of the Korean earth science society Vol.40 No.6 pp.599-605
DOI : https://doi.org/10.5467/JKESS.2019.40.6.599

Estimation of Rice Yield by Province in South Korea based on Meteorological Variables

Jina Hur*, Kyo-Moon Shim, Yongseok Kim, Kee-Kyung Kang
Climate Change & Agroecology Division, Department of Agricultural Environment, National Institute of Agricultural Sciences, Wanju 55365, Korea
Corresponding author: hjn586@korea.kr Tel: +82-63-238-2521
December 27, 2019 December 27, 2019 December 29, 2019

Abstract


Rice yield (kg 10a−1) in South Korea was estimated by meteorological variables that are influential factors in crop growth. This study investigated the possibility of anticipating the rice yield variability using a simple but an efficient statistical method, a multiple linear regression analysis, on the basis of the annual variation of meteorological variables. Due to heterogeneous environmental conditions by region, the yearly rice yield was assessed and validated for each province in South Korea. The monthly mean meteorological data for the period 1986-2018 (33 years) from 61 weather stations provided by Korean Meteorological Administration was used as the independent variable in the regression analysis. An 11-fold (leave-three-out) cross-validation was performed to check the accuracy of this method estimating rice yield at each province. This result demonstrated that temporal variation of rice yield by province in South Korea can be properly estimated using such concise procedure in terms of correlation coefficient (0.7, not significant). Furthermore, the estimated rice yield well captured spatial features of observation with mean bias of 0.7 kg 10a−1(0.15%). This method may offer useful information on rice yield by province in advance as long as accurate agro-meteorological forecasts are timely obtained from climate models.



기상자료를 이용한 남한지역 도별 쌀 생산량 추정

허 지나*, 심 교문, 김 용석, 강 기경
국립농업과학원 농업환경부 기후변화생태과, 55365, 전라북도 완주군 이서면 농생명로 166

초록


작물 생육에 영향 요소인 기상 변수들을 이용하여 우리나라 쌀 생산량(kg 10a−1)을 추정하였다. 이 연구는 기상 변수의 연 변동성을 기반으로 간단하지만 효과적인 통계 방법인 다중회귀모형을 이용하여 쌀 생산량에 대한 예측 가능 성을 살펴보았다. 비균질적인 환경 조건의 특성을 고려하여, 연 쌀 생산량을 우리나라 도별로 추정하고 검증하였다. 기 상청에서 제공하는 1986년부터 2018년까지 33년간 관측된 61개지점의 월 평균 기상 자료를 설명자료로 사용하였다. 11겹 교차검증(11-fold cross-validation)을 이용하여 추정된 쌀 생산량의 정확도를 추정하였다. 분석한 결과, 상관계수 (0.7) 측면에서 간단한 과정으로도 도별 쌀 생산량의 시간적 변화를 잘 모의하였다. 또한 추정된 쌀 생산량은 0.7 kg 10a−1(0.15%)의 평균 오차를 가지며, 관측의 공간적 특성을 잘 모의하였다. 이 방법은 적시에 농업기상 예측 정 보를 얻는다면 쌀 생산량에 대한 유용한 정보를 사전에 얻을 수 있을 것으로 생각된다.



    Rural Development Administration
    PJ01185802

    서 론

    쌀은 우리나라 주식으로, 국가적 차원에서 수급안 정을 위해 종합적인 관리를 받고 있는 주요 식량작 물 중의 하나이다. 매년 변화하는 생육 환경을 고려 한 쌀 생산량 사전 예측 정보는 쌀 수급 확보 및 가 격 안정 정책 마련을 위해 중요하다. 그러나 최근 이 상기상 재해 및 병해충 발병 등에 인한 작황 부진이 나 기상여건 호조로 인한 풍년 등 여러 요인으로 인 해 매년 쌀의 생산량과 가격은 매우 유동적으로 변 한다.

    국내 다양한 기관에서는 신뢰성 있는 쌀 생산량 및 수량 예측을 위해 노력하고 있다. 쌀 생산량 공식 예측 기관인 통계청은 매년 10월 쌀 생산량을 벼의 생산량 표본조사와 지역별 회귀 모형을 이용하여 예 측하고 발표하고 있다. 농촌진흥청 국립식량과학원은 작황조사 기반의 통계적 접근 방법을 이용하여 벼 작황 예측을 하고 있으며(Kim et al., 2017a), 한국농 촌경제원은 9월까지의 일조, 강수, 기온 자료와 KREI 쌀 단수 모형을 이용한 쌀 생산량을 추정하고 있다. 본 연구에서는 이러한 모형 중 예측변수와 벼 생산 량과의 직접적인 관계를 찾는 통계적 기법인 회귀모 형을 이용하여 쌀 생산량을 추정하고자 한다. 단, 지 역적 특성을 고려하여 도에 적합한 설명 변수를 선 택하고 도별로 회귀모형을 구축하였다.

    작물 생산성 변화에 대한 예측 방법으로 일반적으 로 통계적 모형과 과정 기반의 작물 모형(processbased crop model)이 활용되고 있다. 과정 기반의 작 물 모형은 환경 변화에 의한 작물의 생리학적 반응 을 고려한다는 점에서 영향력 있는 방법으로 간주되 지만, 다양한 입력 정보, 전산 자원, 그리고 보정 (calibration) 등이 필요하다는 점에서 복잡한 모형으 로 여겨진다. 통계적 모형은 작물의 생리생태학적 특 성을 고려하지 못한다는 단점이 있지만, 모형 훈련 (training)을 위한 충분한 자료만 확보한다면 적은 입 력변수로 적절한 결과 빠르게 낼 수 있다는 큰 장점 이 있다(Jeong et al., 2016). 이러한 통계적 모형의 장점 때문에 경험식을 바탕으로 한 회귀모형들은 작 물의 생산량 추정에 오랫동안 사용되어 왔다(Landau et al., 2000). 본 연구에서는 기상청에서 제공하는 기 후 요소(최고최저평균 기온, 강수량, 일조시간)들을 이용하여 환경 요소와 도별 쌀 생산량과의 관계를 분석하고, 다중 회귀 모형 기반의 쌀 생산량 추정 가 능성을 정량적으로 평가하고자 한다.

    자료 및 방법

    다중회귀모형의 반응변수로 국가통계포털(Korean Statistical Information Service, KOSIS)에서 제공하는 최근 33년(1986-2018년)동안의 남한지역 도별 미곡생 산량(kg/10a)으로, 10a (1,000m2) 면적 내에서 수확한 백미(현백률 92.9%)의 수량(kg) 자료를 이용하였다. 설명변수로는 기상청에서 관측 제공하는 61개 지점 의 전국 기상자료를 사용하였다. 분석에 사용된 기상 요소는 생식성장기로 전환되는 무렵(6~8월)부터 등숙 후반부인 시기(9~10월)까지의 월평균 된 최고온도, 최저온도, 평균온도, 강수량, 일조시간이다.

    본 연구에서는 쌀 생산량(반응변수)에 영향을 미치 는 기상요인들(설명변수)사이의 선형관계를 가정하고 함수관계를 설정하는 다중회귀모형을 이용하였다(Jo and Ahn, 2015). 먼저 다중회귀모형을 구축하기 전, 검증 기간(최근 3년)을 제외한 나머지 기간에 대한 각 도별로 설명변수와 반응변수들의 시간적 변화 추 세를 제거하였다. 추세를 제거하는 이유는 지역별 품 종 변동, 재배기술 발전, 기후적인 변화 추세들을 제 외함으로써 기상환경의 연 변화에 의한 쌀 생산량 변화량을 살펴보기 위함이다. 월별 기상 변수와 쌀 생산량과의 상관계수를 계산하고, 가장 높은 상관계 수를 가지는 변수 3개를 선택하여 설명변수로 선정 하였다. 이때 다중공선성을 최소화 하기 위해 같은 월에 대해서는 설명 변수를 하나만 가지도록 설정하 였다. 선택한 설명변수들을 이용해서 3년의 자료를 제외하고 나머지 기간(30년)에 대해 다중회귀모형을 구축하고, 제외된 3년에 대해 자료를 추정하고 검증 하였다. 그리고 이러한 기법들이 다른 기간에도 적용 가능한지 살펴보기 위해서 11겹 교차검증(11-fold crossvalidation) 을 수행하고 검증하였다(Fig. 1). Fig. 1은 교차검증 방법에 대한 설명도이며, 본 연구에서 사용 된 11겹 교차검증은 3년 제외 교차검증(leave-threeout cross validation)과 비슷하다. 즉, 총 33년 샘플 중에서 3년 자료(test period)을 검증을 위해 남겨두 고 나머지 30년 자료(training period)를 이용하여 다 중회귀모형을 구축한다. 그리고 모형 구축에 사용하 지 않은 3년에 대해 쌀 생산량 값을 추정하고, 관측 과 비교한다. 이때 정량적 평가를 위해 모형에 의해 추정된 도별 쌀 생산량과 관측된 쌀 생산량과의 오 차제곱근(kg/10a), 평균 오차(kg/10a), 상관계수를 계 산하였다. 또한 모형의 민감도를 설명하기 위해 11겹 교차 검증 동안의 다중회귀모형의 상수 변동성을 살 펴보았다.

    결과 및 고찰

    먼저 다중선형회귀 모형을 구축하기 위해 각 도별 쌀 생산량의 연 변화와 추세를 분석하였다. Fig. 2는 모형 구축에 사용될 30년(1986-2015) 쌀 생산량의 평균 분포도와 도별 시계열을 나타낸다. 최근 30년간 전라북도와 충청북도의 평균 쌀 생산량은 약 518과 485 kg 10a−1로 다른 지역보다 많게 관측되었다. 강원 도, 경상북도, 경상남도 즉 우리나라 동부지역의 쌀 생산량은 연간 3.5 kg/10a 정도 증가하는 추세를 가 지고 있었다. 반면에 전라남도와 전라북도는 쌀 생산 량의 증가속도가 연간 0.8 kg/10a로 약하게 증가하는 것으로 확인되었다. 연간 변동성을 살펴보기 위해 각 도에 대한 쌀 생산량 증가 추세를 제거하였다(Fig. 3). 추세가 제거된 동부지역(강원도, 경상북도, 경상남 도)의 쌀 생산량의 표준편차가 41 kg/10a 이상으로 다른 지역과 비교해 평균 연 변동성이 큰 것으로 나 타났다. 그리고 주목할 만한 점은 모든 도가 비슷한 형태로 30년 추세 대비 편차를 보이지만, 반드시 일 치하는 것은 아니다. 예를 들어 쌀 소동이 일어났던 1993년의 경우는 경상북도와 강원도의 쌀 생산량이 추세 대비 약 120 kg/10a가 감소하였다. 반면에 우리 나라 서부지역에 위치한 경기도, 전라남도, 전라북도 등은 1993년에 쌀 생산량이 크게 감소하지는 않았다. 또한 최근 2014년도의 경우, 제주도, 경상남도에는 추세대비 음의 편차가 발생한데 반해, 전라북도나 충 청북도에서는 양의 편차가 발생하였다. 즉, 이는 도 별로 영향을 주는 환경요인이 다를 것이라고 해석될 수 있다. 모든 지역에 대해서 동일한 설명변수로 동 일한 다중회귀모형을 구축하는 경우, 추정값은 지역 별 쌀 생산량의 변동성을 반영하기 어렵다.

    본 연구에서는 도별 쌀 생산량에 영향을 주는 기 후요인들이 다를 수 있기 때문에 다중회귀식의 설명 변수를 각 도별로 선정하였다. 상관분석을 통해 쌀 생산량의 변동성과 가장 연관이 클 것으로 여겨지는 기상 변수 3개를 선택하였다(Table 1). 예를 들어 경 기도의 경우 쌀 생산량과 8월 최저기온과 9월 최고 기온이 각각 −0.43, 0.40의 상관 계수로 통계적(95% 신뢰구간)으로 유의한 관계가 있고, 7월 일조시간과 도 통계적으로 유의하지 않지만 0.38의 양의 상관이 있는 것으로 분석되었다. Kim et al. (2017b) 연구에 서도 7월 일조시간이 영화수, 천중량과 양의 상관이 있는 것으로 보였으며, 이는 출수전 높은 일조가 식 물체내의 비구조 탄수화물 축적에 영향을 미쳤을 가 능성을 제시하고 있다. 또한 일반적으로 7월 중하순 부터 분화가 시작되어 8월 초중순 무렵에 출수하는 데 출수기의 단위면적당 영화수와 연관이 있는 영화 생성효율은 더운 지역보다 한랭한 지역에 높다고 하 였다(Park et al., 2002). 이러한 이유로 8월의 최저기 온이 쌀 생산량과 음의 상관을 가질 가능성이 있다. 물론 이러한 상관 분석 결과는 생리학적 관계 이외 에도 우연히 발생한 위상관일 가능성도 존재한다.

    이렇게 선택된 도별 설명변수들의 월 평균 자료와 30년(1986-2015) 쌀 생산량 관측 자료를 바탕으로 다 중회귀모형을 구축하였다(Fig. 4). 검증기간인 최근 3 년(2016-2018)의 관측 자료를 추정 자료와 비교한 결 과, 추정 자료는 관측된 쌀 생산량의 연 변화 패턴을 정성적으로 잘 모의하였다. 특히 경상남도의 경우 최 근 3년의 증감 패턴을 다중회귀모형이 잘 모의하였 다. 오차제곱근은 전체 도에 대해 7.4에서 38.4 kg 10a−1까지의 범위를 가졌으며, 도별 오차크기가 달 랐다. 예를 들어, 제주의 경우 오차제곱근이 38.37 kg/10a으로 가장 큰 것으로 나타났으며, 충청남도와 경상남도의 경우 7.96, 7.35 kg 10a−1으로 가장 작은 것으로 나타났다. 제주도에 오차가 큰 것은 제주도가 현무암 기반으로 쌀 재배면적이 적고, 지역적 위치 특성상 태풍이 잦아 쌀 생산량의 연간 변화량 (표준 편차: 52.5 kg 10a−1)이 크기 때문인 것으로 분석된다.

    모형의 신뢰성을 보다 객관적으로 평가하기 위해 33년(1986-2018)에 대한 교차검증을 수행하였다. 즉, 11회에 걸쳐 다중모형을 구축(훈련기간-30년, 검증기 간-3년)하고 추정된 33년(3년×11회)에 대한 쌀 생산 량 값을 관측과 비교하였다. 먼저 모형의 민감도를 살펴보기 위해 11겹 교차 검증 동안의 다중회귀모형 의 상수 변동성을 간략하게 살펴보았다(Table 2). 11 겹 교차 검증 동안 제주도의 다중회귀 계수의 표준 편차가 2.8 이상으로 모형 훈련기간에 따른 다중회귀 모형 계수의 변화가 큰 것으로 나타났다. 반대로 충 청북도나 경상북도의 경우 다른 지역에 비해서 모형 의 민감도가 낮은 것으로 나타났다.

    11겹 교차 검증을 통해 추정된 33년 동안의 쌀 생 산량을 정량적으로 평가해 보았다(Fig. 5). 오차제곱 근은 26.7 kg 10a−1의 평균값을 가지며, 21.2-39.8 kg 10a−1 의 범위를 가진다. 도별로 살펴보면 제주도가 39.7 kg 10a−1로 가장 높았고, 경상남도가 21.2 kg 10a−1로 가장 낮았다. 평균 오차의 경우 전반적으로 0.2 kg 10a−1로 추정된 쌀 생산량의 평균 값이 관측된 쌀 생산량의 평균과 유사하였다. 평균 오차에서도 제주 도가 1.4 kg 10a−1로 가장 크게 나타났으며, 충청북도 가 0.0 kg 10a−1으로 가장 작게 나타났다. 상관계수(평 균 0.7)의 경우, 통계적으로 유의하지는 않았지만(신 뢰구간 90% 이하), 추정한 쌀 생산량은 관측된 쌀 생산량의 시간적 특성(연 변동성)을 잘 모의하였다.

    교차검증으로 추정된 쌀 생산량을 관측된 쌀 생산 량과 비교하여 공간적으로 살펴보았다(Fig. 6). 33년 (1986~2018) 평균값을 살펴보면, 추정된 쌀 생산량은 9개 도 평균이 475.3 kg 10a−1로 관측(474.6 kg 10a−1 ) 보다 0.7 kg 10a−1 정도 과대모의 하였다(Fig. 6a-b). 다중회귀모형 결과는 전라북도와 충청북도에서 많은 생산량과 강원에서 낮은 생산량을 가지는 관측의 공 간적 특성을 잘 모의하였다. 이를 백분율 오차(percent bias)의 공간 분포도로 살펴보았을 때, 추정 값과 관 측 값의 차이가 평균 0.15%로 충청남도(0%)에서 가 장 적고, 강원도(0.29%)에서 가장 큰 것으로 나타났 다. 이러한 분석 결과들은, 다중회귀모형으로 구축된 쌀 생산량이 관측을 평균 1.4 kg 10a−1 (0.15%)의 오 차로 비교적 잘 추정한다는 것을 의미한다. 또한 도 별로 다중회귀모형을 구축함으로써 관측의 지역적 특 성까지 반영하고 있음을 알 수 있다.

    결 론

    본 연구에서는 월평균 기상 변수들을 다중회귀모형 의 설명변수로 이용하여 우리나라 도별 쌀 생산량 (kg/10a)을 추정하였다. 이 연구는 쌀 생산량의 지역 적 비균질성을 고려하여 다중회귀모형을 도별로 구축 하고 1986년부터 2018년까지 33년에 대한 도별 쌀 생산량을 추정하고 검증하였다는 점에서 선행연구와 차별 점이 있다. 또한 30년 훈련기간과 3년 검증기간 으로 설정하여 11겹 교차검증 통해 다중회귀모형의 쌀 생산량 추정 능력을 정성적, 정량적으로 평가하였 다. 33년 평균 분포도에서는 다중회귀모형의 결과가 관측의 공간적 특성을 잘 모의하는 한편, 관측(474.6 kg 10a−1 )과 비교하여 0.7 kg 10a−1 (0.15%)정도 다소 과대모의 하는 특성이 나타났다. 상관계수(0.7) 측면 에서 살펴보면, 추정된 쌀 생산량이 관측의 연 변동 성을 잘 모의하는 것으로 나타났다. 본 연구에서 사 용된 방법은 기후모델링을 통해 농업기상 예측 정보 를 얻는다면 쌀 생산량에 대한 유용한 정보를 사전 에 얻을 수 있을 것으로 생각된다. 본 연구에서 사용 된 다중회귀모형은 쉽게 활용 가능한 장점이 있지만, 작물 생육에 대한 생리생태학적 설명이 부족하다. 따 라서 향후 다양한 통계 모형 또는 과정 기반의 작물 모형을 이용하여 쌀 생산량에 대한 예측성을 향상시 키는 연구는 필요하다.

    감사의 글

    This study was carried out with the support of “Research Program for Agricultural Science & Technology Development (Project No. PJ01185802)”, National Institute of Agricultural Sciences, Rural Development Administration, Republic of Korea.

    Figure

    JKESS-40-6-599_F1.gif

    Diagram of 11-fold cross-validation.

    JKESS-40-6-599_F2.gif

    Rice yield (kg/10a) at each province in South Korea for the period 1986-2015.

    JKESS-40-6-599_F3.gif

    Annual variation of rice yield (kg/10a), removed the least squares linear trend, at each province in South Korea for the period 1986-2015.

    JKESS-40-6-599_F4.gif

    Observations (dots) and estimations (lines) of rice yield (kg/10a) derived from the multiple linear regression. Here, the years from 1986 to 2015 (black solid line) are training period, whereas the last three years (2016-2018) (blue dashed line) are test (validation) period.

    JKESS-40-6-599_F5.gif

    The statistical evaluation of estimated rice yield (kg/ 10a) based on 11-fold cross-validation analysis for the period 1986-2018.

    JKESS-40-6-599_F6.gif

    Spatial distributions of observation (a) and estimation (b), derived from 11-fold cross-validation analysis, for rice yield (kg/10a) and its percent bias (c, %) over the period 1986-2018.

    Table

    Three independent variables at each province selected for multiple linear regression analysis. Numbers in parentheses are correlation coefficient between meteorological variables and rice yield for the period 1986-2015. Asterisk means 95% confidence level

    Standard deviation of regression coefficients for three independent variables derived from 11-fold cross-validations

    Reference

    1. Kim, J. , Lee, C.-K. , Sang, W. , Shin, P. , Cho, H. , and Seo, M. ,2017a, Introduction to Empirical Approach to Estimate Rice Yield and Comparison with Remote Sensing Approach. Korean Journal of Remote Sensing, 33(5-2), 733-740. (in Korean)
    2. Kim, J. , Sang, W. , Shin, P. , Cho, H. , and Seo, M. ,2017b, A Meteorological Analysis on High Rice Yield in 2015 in South Korea. Korean Journal of Agricultural and Forest Meteorology, 19(2), 54-61. (in Korean)
    3. Jeong, J. H. , Resop, J. P. , Mueller, N. D. , Fleisher, D. H. , Yun, K. , Butler, E. E. , Timlin, D. J. , Shim, K.-M. , Gerber, J. S. , Reddy, V. R. , and Kim, S.-H. ,2016, Random Forests for Global and Regional Crop Yield Predictions. PLoS ONE, 11(6),
    4. Jo, S. and Ahn, J.B. ,2015, Improvement of CGCM Prediction for Wet Season Precipitation over Maritime Continent using a Bias Correction Method. International Journal of Climatology, 35(13), 3721-3732.
    5. Landau, S. , Mitchell, R.A.C. , Barnett, V. , Colls, J.J. , Craigon, J. , and Payne, R.W. ,2000, A Parsimonious, Multiple-Regression Model of Wheat Yield Response to Environment. Agricultural and Forest Meteorology, 101(2-3), 151-166.
    6. Park, D. , Choi, I. , and Lee, B. ,2002, Relationship of Spikelet Number with Nitrogen Content, Biomass, and Nonstructural Carbohydrate Accumulation during Reproductive Stage of Rice. Korean Journal of Crop Science 47(6), 486-491. (in Korean)