Journal Search Engine
Search Advanced Search Adode Reader(link)
Download PDF Export Citaion korean bibliography PMC previewer
ISSN : 1225-6692(Print)
ISSN : 2287-4518(Online)
Journal of the Korean earth science society Vol.41 No.2 pp.111-128
DOI : https://doi.org/10.5467/JKESS.2020.41.2.111

A Study on the Prediction of Residual Probability of Fine Dust in Complex Urban Area

Sung Ju Park1, You Jin Seo1, Dong Wook Kim2, Hyun Jeong Choi3*
1School of Freshmen, KAIST, Daejeon 34141, Korea
2College of Life Science & Biotechnology, Korea University, Seoul 02841, Korea
3Department of Physics & Earth Science, Korea Science Academy of KAIST, Busan 47162, Korea
Corresponding author: coscoo@naver.com Tel: +82-51-606-2141
February 17, 2020 March 25, 2020 April 6, 2020

Abstract


This study presents a possibility of intensification of fine dust mass concentration due to the complex urban structure using data mining technique and clustering analysis. The data mining technique showed no significant correlation between fine dust concentration and regional-use public urban data over Seoul. However, clustering analysis based on nationwide-use public data showed that building heights (floors) have a strong correlation particularly with PM10. The modeling analyses using the single canopy model and the micro-atmospheric modeling program (ENVI-Met. 4) conducted that the controlled atmospheric convection in urban area leaded to the congested flow pattern depending on the building along the distribution and height. The complex structure of urban building controls convective activity resulted in stagnation condition and fine dust increase near the surface. Consequently, the residual effect through the changes in the thermal environment caused by the shape and structure of the urban buildings must be considered in the fine dust distribution. It is notable that the atmospheric congestion may be misidentified as an important implications for providing information about the residual probability of fine dust mass concentration in the complex urban area.



복잡한 도심에서의 유입된 미세먼지 잔류 가능성 예보 연구

박 성주1, 서 유진1, 김 동욱2, 최 현정3*
1한국과학기술원(KAIST) 새내기과정학부, 34141, 대전시 유성구 대학로 291
2고려대학교 생명과학부, 02841, 서울시 성북구 안암로 145
3한국과학기술원(KAIST) 부설 한국과학영재학교 물리지구과학부, 47162, 부산시 부산진구 백양관문로 105-47

초록


본 연구에서는 복잡한 도심의 구조로 인한 미세먼지 농도의 강화 가능성에 대하여 데이터 마이닝 기술과 군집분석 을 이용해 조사하였다. 데이터 마이닝 분석에서 미세먼지 농도와 서울지역 도시용도 데이터 사이에는 유의한 상관관계를 보 이지 않았다. 그러나 전국 공공데이터를 기반으로 한 군집분석에서는 건물의 높이(층수)에서 특히 PM10과 강한 상관관계가 나타났다. 단일 케노피 모델(Single Canopy Model) 및 미기상 도시모델링 프로그램(ENVI-Met.4)을 사용한 모델링 분석을 실 시하여 도시지역에서 모사된 대기 대류가 건물 분포 및 높이 유형의 배열에 따라 다양한 난류의 패턴을 구현함을 확인하였 다. 도시 건물의 복잡한 구조는 대류활동을 제어하여 정체상태를 유도하고 지표 부근의 미세먼지 강화가능성을 초래 하였다. 따라서 도심 구조와 형태에 따른 열환경의 변화로 인한 정체 효과는 미세먼지 산정에 있어서 반드시 고려되어야 한다. 복잡 한 도시지역의 미세먼지 잔류확률에 대한 정보를 제공하기 위해서는 대기정체 현상이 중요한 의미로 해석될 수 있다.



    Ministry of Science and ICT

    1. 서 론

    대기오염 저감대책 마련과 규제, 환경관리를 위해 서는 대기 오염물질의 확산에 대한 정확한 정보를 획득하는 것이 필수적인 일이다. 보다 실질적인 오염 예측에의 적용을 위해서는 지형과 지표면의 특성을 충분히 고려하여 구조물에 대한 난류유동을 포함한 지면 가까이의 복잡한 대기 유동장의 양상을 수치 해석적으로 풀어야 한다(Lee et al., 2005;Choi, 2006;Lee et al., 2006). 지표면 상태의 수평적인 변 화는 대기의 수평적인 불균일성을 통하여, 내부 경계 층 및 공기 역학적인 난류를 생성시키고(Lee and Kimura, 2001), 특히 지상의 배출원으로부터 연속적 으로 배출되는 대기오염물질의 대기 중으로의 확산은 바람의 연직 및 수평성분의 난류 강도에 의해 영향 을 크게 받기 때문에(Tong et al., 2005;Lee, 2011;Ryu et al., 2011), 오염물질들의 대기 중으로의 확산 을 설명하기 위해서는 보다 정확한 난류 특성자료를 산출할 수 있는 방안이 필요하다.

    최근 몇 년간 우리나라 대도시는 물론 중소도시는 꾸준히 도시화가 진행되어 건물과 아스팔트와 같은 대단위 인공 건조물들이 들어서 대지와 도로의 점유 율이 50% 이상 차지하는 고밀도형 대도시 형태를 갖고 있다(Choi, 2016). 급격히 증가한 도시화로 인 해 도심지역으로 유입된 미세먼지의 발생원에 관한 문제뿐 만 아니라 장시간 정체된 공기로 인한 확산 의 어려움도 예상된다. 실제로 통계청(2018)의 조사 에 따르면 인구의 82.5%가 지속적이고 빈번한 미세 먼지 문제에 대해 약간 불안함 또는 매우 불안함으 로 답변하였으며, 특히 고밀도형 도시인 서울시의 조 사 결과는 85.3%로 전국 평균을 웃돌았다(KOSIS, 2018).

    본 연구에서는 고층 건물이 밀집된 도심의 구조가 공기의 확산에 인위적인 영향을 유발하여 상층부 순환 을 방해하고 대류현상을 억제할 가능성(Ozkeresteci, 2003;Yamada, 2004;Carfan et al., 2011;Elnabawi, 2013;Choi et al., 2015)에 주목하였다. 이를 통해 유 입된 미세먼지 농도 산정량에 대하여 도심 내에 장 시간 잔류하게 되어 심화될 가능성에 대한 검증을 하고 미세먼지 농도 산정에 중요한 예보적 정보를 제공하고자 한다.

    먼저, 데이터 마이닝 기법(Data mining method)을 시도하여 도시 데이터와 대기오염도 간의 관계를 파 악하였다. 또한 다양한 도심 구조와 형태에 따른 도심 내 대류현상을 수치모의 하기 위하여 Single Canopy Model과 미기상 도시모델인 ENVI-Met.을 사용하였 다. 본 연구에서 도심 지형 위 건물의 효과를 충분히 고려하여 도심 미세먼지 산정에 있어서 잔류가능성에 대한 정보를 예측하는 것은 국지규모의 부유 분진 발생 특성 분석을 보다 정량적으로 수행할 수 있음 을 의미하는 매우 중요한 과정이라 할 수 있다.

    2. 연구 방법

    본 연구에서는 대기오염도와 도시 요소에 대한 상 관분석을 위해 데이터 마이닝 기법 중 대표적인 방 법인 연관규칙분석, 군집화, 인공신경망을 활용하였다. 이때, 군집화에서는 k-평균 군집화를 활용하여 데이 터를 분석하기 적합한 경태로 가공하며 연관규칙분석 의 FP-Growth 알고리즘, 인공신경망을 사용해 데이 터 간의 패턴과 상관관계를 분석하였다. 데이터 마이 닝은 파악하고자 하는 지식, 정보를 데이터에서 추출 하는 과정으로 데이터 정제 및 통합, 데이터 추출, 적절한 형식으로의 데이터 변환, 데이터의 유의미한 패턴 판단, 시각화의 과정을 거친다. 연관규칙분석 (Association Rule)은 데이터 내부에 존재하는 항목 간의 상호관계 혹은 종속 관계를 찾아내는 분석 방 법이며, 연관성을 일반화하거나 신뢰할 수 있는 기준 은 아래 식(1)과 같다.

    S ( A B ) = P ( A B ) C ( A B ) = P ( B | A ) L ( A B ) = P ( B | A ) / P ( B ) = P ( A B ) / P ( A ) P ( B )
    (1)

    지지도(Support)는 전체 데이터 중 A와 B가 함께 발생한 데이터의 빈도 수, 신뢰도(Confidence)는 A가 발생했을 때 B가 함께 발생한 데이터 수, 향상도(Lift) 는 A가 일어났을 때 거래 수에 비하여 B가 발생했을 때 A가 함께 일어난 데이터의 비율로 정의된다. 세 값이 높을수록 데이터 내에서 빈번한 패턴이며 수식 1의 A는 조건절, B는 결과절로 정의된다. 판단 기준 을 만족하는 가장 긴 패턴을 찾아내는 계산 방식은 Fig. 1(최소지지도가 2인 경우 가정)에 제시되었다. 규 칙 내 데이터가 증가할수록 계산하는 시간은 기하급 수적으로 증가하며, Apriori 알고리즘은 이런 문제점을 해결한 방식으로 최소 지지도를 만족하는 집합의 하 위 집합 역시 최소 지지도를 만족한다는 특징을 이용 해 효과적으로 작동한다. 모든 후보가 빈번하다고 파 악되지 않을 때까지 작동하며, 그 후 빈번한 itemset을 확인한다. 그러나 여전히 데이터베이스를 여러 번 읽 어야 하는 단점이 발생하는데, 이를 FP-Growth 알고 리즘(Frequent pattern growth, 이하 FP-Growth)을 통 해 극복할 수 있다. FP-Growth는 전체 데이터를 스캔 하여 1-itemset을 찾고, 내림차순으로 빈번한 아이템을 정렬한다. 이후 다시 스캔하여 FP-Tree를 생성하는데, 긴 데이터의 패턴이 끊어지지 않고 완전한 정보를 보 존하며, 빈번한 패턴을 찾기 위해 전체 트리를 탐색하 지 않아도 되는 장점이 있다.

    둘째, 군집화(Clustering)는 군집 간 분산 최대화와 군집 내 분산 최소화를 목적으로 한다. 군집화는 정 답이 없는 비지도 학습(Unsupervised learning)이며 한 개체가 여러 군집에 속할 수 있는지, 계층적 혹은 동시에 모든 개체의 군집화가 이루어지는지 등에 따 라 다양한 종류로 구분된다. 군집화 방법 중 대중적 으로 활용되는 k-평균 군집화(k-mean clustering)는 유클리드 거리를 이용하며 모델의 작동 시간이 다른 모델에 비해 짧은 특징을 가진다. 수행 단계는 먼저 d차원 공간에서 입력된 개의 중심점을 임의로 선택하 며, 각 데이터 포인트를 가까운 중심점에 할당, 군집 을 형성한 후 각 중심점은 군집의 평균 위치로 이동 하게 되며 할당 작업에 큰 변화가 없을 때까지 위 과정을 반복한다. 단일 해가 존재하지 않는 경우 일 정한 과정을 계속하여 돌게 되는 문제가 존재하지만, 데이터 개수가 n, 군집 개수가 k, 군집 중심 조정 횟 수가 t일 때 시간복잡도가 O(nkt)과 같기 때문에 무 겁지 않은 알고리즘이다(Fig. 2).

    마지막으로 활용된 인공신경망(Neural Network)은 일반적으로 Multilayer Feed-Forward 네트워크를 가 리킨다. 이는 입력층, 은닉층, 출력층을 가지며 각 층 의 노드(node) 사이에는 가중치와 bias 관계가 성립 한다. 가중치 관계는 출력층에서 입력층으로 향하는 역방향 관계가 성립하지 않는 feed-forward 네트워크 이다. 사용자가 은닉층의 개수와 입력값의 개수를 지 정해 주어야 하고 입력 데이터는 사용의 편이를 위 해 정규화 되어 있어야 하며 분류와 예측 모두에 사 용되며 최상의 은닉층 수는 존재하지 않는다(Fig. 3).

    이와 함께 도시의 기상에 영향을 주는 구조물에 의한 다양한 난류의 발생과 열섬 현상, 등온층의 형 성 등을 재현하기 위해 수치모델인 Single Canopy Model과 미기상 대기 모델인 ENVI-Met.4 Model을 이용하였다. 도시의 모든 건물이 같은 높이, 일정한 간격의 직사각형 모양으로 세워졌을 때를 가정한 수 치시뮬레이션 모델인 Single Canopy Model(이하 SCM) (Fig. 4)을 이용하면 도심의 건물들 사이에서 유체의 흐름을 통해 온도의 분포 변화를 설명할 수 있다. SCM에서는 태양빛이 닿지 않는 음지의 부분에도 반 사된 태양열이 닿아 에너지를 전달한다는 것을 전제 로 하고 있다. 이때 가해지는 열에너지에 의한 영향 을 받는 습도, 바람의 방향 등과 같은 다른 변수들이 있지만 이를 무시하고 태양빛의 복사만 생각해본다면 벽면에 가해지는 복사열의 양은 태양빛의 입사 각도에 따라 달라지며, 건물 높이와 건물 사이의 각도에 의 해 차이가 난다(Ryu, 2011). 이 경우의 복사선에 의 한 복사 에너지의 양은 Fig. 5를 통해 산정 가능하다.

    ENVI-Met.은 3차원 미기상 모델링 프로그램으로 독일 Bochum university의 Michael bruse에 의해 1998년 개발되었다. ENVI-Met.에는 1차원의 토양 모 델, 식생모델, 열교환 모델이 포함되어 있다. 그리고 지면과 건축물에 관한 식으로 이루어져 있는데, 이러 한 구성적 특성은 공간적으로 넓은 영역보다 좁은 영역에서의 상세한 기상 정보를 도출하는데 장점을 가지고 있으며, 미기상에 영향을 미칠 수 있는 물리 적 과정에 대한 고려를 구체적으로 하고 있다. 도시 지역의 고층 건물에 의한 주변 지역의 미기후 변화 (기류, 유체의 흐름장, 온도와 습도의 분포) 등을 계 산할 수 있으며, 식생, 토양, 건물 등에 관한 조건들 은 다양한 유형의 선택으로 격자 내부에서 자유롭게 배치 될 수 있어, 사용자의 설계 계획에 따라 실제지 형을 고려한 미세규모로 분석이 가능하다는 장점이 있다(Fig. 6). 다양한 선행연구를 통해 ENVI-Met.은 지표, 식물, 대기의 상호작용을 기본으로 하여 도심 의 건축물, 대기, 지표면, 식생 요소 간 소규모의 상 호작용을 효과적으로 분석할 수 있는 최적의 모델로 사용되고 있음을 확인하였다(Choi, 2016).

    3. 연구 내용

    도심 열섬 현상(Urban Heat Island)은 주위의 지역보 다 대도시에서 온도가 더 높게 나타나는 현상으로, 그 원인 가운데 대표적인 것이 도시화로 인한 지표면 개 발과 에너지 사용으로 인한 열 발생이다(Rosenzweig, 2009). 이때 지표면이 아스팔트로 바뀜에 따라 그 열 복사 특성이 변화하게 되고, 도시 지역의 증/발산량 이 바뀌게 된다. 또한, 인구 밀집도가 높아지면서 더 넓은 면적의 토지 개발이 촉진되고, 이로 인해 평균 온도가 상승하는 효과가 일어나게 된다(Oke, 1982;Hiroyuki et al., 2001). 실제 예시로 Fig. 7에서 볼 수 있듯이, 산업화와 도시화가 진행된 1970년대 이후 의 도쿄의 평균기온은 다른 농촌 도시나 소도시의 기온을 상회하는 것을 볼 수 있다. 주로 1~2층의 목 조주택과 흙바닥, 녹지로 구성되어 있던 도시가 아스 팔트로 만들어진 도로, 시멘트와 콘크리트로 만들어 진 건물 등으로 변하고, 이는 태양열의 흡수를 촉진 하게 되어 표면 온도와 그 주변의 온도를 모두 상승 시키게 된다. 이와 함께 본 연구에서 중요한 현상으 로 인식되는 도시 먼지 돔 현상(Urban Dust Dome Effect)은 먼지, 재, 화학 물질 등을 포함한 공기가 이 러한 도심 상층에 형성된 따뜻한 역전층에 의해 순 환하지 않고 특정 장소의 상공에 갇혀 있는 현상이 다. 이는 도시 상공의 등온층의 경계를 따라 형성되 며, 주로 대도시에서 발생하기에 이를 Urban Dust Dome이라고 부른다.

    이와 같은 도심 상공에 장시간 오염물질이 정체할 조건과 그에 따른 농도의 부가 가능성에 대한 연구 를 진행하기 위해 본 연구에서는 먼저 데이터 마이 닝을 통한 대기오염도와 도심의 다양한 정보와의 관 계를 분석하기로 하였다.

    3.1. 군집화를 통한 대기오염도와 환경 변수의 관계

    군집화는 크게 3단계, 데이터 전처리, 연관 패턴 분석, 결론 도출 단계로 구성되며, 데이터 전처리 과 정에서 행정구역 데이터를 수집하고 분석에 적합한 형태로 통합된다. 연관 패턴 분석에서 군집-대기오염 도 패턴을 분석하며 서울시/전국 군집별 데이터 속성- 대기오염도 패턴과 상관관계를 파악한 후 결과를 종 합해 결론을 도출하였다. 데이터 전처리 단계는 분석 할 데이터를 수집하고 분석하기 쉬운 형태로 가공하 는 단계이다. 연관 패턴 분석에 서울시 데이터광장, 통계청, 기상청 웹사이트에서 수집한 데이터를 활용 했다. 연관 패턴 분석에는 전국적인 양상을 파악하기 위한 전국 공통 데이터와 구체적인 분석을 위해 데 이터가 많이 제공되는 서울시 공통 데이터를 확보했 다. 데이터를 (군집, 지역명, 지역번호, 연도, 데이터 속성1, 데이터 속성2, ....)의 형태로 편집해 각각 한 개의 파일로 병합하며, 2014~2018년 서울시 데이터 와 2000~2018년 전국 데이터를 사용하였다(Table 1). 연관규칙 분석을 할 때 각 데이터 속성을 세 단계로 이산화하며, 인공신경망의 경우 입력 전 모든 데이터 를 0과 1사이의 값으로 변환하는 정규화 작업을 거 치고 지역의 특징에 따라 분석하기 위해 각 행정구 역을 군집으로 구분하였다. 용도지역 데이터를 바탕 으로 서울시는 25개 구역의 주거, 공업, 상업, 녹지지 역 비율을 속성 값으로, 전국은 대한민국 17개 행정 구역의 도시, 관리, 농림, 자연보전지역 비율을 속성 값으로 하여 Python을 이용해 구축한 k-평균 군집화 코드를 활용해 군집화 했다(Table 2). 제주특별자치도 (Table 3, *)는 관리지역으로 분류할 수 있지만 관리 지역 비율이 50% 이상이기에 다른 관리지역과 다른 군집으로 분류되며 분석에 포함하지 않았다. 서울시 의 대기 및 대기오염도 정보는 평균값이 비슷하기 때문에 변화하는 양상에 주목할 필요가 있으며, 시계 열 데이터를 분류해 평균값과 함께 분석하였다. 시계 열 군집화 역시 k-평균 군집화로 진행했으며, 2014년 부터 2018년의 대기 및 대기오염도 데이터를 사용했 다. 대기 데이터는 연도 별로 약 두 개 이하의 군집 으로 분류되었으며(Table 4), 대기오염도 데이터 역시 연도 별로 같은 군집으로 분류되었다(Table 5). 연도 내에서 다른 군집으로 나뉜 경우 최댓값과 최솟값에 차이가 있었다. 대기 데이터 속성의 경우 군집화 속 성만을 분석에 사용하였고, 대기오염도 속성의 기존 값은 분석 대상이기 때문에 대기오염도 시계열 군집 속성을 추가해 결과를 데이터셋에 반영하였다. 각 군 집에 해당되는 데이터의 군집화 속성 값은 군집 번 호로 부여되었다. 예를 들어 Table 4의 평균기온 데 이터 속성의 2014년 데이터들은 평균기온 군집 속성 에서 모두 ‘1’ 값을 가지게 하였다.

    마지막으로 데이터 속성 종류와 대기오염도 사이의 관계를 분석하기 위해 데이터 속성 종류를 구분하였다. 서울시 데이터의 속성은 녹지, 하수 및 분뇨, 대기, 건 물 및 교통, 대기오염도 속성으로 나뉜다. 전국 데이터 는 건물 층수, 지역 활용도, 화학 폐기물, 도로 현황, 교량, 교통량, 대기오염도 속성으로 구분하며, 자세한 속성 분류는 아래와 표의 내용과 같다(Table 6, 7).

    3.2. 연관 패턴과 인공신경망

    데이터셋을 구성하고 형태를 통일한 후 연관 패턴 분석은 연관패턴분석과 인공신경망을 이용한 상관관 계(R 2 ) 분석으로 구분되었다. 연관패턴분석은 Apriori Algorithm의 단점을 보완한 FP-Growth Algorithm을 사용하여 Python으로 코드를 구축했고, 인공신경망은 Keras를 이용해 간단한 회귀 모델을 설정하였다. 인 공신경망 코드는 같은 데이터에 대해 지정된 횟수만 큼 반복되어 가장 적합한 모델을 저장하고 실행 종 료 후 각 모델의 R 2 값을 구했다. 먼저, 한 데이터 속성을 조건, 한 지역 군집을 결과로 하여 연관패턴 을 분석하고 이를 바탕으로 군집에 따른 대기오염도 의 변화를 비교하였다. 이후 서울시의 4개 군집 별로 데이터 속성 종류와 대기오염도 사이의 연관패턴과 상관관계를 분석하며, 전국 역시 3개 군집에 대해 서 울시와 같은 방식으로 분석했다(Fig. 8).

    3.3. 미기상 수치모델 ENVI-Met. 모델링 및 초기 기상장 설정

    건물정보를 반영한 시뮬레이션을 진행하기 위해서 먼저 대상이 될 도시를 선정하였다. 건물의 높이가 다양하고 혼재되어 있는 일반적인 도시의 경우, 건물 높이의 차이로 인해 Single Canopy Model을 이용하 여 시뮬레이션을 진행하기 어렵다. 이 경우 Multilayer Canopy Model을 이용한 시뮬레이션을 진행하여야 하는데, 오차범위가 더 커지는 현상이 일어날 가능성 이 높아진다. 따라서 건물 높이가 일정하고 건물 사 이의 간격이 일정한 구조를 검토한 결과 약 1만 단 지 규모의 서울시 송파구 헬리오시티 지역을 모델링 영역으로 선정하였다(Fig. 9). 단지 내 도로의 성분을 아스팔트(Asphalt Road)이외의 성분을 롬(Loamy Soil) 으로 설정하였고(Fig. 10), 이후 시뮬레이션을 위한 초기 기상장을 Table 8과 같이 설정하였다. 수치 모 델링의 결과를 도출하기 위해 Fig. 11과 같은 9개의 지점을 선택하여 그 지점에서의 시간대별 기온 수치 를 분석했으며, 측정지점들은 바람의 입사 방향과 진 행 방향에 따라 Table 9와 같이 분류하였다. A형으 로 분류된 지점들의 경우, 바람의 입사 방향과 진행 방향에 대해 건물이 수직인 방향으로 세워져 있어 바람길을 차단하게 되는 지점이고, 반면 B형의 경우 에는 바람의 입사 방향과 진행 방향에 건물이 없어 바람이 진행할 수 있으며, C형의 경우에는 입사 방 향과 진행 방향이 건물에 의해 굴절되는 현상을 갖 는 지점으로 분류되었다.

    4. 연구 결과

    4.1. 군집화를 통한 대기오염도와 환경 변수의 관 계 분석

    서울시의 경우 전반적인 대기오염도의 분포 형태는 비슷하나 평균값에서 차이를 보였다(Table 10). 이는 서울시의 구분 대상인 구가 상대적으로 국지 지역이 기 때문에 지역 별로 극단적인 차이를 보이지 않기 때문이다. 주거 및 녹지지역은 높은 PM10, NO2, CO 농도와 낮은 PM2.5, O3, SO2 농도를 보이고 있다. 주 거지역은 높은 O3, SO2 농도와 낮은 PM10 농도로 나 타났고, 녹지지역은 높은 PM2.5, O3 농도와 낮은 PM10, NO2, CO 농도를 보여준다. 마지막으로 공업지 역에서는 높은 PM10, PM2.5, CO, SO2 농도를 확인할 수 있었다. 전국 역시 서울시와 같이 평균값에서 분 포의 차이가 나타내었다(Table 11). 농림지역의 PM10, NO2, SO2 농도는 낮은 반면, O3, CO 농도는 타 지 역에 비해 높았다. 관리 지역의 O3 농도는 낮지만, 그 외의 대기오염물질 농도 평균값은 높았으며, 도시 지역의 경우 낮은 O3, CO 농도를 보이는 반면 NO2 농도는 높게 나타났다.

    서울시 군집 별로 데이터 속성과 대기오염도 수치 간의 패턴을 분석한 결과, 군집 별로 다양한 패턴을 추출했다. 최소 지지도를 5, 최소 신뢰도를 0.5로 지 정했을 때, 주거지역-대기, 공업지역-대기 관계를 제 외한 모든 관계의 패턴을 얻을 수 있었다(Table 12, Fig. 12). 서울시 용도지역 군집-대기오염도 시계열 군집 간의 패턴 역시 연관패턴분석 코드를 활용, 최 소 지지도와 최소 신뢰도를 각각 5, 0.5로 설정해 탐 색했으나 유의미한 패턴이 파악되지 않았다. 따라서 서울시 용도지역 군집별 데이터와 대기오염도 시계열 군집, 즉 대기오염도 추이 간의 유의미한 관계를 가 지지 못해 서울시 데이터와 대기오염도 시계열 군집 간의 상관관계를 해석하는 것은 어렵다고 판단되었다. 먼저 PM10과 서울시 용도지역 데이터간의 유의미한 상관관계가 거의 없고, PM2.5 농도가 높았던 녹지 지 역과 공업지역에서 뚜렷한 관계가 파악되지 않은 것 은 사용한 서울시 데이터 요소들이 미세먼지와 큰 관련이 없다는 것으로 해석할 수 있다. 분석한 결과 를 바탕으로 서울시 미세먼지의 경우 본 연구에서 고려하지 않은 데이터 속성, 즉, 타 지역의 데이터와 관련이 있다는 것을 유추할 수 있었다. 대기 입자상 오염물질은 바람을 타고 멀리 이류 되며, 보통 풍속 일 때 하루에 수평으로 수백 km, 수직으로 수 km 정도를 이동한다. 그리고 PM2.5의 대기 중 체류시간 은 약 7일로 PM10에 비해 2~3배 길다(Hwang et al., 2008). 따라서 대기 중 미세 먼지는 주변지역으로부 터의 이동성 영향을 함께 받는다. 실제로 최근 분석 된 지역별 대기질은 외부에서 유입된 미세입자나 여 러 오염물질의 영향을 많이 받고 있는 것으로 분석 되고 있다(Ko et al., 2015).

    연관패턴분석과 상관관계 분석을 토대로 O3 농도 가 높고 녹지 비율이 낮은 주거지역에서 녹지-O3 농 도 간의 관계는 O3 농도와 녹지 비율 사이의 유의미 한 상관성을 보여주었다. NO2 농도가 높았던 주거 및 녹지 지역, 주거 지역에서 각각 녹지 속성과 대기 속성과의 상관 관계가 나타났고, NO2 농도가 낮았던 녹지 지역에서 하수 및 분뇨/건물 및 교통 속성과 유 의미한 관계가 파악되었다. 주거 및 녹지 지역의 녹 지 비율이 낮고, 녹지 지역의 하수 및 분뇨 데이터가 타 군집에 비해 낮기 때문에 NO2는 전반적으로 도심 데이터 요소와 광범위한 관계를 가짐을 알 수 있었 다. 또한 CO 농도가 높았던 주거 및 녹지 지역, 주 거 지역과 SO2 농도가 높았던 녹지 지역, 공업지역 역시 데이터와 강한 상관관계가 드러났다. 분석한 결 과를 바탕으로 서울시 미세먼지의 원인은 본 연구에 서 고려하지 않은 데이터 속성, 즉 타 지역의 데이터 와 관련이 있다는 것을 유추할 수 있다. 또한 주거지 역의 O3 농도를 감소시키기 위해 녹지 비율과의 인 과관계를 분석해야 하며, NO2 농도는 친환경 도시 정책을 통해 효과적으로 감소할 수 있음을 알 수 있 었다(Fig. 13).

    전국 군집 별 데이터 속성과 대기오염도 간의 연 관패턴을 분석한 결과, 서울시와 동일하게 대부분의 군집-데이터 속성 간의 패턴이 파악되었다(Fig. 14). 최소 지지도를 7, 최소 신뢰도를 0.7로 설정한 결과 관리지역-도로 현황, 도시지역-지역 활용도/도로 현황 관계를 제외하고 모든 군집-데이터 속성 간의 패턴을 추출하였으며, 이를 통해 모든 군집에서 대기오염물 질과 높은 상관관계를 가진다는 것을 알 수 있었다 (Fig. 15, Table 13). 특히, 건물 층수, 화학 폐기물, 교량 속성은 대기오염도와 모든 군집에서 강한 상관 관계를 보이며, 지역 활용도, 도로 현황, 교통량은 도 시지역 군집에서만 유의미한 관계를 가졌다. 연관패 턴분석과 상관관계 분석을 종합한 유의미한 패턴을 바탕으로 분석할 수 있다. 그 결과 전국 데이터 역시 군집 별로 패턴 생성 비율과 상관관계의 정도가 다 르게 나타났다. PM10 농도가 낮았던 농림지역에서 강한 상관관계가 나타났고, 농도가 평균 정도였던 도 시지역은 다양한 데이터 속성에서, 농도가 높았던 관 리지역 역시 상관관계가 유도되었다. 이는 데이터 속 성, 특히 건물 층수와 교량이 PM10 농도와 유의미한 상관성이 있다는 것을 보여준다. 화학 폐기물/교량- O3 농도간의 관계가 모든 군집에서 발견되었으며, 건 물 층수/화학 폐기물/교량-NO2 농도간의 관계 역시 대부분의 군집에서 파악되었다. CO 농도와 다른 데 이터 간의 상관관계가 다수 발견되었으나 패턴을 종 합한 결과 유의미한 패턴은 아닌 것을 알 수 있다. 마지막으로 SO2 농도가 높았던 관리지역과 농도가 낮았던 도시지역에서 건물 층수/지역 활용도/화학 폐 기물/교량-SO2간의 상관성이 확인되었고, SO2는 도심 데이터와 광범위한 관계를 가짐을 알 수 있다. 패턴 의 타당성을 확인하기 위해 상관관계를 파악한 결과, 주거지역 군집에서 건물 및 교통 데이터 속성과 대 기오염도는 유의미한 관련이 없는 것으로 파악되었다. 공업지역 군집은 대기/건물 및 교통 속성과 대기오염 도의 상관 관계가 낮았다. 또한 같은 군집과 같은 데 이터 속성 간의 상관관계는 대기오염물질에 따라 상 이하다. 유의미한 관계를 가지는 데이터 속성-대기오 염물질 관계를 분석한 결과에서 주거 및 녹지지역 데이터는 PM2.5 농도와 관계가 있으며 주거지역은 CO, NO2, O3, PM2.5와 강한 관계를 가졌다. 녹지지역 과 공업지역은 SO2와 강한 상관관계를 보이며 녹지 지역과 NO2의 상관관계도 확인되었다. 전국 데이터 와 대기오염도 간의 상관관계를 분석한 결과에서, 농 림지역 군집에서 건물 층수/화학 폐기물/교량 속성과 대기오염도 간의 상관관계가 유의미한 것으로 파악되 었고, 도시지역 군집은 모든 데이터 속성에서 높은 상관관계를 나타내었으며, 관리지역 군집은 건물 층 수/화학 폐기물/교량 속성에서 유의미한 상관관계를 확인했다.

    4.2. 미기상 도시모델 ENVI-Met. 결과

    도시지역은 다양한 데이터 속성에서 농도가 높았던 관리지역 등에서 특히 건물 층수가 PM10 농도와 상 관성이 있다는 것을 보여주었다. 이를 바탕으로, 도 심 지형 위 건물의 효과를 충분히 고려하여 도심 미 세먼지 산정에 있어서의 영향을 분석하기 위해 미기 상 도시 모델 ENVI-Met. 결과를 나타내었다. Fig. 16의 연직 기온 단면도는 모델링 산정 도시에 대해 Y-Z 평면을 나타낸 것이다. 10시부터 20시까지 2시 간 간격으로 총 6번의 측정치를 분석한 결과이며, 12 시부터 16시까지 도시의 중심부를 중심으로 기온의 분포가 연직 상방으로 높게 분포되는 것을 확인할 수 있었고 전반적으로 종 모양을 띠게 되었다. 이는 모델 도시인 헬리오시티에서 상층 도시 열섬 현상이 부분적으로 나타난다는 것을 의미한다.

    측정 지점에서의 연직 방향 풍속을 알아보면(Fig. 17), A형 지점의 경우 Flow w 값이 양수(+)값으로, 이는 건물의 벽을 통한 기계적 난류에 의한 상승류 (updraft)를 유도했기 때문이라고 볼 수 있다. 또한 시간이 지날수록 그 수치가 커졌는데, 이는 가열된 공기로 인해 부력이 커졌기 때문이다. 하지만, 건물 높이를 전후로 Flow w 값이 감소하기 시작했고 측 정 지점 9의 경우에는 50 m 부근에서 Flow w의 크 기가 0이 되는 것을 관찰할 수 있다. 이는 이 지점에 서 상승풍과 하강풍이 만나 정체층을 형성한 것으로, 상하로의 공기 순환이 일어나지 않고 그로 인해 부 근에서의 공기 온도가 상승할 것이라는 예측을 할 수 있다. 측정 지점 1 역시 높이 70 m을 전후로 Flow w가 감소하고 있으며, 측정 지점 9와 같은 현상이 나타날 것으로 예상되었다. B형 측정 지점의 경우, A형 지점과는 반대로 하강풍이 발생하였으며, 시간별 로 Flow w 값을 비교해 본 결과 하강풍의 세기는 시간이 지나며 더 강해졌다. 특징적으로 측정 지점 4 와 측정 지점 5의 경우, 같은 고도에서 Flow w의 수 치를 비교해 보면 측정 지점 4는 하강풍, 측정 지점 5는 Flow w 값이 0인 것을 확인할 수 있다. 이는 측 정 지점 5를 중심으로 대류 현상이 일어난다는 것을 말하며, 측정 지점 5의 오른편에서 입사하는 공기가 가열되어 상승한 후 상층부에서의 냉각을 거쳐 측정 지점 4로 하강풍을 발생시킬 가능성을 나타낸다. C 형 측정 지점의 경우, 측정 지점 1에서는 하강풍, 측 정 지점 2에서는 상승풍이 생성되었는데 고도가 올 라갈수록 상승/하강풍의 세기가 더 강해지는 것을 확 인할 수 있었다. 이는 C형 측정 지점의 건물 배치 구조상 바람이 지속적으로 유입되기 때문이며, 입사 방향에 대해 수직인 형태의 A형 측정 지점처럼 세기 가 약해지지 않음을 나타내었다.

    측정 지점에서의 기온 감률을 살펴보면(Fig. 18), A형 지점에 대해 두 시간 간격으로 연직 방향의 기 온 변화 그래프를 그려 본 결과, 시간에 따른 기온의 경향은 오전보다 오후에서 더 높게 나타났으며, 16시 경에 그 기온이 최대가 됨을 알 수 있었다. 반대로 B형 지점의 경우, 지표면 근처의 기온보다 높이가 높 아질수록 그 기온이 감소하는 것을 확인할 수 있다. 이는 A형과는 다르게 바람의 입사방향에 대해 바람 의 진행방향에 건물이 존재하지 않기 때문이며 이로 인해 대류현상이 일어나게 되기 때문으로 판단된다. 또한 C형 지점에 대해 두 시간 간격으로 연직 방향 의 기온 변화 그래프에서 시간에 따른 기온 분포의 경향은 오전보다 오후에서 더 높고, 특히 16시에 그 기온이 최대가 됨을 알 수 있다. 이는 태양 복사 에 너지가 지표에 전달된 후 지표가 가열되는 지연현상 이 존재하기 때문이며, 일몰 이후인 18시, 20시의 경 우에는 지표면이 냉각되어 열원이 사라지기 때문이라 고 볼 수 있다. 또한, A형 지점의 특성으로써 지표면 근처의 기온보다 높이가 높아질수록 그 기온이 증가 하는 것을 확인할 수 있다. 이에 대해서는 연직 방향 으로의 바람 속력을 나타내는 Flow w 값의 변화에 서 알 수 있듯, 빌딩 벽에 부딪히는 바람이 상승풍으 로 변환되기 때문에 이로 인해 상승한 공기가 상층 부에서 고립되어 있을 것이라고 생각할 수 있다. C 형 지점에서 기온의 감소가 일어나지만 B형 지점에 서 나타난 감률보다 줄어들었음을 확인할 수 있다. 즉 도심 대기의 정체를 가져오는 도시 열섬 현상의 확산과 이동은 이러한 상층의 상대적으로 차고 깨끗 한 상층공기의 유입을 유도하여 확산이 될 수 있으 며, 정체되어 그 층 내에 머물러 있게 된 도심의 상 층 열 환경으로 인해 미세먼지의 정체가능성은 더욱 심화될 수 있음을 의미한다.

    5. 결 론

    본 연구에서는 복잡한 도심의 구조가 대류현상을 제어하여 유입된 미세먼지가 외부로 확산-배출되지 못하고 도심에 머무르는 현상으로 인해 그 영향을 심화시킬 수 있는 가능성에 대해 데이터 마이닝 기 법과 미기상 도시모델을 이용하여 분석하였다. 데이 터 마이닝 분석에서 서울시와 전국의 용도지역의 비 율에 따라 대기오염물질 농도의 분포 평균에 차이가 있으며, 이는 용도지역 데이터를 활용한 k-평균 군집 화와 데이터 분석을 통해 확인되었다. 분석할 데이터 의 속성을 찾기 위해 서울시와 전국 공공데이터를 사용했고, 연관패턴분석과 인공신경망을 활용한 상관 관계(R 2 값) 분석을 활용했다. 서울시 데이터 분석 결과, 서울시 용도데이터와 PM10, PM2.5 농도와의 유 의미한 상관관계가 파악되지 않았다. 분석한 결과를 바탕으로 서울시 미세먼지의 경우 본 연구에서 고려 하지 않은 데이터 속성 즉, 타 지역의 데이터와 관련 이 있다는 것을 유추할 수 있으며 주변지역으로부터 의 이동성 영향을 함께 받는다고 볼 수 있었다. 전국 데이터 분석 결과, PM10 농도와 전반적인 데이터 속 성 간의 유의미한 상관성을 보이며, 그 중 건물 층수/ 교량-PM10 농도의 관계가 특히 강함을 확인했다. 데 이터 마이닝 결과를 바탕으로 도심의 건물의 영향과 미세먼지의 관계에 대해 미기상 도시모델 ENVI-Met. 등을 통한 분석에서는 고층 건물이 밀집되어 있는 지역에서 건물 구조 상의 특징에 따라 상층부의 공기 가 다양한 패턴으로 정체된 체 존재할 가능성을 보여 주었다. 실험 사례와 같이 도심 상층부의 공기가 가열 된 채로 정체하게 되면 일몰 이후 지표면이 더욱 급 속히 냉각되어 대기의 대류현상을 더욱 방해해 순환 이 원활하지 않게 하는 결과를 가져오고, 상층부의 미 세먼지를 포함한 공기가 도시 상공에 장시간 잔류하 는 결과를 갖게 됨을 알 수 있었다. 건물의 배치형태 또한 도심 상층 역전층 형성에 영향을 주어 미세먼지 가 정체되면서 잔류하게 되는 시간에 영향을 갖게 됨 으로 분석되었다. 즉, 도심으로 유입된 미세먼지의 산 정량을 예측함에 있어서 도심 내 구조물에 의한 열환 경 변화를 통해 잔류 영향을 반드시파악해야 함을 의 미한다. 이는 도심으로 유입된 미세먼지의 발생 특성 분석을 보다 정량적으로 수행할 수 있을 뿐 만 아니 라 고농도 미세먼지 오염으로부터 피해를 저감할 수 있는 예보 확보에 기여할 수 있을 것으로 판단된다.

    사 사

    본 연구는 과학기술정보통신부의 지원을 받아 KAIST 부설 한국과학영재학교의 프로그램의 일환으로 수행 되었습니다.

    Figure

    JKESS-41-2-111_F1.gif

    Candidate itemset and frequent itemset creation process (e.g., if the minimum support is 2).

    JKESS-41-2-111_F2.gif

    k-Average clustering process ((a) Setting clusters randomly (b) Process of finding a new center point (c) A new cluster after one adjustment).

    JKESS-41-2-111_F3.gif

    Artificial neural network (One hidden layer).

    JKESS-41-2-111_F4.gif

    Single Canopy Model overview for the changes in temperature distribution between buildings.

    JKESS-41-2-111_F5.gif

    When the sunlight enters only between buildings case (Left) and when the sunlight enters the wall of a building and neighboring building case (Right) in Single Canopy Model.

    JKESS-41-2-111_F6.gif

    Envi-Met. modeling flow chart (http://www.model.envi-met.com/hg2e/doku.php) (Left) and Envi-Met. model boundary (http://www.model.envi-met.com/hg2e/doku.php (Right)).

    JKESS-41-2-111_F7.gif

    Average temperature in Tokyo during 1907-2007.

    JKESS-41-2-111_F8.gif

    Data analysis flow chart on the correlation between data types and air pollution.

    JKESS-41-2-111_F9.gif

    Songpa Heliocity map (Left) and the location of the building in ENVI-Met. 4 setting (Right).

    JKESS-41-2-111_F10.gif

    Modeling of the Songpa Heliocity ground on ENVI-Met.4.

    JKESS-41-2-111_F11.gif

    The selected area as a representative case for the numerical modeling in Fig. 10 (Arrow is the initial wind direction field).

    JKESS-41-2-111_F12.gif

    The ratio of pattern generation by cluster of Seoul city (Minimum support = 5, Minimum confidence = 0.5).

    JKESS-41-2-111_F13.gif

    Comparison of correlation (R 2 value) by Seoul city clusters.

    JKESS-41-2-111_F14.gif

    The ratio of pattern generation by cluster of nationwide (Minimum support = 7, Minimum confidence = 0.7).

    JKESS-41-2-111_F15.gif

    Comparison of correlations (R 2 values) by nationwide clusters.

    JKESS-41-2-111_F16.gif

    The vertical section analysis of temperature distribution at 10 h, 12 h (Top left. Top right), 14 h, 16 h (Left center, Right center), 18 h, 20 h (Bottom left, Bottom right).

    JKESS-41-2-111_F17.gif

    The hourly vertical wind speed distribution (Checkpoint 3, 9: Type A point, Checkpoint 4, 5: Type B point, Checkpoint 1, 2: Type C point).

    JKESS-41-2-111_F18.gif

    The hourly vertical temperature distribution (Checkpoint 3, 9: Type A point, Checkpoint 4, 5: Type B point, Checkpoint 1, 2: Type C point).

    Table

    Public data collected and categorized in this study

    Clustering results to determine the correlation with air pollution pattern in Seoul city

    Clustering results to determine the correlation with air pollution pattern in nationwide

    The clustering analysis result of meteorological value index

    The clustering analysis result of atmospheric quality index

    Analysis of Seoul-use public data properties

    Data category properties in nationwide-use public data

    Initial conditions for the atmospheric model ENVIMet. 4

    Classification area as a representative case for analyzing the modeling result

    Average air pollutant concentration (ppm) distribution by cluster analysis in Seoul data

    Average air pollutant concentration (ppm) distribution by cluster analysis in nationwide data

    Significant relationship properties between Seoul-use data and air pollutant

    Significant relationship properties between nationwide- use data and air pollutant

    Reference

    1. Carfan, A. C. , Galvani, E. , and Nery, J. T. ,2011, Study of thermal comfort city of sao paulo using ENVI-Met, Boletin del Instituto de Geografia, 78, 34-47.
    2. Choi, H. J. ,2006, The simulation of meteorological field and photochemical air pollution in high resolution, Unpublished Dr. dissertation, Pusan National University, Korea, 183 p. (in Korean)
    3. Choi, H. J. , Lee, S. H. , and Kim, H. S. ,2015, The analysis of regional scale topographic effect using MM5-A2C coupling modeling. J. Korean Earth Sci. Soc., 36, 3, 210-221.
    4. Choi, H. J. ,2016, Thermal comfort evaluation using the Envi-Met. Micro Climate Model, KIAEBS, 10(6), 416-428.
    5. Elnabawi, M. H. ,2013, Use and evaluation of the ENVIMet model for two different urban forms CAIRO, EGYPT. International Building Performance Simulation Association, 2800-2806.
    6. Hwang, G. M. , Lee, B. , Shin, G. , and Lee, J. ,2008, Mass concentration and ionic composition of PM2.5 observed at ieodo ocean research station, J. Korean Soc. Atmos. Environ., 24(5), 501-511. (in Korean)
    7. Hiroyuki, K. , Kondo, H. , Kikegawa, Y. , and Kimura, F. ,2001, A simple single-layer urban canopy model for atmospheric models: Comparison with multi-layered slab models. J. Bound. Layer Met., 104, 329-358.
    8. Ko, H. J. , Lim, E. H. , Song, J. M. , Kim, W. H. , Kang, C. H. , Lee, H. Y. , and Lee, C. K. ,2015, Composition variation of atmospheric fine particulate matters in accordance with air mass transport pathways at background site of Korea in2013. Journal of Korean Society for Atmospheric Environment, 31(1), 15-27.
    9. KOSIS,2018, http://kosis.kr/statHtml/statHtml.do?orgId=101&tblId=DT_1SSEN053R&vw_cd=MT_ZTITLE&list_id=101_D219&seqNo=&lang_mode=ko&language=kor&obj_var_id=&itm_id=&conn_path=MT_ZTITLE.
    10. Lee, S. H. , and Kimura, F. ,2001, Comparative studies in the local circulation induced by land-use and topography. J. Bound. Layer Met., 101, 157-182.
    11. Lee, H. W. , Choi, H. J. , and Lee, K. Y. ,2005, The effect of the detailed bottom boundary condition and numerical interpolation on the simulation of the air flow field with complex topography. J. of Korean Meteorological Society, 41(1), 73-87. (in Korean)
    12. Lee, H. W. , Choi, H. J. , Lee, K. Y. , Lee, S. H. , and Sung, K. H. ,2006, The effect of using detailed land-use conditions for the photochemical modeling of Seoul, Korea. Journal of the Korean Meteorological Society, 42(2), 57-73.
    13. Lee, S. H. ,2011, A numerical study on the characteristics of high resolution wind resource in mountainous areas using computational fluid dynamic analysis. Journal of Korean Earth Science Society, 32(1), 46-56. (in Korean)
    14. Oke, T. R. ,1982, The energetic basis of the urban heat Island. Quarterly J. of the Royal Met. Society, 108, 1-24.
    15. Ozkeresteci, I. ,2003, Use and evaluation of the ENVI-Met model for environmental design and planning an experiment on liner parks, Proceededing of the 21 International Cartographic conference. International Cartographic Association, 402-409.
    16. Rosenzweig, E. ,2009, Mitigating New York City’s Heat Island: Integrating Stakeholder perspectives, Scientific Evaluation. Bulletin of the American Meteorological Society, 90(9), 1297-1312.
    17. Ryu, Y. H. , Baik, J. J. , and Lee, S. H. ,2011, A new single-layer urban canopy model for use in mesoscale atmospheric models. J. Applied Met. and Climatology, 50, 1773-1794.
    18. Tong, H. , Walton, A. , Sang, J. , and Chan, C. L. ,2005, Numerical simulation of the urban boundary layer over the complex terrain of Hong Kong, J. Atmos. Envir., 39, 3549-3563.
    19. Yamada, T. ,2004, Merging CFD and atmospheric modeling capabilities to simulate air flows and dispersion in urban areas. Computational Fluid Dynamics Journal, 47, 329-341.