광산란 기기로 측정한 미세먼지 농도와 환경요인간의 상관관계는 광산란 측정기기의 측정가능 환경조건과 함께 측정된 입자상 물질 농도의 신빙성을 분석하기 위해 활용될 수 있으므로, 이를 규명하기 위한 연구가 필요하다.
따라서 베타선 측정기기와 광산란 측정기기의 PM2.5 농도와 7가지 환경적 요인간의 관계를 조사하였다. 이를 위해 일반적인 통계기법과 함께, 머신러닝 기법 중 대표적인 feature selection 기법인 '피어슨 상관계수'와 'RrleiefF'를 이용하여 PM2.5와 환경요소간의 관계를 식별하였으며,오차율을 보정하기 위한 머신러닝 방식을 활용하였다.
먼저 베타선법과 광산란법 기기의 비교 측정이 수행된 SITE로부터 반경 60km 이내 5개 도시의 BAM 값을 통해, 지역에 따른 일반적인 PM2.5와 환경적 요인과의 관계를 확인하였다. 그 결과 PM2.5 단기측정의 경우 풍향, 장기측정의 경우 온도·국부기압이 비선형적인 영향을 끼치는 것으로 확인되었다.
이후 SITE에서 베타선법과 광산란법 기기의 단기측정값을 일반적인 통계분석을 활용하여 상대적으로 LS의 상대적 정확도가 높게 유지되는 환경을 도출하였다. 또한, 머신러닝을 통해 광산란법이 베타선법보다 8.2%p 풍향의 영향을 더 많이 받는 것으로 나타나 무방향 풍향에 대한 장치 설계가 중요함을 나타낸다.
광산란 측정기기의 보정은 총 4가지 머신러닝 알고리즘(Linear regression, kNN, Treem AdaBoost)가 활용되었으며, 기존 광산란 측정값 대비 모든 알고리즘에서 metric값이 향상되는것으 확인할 수 있었다. 결론적으로, AdaBoost가 환경요소를 활용한 광산란 측정기기의 보정방식에 적합할 것으로 판단되었다.