본 연구는 강에 배치된 센서 네트워크 상의 오염물질 농도 변화를 분석하여 정확한 수질 오염원의 위치를 추적하는 문제를 다룬다. 이 문제를 해결하기 위해 본 연구에서 제안된 방법론은 크게 다음의 세 단계로 구성된다. 첫째, 수력학 시뮬레이션을 통해 센서 네트워크로부터 이산 시간에서 관측된 오염물질의 농도를 다량의 데이터 형태로 획득한다. 둘째, 오염물질의 농도 데이터에서 오염원 추적을 위한 최소한의 수치적 특징을 추출한다. 이 과정을 통해 센서 데이터 처리 속도와 효율을 향상 시킬 수 있다. 셋째, 추출된 데이터의 특징을 입력변수로, 실제 오염 발생 위치를 출력변수로 지도 학습한 랜덤포레스트 기법을 이용하여 수질 오염원의 실제 위치를 추정하는 모델을 생성한다. 이 때, 센서 네트워크의 관리 범위가 넓은 경우에는 모델의 정확도 향상을 위해 범위를 나누어 모델을 학습하고 이를 통합하는 형태의 모델을 제안한다.
본 연구에서 제시한 방법론을 미국 조지아 주에 위치한 Altamaha강에 적용하여 분석한 바, 제시된 방법론이 기존 연구의 방법보다 오염원의 위치를 정확하게 탐색하였다. 또한 랜덤 포레스트 모델의 결과로써 제시된 위치가 실제 오염원의 위치일 가능성을 0과 1사이의 숫자로 출력하여 오염원에 대한 유의미한 정보를 추가적으로 제공한다.