기후 변화와 노동력 부족 등 농업의 구조적 위기에 대응하기 위한 대안으로, 4차 산업혁명 기술을 농업에 접목한 스마트팜(smartfarm)이 빠르게 확산되고 있다. 그러나 현실적으로 IoT 기반 장비의 도입 비용과 유지·관리의 복잡성으로 인해, 실제 농업인들이 활용하기에는 한계가 존재한다. 본 연구는 국내 스마트팜 온실에서 대중적으로 보급된 시설 및 장비의 현황을 토대로, 토마토 생산량 예측을 위한 10개의 주요 환경 데이터 항목을 선정했다, 그리고 랜덤포레스트(RandomForest), 장단기기억모델(LSTM), 게이트순환유닛(GRU) 세 가지 모델을 적용하여 각 변수의 영향을 비교·분석하였다. 모델의 성능 평가는 RMSE와 결정계수(R²)를 활용하였으며, 분석 결과 랜덤포레스트 모델이 4개의 변수로 학습하였을 때 가장 높은 성능을 보였다. 전반적으로 3~6개의 변수를 입력으로 사용한 경우 모델별 예측력이 향상되는 경향을 보였으며, 생산량 예측과의 연관성이 높은 주요 변수로는 내부 CO₂ 농도, 외부 온도, 내부 온도, 공급 EC, 누적일사량 등이 도출되었다. 본 연구의 결과는 향후 농업 현장에서 스마트팜 고도화를 위한 시설 및 장비 도입 의사결정시, 과학적 근거자료로 활용될 수 있을 것으로 기대된다.