이 연구는 초등학교 과학과 수행평가에서 총체적 채점과 분석적 채점 방식이 검사 점수의 일반화가능도에 미치는 영향을 분석하기 위하여 주요 요인들의 상대적 영향력과 총체적 채점과 분석적 채점 방식이 신뢰도에 미치는 영향을 분석하고, 수행평가 채점의 효율적인 측정조건을 탐색하였다. 초등학교 학생을 대상으로 과학과 수행평가를 시행하고 총체적 채점과 분석적 채점 방식으로 3명의 교사가 각각 점수를 부여하였다. 이 연구를 통해 도출된 결론은 다음과 같다. 첫째, 분석적 채점 방식이 총체적 채점 방식보다 신뢰로운 채점 결과를 산출할 수 있다는 전통적인 설명과 주장은 일반화가능도 이론을 적용한 이 연구에서는 지지되지 않았다. 오히려 이러한 주장은 Cronbach α와 같이 수행평가의 채점 방식을 적합하게 반영하지 못하는 신뢰도 추정 방법을 적용함으로써 생기는 오해일 수 있다. 둘째, 과학과 수행평가채점의 경우, 분석적 채점과 총체적 채점은 비슷한 수준의 일반화가능도 계수를 산출했고, 그 이유는 채점자와 관련된 분산이 두 채점 방식 모두에서 작았기 때문인 것으로 추정된다. 따라서 채점자 훈련이나 정밀한 채점 기준표 작성·적용 등은 채점 방식에 관계없이 신뢰로운 측정 결과를 확보할 수 있는 방법이 될 것으로 기대된다. 셋째, 총체적 채점 방식을 사용하고자 할 때 적정 수준의 신뢰도를 얻기 위해서는 채점자 수에 대한 고려가 필요하고, 분석적 채점 방식을 사용하고자 할 경우 평가의 상황에 따라 채점자 수와 문항 수 등 다양한 측정 조건을 고려하여야 한다.