ISSN : 1226-9654
채점자의 역량을 개인 수준에서 측정하는 대표적인 지표는, 채점 정확도와 채점자 편향(채점 엄격성, 중앙값 채점 경향성, 채점 무작위성)이다. 두 지표는 주로 전문 채점자를 대상으로 연구되었지만, 영역이 다른 둘 이상의 과제를 통해 평가 역량의 일반성이 검증된 바 없다. 본 연구에서는 대학생들로 하여금 언어영역 과제와 시공간영역의 과제를 채점하게 한 결과로, 채점 정확도와 채점자 편향을 탐색하였다. 분석 결과 한 영역에서 채점 정확도가 높고 채점척도를 잘 사용하는 학생들은 다른 평가영역에서도 그럴 가능성이 높고, 채점 정확도가 높은 학생들보다 낮은 학생들이 평가영역 차이에 영향을 받는 정도가 유의하게 더 컸다. 전체 논의에서는 대학생 평가역량 측정 연구에 시사하는 점과 한계점이 다루어졌다.
Traditionally, researchers have used rating accuracy and rater bias (severity, centrality, and randomness) as individual-level indicators of rating quality. While these have been studied mostly for expert raters, research on whether evaluation capacity is domain-general over two or more different tasks is lacking. Thus, we investigated the two indicators in the context of undergraduate raters. In two studies, undergraduates scored outputs from a verbal-linguistic task and a visual-spatial task. The results showed that proficient students in one domain are also likely to be proficient in the other in terms of rating accuracy and the use of rating scale. In addition, students with lower rating accuracy were more significantly affected by the difference between domains compared to more accurate students. We also discuss the implications and limitations of our findings on measuring student evaluation capacity.