ISSN : 1229-067X
본 논문에서는 계량 심리학 분야에서 지난 수 십 년 동안 꾸준히 논의가 진행되어 왔던 모형 추정과 평가의 원칙을 심리학 연구자들에게 소개하는 것을 목적으로 한다. 계량 심리학 분야에서 진행된 논의의 핵심은 1) 후보 모형들은 참 모형(true model)이 아니라 근사 모형(approximating model)이며, 2) 데이터 크기가 무한히 커지더라도 참 모형과 근사 모형 간 불일치는 사라지는 것은 아니기 때문에, 3) 여러 후보 모형 중 참 모형과의 불일치가 가장 낮은 것으로 추정되는 근사 모형을 선정하는 것이 바람직하다는 것이다. 이러한 모형 선정의 원리는 4차 산업 혁명의 시대, 여러 학문 분야에 걸쳐 그 영역을 확장하고 있는 기계 학습(machine learning) 분야에서 채택하고 있는 모형 평가의 원칙과 동일함을 설명하였다. 즉, 기계 학습 분야에서는 훈련(training) 과정에 노출되지 않았던 새로운 사례에서 보이는 모형의 성능인 일반화 혹은 예측 오차(generalization or prediction error)를 추정함으로써 모형을 선정하는데, 이는 계량 심리학 분야에서 근사모형과 참모형의 불일치 추정량인 총체적 오차(overall discrepancy)를 추정함으로써 모형을 선정해야 한다는 원리와 동일함을 설명하였다. 본 논문의 두 번째 목적은, 이러한 모형 선정의 원칙에 대한 이해를 바탕으로, 현재 심리학 분야에서 주어진 데이터에 대한 “철저한” 분석 관행이 초래하는 과적합(overfitting) 문제와 그 해결 방안을 논의하는 데 있다. 특히, 기계 학습 분야에서 가정 널리 사용되고 있으며, 계량 심리학 분야에서도 오래전부터 논의가 되어온(Mosier, 1951) 교차-타당성 입증법(cross-validation)을 일반화 오차의 추정량이라는 관점에서 소개하고 사용을 당부하였다.
The objective of the present article is to explain principles of estimation and assessment for statistical models in psychological research. The principles have indeed been actively discussed over the past few decades in the field of mathematical and quantitative psychology. The essence of the discussion is as follows: 1) candidate models are to be considered not the true model but approximating models, 2) discrepancy between a candidate model and the true model will not disappear even in the population, and therefore 3) it would be best to select the approximating model exhibiting the smallest discrepancy with the true model. The discrepancy between the true model and a candidate model estimated in the sample has been referred to as overall discrepancy in quantitative psychology. In the field of machine learning, models are assessed in light of the extent to which performance of a model is generalizable to the new unseen samples, without being limited to the training samples. In machine learning, a model’s ability to generalize is referred to as the generalization error or prediction error. The present article elucidates the point that the principle of model assessment based on overall discrepancy advocated in quantitative psychology is identical to the model assessment principle based on generalization/prediction error firmly adopted in machine learning. Another objective of the present article is to help readers appreciate the fact that questionable data analytic practices widely tolerated in psychology, such as HARKing (Kerr, 1998) and QRP (Simmons et al., 2011), have been likely causes of the problem known as overfitting in individual studies, which in turn, have collectively resulted in the recent debates over replication crisis in psychology. As a remedy against the questionable practices, this article reintroduces cross-validation methods, whose initial discussion dates back at least to the 1950s in psychology (Mosier, 1951), by couching them in terms of estimators of the generalization/prediction error in the hope of reducing the overfitting problems in psychological research.
인간의 역사는 생활의 주체로서 자신을 구속하는 환경에 대한 통제력을 확대시켜 온 과정이라 볼 수 있다. 이 확대에 결정적인 역할을 한 것은 언어와 자의식의 출현이다. 자의식에 의해 성립한 주체성(selfhood)은 개인주의와 자유주의로 사상적 무장을 하면서 개인의 욕망을 무한대로 추구하고 충족시키는 생활방식을 추구해 왔다. 바야흐로 기술발전에 힘입어 인간을 규정해 왔던 모든 제약을 풀고 신이 되는 것이 가능한 4차산업혁명의 시대를 맞고 있다. 우리는 이런 현상이 주체성이 과잉적으로 확대되면서 가능해 졌다고 본다. 주체성의 과잉 양상은 삶을 행복의 추구 과정으로 규정하면서 행복강박증과 자기애성향의 증가라는 증상을 드러내고 있다. 이런 과정을 이해하기 위해, 주체성의 진화 과정을 짚어 보고, 주체성의 조절과 관련된 자기실현, 자기초월, 성숙에 대한 논의를 일별한 후에 과잉 주체성에 대한 해법이 될 수 있는 새로운 접근으로 주체성 확장과 해체의 논의를 살핀 후 한국인의 세계관에 바탕한 쪽자기적 주체성 개념을 제시하였다.
Human history has been the process of expanding human control over environment. The critical factor from psychological viewpoint is the emergence of the selfhood owing to the capacity for self-consciousness and language. The Western self, armed with the political philosophies of individualism and liberalism, redefined the nature of humanity and provided incessant source of power to energize its quest of expanding control over environment in undeterred manner. The development of technology has got rid of most restraints which defined the humanity and posed a pivotal moment to proceed beyond the humanity. Facing the 4th industrial revolution, humanity experiences the age of selfhood being overly inflated. Two symptoms are noted as exposing such symptoms: the obsession with happiness and the increase of narcissism across nations. To understand this inflated self and the proposals to deflate it, we review briefly two approaches-- self actualization and self transcendence-- and relate them to mature personality. We review some alternative conceptions arising to quiet the self such as self-expansion, selflessness, and the interactive self. We propose a new perspective of the interactive selfhood(Chok self), couched in the Korean worldview, is a promising alternative to cure the overly inflated self.
인공지능 편향은 사회적 영향과 거버넌스의 문제일 뿐만 아니라 인공지능 시스템의 강건성 문제이기도 하다. 부호처리 패러다임의 인공지능에서는 제기되지 않던 인공지능 편향 문제는 컴퓨터가 인공신경망 기반의 자율지능시스템 단계가 되면서 시스템 구축 절차 각각에서 개입된다. 이 논문의 목적은 인공지능의 구성 절차에서 개입되는 편향의 양상, 편향 판단의 공정성 기준들, 편향완화 방법을 탐색하는 것이다. 공정성의 다양한 유형들은 동시에 만족되기 어렵고 인공지능의 적용 분야 및 맥락에 따라 상이한 기준과 요소의 결합이 필요하다. 학습 데이터, 분류자, 예측 내용의 편향을 완화하는 방법 또한 편향을 완전히 차단하는 것은 아니며 편향완화와 정확도 간의 조화를 모색해야 한다. 인공지능 감사를 통해 알고리즘에 무제한으로 접근하여 편향을 식별해낸다 하더라도 해당 알고리즘의 편향 여부를 단정하기는 어렵다. 편향완화 기술은 단순히 편향을 제거하는 단계를 넘어서서 편향완화와 시스템의 강건성을 동시에 확보하는 과제, 그리고 다양한 공정성 유형들을 조정하는 과제를 해결하는 단계로 나아가고 있다. 결론적으로, 이러한 특성들은 인공지능 편향을 인지하고 해결책을 모색하는 과제가 개념적 차원의 사안 인지를 넘어서 시스템 이해에 기반한 편향 인식 및 조정 차원에서 모색되어야 함을 암시한다.
AI bias is not only an issue of humanities and social impact and governance, but also of systemic robustness. The algorithm bias has the characteristic of being intervened in the system construction process as the computer becomes an artificial neural network-based autonomous intelligence system. The objective of this paper is to deal with the aspects of bias that are involved in each stage of artificial intelligence, the fairness criterion for the judgment of bias, and the bias mitigation methods. Different types of fairness are difficult to satisfy simultaneously and require different combinations of criteria and factors depending on the field and context of AI application. Each method for mitigating the bias of training data, classifiers, and prediction alone do not completely block the bias, and a balance between bias mitigation and accuracy should be sought. Even if bias is identified through unlimited access to the algorithm through AI auditing, it is difficult to determine whether the algorithm is biased. The bias mitigation technology goes beyond simply removing the bias, and is moving toward solving the problem of both reducing the bias and securing the robustness of the system, and adjusting the various types of fairness. In conclusion, these characteristics imply that policies and education that recognize AI biases and seek solutions should be explored in terms of bias recognition and coordination based on system understanding beyond recognizing issues at the conceptual level.
본 연구는 사용자 특성이 인공지능 기술의 수용성에 미치는 영향을 살펴보고자 하였다. 보다 구체적으로 인공지능에 대한 사용자 인식, 성격적 특성, 그리고 인구통계학적 특성이 인공지능 기술 수용성에 미치는 영향을 검증하였다. 연구 결과에 따르면, 인공 지능 수용성의 경우 사용자 인식의 영향이 가장 중요한 것을 확인할 수 있었다. 사용자 인식 중 인공지능 기기나 서비스를 유용하게 지각하는 정도와 인공지능 기술에 대한 수용성이 밀접하게 관련되어 있는 것으로 나타났다. 인공지능에 대한 불안의 경우, 성격적 특성과 사용자 인식이 사용자의 인구통계학적 특성에 비해 중요한 것으로 나타났다. 다섯 가지 성격 요인 중 개방성, 그리고 사용자 인식 중 의인화가 인공지능에 대한 불안에 있어서 중요한 요인으로 나타났다. 제품 사용의도의 경우, 수용성과 마찬가지로, 사용자 인식의 영향력이 가장 큰 것으로 나타났으며, 사용자 인식 중 쾌락적 동기와 사회적 영향력이 중요한 것으로 나타났다. 마지막으로 본 연구의 의의와 추후 연구를 위한 제언을 논의하였다.
This study examined that the effect of user characteristics on the acceptability of artificial intelligence technology. More specifically, the effects of user perception, psychological characteristics, and demographic characteristics on the acceptability of artificial intelligence technology were examined. According to the results, in the case of artificial intelligence acceptability, the effect of user perception was found to be more important than others. In particular, it was found that the performance expectancy of artificial intelligence devices or services and acceptance of artificial intelligence were closely related. For anxiety about artificial intelligence, openness and anthropomorphism among user perception was found to be more important than the demographic characteristics of users. In the case of product use intention, like acceptability, user perception was found to have the greatest influence, and hedonic motivation and social influence were found to be important among user perception. Finally, the implications of our findings and suggestions for future research were discussed.
본 연구의 목적은 4차 산업혁명 시대에서 진로상담 및 직업심리학의 역할과 과제가 무엇인지를 고찰해 보는 것이다. 이를 위하여 첫째, 4차 산업혁명 시대의 일의 세계가 어떻게 변화하고 있는지를 개인과 사회의 측면에서 논의하였다. 둘째, 개인과 사회는 변화하는 일의 세계에서 적응하고 나아가 변화를 주도하여 더 나은 삶을 살기 위하여 어떠한 점을 고려해야 하는지를 현대적 관점의 진로상담및 직업심리학의 개념과 이론을 통하여 논의하였다. 구체적으로, 무경계 경력태도와 프로티언 경력태도, 구성주의 진로이론과 일의 의미 이론, 그리고 일의 심리학 관점을 살펴보았다. 마지막으로, 기존 담론에서 충분히 다루어지지 않은 부분들을 비판적으로 고찰하여 향후 주목해야 할 진로상담 및 직업 심리학의 주제들을 제시하였다. 구체적으로, 개인의 경력개발에 영향을 미치는 조직과 사회적 맥락에 관심을 기울이고, 자기계발 현상의 잠재적 위험성을 포함하는 다각적 고찰을 시도하고, 일에서의 내면적 가치추구, 의미와 목적감 경험을 조력할 수 있는 방안을 모색하는 것의 필요성을 논하였다. 또한, 일의 다양성과 포괄성을 적극적으로 고려하여 사회구조적 불평등 개선에 공헌하며, 일에 대한 인식의 확장을 통하여 일과 삶을 통합적으로 바라보는 것의 중요성을 논하였다.
The purpose of this study was to discuss the role and task of career counseling and vocational psychology in the fourth industrial revolution era. We first addressed how the world of work has changed in the fourth industrial revolution era and how these changes have impacted individuals and the society. Second, we explored issues to consider in order to improve individuals’ lives and the society utilizing contemporary concepts and theories of career counseling and vocational psychology. Specifically, we reviewed boundaryless career attitudes and protean career attitudes, constructivist career theories and meaningful work perspectives, and the psychology of working framework. Lastly, we reviewed the under-addressed aspect in the existing discourse and proposed themes and tasks that career counseling and vocational psychology needs to further attend. We specifically discussed that the disciplines need to attend influences of organizational and social contexts on individuals’ career development, examine multifaceted aspects of self-development including its potential risk, and find strategies to help individuals experiences the higher sense of meaning and purpose in work in the changing world of work. We also discussed that it is important for the discipline to contribute to improving structural social inequality through taking a more diverse and inclusive view of work and promoting a more integrative perspective on life and work by expanding the definition of work.
컴퓨터 기반 적응적 검사는 이전에 제시된 문항에 대한 반응을 기반으로 피검사자의 잠재 특질 수준을 추정하기에 가장 적절한 다음 문항을 선택해 출제함으로써 피검사자별 맞춤형 검사를 제시하는 컴퓨터 기반 검사형태다. 컴퓨터 기반 적응적 검사 제작의 핵심 요소 중 하나는 문항 선정 알고리즘이라 할 수 있으며, 최근 결정-트리를 이용한 적응적 심리 검사 구성에 대한 관심과 적용 사례가 늘어나고 있다. 결정-트리는 기계학습 분야에서 주로 연구되어온 예측 모형 중 하나로서 쉽게 해석 가능한 트리-구조를 가진다는 장점에도 불구하고 과적합 문제에 매우 취약하다는 것이 알려져 있다. 본 연구의 목적은 기계학습 분야에서 결정-트리의 대안으로 제시된 앙상블 모형 중에서 해석 가능한 트리-구조를 지닌 Alternating Model Tree (AMT)가 컴퓨터 기반 적응적 심리 검사 제작에 활용될 수 있는지 탐색하는 데 있다. 이를 위해 먼저 AMT의 작동 방식을 적응적 검사의 특징에 비추어 상술하였고, 검사 점수를 예측하는 AMT 기반의 적응적 검사와 결정-트리 기반의 적응적 검사의 예측 성능을 두 개의 심리 검사를 대상으로 비교하였다. 그 결과, AMT는 적응적 검사의 특징을 가지는 것으로 확인되었고, AMT 기반 적응적 심리 검사의 성능은 결정-트리 기반 적응적 심리 검사의 성능과 유사하거나 더 나은 결과를 보였다. 이러한 결과를 바탕으로 본 연구의 의의와 한계, 후속연구에 대한 제언 등을 논의하였다.
Computerized adaptive testing (CAT) is a computer-administered test where the next question for estimating the examinee’s trait level is selected depending on his or her reponses to the previous items, resulting in tailored testing for each individual examinee. A defining feature of CAT stems from its item selection algorithms, among which both research interest and practical applications of decision-tree based CAT (DT-based CAT) have been rising recently. In the field of machine learning, however, it is well known that decision-trees, as a form of predictive models with simple and interpretable tree structures, can be vulnerable to the problem of overfitting or the problem of creating overly complex trees that do not generalize to newly observed data. Among various ensemble techniques developed to adequately address this problem, we the authors paid attention to the Alternating Model Tree (AMT) due to its interpretable tree-like structure. The purpose of this article is to investigate the viability of the Alternating Model Tree (AMT) as an item selection algorithm for constructing CAT. To this end, we first presented a detailed exposition of how AMT-based CAT can be constructed and then compared its performance with DT-based CAT using two sets of publicly available psychological test scores. The results provided supportive evidence that AMT-based CAT is viable, and that AMT-based CAT can predict test scores at least as accurate as DT-based CAT does. Based on our findings, we discuss implications, limitations, and directions of future studies.
최근 베이지안 추정 방법이 사회과학 분야에서 많은 관심을 받고 있다. 베이지안 방법에는 연구자의 배경지식을 추정에 반영할 수 있는 사전분포라는 특별한 요소가 있으며, 이를 어떻게 지정하는지가 추정 전반에 영향을 미친다. 사전분포는 베이지안 분석에서 가장 중요한 요소임에도 불구하고, 사전분포를 이해하고 적절히 지정하기 위해 참고할 수 있는 방법론적 연구는 부족한 상황이다. 본 연구는 사전분포의 중요성과 사전분포 지정에 대한 전반적인 내용을 다룬다. 먼저, 연구자가 사전분포를 직접 지정하지 않는, 즉 프로그램이 제공하는 디폴트 사전분포 방법을 알아본다. 자주 사용되는 프로그램들의 디폴트 사전분포를 알아봄과 더불어 디폴트 사전분포의 알려진 문제점도 확인한다. 다음으로는 연구자가 사전분포를 직접 지정하는 방법에 대해 다룬다. 직접 지정할 수 있는 사전분포에는 무정보 사전분포와 정보 사전분포가 있으며, 어떤 사전분포를 이용할지는 모수에 대한 사전 정보의 유무에 따라 결정된다. 무정보 사전분포의 필요성과 이를 지정할 때 참고할 수 있도록 제안된 방법을 다루고, 정보 사전분포를 지정할 때 참고할 수 있는 연구들을 제공하며, 여러 연구의 기준을 종합해 연구자의 정보성 선택에 참고할 수 있는 기준을 탐색한다. 이후 본문에서 논의한 방법들을 적용한 자료 예시를 통해 실질적 도움을 제공하고자 하였으며, 마지막으로 본 연구의 의의와 한계에 대해 논의한다.
The Bayesian estimation method has recently received a lot of attention in the social sciences. The Bayesian method has a special factor of prior distribution that can reflect researchers’ background knowledge in the estimation process. The specification of the prior distribution affects the overall estimation. Despite prior distribution being the most important factor in Bayesian analysis, there is a lack of methodological research for understanding and appropriately specifying the prior distribution. Therefore, the present study tries to help researchers to apply the prior distribution to their estimation by addressing the importance of the prior distribution and the overall content of the prior specification. First, we explore the method that researchers do not directly specify the prior distribution. This method means selecting the default prior distribution automatically provided by the program, and if you want to use this option, you must know exactly what kind of the default prior distribution is actually provided. For this, we discuss the default priors of frequently used programs, as well as the known problem of the default priors. Second, we address the method that researchers do specify the prior distribution by themseleves. The prior distributions that can be directly specified include noninformative prior distributions and informative prior distributions. Which prior distribution to use is determined by the presence of prior information on parameters. This study deals with the necessity of noninformative prior distributions and the proposed method when specifying them, provides studies that can be referenced when specifying informative prior distributions, and explores criteria that can be referenced for the select of informativeness by synthesizing the criteria across many studies. We provide practical help through data examples applying the methods discussed in the text, and finally discuss the significance and limitations of the present study.
본 연구의 목적은 동기균형이론(신성만, 2017)을 측정할 수 있는 동기균형 척도 및 균형지수를 개발하는 것이다. 이를 위해 동기 관련 선행연구와 개방형 질문지 분석을 통해 동기의 구성요소를 도출하고 예비문항을 개발했다. 전국 대학생을 대상으로 한 예비조사(n=353)에서 동기의 구성요소를 경험적으로 확인했고, 본조사(n=464)에서 타당화 분석을 실시했다. 연구결과, 동기균형 척도는 4요인(자율감, 유능감, 소속감, 목표감)이며, 각 하위요인마다 4문항씩 총 16문항으로 구성되었다. 또한 선행연구를 토대로 동기균형 척도 하위요인 총점 간 균형 정도를 확인할 수 있는 지수를 개발했다. 마지막으로 본 연구에서 개발한 동기균형 척도 및 균형지수의 시사점에 대해 논의했다.
The purpose of this study is to develop the Motivation Balance Scale and Balance Index that can measure the motivational balancing theory (Shin, 2017). To this end, previous studies related to motivation and open questionnaire analysis were conducted to derive the components of motivation and develop preliminary questions. The components of motivation were empirically confirmed in a preliminary survey (n=353) of university students nationwide, and a validation analysis was performed in the main survey (n=464). As a result of the study, the Motivation Balance Scale consists of 4 factors (autonomy, competence, belongingness, and a sense of goals), and each sub-factor consists of 4 items, for a total of 16 items. In addition, based on previous studies, an index was developed that can check the degree of balance between the sub-factors of the Motivation Balance Scale. Finally, the implications of the Motivation Balance Scale and Balance Index developed in this study were discussed.
본 연구는 심리학 영역에서 주목받지 않았던 자극측정 방법인 연속적 간격법을 소개하고, 이 방법을 적용하여 행동의 비난가능성을 측정하며, 측정된 행동의 척도치를 심리적 변인을 측정하는 데 활용할 수 있다는 것을 보여주기 위해 수행되었다. 먼저, 심리측정방법을 분류하고, 구체적인 측정방법들을 소개한 후, 다른 자극측정 방법들과 연속적 간격법을 비교함으로써 이 방법의 유용성을 논의하였다. 연속적 간격법은 자극의 척도치와 반응범주 경계선을 찾는 방법으로 개별 자극에 대해 각 반응범주에 응답한 판단자 비율에 기초하여 모든 자극과 반응범주의 상대적인 위치를 결정한다. 연구 1에서 연구자들은 33개 행동의 비난가능성을 평정한 500명의 자료를 분석에 사용하였으며, 연속적 간격법을 이용하여 각 행동의 비난가능성 측정치를 산출하였다. 행동의 비난가능성 측정 결과, 법률로 금지하고 있는 행동들의 비난가능성은 약 3점으로 높게 산출되었으며, 처벌할 수는 없지만 부정적으로 인식될 수 있는 행동들의 측정치는 약 1점~2점으로 낮게 산출되었다. 연구 2에서는 108명의 자료를 분석하였으며, 행동의 비난가능성 측정치를 활용하여 일상생활에서 사람들이 사용하는 ‘무죄’의 의미를 나타내는 무죄표상을 측정하였다. 기존의 확률추정 방법으로 측정된 무죄표상과 관련변인은 관계가 없는 것으로 나타난 반면, 비난가능성 측정치가 확인된 행동목록으로 측정된 무죄표상과 관련변인들의 관계는 이론적으로 타당한 방향성을 보여주었다. 이와 같은 결과는 연속적 간격법으로 측정된 자극의 척도치를 활용하여 자극과 의미적으로 관련된 다른 개념을 타당하게 측정할 수 있음을 보여준다. 본 연구는 심리학 영역에서 활발하게 사용되지 않았던 자극측정 방법의 활용가능성을 제시함으로써 연구자들에게 심리적 변인의 측정방법에 대한 다양한 통찰의 기회를 제공할 수 있을 것으로 기대된다.
The current study was conducted to i) introduce the method of successive intervals, a stimulus-centered scaling that has not received much attention in psychology, ii) show that it can be applied to measure the blameworthiness of behavior, and iii) demonstrate the scaled behaviors could be applied to measure an individual’s psychological property. The authors classified psychometric methods and introduced several stimulus-centered scaling methods. The usefulness of the method of successive intervals was discussed by comparing those stimulus-centered scaling methods. In order to find the scale value of the stimulus and the boundary of the response category, the method of successive intervals determines the relative positions of all stimuli and response categories based on the proportion of raters who responded to each response category to individual stimuli. In Study 1, a list of 33 morally justifiable behaviors was constructed from existing studies. Then, scale values of the blameworthiness of the behaviors were calculated (N=500). As a result, the scale values of behaviors prohibited by law were higher than others. On the other hand, the scale values of behaviors that could not be punished but could be perceived as bad were relatively low. In Study 2, the representation of innocence (representation of ‘innocent’), meaning people’s psychological representation of ‘not blameworthy’ was measured (N=108) based on the scale values obtained in Study 1. The relationship between the representation of ‘innocent’ measured by the list of behaviors and related variables had a theoretically predictive direction. These results show that the scale values of stimulus based on the method of successive intervals can be applied to measure individual’s psychological attribute related to the stimulus. This study is expected to allow researchers to consider various scaling methods by showing the applicability of the method of successive intervals that have not been used frequently by researchers in psychology.