반의어/동의어 일관성(antonyms/synonyms consistency)이라고도 불리는 이 기법은 일관성을 기준으로 불성실 응답을 분류하는 방법이다. 성실한 응답자라면 의미상 유사한 문항에 대해서는 유사한 답변을, 반대되는 항목에 대해서는 상반된 답변을 할 것이라는 전제를 활용하는 것이다. 이는 설문 내 전체 문항 중 비교에 활용할 ‘동의/반의 관계에 있는 문항 쌍’들을 결정하는 방법에 따라 의미적(semantic) 방법과 심리측정적(psychometric) 방법으로 나뉜다(Curran, 2016; Goldberg & Kilkowski, 1985; Johnson, 2005). 의미적 방법은 연구자가 사전에 문항의 의미를 해석하여 유사한 답변이 예상되는 문항의 쌍을 지정하여 활용하는 방법인 반면, 심리측정적 방법은 연구자의 임의의 판단을 배제하고 사후에 전체 응답자들의 실제 응답 중 상관관계가 높은 문항 쌍을 통계적으로 추출하여 비교하는 방법이다. 서로 동의 또는 반의 관계에 있는 문항 쌍들을 다수 지정한 후, 각 그룹에 대한 개인의 응답을 벡터화하여, 두 벡터 간의 상관을 구하는 방법으로 동의어/반의어 일관성을 계산한다.
Curran(2016)¹에 의하면 동의어 측정 시 개인 내 상관관계가 음수로 나타나면 불성실 응답으로 간주할 수 있으며, 반의어의 경우에는 양수로 나타나면 불성실 응답으로 간주할 수 있다. 심리측정적 방법은 겉으로는 잘 드러나지 않는 높은 상관관계의 문항 쌍을 확보하여 이 기법의 신뢰도를 높일 수 있다. 심리측정적 방법은 대부분의 응답자가 성실한 응답자라는 가정을 전제하지만, 의미적 방법은 이 가정이 충족되지 않아도 된다.
의미적 반의어/동의어의 측정은 연구자가 반의 혹은 동의 관계에 있는 문항 쌍을 구조적으로 설정한 후 해당 문항의 응답 간의 상관을 분석하여 쉽게 진행할 수 있다. 반면 심리측정적 반의어/동의어 기법은 실제 응답 중 상관관계가 높은 응답을 문항 쌍을 추출하고 문항 쌍들을 이용하여 일관성을 구하는 보다 복잡한 과정을 거치며 이를 위한 코드가 개발되어 있다.
R에서 심리측정적 반의어/동의어 일관성 분석은 ‘careless’ 패키지에 포함된 ‘psychant’(반의)와 ‘psychsyn’(동의) 코드를 이용해 진행할 수 있다. ‘psychant’ 코드는 psychant(x, critval = -0.6, diag = FALSE)
이며 x
는 데이터 매트릭스를 의미한다. critval
은 심리측정적 반의어로 간주되기 위한 상관 관계의 최소 기준을 제공하는 매개변수이며 이 기준을 넘는 상관을 가지는 문항 쌍들이 분석에 포함된다. diag
는 누락 값이 포함되어 있는지, 즉 데이터 유효성을 확인하는 매개변수이다. ‘psychsyn’ 코드는 psychsyn(x, critval = 0.6, anto = FALSE, diag = FALSE, resample_na = TRUE)
로 이루어져 있다. anto
매개변수는 동의어가 아닌 심리측정적 반의어로 반환할지 여부를 결정하는 함수로 보통 기본값은 거짓(False)이다. 한편 resample_na
매개변수는 psychsyn이 NA(결측값)를 반환하는 경우, NA가 아닌 결과를 얻기 위해 재표집을 시도할지 여부를 결정하는 것이다. 두 가지 코드를 사용하는 예시는 다음과 같다.
antonyms <- psychant(careless_dataset, .-50) # .-50 기준 반의 일관성 분석
antonyms <- psychant(careless_dataset, .-50, diag = TRUE) # .-50 기준 반의 일관성 분석 및 누락 값 확인
synonyms <- psychsyn(careless_dataset, .60) # .60 기준 동의 일관성 분석
antonyms <- psychsyn(careless_dataset, .-50, anto = TRUE) # .-50 기준 **반의** 일관성 분석
심리측정적 반의어/동의어 기법의 두 코드에서 각 문항 쌍이 반의어와 동의어 쌍으로 간주되기 위한 상관 계수 기준인 critval
값은 각각 -.6과 .6을 기본값으로 가진다. 하지만 실제 연구를 진행하다 보면 이 기준을 만족하는 문항 쌍이 나타나지 않을 수 있다. 특히 반의 관계는 강하게 드러나지 않는 경우가 많아 보다 완화된 값을 적용해야 심리측정적 반의어 코드의 결과가 잘 나타난다. 그러므로 연구자는 자신의 데이터에서 심리측정적 반의어/동의어 기법을 사용하기에 적합한 기준치를 확인해야 하는데 이때 같은 ‘careless’ 패키지에 포함된 psychsyn_critval(x, anto = FALSE)
코드를 이용하면 된다. 이 코드는 가능한 모든 문항 쌍의 상관 관계를 강한 관계부터 보여주며 x
는 데이터 매트릭스에 해당하는 매개변수이다. anto
매개변수가 TRUE
일 때 반의 관계의 문항 쌍들의 상관을 제공하며 FALSE
일 때 동의 관계의 문항 쌍들의 상관을 제공한다. 연구자는 코드의 결과를 참고하여 상관 분석이 이뤄질 수 있을 만큼 충분한 양의 문항 쌍을 포함하는 기준치를 정하여 사용해야 한다. Goldammer 등(2020)²은 최소 5개 문항 쌍을 사용할 것을 제안했다.
실제 데이터로 분석 시의 과정과 결과를 예시를 통해 설명하고자 한다.1번 데이터의 성격을 측정하는 50문항에 대한 응답을 역코딩하여 사용하였다. 실제로 적용해본 코드와 그에 따른 결과는 다음과 같다.
psychsyn_critval(big5_reverse50, anto = TRUE)
psychsyn_critval(big5_reverse50)
antonyms <- psychant(big5_reverse50, .-20) # **.-20** 기준 반의 일관성 분석(기준값이 높은 경우 계산이 안되는 경우가 있으니 참고 바람)
synonyms <- psychsyn(big5_reverse50, .50, ) # .50 기준 동의 일관성 분석
<반의어 기준치 분석 결과>
psychsyn_critval(big5_reverse50, anto = TRUE)
var1 var2 cor
1839 a42 a40r -0.323821280
1889 a42 a41r -0.319683935
1437 a40r a30 -0.313405780
1688 a41r a36 -0.302182200
1844 a47 a40r -0.300263609
1687 a40r a36 -0.292274240
2399 a52 a51r -0.279275623
1899 a52 a41r -0.275020113
1894 a47 a41r -0.264389075
1188 a41r a25 -0.262537574
299 a52 a6 -0.262335499
2299 a52 a49r -0.253932512
688 a41r a14 -0.247695669
259 a9r a6 -0.244074245
2198 a51r a47 -0.242973441
1198 a51r a25 -0.242608805
2144 a47 a46r -0.233961708
1799 a52 a39r -0.231250159
1698 a51r a36 -0.231157890
2049 a52 a44r -0.230771688
274 a25 a6 -0.228456842
269 a20 a6 -0.221487371
1849 a52 a40r -0.219210165
1438 a41r a30 -0.214311569
1948 a51r a42 -0.212441364
579 a30 a12 -0.208266077
1049 a52 a22 -0.206430248
1187 a40r a25 -0.202416439
691 a44r a14 -0.198252279
921 a22 a20 -0.197395285
2450 a53r a52 -0.195794621
....
<동의어 기준치 분석 결과>
psychsyn_critval(big5_reverse50)
var1 var2 cor
1689 a42 a36 0.7154555
449 a52 a9r 0.5852603
1949 a52 a42 0.5808142
1699 a52 a36 0.5651144
633 a35r a13 0.5419323
1592 a45r a34r 0.5409265
500 a53r a10 0.5384701
1041 a44r a22 0.5373293
82 a34r a2 0.5303160
1944 a47 a42 0.5241048
2097 a50r a45r 0.5129664
31 a33r a1 0.5116777
1199 a52 a25 0.5116559
516 a16 a11 0.5079813
1444 a47 a30 0.5078708
1189 a42 a25 0.5022835
735 a37 a15 0.4877778
16 a16 a1 0.4865462
.....
<반의 일관성 분석 결과>
id | antonyms |
---|---|
940 | 0.500535 |
2263 | 0.457067 |
949 | 0.431453 |
1254 | 0.420084 |
2082 | 0.372998 |
… | |
1193 | 0.0035 |
1508 | 0 |
2372 | 0 |
2020 | 0 |
… | |
1093 | -0.96276 |
373 | -0.96468 |
708 | -0.96556 |
522 | -0.96717 |
396 | -0.98181 |
291 | N/A |
566 | N/A |
<동의 일관성 분석 결과>
id | synonyms |
---|---|
607 | -0.60312 |
370 | -0.55361 |
484 | -0.5108 |
1214 | -0.5 |
… | |
2311 | -0.01952 |
881 | -0.01641 |
2089 | -0.01546 |
495 | -0.01384 |
1552 | -0.01277 |
1088 | -0.0091 |
2136 | -0.00901 |
847 | 0 |
1767 | 0 |
… | |
462 | 0.980469 |
220 | 0.986928 |
708 | 0.990529 |
2028 | 1 |
566 | N/A |
2317 | N/A |
먼저 상관 관계 기준치를 찾기 위한 psychsyn_critval
코드를 이용해 문항 쌍의 상관 관계 기준을 동의어의 경우 .5, 반의어의 경우 -.2로 설정했다. 심리측정적 반의어/동의어 기법의 분석 결과, 반의어는 불성실 응답의 기준인 0 이상의 응답자가 323명으로 전체 응답자의 12.78%정도 였으며 동의어의 경우 0 이하의 응답자가 204명으로 8.07%정도로 나타났다. 반의어 분석에는 28개 문항 쌍, 동의어 분석에는 16개 문항 쌍이 사용되었다.