이것은 응답자들의 응답 문자열을 분석하여 불성실한 응답을 탐지한다. 참여자들의 응답 중에서 가장 긴 연속된 동일 응답의 수를 확인하여, 이를 통해 불성실한 응답을 식별한다. 예를 들어 10개의 문항에 대한 응답 중에서 '4'라는 답변이 세 번 연속으로 나타나는 것처럼, 지속적으로 동일한 응답이 많이 나타난다면 이는 불성실한 응답으로 간주될 수 있다. 롱스트링 기법은 역문항이 포함되어 있을 때 특히 효과적이다(Curran, 2016)¹.

동일 응답을 계속할수록, 즉 롱스트링 지표가 클수록 불성실 응답으로 간주할 수 있으나 정확한 기준치(cutoff)는 존재하지 않는다. 이는 문항의 길이에 영향을 받기 때문이며, 연구자는 자신이 진행한 설문의 길이에 따라 어느 정도의 롱스트링 지표를 불성실 응답으로 간주할지 판단할 필요가 있다. 한편, Yentes(2020)²는 전체 응답자의 롱스트링 지표의 평균과 표준편차를 이용한 cutoff 점수를 제안하기도 하였으나 추가적인 연구가 필요하다.

R manual

R에서 롱스트링 분석은 ‘careless’ 패키지에 포함된 ‘longstring’ 코드를 이용해 쉽게 진행할 수 있다. 해당 코드는 ‘longstring(x, avg = FALSE)’ 로 이루어져 있으며, 다른 코드들과 같이 x는 데이터 매트릭스를, avg는 추가로 동일한 연속 응답의 평균 길이를 반환할지 여부를 나타낸다. 이는 응답자가 보인 모든 응답을 롱스트링 기법으로 쪼개어 그 평균을 제공해주는 것이다. ‘careless’ 패키지에 포함된 예시 데이터셋을 이용한 코드의 작성은 다음과 같이 이루어질 수 있다.

careless_long <- longstring(careless_dataset, avg = FALSE) 
#각 부분에서 연속적으로 나타나는 동일한 응답들의 최대 길이만 반환하며, 연속된 반응의 평균 길이를 반환하지 않음

careless_avg <- longstring(careless_dataset, avg = TRUE) 
#각 부분에서 연속적으로 나타나는 동일한 응답들의 평균 길이를 추가로 반환함

Practice example

실제 데이터로 분석 시의 과정과 결과를 예시를 통해 설명하였다. 사용한 데이터는 총 1번 데이터를 사용했으며 롱스트링 분석은 응답의 불변성을 기준으로 불성실 응답을 탐지하는 방법이기 때문에 성격특성 척도 뿐만 아니라 신체불만족 척도가 포함된 데이터를 사용했고 따로 역코딩을 진행하지 않았다(Curran, 2016). 실제로 적용해본 코드와 그에 따른 결과는 다음과 같다.

big5_long <- longstring(big5_raw53, avg=TRUE)
id longstr avgstr
566 32 7.571429
1467 28 4.416667
1767 25 3.785714
2525 21 2.944444
1671 18 2.65
66 16 1.962963
104 16 2.12
231 16 2.038462
1044 16 1.962963
1245 16 1.962963
2125 16 2.52381
329 15 3.533333
624 15 2.52381
822 15 2.12
901 15 2.52381
1380 15 3.117647
1385 15 4.818182
2170 15 2.52381
801 14 2.52381
1815 14 2.52381
156 13 1.606061
330 13 1.709677
418 13 1.766667
696 13 3.785714
847 13 2.52381
2452 2 1.20454545
2482 2 1.15217391

앞서 언급했듯이 롱스트링 기법은 문항의 길이에 영향을 많이 받으며 별도의 불성실 응답 탐지 기준(cutoff)이 존재하지 않는다. 가장 큰 롱스트링 점수를 보인 응답부터 불성실 응답에 해당하는지 면밀히 살펴본 후 제거에 대한 결정을 하는 것이 바람직하다.