머신러닝을 이용한 아이트래커의 사시 스크리닝

Strabismus Screening Using Eyetracker Combined with Machine Learning

Article information

J Korean Ophthalmol Soc. 2024;65(10):675-682
Publication date (electronic) : 2024 October 15
doi : https://doi.org/10.3341/jkos.2024.65.10.675
1Department of Ophthalmology, Busan Paik Hospital, Inje University College of Medicine, Busan, Korea
2TI INC., Goyang, Korea
손선명1, 김주현1, 문성혁,1,2
1인제대학교 의과대학 부산백병원 안과학교실
2(주)티아이
Address reprint requests to Sunghyuk Moon, MD, PhD Department of Ophthalmology, Busan Paik Hospital, Inje University College of Medicine, #75 Bokji-ro, Busanjin-gu, Busan 47392, Korea Tel: 82-51-890-8611, Fax: 82-51-890-8722 E-mail: koils79@naver.com
Received 2023 October 18; Revised 2024 May 13; Accepted 2024 September 13.

Abstract

목적

Tobii pro glasses 2 (TPG2)로 측정한 안구편위 데이터를 머신러닝을 이용하여 수평사시를 진단하는 스크리닝 프로그램의 유효성을 알아보았다.

대상과 방법

TPG2는 동공 중심을 찾아 눈의 이동을 측정할 수 있는 웨어러블 아이트래커이다. TPG2를 착용한 정상 성인에서 왼쪽 눈을 가린 후 오른쪽 눈에 프리즘 양과 방향을 달리해서 수평안구편위를 유도하였다. 대상자마다 2, 3, 4, 5, 6, 8, 10, 12, 15, 20, 25, 30, 35, 40 프리즘 기저부를 안쪽, 바깥쪽으로 안구편위를 유도하여 28종류 세트를 얻었다. 각 세트에서 안구편위 전후 각 20개의 X축 좌표값을 오버샘플링기법으로 랜덤 추출하여 총 61,600개 안구편위세트를 만들었다. 56,000개는 훈련세트로 활용하였고, 5,600개는 테스트세트로 민감도, 특이도, area under the curve (AUC)를 조사하였다.

결과

11명의 정상 성인(남자 5명)이 참여하였고 평균 연령은 34.8 ± 7.37세였다. 8 PD 기준으로 분류하였을 때 8 PD 이하는 민감도 1.00, 특이도 0.95, AUC 0.97으로 측정되었다. 8, 20 PD 기준으로 세 구간으로 나누었을 때, 8 PD 이하의 민감도 0.90, 특이도 0.95, 8-20 PD의 민감도 0.60, 특이도 1.00, 20 PD 초과의 민감도 1.00, 특이도 0.88로 측정되었다.

결론

프리즘으로 유도한 안구편위를 TPG2로 측정하여 안구편위구간에 따른 머신러닝 프로그램을 개발하였다. 향후 이를 이용하여 사시 스크리닝 검사에 유용하게 사용할 수 있을 것이다.

Trans Abstract

Purpose

To assess the effectiveness of an automated screening program that diagnoses horizontal strabismus using machine learning based on ocular deviation data captured by the wearable eyetracker, Tobii pro glasses 2 (TPG2).

Methods

The TPG2 which locates the pupil center to measure ocular movement was used. In normal adults wearing TPG2, horizontal ocular deviation was induced by covering the left eye and applying prisms of varying strengths (2, 3, 4, 5, 6, 8, 10, 12, 15, 20, 25, 30, 35, and 40 PD base-in and out) to the right eye. TPG2 automatically recorded ocular deviation before and after prism induction generating 28 types of ocular deviation sets. From each set, 20 X-axis values before and after ocular deviation were randomly extracted using an oversampling technique creating a total of 61,600 ocular deviation sets. For training, 56,000 sets were used and 5,600 were evaluated for sensitivity, specificity, and area under the curve (AUC).

Results

Eleven normal adults (5 males) participated with a mean age of 34.8 ± 7.37 years. Based on an 8 PD threshold, deviations of 8 PD or less demonstrated a sensitivity of 1.0, a specificity of 0.95, and an AUC of 0.97. When categorized into three groups based on 8 PD and 20 PD thresholds, the results were: sensitivity of 0.90 and specificity of 0.95 for ≤ 8 PD; sensitivity of 0.60 and specificity of 1.00 for 8-20 PD; sensitivity of 1.00 and specificity of 0.88 for > 20 PD.

Conclusions

The machine learning program developed using induced ocular deviations measured with prisms and TPG2 shows promise for use in future strabismus screening tests.

사시는 소아에서 흔하게 관찰되는 안과적 질환으로 두 눈이 정렬되지 않고 시축이 어긋난 상태를 말한다. 두 눈의 시축 방향에 따라서 외사시, 내사시, 수직사시로 분류할 수 있다.1,2 사시의 종류 중 하나인 간헐외사시는 외사위가 간헐적으로 융합눈모음이 깨어질 때 외사시가 발현하는 질환으로, 각성이 저하되거나 피로할 때 간헐적인 현성 사시가 발현한다.3 조절내사시는 조절과 연관되어 나타나는 내사시이며, 굴절교정에 따라 사시각의 변동이 생기는 경우가 많다.4

이런 사시나 사위를 진단하는 방법으로는 가림검사, 가림안가림검사, 교대가림검사를 시행할 수 있고, 사시각을 측정하기 위해 프리즘교대가림검사, Krimsky 검사, Hirschberg 검사 등을 시행할 수 있다.5-7

교대가림검사는 두 눈으로 시표를 주시시키고, 두 눈을 교대로 가리면서 가렸던 눈 움직임을 관찰하는 검사 방법으로 임상에서 흔히 사용되는 객관적인 진단 방법이다.8 이와 함께 프리즘을 이용해서 눈의 움직임이 없어질 때까지 프리즘을 증감하여 사시각을 측정하는 프리즘교대가림검사가 있다.9

이러한 사시 검사는 검사자가 직접 검사를 시행하면서 한 눈의 변화를 파악하여 측정하는 방법으로 숙련도에 영향을 받으며, 협조가 되지 않는 환자에게는 정확한 검사를 시행하기 어렵다.10 또한 사시각을 직접 측정하기 때문에 병원을 옮기거나 담당 의사가 바뀌는 경우에 검사자 간의 오차에 의해서 사시의 악화 정도를 정량적으로 파악하기 힘든 점은 치료를 계획하려는 안과의사에게는 부담이 될 수 있다.

검사자가 하는 수동검사를 기계적으로 자동 측정되는 의료기기 검사로 대체한다면 검사자의 숙련도에 관련없이 자동으로 사시를 진단할 수 있고, 사시각에 대한 객관적인 데이터를 확보할 수 있을 것으로 생각한다.

안구운동을 기록하고 분석하는 방법으로 안구운동사진, 공막탐지코일법 및 비디오안구운동검사(video-oculography)가 있다.11,12 비디오안구운동검사를 이용하여 교대가림검사를 통해 얻어진 측정값과 프리즘교대가림검사를 이용하여 구한 사시각이 유의하게 일치한다고 확인되었지만, 굴절렌즈와 자동화된 교대가림장치를 장착할 수 없고 휴대가 용이하지 않아 임상에서 사시의 스크리닝 용도로 간편하게 사용하기에 구조적인 제한점을 가지고 있다.13

반면 Tobii pro glasses 2 (TPG2; Tobii Technology Inc., Stockholm, Sweden)는 웨어러블 아이트래커로 각각의 카메라가 안경 프레임의 안쪽면에 부착되어 두 눈의 움직임을 독립적으로 촬영할 수 있고, 내장되어 있는 동공추적장치(pupil tracking system)를 이용하여 안구움직임 변화를 측정하고 3차원 시축의 움직임을 X, Y, Z 좌표의 벡터값으로 분리하여 각각 표시된다(Fig. 1A). 휴대가 가능하고, 시축을 가리는 구조물이 없어 굴절렌즈와 교대가림장치를 장착할 수 있는 구조적 장점을 가지고 있지만(Fig. 1B), 아직까지 TPG2에서 사시각 측정에 대한 객관적인 연구가 없어 정략적인 측정을 하기 힘든 제한점이 있다.

Figure 1.

Illustrations of Tobii pro glasses 2 (TPG2) and photographs of TPG2 with lens frame attached. (A) By finding the center of the pupil, TPG2 analyzes eye movement along the X-axis, Y-axis, and Z-axis. (B) Lens frame (black arrow) is for occlusion and parallels with forehead. The camera that identify the center of the pupil is positioned on the inside of the lens frame (blue arrowhead). (C) Prism is aligned parallel to forehead.

따라서 본 연구에서는 의료기기로 대체하기 위한 첫걸음으로 안경 타입의 아이트래커(TPG2)를 착용하고 프리즘으로 안구편위를 유도한 후 안구편위각의 변화 데이터를 추출하였다. 프리즘으로 유도된 안구편위를 라벨링하여 안구 편위각 수치에 상관없이 ‘데이터 변화 패턴’을 머신러닝 프로그램으로 훈련시켜 사시 유무를 진단하고 그 유효성을 알아보고자 한다.

대상과 방법

2021년 4월부터 2022년 12월까지 정상 성인 지원자 11명을 전향적으로 조사하였다. 나안시력 20/25 이상, 자발적으로 검사에 지원한 정상 성인을 대상으로 선정하였다. 사시를 유발할 만한 전신 또는 안과적 질환을 가지거나 사위, 사시 및 안구운동이상이 있는 경우 대상자에서 제외하였다. 또한 검사 협조도가 낮은 경우에도 대상에서 제외하였다.

오른쪽 눈에 프리즘을 댈 때 프리즘의 뒷면이 항상 이마면 위치가 될 수 있게 가이드를 할 수 있는 렌즈프레임을 제작하여 TPG2에 장착하였다. 프리즘의 뒷면의 양 끝이 렌즈프레임의 앞부분에 모두 접촉하게 하여 눈과 프리즘의 뒷면이 항상 같은 각도가 이루어 지도록 유지하였고, 각막과 프리즘 후면 사이의 거리는 1.5 cm이다(Fig. 1C). 또한 TPG2를 착용한 대상자는 검사 동안에는 얼굴돌림이나 기울임이 없도록 같은 자세를 유지시켰다. 검사에 앞서, 캘리브레이션(calibration) 과정을 거쳤으며, 1.5 m 거리에서 흰색 바탕의 검은색 원이 그려진 카드를 수초간 주시하여, TPG2 프로그램에서 승인되면 검사를 시행하였다.

검사자는 대상자의 오른쪽 눈에 프리즘을 댄 후 정면에 있는 4 m 거리에서 스넬렌 20/30 시표를 바라보게 하여 프리즘 각도만큼 안구편위를 유발시키게 된다. 5초간 시표를 바라본 후 프리즘을 제거하고 다시 5초간 정면의 시표를 바라보게 하여 안구의 움직임을 기록하였다(Fig. 2). 2, 3, 4, 5, 6, 8, 10, 12, 15, 20, 25, 30, 35, 40 프리즘의 기저부를 안쪽, 바깥쪽 두 방향으로 안구편위를 유도하여 총 28종류의 안구편위 세트에서 X축 벡터값을 추출하였다.

Figure 2.

Photograph of the subject wearing TPG2 before and after applying prism. (A) Subjects are looking at the target without the prism applied. (B) Picture shows induced ocular exodeviation in the right eye by applying 30 PD base-in.

머신러닝 과정은 데이터 형태 확인, 데이터 전처리, 데이터 준비, 모델 생성, 모델 평가, 모델 적용의 일련의 과정을 거쳐서 시행하였다. 얻어진 데이터에서 비정상값(상, 하위 20%)을 제외시키는 전처리과정을 시행하였다. 각 세트에서 안구편위 전후 20개의 데이터를 오버샘플링 기법으로 랜덤 추출 및 조합하여 총 61,600개의 안구편위 세트를 만들었다(Fig. 3). 그 중 56,000개의 훈련 세트에 프리즘양과 방향을 라벨링(labeling)하여 머신러닝(XG Boost)을 사용하여 훈련하였고 5,600개의 테스트 세트를 통해 민감도, 특이도, area under the curve (AUC)를 측정하였다.

Figure 3.

Process of creating an ocular deviation set by oversampling from ocular deviation data. (A, B) Irregular values (upper and lower 20%) are excluded from the data obtained through the preprocessing process. (C) Data of ocular horizontal position is observed after prism induction (yellow arrow), then get the data in opposite direction by removing the prism (sky-blue arrow). (D ) Deviation sets are created by randomly extracting, shuffling and combining 20 data before and after ocular deviation in each set using an oversampling technique. The “10” mark at the bottom left represents 10 PD, lower horizontal line indicates induced esodeviation derived from 10 PD base-out at right eye, the higher horizontal line shows the position after removing the prism when looking straight ahead. X-axis = sample number, Y-axis = pupil position (mm).

본 연구에서는 8 PD 이하의 사시를 ‘비사시’, 8 PD 초과의 사시를 ‘사시’로 정의하였고, 20 PD 이상의 사시를 ‘의미 있는 사시’로 정의하였다. 머신러닝된 모델의 테스트는 2가지 조건에 대해서 머신러닝 모델의 정확도를 측정하였다. 첫 번째, 8 PD 기준 두 구간의 안구편위를 분석하여 사시와 비사시를 구분할 수 있는지, 두 번째로 8 PD 이하, 8-20 PD, 20 PD 초과의 세 구간의 안구편위를 분석하여 사시유무 및 수술이 필요한 의미있는 사시를 구분할 수 있는지 평가하였다.

본 연구는 인제대학교 부산백병원 임상연구관리규정과 헬싱키선언을 준수하였고, 모든 환자에서 본 연구 및 검사에 대해 충분히 설명을 한 뒤 서면 동의서를 받았다(인제대학교 부산백병원 임상시험윤리 위원회 승인번호: 2021-04-024-017).

결 과

총 연구 대상자는 11명으로 평균 연령은 34.8 ± 7.37세였고 남성이 5명, 여성이 6명이었다. 8 PD를 기준으로 두 구간을 분석한 경우, 8 PD 초과를 진단하는 민감도 0.95, 8 PD 이하를 진단하는 특이도 1.0를 보였다(Fig. 4A, B). 또한 AUC는 0.97을 보였다(Fig. 4C).

Figure 4.

Confusion matrix and ROC curve of the machine learning data for distinguishing between strabismus and non-strabismus. (A, B) Pictures display the confusion matrix with percent and the number of data obtained from machine learning (XGBoost) based on 8 PD. A sensitivity of 0.95 and specificity of 1.00 for diagnosing 8 PD or less are measured. (C) The ROC curve for distinguishing between strabismus and non-strabismus and AUC of 0.97 is measured. ROC = receiver operating characteristics; AUC = area under the curve.

8 PD 이하, 8-20 PD, 20 PD 초과 세 구간을 기준으로 각 구간에 대한 민감도, 특이도 조사에서, 8 PD 이하의 구간에서는 민감도 0.90, 특이도 0.95로 측정되었다. 8-20 PD의 구간에서는 민감도 0.60, 특이도 1.00를 보였으며, 20 PD 초과 구간에서는 민감도 1.00, 특이도 0.88을 보였다(Fig. 5A, B).

Figure 5.

Confusion matrix, histogram and ROC curve for each of the three sections based on 8 PD and 20 PD. (A, B) Pictures show the confusion matrix with percent and the number of data obtained from machine learning based on 8 PD and 20 PD. Sensitivity of 0.90, specificity of 0.95 for diagnosing 8 PD or less, sensitivity of 0.60 and specificity of 1.00 for 8-20 PD, sensitivity of 1.00 and specificity of 0.88 for greater than 20 PD are measured. (C, D) In the histogram and ROC curve, (Left) < 8 PD (orange) is distributed close to 1 and the rest (8-20 PD, > 20 PD) (blue) is distributed close to 0, resulting in AUC of 1.00; (Center) 8-20 PD (orange) is distributed evenly, but the rest (≤ 8 PD, > 20 PD) (blue) is distributed close to 0, resulting in AUC of 0.97; (Right) > 20 PD (orange) is distributed close to 1 and the rest (≤ 8 PD, 8-20 PD) (blue) is close to 0, resulting in AUC of 0.99. However, some of the rest (≤ 8 PD, 8-20 PD) (Blue) is also distributed on 1, indicating the possibility of false-positives. ROC = receiver operating characteristics; AUC = area under the curve.

8 PD 기준으로 예측 분포를 나타내는 히스토그램에서 8 PD 이하 구간(주황색)은 1에 가깝게 분포하고 있으며, 8 PD 초과 구간은 0에 가깝게 분포하며 AUC 1.00으로 측정되었다(Fig. 5C, D 좌측). 8-20 PD 구간(주황색)은 전반적으로 분포하고 있고, 8 PD 이하, 20 PD 초과 구간(파란색)은 0에 가깝게 분포하고 있으며 AUC 0.97로 측정되었다(Fig. 5C, D 중간). 마지막으로 20 PD 초과 구간은 1에 분포하고 있고 20 PD 이하 구간도 0에 가깝게 분포하고 있어 AUC 0.99로 측정되었으나 20 PD 이하 구간 중 일부도 1에 분포되어 있다(Fig. 5C, D 우측).

고 찰

사시는 소아에서 흔하며, 유병률은 전체의 5%의 빈도를 차지하는 질환이다.14,15 사시를 동반한 환자들은 약시, 양안시기능 감소 등 정상적인 시력발달이 어려우며,16-18 심리사회적 측면에서도 부정적인 자아상을 가지거나 대인관계에도 어려움을 겪는다.19-22 사시는 삶의 질을 크게 떨어뜨릴 수 있는 질환임에도 불구하고 간헐외사시, 조절내사시 등 특정한 사시의 특성상 평상시에는 눈의 정렬이 똑바로 되어 있는 경우가 많거나 육안으로 뚜렷하게 보이지 않는 소아에서는 검사를 하지 않아 뒤늦게 발견되거나 검사자의 오진으로 치료가 늦어지는 경우가 있다.

이러한 이유는 의사가 임상현장에서 직접 환자의 눈을 보면서 프리즘교대가림검사 등 수동적인 검사법으로 진단하는 것이 원인 중 하나로 저자들은 생각한다. 사시검사의 숙련도가 높지 않은 안과의사에게는 이런 검사법으로는 오진을 할 수 있고, 숙련된 안과의사라도 협조가 잘 되지 않는 소아에서는 오차가 클 수 있기 때문이다. 이런 한계를 극복하기 위해 최근 사진이나 비디오 장치를 이용하여 사시각을 측정하려는 시도가 있었다.23-27 환자들을 디지털 카메라로 촬영해 사진을 추출하여 사시유무 및 사시각을 분석할 수 있는 소프트웨어를 이용하거나25-27 비디오안구운동검사기, 가상현실기기(virtual reality-based measurement) 등의 아이트래커를 이용하여 안구편위를 분석하였다.13,28 가상현실기기를 이용한 사시각 측정은 내사시 환자에서 각도를 과대평가하고, 외사시 환자에서는 과소평가하는 경향을 보이거나,29 안구운동충돌을 유발하며 조절대비폭주비를 증가시키거나 근거리원거리사위에도 영향을 줄 수 있다고 보고하였다.30,31 또한 평균적인 머리 크기로 제작되었기에 소아를 포함하여 다양한 연령대의 환자에서 적용하기 어려우며, 폐쇄공포증이 있는 경우에도 적용하기 어려운 단점이 있다.13,32

본 연구에서는 기존의 검사기기가 소아나 폐쇄공포증이 있는 환자들에게 거부감을 줄 수 있다는 단점을 해결하기 위해 안경 타입의 아이트래커를 사용하였다. 연구에 사용된 TPG2는 눈 주위에 갇혀 있는 느낌이 들지 않아 검사가 용이하다는 장점이 있다. 본 연구는 새로운 타입의 아이트래커를 이용하여 안구편위를 측정하고, 머신러닝을 통하여 사시를 진단하려는 시도를 한 연구로서 의미가 있다.

프리즘교대가림검사는 한 눈 앞에 프리즘을 대고 가림을 시행하여 안구편위를 유발시킨 후, 가림을 반대쪽 눈으로 옮긴다. 이때 편위가 일어난 눈의 시축이 프리즘으로 굴절된 상과 일치되도록 눈이 움직이는데, 움직임이 없을 때까지 프리즘을 증감하여 더 이상의 움직임이 없을 때의 프리즘의 양이 사시각이 된다. 이는 프리즘양만큼 굴절시킨 정면의 상이 안구편위된 눈과 시축이 일치하기 때문이며, 프리즘으로 굴절시킨 각도가 결국 안구편위각이 된다. 즉 가림이 없어지면서 재주시 할 때 눈의 움직임을 확인하여 사시각을 측정하는 원리이다.

반면에 TPG2는 한 눈의 움직임을 촬영하는 2대의 카메라가 있으며, 동공추적 알고리즘을 이용하여 동공을 인식하고 3차원적으로 눈의 시축을 계산하여 안구편위각을 찾는 방식이다. 사시가 있을 때에는 한 눈을 가리면 가린 눈에 안구편위가 일어나게 되고, 카메라가 프리즘보다 눈 쪽에 가깝게 위치하며, 가림과 상관없이 두 눈의 안구편위를 벡터값으로 측정하게 된다. 반대눈을 가릴 때 재주시하기 위해 눈이 이동하게 되는데, 안구편위된 벡터값과 재주시한 눈의 벡터값의 차이를 안구편위각으로 정하였다. 이와 같은 원리로 비디오안구운동 검사기를 이용하여 간헐외사시를 측정한 연구가 보고되었는데, Park et al13은 공동외사시에서 비디오안구운동검사기를 착용하고 교대가림동안 카메라로 측정한 안구편위각과 프리즘교대가림검사 결과를 비교하였을 때 강한 양의 상관관계(R=1.000; p<0.001)가 있다고 하였고, Ban and Moon33은 간헐외사시에서 우세안과 비우세안의 안구편위각의 차이가 없다고 보고하였다.

본 연구는 수동으로 구간을 설정하여 안구편위각을 찾는 것이 아니라 데이터의 변화 양상에 대한 머신러닝 모델을 만들어 자동으로 안구편위각을 찾는 방법을 고안하였다. 머신러닝 모델은 프리즘으로 기저부 안쪽, 바깥쪽 두 방향으로 14개의 양이 다른 프리즘으로 28종류의 안구편위를 유도하였고, 안구편위 데이터세트에 유도시킨 프리즘 값과 방향을 라벨링하여 훈련시켰다.

8 PD 이하의 사시는 두 눈 단일시가 유지되지만,34 20 PD 초과의 사시는 외관상이나 기능적으로 이상이 생길 수 있어 수술을 권장하게 된다.35 따라서 본 연구에서는 8 PD 이하의 사시를 ‘비사시’, 8 PD 초과의 사시를 ‘사시’로 정의하였고, 20 PD 이상의 사시를 ‘의미 있는 사시’로 정의하였다. 먼저 훈련된 머신러닝 모델을 사용하여 테스트 세트를 통해서 8 PD를 기준으로 사시와 비사시를 구별할 수 있는지를 알아보았는데, 사시유무 판별에 대해서 민감도 100%, 특이도 95% 및 AUC 0.97로 사시 여부를 판단하는 스크리닝 검사로써 유용하다고 할 수 있다. 특히 실제 사시각이 8 PD 이하일 경우 머신러닝 모델이 100%에서 비사시라고 판단한다는 점이 강점이라고 저자는 생각한다.

두 번째로, 8, 20 PD를 기준으로 비사시, 사시, 의미 있는 사시를 분류하고 사시의 스크리닝과 수술이 필요한 정도의 사시 여부를 판단할 수 있는지를 알아보았다. 비사시, 사시, 의미 있는 사시의 세 구간을 판단하는 테스트에서는 의미 있는 사시를 진단하는 능력으로는 민감도 100%, 특이도 95%, AUC 0.97, 비사시를 진단하는 능력으로는 민감도 90%, 특이도 95%, AUC 1.00으로 높은 판단력을 가진다고 할 수 있다. 히스토그램에서 비사시와 사시의 분포(Fig. 5B 좌측)는 두 군 간에 잘 구분되어 있고, 의미 있는 사시 유무의 분포(Fig. 5B 우측)에서도 두 군 간에 잘 구분되어 있지만 소수의 의미 있는 사시가 아닌 경우에도 의미 있는 사시로 분류되어 있음을 알 수 있어 위양성이 존재할 수 있다. 그럼에도 불구하고 두 경우 모두 AUC 가 0.95 이상으로, 머신러닝 모델에서 비사시 또는 의미 있는 사시로 판단하는 경우에는 실제로 비사시 또는 의미 있는 사시일 가능성이 높아 스크리닝으로는 유용하다고 생각한다. 반면 8-20 PD 사시를 진단하는 능력에서는 민감도가 60%로 낮게 측정되었는데, 히스토그램에서 8-20 PD 사시 유무의 분포(Fig. 5B 중간)에서는 8-20 PD 구간(주황색)이 전체적으로 고루 분포되어 올바르게 예측하지는 못하지만 상대적으로 나머지 구간(파란색)이 일괄되게 분포되어 있어 AUC가 높게 측정되었다. 따라서 머신러닝을 사용하여 비사시와 의미 있는 사시에 한해서는 유의미하게 분류할 수 있을 것으로 저자들은 생각한다.

본 연구에서는 몇 가지 제한점이 있었다. 첫째, 참여자가 11명으로 적어 얻어진 안구편위 세트를 전처리 과정 및 오버샘플링하여 총 데이터 수를 61,600개로 해 한계점을 극복하려 하였다. 사시 유무를 구별하는 데 유용한 결과를 보여주었지만 프리즘의 양과 방향을 달리한 28개의 편위세트 각각의 안구편위를 정확하게 진단하는 능력은 현재 머신러닝 모델로는 정확도가 높지 않았다. 추후 충분한 데이터를 쌓는다면 정확한 사시각을 측정하기 위한 후속연구에 도움이 될 것으로 기대된다. 둘째, 아이트래커를 착용 후 프리즘 후면과 각막사이의 거리가 1.5 cm 정도로 기존 안경을 착용한 상태(1 cm)에 비하면 거리가 멀어졌다. 하지만 본 연구에서의 안구편위 유도는 프리즘을 이마면 위치에 놓고 시표를 바라보게 하여 거리에 따른 안구편위의 차이는 크지 않으며, 프리즘보다 각막에 인접한 안경의 안쪽면에 부착된 카메라로 안구편위를 측정하여 프리즘과 각막과의 거리에 따른 오차가 크지 않을 것으로 생각한다. 셋째, 소프트웨어 프로그램을 통해 안구편위를 분석하는 과정에서 데이터에서 갑자기 튀는 값들이 생겨났다. 이는 아이트래커의 한계점을 보여주는 것으로 동공추적장치가 동공의 중심을 인식하지 못하고 각막윤부를 인식하거나 다른 곳을 인식하는 경우가 있기 때문이다. 그래서 본 연구에서는 상하위 데이터의 20%를 제거하는 전처리과정을 거친 후의 데이터를 사용하였으며, 제거된 데이터를 보완하기 위해 오버샘플링 기법을 활용하였다. 오버샘플링 기법은 유도된 안구편위 데이터와, 프리즘 제거 후 데이터에서 각각 무작위로 20개의 데이터를 추출하고 무작위로 조합하여 61,600개의 데이터를 얻었다(Fig. 3).

그럼에도 불구하고, 사시를 진단하는 정확도는 97%, 의미 있는 사시를 진단하는 정확도는 99%로 사시에 대한 스크리닝 검사로는 유용하게 사용할 수 있을 것으로 기대한다.

대표적인 객관적인 사시검사법인 프리즘교대가림검사는 검사자가 직접 피검자의 눈을 보고 움직임 여부를 판단하는 방법이다. 하지만 The Pediatric Eye Disease Investigator Group은 2명의 숙련된 검사자에서 내사시 환자의 사시각 측정을 비교하였을 때 20 PD 이상의 사시각은 12 PD의 오차를, 20 PD 이하의 사시각에서는 6 PD의 오차를 보일 수 있다고 보고하였다.36 이는 한 명의 검사자에게 지속적으로 사시검사를 받는다면 사시의 변화를 확인할 수 있으나, 검사자가 바뀐다면 마지막 검사자가 사시의 악화 등을 결정하기가 쉽지 않다. 하지만 검사기기를 사용하면 검사자가 바뀌더라도 지속적으로 객관적인 검사를 할 수 있는 장점이 있다고 생각한다.

아직까지는 스크리닝 수준의 정확도를 가졌지만, 많은 안구편위 데이터로 머신러닝 모델이 개발된다면 좀 더 정확하게 사시각과 사시유형을 파악할 수 있을 것으로 생각한다. 아이트래커를 이용한 사시검사는 병의 진행 및 악화 정도를 일괄되게 파악하고 객관적으로 분석할 수 있어 적절한 수술 시기를 결정하는 데 유용하고 사시검사가 익숙하지 않은 의료진에서 오진율을 감소시킬 수 있을 것이다. 무엇보다 검사자가 직접 검사하는 것을 검사실에서 검사하는 방법으로 대체하여 한정된 진료시간에 병의 경과나 치료에 대한 설명에 많은 시간을 활용할 수 있을 것이다.

결론적으로 아이트래커를 이용하여 안구편위 데이터를 활용하여 스크리닝 머신러닝 모델을 개발하였으며, 사시 유무를 판단하는 스크리닝에 유용하게 사용될 수 있을 것이다. 또한 아이트래커를 이용한 안구편위의 객관적 데이터를 제공하여 사시를 진단하거나 수술 시기를 결정하는데 유용하게 사용할 수 있을 것이다.

Notes

Conflicts of Interest

The authors have no conflicts to disclose.

Acknowledgements

This research was supported by a grant of the Korea Health Technology R&D Project through the Korea Health Industry Development Institute (KHIDI), funded by the Ministry of Health & Welfare, Republic of Korea (grant number: HR21C1003).

References

1. Robaei D, Rose KA, Kifley A, et al. Factors associated with childhood strabismus: findings from a population-based study. Ophthalmology 2006;113:1146–53.
2. Korean Association for Pediatric Ophthalmology and Strabismus. Current concepts in strabismus. 4th ed. Seoul: Naewae Haksool, 2018;180.
3. Korean Association for Pediatric Ophthalmology and Strabismus. Current concepts in strabismus. 4th ed. Seoul: Naewae Haksool, 2018;220.
4. Kwon JY, Lee DE, Song HC. Clinical studies on accormmodative esotropia. J Korean Ophthalmol Soc 1997;38:687–91.
5. Goldbaum MH, Smithline M, Poole TA, Lincoff HA. Geometric analysis of radial buckling. Am J Ophthalmol 1975;79:958–65.
6. Krimsky E. The binocular examination of the young child. Am J Ophthalmol 1943;26:624–5.
7. Riddell PM, Hainline L, Abramov I. Calibration of the Hirschberg test in human infants. Invest Ophthalmol Vis Sci 1994;35:538–43.
8. Deacon MA, Gibson F. Strabismus measurements using the alternating and simultaneous prism cover tests: a comparative study. J Pediatr Ophthalmol Strabismus 2001;38:267–72.
9. Yang HK, Jung JH. Diagnosis and treatment of childhood strabismus. J Korean Med Assoc 2019;62:325–32.
10. Anderson HA, Manny RE, Cotter SA, et al. Effect of examiner experience and technique on the alternate cover test. Optom Vis Sci 2010;87:168–75.
11. Yang HK, Han SB, Hwang JM, et al. Assessment of binocular alignment using the three-dimensional Strabismus Photo Analyzer. Br J Ophthalmol 2012;96:78–82.
12. van der Geest JN, Frens MA. Recording eye movements with video-oculography and scleral search coils: a direct comparison of two methods. J Neurosci Methods 2002;114:185–95.
13. Park N, Park B, Oh M, et al. A quantitative analysis method for comitant exotropia using video-oculography with alternate cover. BMC Ophthalmol 2018;18:80.
14. Han KE, Baek SH, Kim SH, et al. Prevalence and risk factors of strabismus in children and adolescents in South Korea: Korea National Health and Nutrition Examination Survey, 2008-2011. PLoS One 2018;13e0191857.
15. Williams C, Northstone K, Howard M, et al. Prevalence and risk factors for common vision problems in children: data from the ALSPAC study. Br J Ophthalmol 2008;92:959–64.
16. Oliver M, Nawratzki I. Screening of pre-school children for ocular anomalies. II. Amblyopia. Prevalence and therapeutic results at different ages. Br J Ophthalmol 1971;55:467–71.
17. Preslan MW, Novak A. Baltimore vision screening project. Ophthalmology 1996;103:105–9.
18. Shaw DE, Fielder AR, Minshull C, Rosenthal AR. Amblyopia--factors influencing age of presentation. Lancet 1988;2:207–9.
19. Menon V, Saha J, Tandon R, et al. Study of the psychosocial aspects of strabismus. J Pediatr Ophthalmol Strabismus 2002;39:203–8.
20. Olitsky SE, Sudesh S, Graziano A, et al. The negative psychosocial impact of strabismus in adults. J AAPOS 1999;3:209–11.
21. Satterfield D, Keltner JL, Morrison TL. Psychosocial aspects of strabismus study. Arch Ophthalmol 1993;111:1100–5.
22. Uretmen O, Egrilmez S, Kose S, et al. Negative social bias against children with strabismus. Acta Ophthalmol Scand 2003;81:138–42.
23. Garcia SSS, Santiago APD, Directo PMC. Evaluation of a Hirschberg test-based application for measuring ocular alignment and detecting strabismus. Curr Eye Res 2021;46:1768–76.
24. Joo KS, Koo H, Moon NJ. Measurement of strabismic angle using the distance Krimsky test. Korean J Ophthalmol 2013;27:276–81.
25. Kim TY, Seo SS, Kim YJ, et al. A New software for quantitative measurement of strabismus based on digital image. J Korea Multimed Soc 2012;15:595–605.
26. Maor R, Holland J, Tailor V, et al. Rate of strabismus detection on digital photographs increases by using off-center near target. J Pediatr Ophthalmol Strabismus 2017;54:90–6.
27. Valente TLA, de Almeida JDS, Silva AC, et al. Automatic diagnosis of strabismus in digital videos through cover test. Comput Methods Programs Biomed 2017;140:295–305.
28. Miao Y, Jeon JY, Park G, et al. Virtual reality-based measurement of ocular deviation in strabismus. Comput Methods Programs Biomed 2020;185:105132.
29. Yeh PH, Liu CH, Sun MH, et al. To measure the amount of ocular deviation in strabismus patients with an eye-tracking virtual reality headset. BMC Ophthalmol 2021;21:246.
30. Mon-Williams M, Wann JP, Rushton S. Binocular vision in a virtual world: visual deficits following the wearing of a head-mounted display. Ophthalmic Physiol Opt 1993;13:387–91.
31. Neveu P, Priot AE, Plantier J, Roumes C. Short exposure to telestereoscope affects the oculomotor system. Ophthalmic Physiol Opt 2010;30:806–15.
32. Weber KP, Rappoport D, Dysli M, et al. Strabismus measurements with novel video goggles. Ophthalmology 2017;124:1849–56.
33. Ban JH, Moon SH. The analysis of ocular deviations between dominant and non-dominant eye using video-oculography in intermittent exotropia. J Korean Ophthalmol Soc 2019;60:685–91.
34. Choi KS, Chung SA, Lee KS, Lee JB. The prismatic effect on stereoacuity in intermittent exotropia. Yonsei Med J 2010;51:117–20.
35. Von Noorden GK, Campos EC. Exodeviations. In: Von Noorden GK, Campos EC, eds. Binocular Vision and Ocular Motility. 6th ed. St. Louis: Mosby, 2002; chap. 17.
36. Pediatric Eye Disease Investigator Group. Interobserver reliability of the prism and alternate cover test in children with esotropia. Arch Ophthalmol 2009;127:59–65.

Biography

손선명 / Sun Myung Son

Department of Ophthalmology, Busan Paik Hospital, Inje University College of Medicine

Article information Continued

Figure 1.

Illustrations of Tobii pro glasses 2 (TPG2) and photographs of TPG2 with lens frame attached. (A) By finding the center of the pupil, TPG2 analyzes eye movement along the X-axis, Y-axis, and Z-axis. (B) Lens frame (black arrow) is for occlusion and parallels with forehead. The camera that identify the center of the pupil is positioned on the inside of the lens frame (blue arrowhead). (C) Prism is aligned parallel to forehead.

Figure 2.

Photograph of the subject wearing TPG2 before and after applying prism. (A) Subjects are looking at the target without the prism applied. (B) Picture shows induced ocular exodeviation in the right eye by applying 30 PD base-in.

Figure 3.

Process of creating an ocular deviation set by oversampling from ocular deviation data. (A, B) Irregular values (upper and lower 20%) are excluded from the data obtained through the preprocessing process. (C) Data of ocular horizontal position is observed after prism induction (yellow arrow), then get the data in opposite direction by removing the prism (sky-blue arrow). (D ) Deviation sets are created by randomly extracting, shuffling and combining 20 data before and after ocular deviation in each set using an oversampling technique. The “10” mark at the bottom left represents 10 PD, lower horizontal line indicates induced esodeviation derived from 10 PD base-out at right eye, the higher horizontal line shows the position after removing the prism when looking straight ahead. X-axis = sample number, Y-axis = pupil position (mm).

Figure 4.

Confusion matrix and ROC curve of the machine learning data for distinguishing between strabismus and non-strabismus. (A, B) Pictures display the confusion matrix with percent and the number of data obtained from machine learning (XGBoost) based on 8 PD. A sensitivity of 0.95 and specificity of 1.00 for diagnosing 8 PD or less are measured. (C) The ROC curve for distinguishing between strabismus and non-strabismus and AUC of 0.97 is measured. ROC = receiver operating characteristics; AUC = area under the curve.

Figure 5.

Confusion matrix, histogram and ROC curve for each of the three sections based on 8 PD and 20 PD. (A, B) Pictures show the confusion matrix with percent and the number of data obtained from machine learning based on 8 PD and 20 PD. Sensitivity of 0.90, specificity of 0.95 for diagnosing 8 PD or less, sensitivity of 0.60 and specificity of 1.00 for 8-20 PD, sensitivity of 1.00 and specificity of 0.88 for greater than 20 PD are measured. (C, D) In the histogram and ROC curve, (Left) < 8 PD (orange) is distributed close to 1 and the rest (8-20 PD, > 20 PD) (blue) is distributed close to 0, resulting in AUC of 1.00; (Center) 8-20 PD (orange) is distributed evenly, but the rest (≤ 8 PD, > 20 PD) (blue) is distributed close to 0, resulting in AUC of 0.97; (Right) > 20 PD (orange) is distributed close to 1 and the rest (≤ 8 PD, 8-20 PD) (blue) is close to 0, resulting in AUC of 0.99. However, some of the rest (≤ 8 PD, 8-20 PD) (Blue) is also distributed on 1, indicating the possibility of false-positives. ROC = receiver operating characteristics; AUC = area under the curve.