실시간 대장 용종 검출 AI 솔루션 개발 수행기
우리나라의 대장암 발병률은 세계 상위권에 해당합니다.
대장암을 효과적으로 예방하기 위해서는 조기 발견이 중요하며,
대장 용종 중 30~50%는 암으로 발전할 수 있기 때문에 대장 내시경 검사를 통해 조기 발견을 하고 있습니다.
다만, 대장 내시경 검사와 절제술은 의사 개인의 역량에 따라 용종 간과율이 16~26% 발생한다는 연구 결과가 있습니다.
검사에 인공지능 기술을 도입하면 대장 내 용종 검출의 역량을 상향 평준화할 수 있어 진료 시간이 줄고, 경제적 비용이 감소될 수 있습니다.
이는 환자가 대장 용종 검사의 부담이 줄어들어 우리나라의 대장암 발병 순위도 내려갈 수 있지 않을까요?
고객사의 Problem
현재 대장내시경 영상 분석 AI 솔루션은 해외 특정 내시경 제조사를 주도로 해당 회사의 내시경 기기에만 호환되는 형태가 대부분으로 범용성 및 의료의 공공성이
저하되는 측면이 있었습니다. 이로 인해 저희에게 의뢰한 고객사의 경우 특정 제조사의 내시경 기기에 국한되지 않는 용종 자동 검출 AI모델을 개발하고자 했습니다.
고객사 특성 상 데이터 수집은 원활하나, AI 모델 개발 전문 인력이 부족하고 솔루션을 지속적으로 고도화하기에는 학습용 데이터를 가공할 시간적, 인력적 여유가
많이 부족했습니다. 또한, 자체 인력으로 라벨링을 하더라도 신규 데이터셋에 대한 관리가 어려운 경우가 발생하여 저희를 찾아주셨습니다.
데이터메이커의 Solution
이러한 고객사의 문제점들을 해결하기 위해 저희 데이터메이커에서 많은 고민을 시작했습니다.
1. 의료용 데이터 보안 이슈 해결
제일 먼저 의료용 데이터는 개인정보 이슈로 인해 반출이 불가능해 보안 서버를 연동하여 확보하였습니다. 또한 영상 내 기재된 개인정보 역시 작업자에게
노출되지 않도록 가공 전 비식별화 전처리를 통해 정제 작업을 하였습니다.
이렇게 개인정보 유출 이슈가 없는 상태에서 AI 모델 개발을 위한 학습용 데이터셋 구축에 착수했습니다.
2. AI 모델 성능 고도화를 위한 정확도 높은 데이터 셋 구축
확보된 데이터는 대장 내시경 검사 시 실제 촬영된 영상이다 보니 이미지 데이터로 추출이 먼저 필요했습니다.
영상을 초당 30fps 단위로 추출하여 유사성이 높거나, 흔들림이 심한 경우 그리고 가려진 부분 등 불량 데이터를 먼저 정제 하였습니다.
이미지로 추출된 데이터에서 대장 내 용종이 존재하는 위치를 찾고 용종이 가장 잘 보이는 경계점을 라벨링 하여 총 30,000례의 데이터 셋을 구축하였습니다.
또한 초기에 가공된 소량의 데이터로 개발한 자동 라벨링 엔진을 통해 가공 시간을 4배 이상 단축 시켜 작업 효율을 높였습니다.
3. 의학적 지식 학습을 통한 작업자 가이드 교육 진행
데이터메이커는 의료분야 데이터 처리 및 AI 솔루션 개발 프로젝트를 수행한 경험을 이미 보유하고 있었습니다.
그래서, 관련 특성을 잘 이해한 실무진을 구성하고, 의료 관련 지식을 작업자들에게 교육하여 전문 인력으로 양성하였습니다.
그 결과 데이터 가공을 할 때 의학적 지식을 갖춘 상태에서 용종의 특성을 이해하고, 영역을 확인하여 정교한 바운딩박스 라벨링을 수행할 수 있었습니다.
그러나 진행하면서 상이한 용종의 형태나 식별이 애매한 경우가 종종 있었습니다.
하지만 의료진과 논의 체계를 마련한 덕분에, 의학적 소견에 따라 신속하게 용종 부위에 정확한 바운딩박스로 라벨링한 데이터를 구축할 수 있었습니다.
4. 용종 검출 솔루션에 활용된 모델
솔루션에 활용된 AI 모델은 실시간 객체 탐지 분야의 최신 성능을 보유한 모델인 YOLOv8을 활용하여 개발됐습니다.
이전 시리즈 (v7)의 백본 네트워크에 FPN 구조를 도입하여 용종 같은 다양한 크기의 객체 검출에 유리하도록 개선하였습니다.
또한 다양한 추론 확장성 및 모델의 범용성을 위해 YOLOv8로 자체 통합 프레임워크를 구축하여 전 시리즈 (v3~v8) YOLO 모델을 모두 사용 가능하도록 했습니다.
이렇게 개발된 용종 검출 AI 솔루션은 현재 고객사에서 사용하고 있는 내시경 기기에 곧바로 탑재하여 진단에 활용할 수 있게 되었습니다.
기존 방식과 달리 AI 기반 진단 보조 화면을 동시에 참고할 수 있어, 용종 간과율을 평균 수치인 16%에서 5%미만으로 크게 줄일 수 있을 것이라 예상합니다.
덕분에 실제 진료 현장과 보유한 장비 및 시스템에 곧바로 적용할 수 있는 결과물을 얻을 수 있었고,
전문지식이 필요한 의료데이터 처리에도 경험이 많은 전문 인력분들을 통해 양질의 데이터로 얻을 수 있었습니다.
강원도원주의료원 ㅣ 조승국 내과 과장님 (인터뷰 https://www.youtube.com/watch?v=E-irBy3bHJs&t=1s)
프로젝트를 마치며
의료분야의 데이터를 가공하는 작업이었기 때문에 의학적 지식을 요구하고, 의료 전문가와 가이드라인을 꼼꼼히 구축해야 했습니다.
많은 의학적 사례와 소견의 연계를 통해 데이터 셋을 구축한다는 점에서 저희 데이터메이커의 보건의료계의 전문성을 향상 시키는 좋은 경험이 되었습니다.
개발된 AI 모델은 대장 내시경 영상에서 용종을 정확하게 검출할 수 있도록 의료 현장에 바로 적용되었을 뿐만 아니라, 향후 공동개발 등 의료기관의 협력 파트너로서
시너지 효과가 가능할 것으로 생각합니다.