뇌 신경 세포 3D 데이터 가공기
고객사 분들에게 최고의 결과물을 드리기까지
저희 데이터메이커가 진심으로 고민한 이야기를 들려드리고자 합니다.
고객사 서비스 소개
우리의 다양한 기억과 재능, 감각은 뇌의 신경 세포들의 연결로 형성됩니다.
사람의 뇌에는 약 1,000억 개의 신경세포가 복잡하게 연결되어 있고, 이에 더하여 신경세포보다 10배 정도 많은 신경 아교 세포들도 있습니다.
뇌 신경 세포들을 추적하여 어떻게 연결되어 있는지 알면 인간의 기억과 재능이 어떻게 형성되는지 알 수 있고, 파킨슨병과 같이 신경 질환들을 치료할 수 있습니다.
저희에게 의뢰한 S 대 연구팀은 뇌 신경 세포들이 어떻게 연결되어 있는지 네트워크를 추적하여 사람의 감각을 연구하고 있습니다.
그러나 복잡하게 얽힌 신경 세포를 추적하는 것은 어렵고 오래 걸리는 작업입니다.
개발사가 겪던 문제
하나의 뇌 신경 세포를 추적하는 데 걸리는 시간은 숙련된 사람 기준 2~3일이 소요되며,
S 대 연구원 본인 혼자서 600개의 세포를 추적할 때 단순 계산 시 약 1,500일, 4년 이상이 걸립니다.
또한, 뇌 신경 세포의 구성을 구분할 수 있는 전문적인 지식이 필요해, 난이도가 높다 보니 아무나 작업할 수 없고 충분히 교육받고 숙련된 사람만이 작업에 투입될 수 있습니다.
이러한 이유로 혼자서 작업을 하기에 큰 어려움이 있어 적절한 가공 솔루션과 서비스를 받기 위하여 데이터메이커를 이용하게 되었습니다.
고객사와의 지속적인 커뮤니케이션
고객사와의 긴밀한 소통을 통해 요구 사항들을 즉각적으로 반영하여 작업했습니다.
효율적인 작업을 위해 실시간으로 고객사의 피드백을 받아 가공하였으며, 원활한 소통을 통해 더욱 완벽한 결과물을 산출해 냈습니다.
프로젝트 소개
본 프로젝트의 원천 데이터는 뇌 신경 세포의 3D 형광 사진을 Z축 단면으로 잘라 하나의 세포에서 약 450장 이상의 이미지 데이터가 생성됩니다.
세포체에서부터 뻗어 나오는 중심 가지돌기들을 추적하게 되며, 해당 가지돌기들과 만나는 미엘린까지 추적하게 되는 프로젝트입니다.
하나의 세포체에서 추적해야 하는 가지들과 미엘린을 모두 합하면 약 250개가 넘게 되는 복잡한 작업입니다.
작업자 교육
일반 작업자가 신경 세포를 구분할 수 있도록 쉬운 설명과 시각 자료로 교육을 진행했습니다.
신경 세포를 구분하는 것과 별개로 작업자들이 처음 접하는 툴에 익숙해질 수 있도록 툴 교육을 병행했습니다.
툴은 뇌세포를 추적하기 위해 개발된 전문 툴을 활용하였습니다.
2주간 연습 기간을 통해서 실제로 작업하게 될 데이터에 익숙해지도록 시간을 가졌고, 고객사가 만족할 때까지 작업자 및 검수자 교육을 진행하였습니다. 이 과정에서 뇌세포에 대한 전문적인 지식뿐만 아닌 고객사에서도 다루기 쉽지 않은 툴도 능숙하게 다룰 수 있는 역량을 키우게 되었습니다.
최종적으로 고객사의 컨펌을 받은 작업자만이 본 작업에 투입될 수 있었으며, 더욱 완벽한 결과물을 만들어 냈습니다.
*가공을 수행 중인 작업자
데이터 가공 프로세스
고객사로부터 받은 원천데이터를 2단계로 나눠서 중심 가지 작업 그리고 하위 가지 작업으로 진행했습니다.
신경 세포의 특성상 세포체를 중심으로 가지가 뻗어 나가는 모양이어서 처음에 중심 돌기 가지를 잘 못 설정하여 오류가 발생했을 시 하위 가지들과 미엘린 가지들을 모두 다시 수정해야 해서 수정 전 작업 시간보다 수정 시간이 너무 길었습니다.
시간과 비용을 고려했을 때 중심 가지를 설정하는 것이 중요했습니다.
마치 첫 단추를 잘못 끼우면 모든 단추를 다시 풀고 처음부터 끼워야 하는 것과 같았습니다.
그래서 저희는 원천 데이터의 중심 돌기 가지들을 먼저 다 찾는 작업을 진행하고, 중심 돌기 가지의 3차 검토까지 완료한 뒤 하위 가지들 작업 진행했습니다.
이 과정을 통해 중심 돌기 가지를 먼저 작업하고 검수한 뒤 진행하지 않았을 경우보다 오류율이 50% 이상 낮아졌으며 작업 속도 역시 30% 이상 높아졌습니다.
작업을 진행하며 뇌 신경 세포가 복잡하게 얽혀 있거나, 희미하게 보여 애매한 경우가 종종 있었습니다.
뇌 공학 전공자도 명확하게 판단하기 어려워 주관적인 판단이 들어가야 하는 상황에선
엄선된 작업자들의 의견을 취합하여 가장 확률이 높은 정답지로 가공하였습니다.
*신경 세포 작업 화면의 예시
데이터 검수 및 납품
*데이터 검수 프로세스
한 치의 오차도 없으면 안 되는 프로젝트 특성상 가장 숙련되고 꼼꼼한 작업자들이 1차로 작업 후 본인이 작업했던 세포 가지 하나하나 다시 추적하는 더블 검수를 진행했습니다.
더블 검수가 완료된 데이터는 최소 3인 이상의 숙련된 작업자들이 한 번씩 보며 크로스 검수를 진행하였습니다.
더블 검수 과정을 통해 스스로 놓치거나 실수한 작업을 보완할 수 있었고, 크로스 검수 과정을 통해 헷갈리거나 애매한 작업에 대한 가장 정답에 가까운 방향으로 데이터를 수정할 수 있었습니다.
작업자의 2차 검수까지 끝나면 최종적으로 담당 PM이 총괄 검수하여 고객사에 매주 약속한 납품 데이터 개수를 꾸준히 프로젝트 기한 내에 전달하였습니다.
이렇게 3차에 걸친 검수 이후 납품한 결과 전체 가공 데이터의 오류율은 5% 정도로 낮았으며 수정해야 할 사항도 복잡하지 않았습니다.
* 뇌 신경 세포가 라벨링 된 예시 이미지 (출처: Individual Oligodendrocytes Show Bias for Inhibitory Axons in the Neocortex, Cell Reports, Volume 27, Issue 10, 4 June 2019)
S대 연구팀의 리뷰
복잡한 데이터이고, 생소한 형태의 데이터이지만 직접 라벨링 했을 때 스스로 하기에 한계가 있어 가공 의뢰를 했습니다.
처음에 관련 지식이 없는 사람에게 라벨링 규칙을 가르치는 것이 힘들었지만 프로젝트 매니저님들이 제가 설명한 내용을 따로 정리해서 작업자분들에게 잘 전달해 주어서 도움이 되었습니다.
처음 의뢰 시 조율할 내용이 많아 처음 계약했던 것보다 작업 기간이 길어져서도 끝까지 책임지고 작업을 마무리해 주었고,
첫번째 의뢰 이후 작업 결과물의 완성도가 높아 추가 의뢰를 했습니다.
결과적으로 아무리 작업 난이도가 높아도 소통이 원활하게 잘 되고 요구사항을 즉각 반영해 주셔서 만족스러웠던 협업이었습니다.
-
데이터메이커와 함께 하시려면,
저희 데이터메이커는 글로벌 데이터 가공 플랫폼입니다.
높은 보안을 갖춘 환경 속에서 작업한 우수한 품질의 학습 데이터를 업계 최저 가격에 제공합니다.
저희는 진심을 담아 고객사에게 최고의 품질의 데이터로 돌려드립니다.