영수증 AI-OCR 데이터 가공기
고객사 분들에게 최고의 결과물을 드리기까지
저희 데이터메이커가 진심으로 고민한 이야기를 들려드리고자 합니다.
고객사 서비스 소개
정리되어 있지 않은 영수증, 어디 있는지 찾기 힘든 종이들.
공간을 어지럽히기만 하는 문서와 그 안에 있는 복잡한 내용들을 사진 한 장으로 컴퓨터에 저장할 수 있다면 얼마나 편리할까요?
데이터메이커에게 의뢰한 S사는
AI-OCR 솔루션을 통하여 다양한 유형의 이미지에 포함된 문자를 편집 가능한 데이터로 변환해주는 기술을 개발 중에 있습니다.
개발사가 겪던 문제
AI 인공지능학습은 다양한 데이터로 학습시키는 것이 중요합니다.
다양한 형식의 영수증을 수집하고 가공하는 것은 가공 전문 업체에 맡기는 것이 더 좋다는 판단이 들었죠.
- S사 담당연구원
데이터메이커는 고객사가 원하는 데이터를 수집부터 가공까지 진행할 수 있는 기업입니다.
프로젝트 시작부터 완료까지, 고객사와의 지속적인 소통을 통하여 더욱 완벽한 결과물을 산출하며
완료 후에도 고객사의 피드백에 귀 기울임으로써 만족스러운 결과물을 제공합니다.
데이터 메이커의 솔루션
영수증 데이터 가공에 키포인트를 다양화, 정확성에 두었습니다.
먼저, 어떻게 하면 다양한 영수증을 수집할 수 있을 지 고민하였습니다.
최대한 많은 사람들이 영수증 수집에 참여하는 것이 다양한 영수증 데이터를 수집하는 최적의 방안이라 판단하였습니다.
이에 크라우드 소싱 방법을 이용하여 많은 사람들이 영수증 수집에 참여할 수 있도록 하였고,
SNS 및 홈페이지를 이용하여 프로젝트를 홍보하여 원하는 목표량을 빠른 시간 내에 수집할 수 있었습니다.
<영수증 사진 수집>
또한 다양한 형태의 영수증을 수집하기 위하여 영수증 5가지로 분류했습니다.
신용(체크)카드 결제 영수증을 '스캔본, 촬영본, 택시 요금 결제 영수증, 온라인 결제 영수증 스캔본, 촬영본으로 나누어 수집을 진행했고,
결과적으로 고객사에서는 다양한 종류의 영수증을 원하는 양만큼 빠른 시일 내에 수집할 수 있었습니다.
영수증 수집이 완료된 후, 가공을 진행하였습니다.
종이 영수증 촬영 및 스캔본이기에 휘어진 글자들을 가공하는 것에 대한 어려움이 있었습니다.
이에 데이터메이커에서는 최적화된 툴을 개발했습니다.
툴을 개발하는 과정에서 지속적인 소통을 통하여 고객사가 원하는 방향으로 데이터 가공을 진행할 수 있어 만족스러운운 결과물을 얻을 수 있었습니다.
<개발된 툴을 사용하여 가공하는 작업자>
작업자 선발
교육 및 테스트를 통하여 작업자를 선발하였습니다.
영수증 내의 글자를 누락없이 작업해야 했기에, 꼼꼼함과 섬세함에 중점을 두고 작업자를 선발했습니다.
선발된 작업자들이 한 작업물을 검수 후, 프로젝트에 대한 이해도가 높고 가공 실력이 뛰어난 작업자들을 선별하여 검수를 진행하였습니다.
검수자가 검수를 한 후, 최종 승인권자인 PM이 3차 검수를 함으로써 조금 더 정확도 높은 가공을 진행 할 수 있었습니다.
데이터메이커와 함께 하시려면,
저희 데이터메이커는 글로벌 데이터 가공 플랫폼입니다.
높은 보안을 갖춘 환경 속에서 작업한 우수한 품질의 학습 데이터를 업계 최저 가격에 제공합니다.
저희는 진심을 담아 고객사에게 최고의 품질의 데이터로 돌려드립니다.