Project Review

음성 신고 처리 시스템 학습용 데이터 구축

프로젝트 소개

음성 인식 및 이해 기술의 정확도가 높아짐에 따라 음성 AI 기반 고객 응대 자동화 도입이 활발하게 이루어지고 있으며, 이는 시간 단축과 효율성 증대를 통해

신고 센터 관계자와 신고자에게 안전과 편리함을 제공할 것으로 기대됩니다.

이러한 서비스의 사용성을 높이기 위해서는 정확한 정보 데이터 확보와 인공지능 학습 강화를 통해 음성 인식 정확도를 높이는 노력이 필요합니다.

 

 

고객사의 Problem

고객사는 이러한 문제를 해결하기 위해 AI 기술을 적용하여 119 종합상황실 신고 접수 음성을 텍스트로 변환하는 인공지능 기반 대화형 AI 서비스 학습용 데이터 구축이 필요했습니다.

AI시스템은 신고 폭주 시 통화 대기 중인 신고 내용을 듣고 텍스트로 변환하여 핵심 키워드를 분석하고, 음성인식 결과를 바탕으로 접수자에게 상황별 질문을 추천하며,

소방 출동대 자동 편성 및 접수요원과 출동 소방관에게 표준작업 절차(SOP)를 제공합니다.

또한, 긴급 신고 선별 및 신속한 대응을 위한 콜백 서비스 개발을 통해 자동 콜백으로 신고자에게 필요한 정보 제공 및 안내, 긴급 상황 해결 지침 및 도움을 제공하고자 하였습니다.

데이터메이커는 119 신고 빅데이터 분석을 통해 신속하고 정확한 초동 대처가 가능한 데이터 구축을 설계하여 높은 음성 인식률을 확보하였습니다.

 

데이터메이커의 Solution

데이터 전처리

원천데이터는 고객사가 보유한 신고 음성(MP3)으로, 해당 데이터를 재난 종류별로 구급, 화재, 구조, 기타 등으로 구분하였습니다.

모든 음성을 인력기반으로 분류하는 것은 비효율적이므로, AI 모델을 기반으로 통화 음성의 대화를 요약하고 요약된 주제를 다시 분류 기준대로 자동 분류하는

전처리를 통해 음성 구분 과정을 효율적으로 진행할 수 있었습니다.

모델의 1차 구분 결과를 사람이 모니터링 하면서, 부정확한 결과를 보완하는 과정을 통해 전체 음성 데이터의 분류 정확도를 확보할 수 있었고, 전체 데이터의

분포 통계 등의 분석 정보들도 확보할 수 있었습니다.

음성 파일은 실제 음성 신고의 긴박한 상황(야외/시끄러운 환경)을 반영하여 유선 전화망의 음질인 8kHz로 샘플링하여 WAV 파일 형식으로 변환하였습니다.

 

 

데이터 구축

1. 음성 전사 가공

  • 신고접수 통화 내용은 외부 전사기 툴을 활용하여 음성이 나오는 구간을 분할 처리하고, 분할된 구간에 전사 작업을 수행하였습니다.
  • 음성 구간 전사 작업은 전사 규칙 기준을 구축하여 통일성을 유지하였습니다.

2. 데이터 검수

  • 1차 검수 : 전사 오류 파일, 오류 단어, 오류 위치를 출력하여 검수자가 효율적으로 검수를 진행할 수 있도록 하였습니다.

  • 2차 검수 : 외부 검증 기관 모델 활용하여 전사 산출물의 음절 단위 인식률을 평가 하였습니다.

  • 문장별 음절 단위 인식률 출력을 위한 TEXT 형식은 숫자, 영문, 기호가 없는 한글만을 출력하고,

    마침표, 느낌표, 물음표 등 문장 부호를 포함하지 않습니다.

작업자 구성

작업 인력은 속기사 자격 보유자로 구성되어 기본적인 맞춤법, 일정 수준 이상의 타자 속도, 전사 규칙에 대한 높은 이해도를 갖추고 있습니다.

전사 작업을 수행하기 위한 툴 사용이 미숙한 작업자들을 위해서 지속적인 피드백이 가능한 메신저를 구축하고, 재난 분류를 위한 소방 전문 교육은 소방 인력이

직접 진행하여 전문성을 강화했습니다.

또한, 작업자들의 원활한 업무 수행을 위해 작업자들이 상주하며 작업할 수 있는 공간과 속기 전문 기기를 제공하여 업무 효율성을 높였습니다.

 

프로젝트를 마치며

인공지능 기반 119 신고 접수 시스템 개발을 위한 데이터를 구축하였습니다.

119 신고 음성 데이터를 수집, 전처리, 구축하여 AI 모델 학습에 필요한 기반을 마련하고, 데이터메이커가 보유한 STT 기술을 황용하여 음성 전사 가공 및 검수 과정을

더욱 정교하고 정확하게 수행할 수 있었습니다.

이를 통해 AI 모델의 정확도를 높이고 신뢰할 수 있는 데이터 기반을 구축하여, 향후 데이터 구축 지속, AI 모델 개발 및 학습, 시스템 실증 및 개선을 통하여 효율적인 음성 시스템 구축을 제공하겠습니다.

Get Started Today
with datamaker

데이터메이커 시냅스를 회사에 도입하고 싶으시다면,
아래 의뢰하기 버튼을 눌러주세요!

Synapse 문의하기