Project Review

위기 상황 음성인식 및 대응을 위한 인공지능 솔루션

프로젝트 소개 

위기 상황 발생 시 핫라인(신고센터)은 생명줄과 같은 역할을 합니다. 신고자는 핫라인을 통해 도움을 요청하고 상황을 보고하지만, 상황적 혼란, 부적절한 정보,
언어 장벽 등으로 인해 어려움을 겪기도 합니다.

특히 위기 상황에서는 전화량 급증으로 인해 문제가 더욱 악화됩니다. 핫라인 담당자는 과도한 전화량으로 인해 여러 보고를 동시에 처리하기 어려워지고, 이는
대응 지연으로 이어져 심각한 결과를 초래할 수 있습니다.

따라서 위기 상황에서 핫라인 대응의 효율성과 효과를 높이는 솔루션이 필요합니다.

인공지능 기반 솔루션은 신고 프로세스를 자동화하고 간소화하여 복잡한 상황에서도 신속하고 정확한 대응하게 하여 핫라인의 효율성을 높일 수 있습니다.

 

 

고객사의 Problem

고객사는 112 신고 문자 내용을 기반으로 위기 상황 판단 시스템 개발하고자 하였고, 이를 위한 데이터셋 구축이 필요하였습니다.
위기 상황 속에서도 정확하게 신고자 음성을 인식하고 분석하여 신속한 대응이 가능하도록, 다양한 유형의 상황을 설계하고 정확한 정보 수집을 위해
다양한 유형의 발화를 포함하는 데이터가 필요하였습니다.

데이터메이커는 데이터 분석 및 활용성을 높이기 위해서 각 발화에 위기 유형, 긴급 수준, 사용된 언어 등을 태그하여 발화문 데이터셋을 구축하였습니다.

 

데이터메이커의 Solution

위기 상황 속에서도 정확하게 신고자 음성을 분석하여 신속한 대응이 가능한 솔루션 개발을 위해 다음과 같은 목표를 설정하였습니다.

데이터 정제

112 신고문자 내용을 토대로 코드별로 인덱스를 매칭하여 메타데이터를 추출하였습니다.

신고 문자 분류별(접수번호/신고번호/신고내용/코드) 표준 질문 리스트를 매칭합니다.

112 신고문자 내용을 토대로 신고전화 발화문 데이터셋 구축

신고 문자 코드 별로 index를 매칭하여 메타데이터로 저장하여, 신고문 분류별로 표준 질문 리스트를 매칭합니다.

  1. 작업자 발화문 작성 기준

    작업자는 신고 문자 내용을 확인하여 가이드라인에 따라 대화문 형식의 발화문을 작성하였습니다.

    1. ‘네, 112 입니다’의 접수자의 대화를 시작으로 신고자간의 질문과 답변 형식을 작성하고, 마지막은
      ‘네, 곧 출동하겠습니다.’ 혹은 ‘경찰관이 출동하겠습니다.’로 대화를 마무리 하도록 합니다.

    2. 대화문은 접수자의 질문은 3개 이상 포함하여, 최소 8개의 문장으로 대화가 진행되어야 합니다.

    3. 단답형은 지양하며, 대화를 잘 이끌어갈 수 있도록 구체적인 답변을 작성하여 다양한 상화의 발화문을 작성합니다.

  2. 라벨링 생성 상세 규칙

    효율적이고 고퀄리티의 데이터셋을 구축하기 위해 라벨링 규칙을 설계하였습니다.

    1. 줄임말, 비속어의 빈번한 사용 금지
    2. 기호 사용 여부 - 마침표, 물음표, 느낌표 등 사용하지 않아도 무방함
    3. 사투리, 추임새, 의성어 등 제외 - 표준어에 가깝게 진행
    4. 위치정보 - 주변 대표 도로, 교차로 및 건물을 활용 또는 주변 지역 이름이나 주소 설명
    5. 필수질문 유형 특성에 따라 접수자의 질문 유형이 유사해도 무관
    6. 대화문 끝의 ‘접미사’의 다양성
  3. 대화 자동 생성기

    작업자가 다양한 상황을 연출할 수 있도록, 대화문은 접수자의 질문을 직접 작성하거나 ‘대화 생성 기능’ 기능을 활용할 수 있습니다.
    대화 생성기 기능은 데이터메이커 어노테이터에 탑재된 기능은 단축키(Ctrl + A)를 통해 상황에 적합한 질문 형태를 제공하여
    작업자가 답변 작성시 느껴질 수 있는 피로도를 줄이고 다양한 상황 연출을 가능하게 하였습니다.

    자동 생성된 대화문은 교차 검수를 통해 맥락의 접합성을 확인하여 품질을 높입니다.

  4. 대표 발화문 선택

    작성된 대화문에서 상황을 나타내는 대표적인 문장을 대표 발화문으로 태깅하여 맥락 파악을 용이하게 했습니다.
    작업자는 상황에 따라 1개 이상의 직물을 선택하여 ‘접수분류’에 가장 부합하는 발화문을 선택할 수 있습니다.

    대표 발화문이 없다고 판단되면 선택 없이 제출하며, 기본 값으로 (O, X)설정이 가능하여 작업 효율성을 높였습니다.

  5. LLM 모델 활용

    작업자가 모든 대화를 직접 생성하는 것은 비효율적인 동시에 다양한 데이터 확보에도 어려움이 있을 수 있어,
    LLM 모델을 학습시킨 신고 대화 전처리 모델을 라벨링 툴에 탑재하였습니다.

    해당 모델은 단일 질문에 대한 응답을 할 수 있는 챗봇 형식으로 세팅되어, 작업자가 작성한 질문에 대해 답변을 출력하였고,
    작업자는 다시 해당 답변을 수정하여 최종 대화 데이터를 구축하였습니다.

    모델은 작업이 진행되는 동안 수정이 완료된 정답데이터로, 지속적으로 학습시켜 최종적으로는 적절한 문장 응답률 92% 이상을 달성하였습니다.

프로젝트를 마치며

이번 프로젝트를 통하여 위기 상황 속 정보 수집과 대규모 발화문 데이터의 다양성 확보를 위한 여러 방법론을 데이터 구축에 활용할 수 있었습니다.

이와 같이 특정 상황을 반영하는 데이터 구축과 모델 학습에 실질적인 기여를 할 수 있는 ‘데이터 중심의 솔루션’ 개발 및 제공으로, 위기 상황에
신속한 대응을 가능하게 하고, 사회 안전 확보에 활용할 수 있는 기술 개발에 참여하겠습니다.

Get Started Today
with datamaker

데이터메이커 시냅스를 회사에 도입하고 싶으시다면,
아래 의뢰하기 버튼을 눌러주세요!

Synapse 문의하기