식물성장이야기

환경지속성을 향한 식물 생장 예측 데이터셋

식물성장

프로젝트 소개

마블의 아이언맨이 처음 개봉한 2008년까지만 하더라도, 주인공 토니 스타크의 AI 비서 자비스는 우리에게 영화 속에서나 등장할 법한 존재였습니다.
하지만 최근 온디바이스에 경량화된 LLM 모델을 활용하는 시도가 늘어나면서, 자비스와 같은 AI 어시스턴트의 등장은 실현 가능한 목표가 되었습니다.
AI 어시스턴트의 자연어 처리 능력은 최신 언어모델을 기반으로 하기 때문에, 사용자들은 자연스럽게 소통할 수 있게 되며, 개인의 사용 패턴을 학습하여 맞춤형 서비스를 제공함으로써 사용자의 편의성을 크게 개선할 수 있습니다.
이러한 발전은 일상 업무의 효율성을 높이고 정보 접근성을 향상시키는 데 큰 도움을 줄 것으로 예상됩니다.

식물성장

데이터메이커의 Solution

데이터 수집 정확한 식물 성장 예측 모델 개발을 위해 다양한 식물 종류의 고품질 이미지 데이터를 수집하였습니다.
고품질 카메라 장비를 설치하고 총 4만 장의 고해상도 식물 성장 이미지를 확보하기 위해서 각 이미지는 식물의 성장 과정을 정확하게 반영하도록 일정한 장소와 시간 간격으로 촬영되었습니다.
특히, 식물의 종류와 크기에 따라 촬영 간격을 차별화하여 (A종: 5분 간격, B종: 9분 간격) 더욱 정밀한 데이터를 확보하였습니다.
파일명 구성 예)식물명_Top or Side_연월일_저장시분초 수집된 이미지 데이터는 식물의 성장 단계별로 분류하고, 파일명 포맷을 표준화하여 관리하였습니다. 이를 통해 데이터의 체계적인 관리 및 활용이 가능하도록 하였습니다.
성장 시기별 식물 이미지 데이터셋 가공

  • 폴리곤 라벨링: 이미지 내 식물 개체를 정확하게 구분하기 위해 폴리곤 라벨링 기법을 적용하였습니다. 특히, 사이드뷰와 탑뷰 이미지에서 식물의 이파리를 정확하게 구분하고, 위아래 가장자리가 잘린 식물은 제외하여 객체의 형태를 명확하게 나타내도록 하였습니다.
  • 데이터메이커 시냅스 활용: 데이터메이커 시냅스의 폴리곤 가공 툴을 활용하여 효율적인 라벨링 작업을 수행하였습니다.
  • 기본 기능과 브러쉬 기능을 활용하여 복잡한 형태의 식물도 정확하게 라벨링 할 수 있도록 하였으며, 복수의 어노테이션을 선택하여 더하거나 빼기 기능을 추가하여 라벨링의 정확도를 높였습니다.
  • 라벨링 스페이스 내에서 확대 축소 기능과 폴리곤 브러쉬의 크기를 조절 기능을 활용하여 브러쉬로 작업한 영역의 외곽을 폴리곤 영역으로 생성하였습니다.
  • 선택된 객체에서 불필요한 부분이 생긴다면 폴리곤 영역을 중첩한 후 플랫폼 단축키를 활용하여 빼기 기능을 활용하여 객체 외곽의 정확성과 효율성을 높였습니다.

식물성장

라벨러 교육 및 가이드라인 제공

  • 겹치는 식물 일관성 유지: 겹치는 식물을 라벨링 할 때 일관성을 유지하도록 라벨러에게 세부 가이드라인을 제공하고 반복적인 교육을 진행했습니다.
  • 코너 케이스 관리: 작업 중 발생하는 다양한 코너 케이스에 대한 피드백을 제공하고, 가이드라인을 지속적으로 업데이트하여 라벨링 품질을 향상시켰습니다.
  • 효율적인 라벨링 기법: 연속된 데이터 그룹을 할당하여 폴리곤 복사 붙여넣기 기능(식물의 외곽선의 흐름을 유연하게 하기 위함)과 포인트 이동 기능을 활용하여 작업 효율성을 높였습니다. 또한, 작업 예시를 제공하고, 식물의 외곽을 완만하게 폴리곤 작업하도록 교육하여 라벨링 품질을 향상시켰습니다.
데이터 기반 AI 모델 개발
  • 딥러닝 모델 선정: 이미지 분류 및 객체 탐지에 특화된 딥러닝 모델을 선정하고, 고객사의 요구사항에 맞춰 모델 구조를 설계하였습니다.
  • 모델 학습: 구축된 고품질 데이터셋을 기반으로 모델을 학습시켜 식물의 성장 단계, 무게, 병해충 발생 가능성, 최적의 성장 환경 등을 예측할 수 있도록 하였습니다.
  • 성능 평가: 다양한 평가 지표를 활용하여 모델의 성능을 평가하고, 지속적인 개선을 통해 최적의 모델을 도출하였습니다.

프로젝트를 마치며

이번 프로젝트는 식물 성장 예측을 위한 객체 폴리곤 라벨링을 진행하였습니다.
자연물인 만큼 가이드라인 구축에 예측하지 못한 코너 케이스가 발생하였지만, 전문가와 고객사와의 의사소통을 통하여 라벨링의 가이드라인을 구축할 수 있었습니다.
라벨링의 기준과 가공 툴의 효율성을 위해서 기능에 대한 자세한 설명을 작업자에게 교육하여 다양한 방법의 라벨링으로 빠른 기간에 프로젝트를 수행할 수 있었습니다.

연관 아티클

가려진 객체 인식 자동화 솔루션

영상 내 가려진 객체에 대한 라벨링을 하여 데이터셋을 구축하였습니다.

건축 설계 DB 데이터셋 구축

건축 도면 OCR 데이터셋 구축

AI가 지키는 우범 사각지대

공공장소의 우범행위 인식 CCTV 데이터셋 구축

상세페이지 자동 생성 AI 에디터

이커머스 상세페이지의 텍스트 전사와 색상 분류 데이터셋을 구축하였습니다.

방대한 양의 정보 속에서 찾아내는 핵심 키워드

기사 전문 내 핵심 키워드에 대한 데이터를 가공하였습니다.

CCTV는 놓치지 않는 눈, 실시간 위협 인식 AI

위험 상황 즉각 대응을 위한 CCTV 영상 내의 객체를 라벨링하였습니다.