상세페이지 자동 생성 AI 에디터
프로젝트 소개
온라인 환경이 발전하면서 소비자들은 다양한 상품을 손쉽게 비교하고 구매할 수 있는 환경을 누리고 있습니다.
이러한 변화는 소비자들에게 더 많은 선택지를 제공하지만, 판매자들에게는 경쟁 속에서 상품을 돋보이게 할 수 있는 전략을 요구합니다.
상품의 가치를 극대화하는 양질의 상세페이지는 단순한 정보 전달을 넘어, 소비자들의 눈길을 사로잡고 구매 결정을 이끄는 방법 중 하나입니다.
고객이 필요로 하는 정보를 명확히 전달하면서도, 제품의 매력을 시각적, 효과적으로 표현하는 상세페이지는 곧 상품의 경쟁력과 직결됩니다.
판매자들이 온라인 시장에서 더 많은 소비자들에게 상품을 노출시키고, 효율적인 판매 전략을 수립할 수 있도록 돕기 위해 디자인, 카피라이팅, 데이터 기반 최적화 요소를 통합한 상세페이지 생성 모델은 어떤 데이터를 학습해야 할까요?
고객사의 Problem
앞서 살펴본 바와 같이, 이커머스 시장은 치열한 경쟁 속에서 차별화된 전략이 필요합니다.
이러한 가운데 고객사는 AI 기반 맞춤형 자동 상품 상세페이지 생성 서비스 고도화를 위한 데이터 구축 프로젝트를 진행했습니다.
이 프로젝트는 쇼핑몰 이미지 데이터를 기반으로 이미지 내 텍스트 전사와 이미지 색상 정보를 추출하여, AI 모델이 상품의 특징과 색상을 정확하게 인식하고 이에 맞는 상품 설명과 이미지 배치를 자동으로 생성하는 것을 목표로 하였습니다.
특히, 쇼핑몰 내 개별 상품에 대한 상세 페이지에서 이미지 내 텍스트 전사와 이미지 색상 정보를 추출하는 작업은 AI 모델이 상품의 특징과 색상을 정확하게 분석하고, 상품 설명과 이미지 배치를 자동으로 생성하는 데 필수적인 요소였습니다.
데이터메이커의 Solution
텍스트 데이터
먼저, 고객사에서 제공한 개별 상품의 상세페이지에 명시된 텍스트를 모두 전사했습니다.
줄바꿈(\n 표기)을 포함한 텍스트 어법을 준수하여 원본의 구조를 유지하고, 상세 페이지를 구성하는 개별 텍스트의 레이아웃 구조를 함께 태깅 하여 모델 학습 측면에서
불필요한 데이터는 전사 범위에서 제외하여 상품 정보의 정확성을 준수하였습니다.
이미지 데이터
개별 상품에 대한 대표 이미지 및 상세 이미지와 그 밖에 별도 부연 설명을 위해 활용된 이미지 데이터를 구분하기 위하여 각 이미지의 목적과 기능, 세부 캡션 데이터를 함께 구축하였습니다.
데이터 정제 및 가이드라인 수립
식별이 애매한 텍스트, 상품과 무관한 정보(모델 정보, 판매 업체 정보, 제조 연월 등)는 작업 대상에서 제외하도록 하였습니다.
카피라이팅 태깅 시스템
문서 맥락 세분화
텍스트의 태깅을 위해 속성값을 세분화하였습니다.
단순 정보 전달을 위한 설명글과 시각적인 효과를 고려한 디자인 그래픽 등 페이지 내 영역 및 순서에 따라, 구성하는 텍스트와 이미지를 고유 스타일에 따라 구분하였으며 이를 통해 데이터 전체 포맷 구성을 상품 상세페이지의 맥락을 이해할 수 있도록 설계하였습니다.
상품 정보 전달 카테고리 태깅
상품의 정보를 전달하는 텍스트 데이터에 대하여는 상세 클래스 태깅을 통해 데이터 활용도를 높였습니다.
1차로 해당 텍스트의 의미적 내용을 기준으로 상품의 특징과 상세 설명이 표현된 브랜드, 상품명, 기타, 정보(제품 상세, 색상, 사이즈, 소재) 등으로 카테고리를 분류합니다.
2차로 텍스트의 문법적 스타일을 기준으로 카피 유형 클래스를 명사형, 형용사형, 문장형으로 구분하여 분류합니다.
색상 인식을 위한 이미지 태깅
색상 분류 체계
총 42개의 색상 표를 기준으로 개별 상품의 색상 인식을 위한 데이터셋을 구성하였습니다.
색상의 명도, 밝기에 따른 주관적 차이를 최소화하기 위해 고객사와 긴밀히 협의하여 기준을 명확히 하였습니다.
대표/보조 색상 태깅
핵심이 되는 대표 색상(전체의 65% 이상 차지)은 필수적으로 1개 이상 태깅하였습니다.
그 외 보조 색상 및 특징(줄무늬, 도트 등 패턴)도 함께 태깅하여, 총 색상 태그 수가 3개를 넘기지 않도록 제한하였습니다.
분류된 색상은 이미지 한 장 당 할당된 정보를 산출 후 교차 검수를 진행하도록 하여 색상의 정확도를 높였습니다.
작업 관리를 위한 플랫폼 기능 개선
데이터 처리의 효율성과 정확성을 높이기 위해 전용 작업 플랫폼을 제공하였습니다.
무수히 많은 색상 카테고리를 관리해야 하는 프로젝트 특성을 고려하여 342가지의 색상을 빠르고 정확하게 확인이 가능하도록 속성 패널에 배치하였습니다.
카테고리의 직관적인 인터페이스를 구현하여 라벨링 작업 효율성을 높였습니다.
프로젝트를 마치며
이번 프로젝트는 데이터셋 구축뿐만 아니라 AI 기술을 활용하여 누구나 쉽게 활용할 수 있는 서비스 개발의 기반을 마련했다는 점에서 큰 의미가 있었습니다.
의류 이미지와 텍스트 데이터를 기반으로 구축된 고품질 데이터셋은 AI 모델 학습에 있어 핵심적인 역할을 수행하며, 이를 통해 고객사는 비전문가도 손쉽게 활용할 수 있는 자동 상품 상세페이지 생성 시스템을 구축할 수 있게 되었습니다.
상품 정보 데이터셋의 구축은 패션, 가구, 식품 등 다양한 상품 카테고리에 적용하여 AI 기반 상품 설명 생성 시스템을 구축할 수 있습니다. 또한, 이미지 인식 기술을
활용하여 시각 검색, 스타일 추천 등 다양한 서비스 개발에도 활용될 수 있습니다.
이번 프로젝트를 통해 축적된 데이터셋 구축 노하우는 다양한 분야의 디지털 전환에 기여할 것으로 기대됩니다.