게티이미지코리아 | Amazon Bedrock 기반 똑똑한 자연어 이미지 검색 시스템 구축

핵심 내용 요약 (Key Point)


국내 최대 규모 1억 9천만 개 콘텐츠 보유 게티이미지코리아가 Amazon Bedrock Claude와 Titan Multimodal 모델을 활용하여, 자연어 기반 직관적 이미지 검색을 구현하고 추론 비용 50% 절감을 달성했습니다.



회사 소개 (The Client)


게티이미지코리아는 국내 최대 규모인 1억 9천만 개 이상의 콘텐츠를 게티이미지코리아와 게티이미지뱅크를 통해 서비스하는 디지털 콘텐츠 업계의 거대한 보물창고예요.


1. 전 세계 크리에이티브 콘텐츠의 허브

대한민국 및 세계 곳곳의 크리에이티브 이미지, 보도·출판용 사진, 동영상, 음원들이 매일 신규 업데이트되고 있어요. 광고, 홍보, 웹, 출판, 방송 등 다양한 분야에 활용되는 크리에이티브한 사진, 일러스트는 물론 전 세계 유명화가들의 대표작품과 희귀 작품, 현대 작가의 작품들까지 보유하고 있습니다.


2. 차별화된 사용자 경험의 선구자

단순한 한글 번역 검색이 아닌 시멘틱 기반의 맞춤 검색 지원, 24시간 무료 시안 다운로드 서비스, 실시간 메신저 상담 및 이미지 추천 서비스 등 고객편의를 위한 다양한 서비스로 차별화된 사용자 경험을 구현하고 있어요.


3. 10만 여명 고객의 든든한 파트너

광고대행사, 프로덕션, 웹에이전시, 기업, 관공서에 이르는 10만 여명의 고객에게 광고콘텐츠를 공급하며 광고콘텐츠 시장의 선두 업체로서 입지를 확고히 하고 있어요. 글로벌 표준과 로컬 니즈를 모두 충족하는 종합 솔루션을 제공합니다!


 

도전 과제 (The Challenge)


1. 키워드에서 자연어로, 검색의 대변혁 필요

게티이미지코리아는 기존의 키워드 중심 검색 방식에서 벗어나 자연어 기반의 이미지 검색 서비스로 고도화해야 하는 변곡점에 서 있었어요. 디자이너와 콘텐츠 창작자들이 머릿속에 떠오르는 이미지를 자연스러운 문장으로 표현하여 검색하고 싶다는 요구가 폭발적으로 증가하고 있었죠.


2. CLIP 모델의 아쉬운 한계

초기에 CLIP 모델을 활용한 검색 시스템을 도입했지만, 촬영 기법, 분위기, 감정적 톤앤매너 등 이미지의 세부적인 특징을 정확하게 인식하는 데는 큰 벽이 있었어요. 특히 전문적인 사진 촬영 기법이나 미묘한 색감 차이, 조명 효과 등 크리에이티브 업계에서 중요하게 여기는 세밀한 요소들을 구분하기가 바늘구멍 통과하기처럼 어려웠어요.


3. 1억 9천만 건 데이터의 압도적 규모

가장 큰 도전 과제는 1억 9천만 건이 넘는 방대한 이미지 데이터베이스에 대해 자동으로 정확한 메타데이터를 생성하면서도 비용 효율적인 검색 시스템을 구축하는 것이었어요. 수억 건의 이미지 처리에는 막대한 컴퓨팅 리소스와 비용이 필요하지만, 동시에 검색 품질과 속도를 보장해야 하는 상충되는 요구사항을 해결해야 했습니다.


4. 실시간 성능과 비용 효율성의 딜레마

대규모 데이터 처리와 실시간 검색 성능을 동시에 만족시키는 것이 미션 임파서블처럼 어려운 상황이었어요.


 

해결 방안 (The Solution)


1. 자연어로 표현하는 이미지의 모든 것

이 시스템은 이미지의 구성 요소, 촬영 기법, 분위기, 색감 등을 자연어로 정확하게 기술하여 사용자들이 머릿속에 그리는 이미지를 더욱 정확하게 찾을 수 있도록 지원해요!


2. Amazon Titan Multimodal로 검색 품질 대혁신

검색 품질의 근본적 향상을 위해 Amazon Titan Multimodal Embedding G1 모델을 도입했어요. 이 모델은 텍스트와 이미지 간의 관계를 효과적으로 표현할 수 있어서, 기존 CLIP 모델의 한계였던 세부적인 특징 인식 문제를 크게 개선했어요.


3. 크리에이티브 전문가들의 까다로운 요구까지

특히 전문적인 사진 촬영 기법이나 미묘한 감정적 톤, 예술적 스타일 등을 더욱 정밀하게 구분할 수 있게 되어 크리에이티브 전문가들의 까다로운 요구사항을 완벽하게 충족할 수 있게 되었어요!


4. 벡터 양자화와 OpenSearch로 비용 혁신

2억 장 이미지 데이터베이스에 벡터 양자화 기법을 적용하고, OpenSearch의 디스크 기반 모드를 활용하여 메모리 사용량을 최적화하면서도 대용량 검색 시스템을 비용 효율적으로 구현했어요.


5. OpenSearch kNN으로 완벽한 검색 경험

OpenSearch kNN 알고리즘을 활용한 유사도 기반 검색 시스템을 구축하여 사용자 질의에 대한 정확도와 관련성을 대폭 개선했어요. 빠른 검색 속도를 보장하면서도 사용자의 의도를 정확히 파악하여 가장 적합한 이미지를 상위에 노출시킬 수 있게 되었습니다!


 

성과 및 결과 (The Result)


1. 자연어 검색의 완벽한 구현

Amazon Bedrock Titan Multimodal 모델 기반의 비용 효율적 이미지 임베딩 솔루션 도입을 통해 복잡한 매칭 알고리즘을 별도로 개발할 필요 없이 자연어 검색 기능을 성공적으로 구현할 수 있었어요!


2. "따뜻한 분위기의 카페에서..." 같은 자연스러운 검색

이제 사용자들이 "따뜻한 분위기의 카페에서 노트북으로 작업하는 사람" 같은 자연스러운 문장으로 검색할 수 있게 되어, 기존의 키워드 조합 방식보다 훨씬 직관적이고 정확한 검색 경험을 제공할 수 있게 되었어요!


3. Batch Inference로 50% 비용 절감의 기적

2억 장 이미지 데이터 처리에 Batch Inference 방식을 도입하여 처리 시간을 대폭 단축하고 추론 비용을 50% 절감하는 획기적인 성과를 달성했어요! 이는 대규모 이미지 데이터베이스를 지속적으로 업데이트하고 개선할 수 있는 경제적 기반을 마련했습니다.


 cfa6e21a8bedb.jpeg