원문정보
A Study of Effective Prompt Design Strategies for Generating Late Joseon Minhwa Images Using Generative AI - Exploring Keyword Mapping and Prompt Dictionary Construction Potential
초록
영어
This study proposes a systematic prompt design strategy that relies on generative AI to effectively reproduce the distinctive formative elements of Minhwa, Korean folk painting from the late Joseon period, and explores the potential of a keyword-based prompt dictionary. Although current text-to-image models such as Stable Diffusion demonstrate strong image generation capabilities, their predominantly Western-centric training data limits the accurate reproduction of Minhwa’s unique humor, exaggerated forms, symbolic motifs, colors, and compositions. To overcome these limitations, 482 Minhwa artworks were analyzed and visual keywords were systematically extracted, with then conducted categorization by form, composition, technique, and atmosphere. Extracted keywords were translated into AI-compatible terms and organized into a structured prompt dictionary, supported by detailed guidelines including synonym expansion, negative prompts, and weighting adjustments. Experiments conducted with Stable Diffusion on representative Minhwa subjects, specifically tiger and peony, compared general prompts against proposed keyword-based prompts structured as simple listings and descriptive sentences. Quantitative evaluation metrics, specifically FID, IS, and CLIP Score, demonstrated that descriptive, keyword-based prompts significantly enhanced alignment with the original Minhwa distributions and improved the reflection of prompt intentions. This research emphasizes the importance of systematic keyword analysis and structured prompt dictionaries for accurately reproducing cultural art styles using AI, providing foundational methods for future traditional cultural content creation.
한국어
본 연구는 생성형 인공지능(AI)을 활용하여 조선 후기 민화의 고유한 조형 요소를 효과적으로 재현하기 위한 체계적인 프롬 프트 설계 전략을 탐색하고, 키워드 기반의 프롬프트 사전 구축 가능성을 제시한다. Stable Diffusion과 같은 최신 텍스트-이 미지 생성 모델은 우수한 이미지 생성 능력을 보여주나, 기존 프롬프트 방식은 서구 미술 중심으로 개발되어 민화 특유의 해 학성, 과장된 형태, 상징적 도상, 색채 및 구도 등을 정교하게 제어하는 데 한계가 있다. 이러한 문제를 해결하기 위해 본 연 구는 조선 후기 민화 작품 482점을 형태, 구도, 표현 기법, 분위기의 네 가지 조형 요소로 분석하여 핵심 키워드를 추출하고, 이를 AI 모델이 이해할 수 있는 언어로 변환하는 키워드 매핑 방법론을 설계하였다. 이렇게 추출된 키워드는 카테고리, 핵심/ 세부 키워드, 프롬프트 예시, 참고 이미지 등을 포함하는 프롬프트 사전으로 체계화하였다. 사전을 통해 민화 특유의 조형성 을 효과적으로 표현할 수 있도록 동의어 확장, 부정 프롬프트 설정, 가중치 조정과 같은 상세한 매핑 규칙을 정립하고 구체적 인 사용 지침도 함께 마련하였다. 또한, 제안된 프롬프트 설계 전략의 유효성을 검증하기 위해 민화의 대표 소재인 호랑이와 모란을 대상으로 Stable Diffusion 기본 모델을 사용하여 프롬프트 유형(일반 vs. 제안 키워드)과 구조(단순 나열 vs. 서술형) 를 변수로 설정한 비교 실험을 수행하였다. 생성된 이미지는 FID, IS, CLIP Score와 같은 정량적 지표를 통해 원본 민화 이미 지와의 분포 유사성 및 프롬프트 반영도를 다각적으로 분석하였다. 실험 결과, 제안된 서술형 키워드 매핑 전략 기반 프롬프 트는 일반 프롬프트 대비 FID 점수를 통계적으로 유의미하게 감소시키고, CLIP Score를 향상시키는 등 원본 민화 이미지 분 포에 더욱 근접하고 프롬프트의 의도를 더 정확히 반영한 이미지를 생성하였다. 본 연구는 특정 문화권의 고유한 예술 스타일 을 AI로 재현하는 데 있어 체계적인 키워드 분석과 프롬프트 사전 구축이 필수적임을 보여주며, 향후 AI 기반 전통문화 콘텐 츠 생성 및 활용 연구의 기초 토대를 마련할 것으로 기대된다.
목차
국문초록
1. 서론
1.1. 연구의 배경 및 필요성
1.2. 연구 목적 및 문제 제기, 연구 질문
2. 이론적 배경
2.1. 생성형 AI와 텍스트 – 이미지 생성 모델
2.2. 프롬프트 엔지니어링과 예술 스타일 재현의 과제
2.3. 조선 후기 민화의 조형 요소 분석: 프롬프트 키워드 추출 관점
2.4. 키워드 매핑 및 텍스트-이미지 매핑 적용
3. 연구 방법론
3.1. 연구 프로세스
3.2. 민화 데이터셋 구축 및 분석
3.3. 키워드 추출, 매핑 규칙 정의 및 프롬프트 사전 구조 설계
3.4. 실험 설계 및 이미지 생성
3.5. 평가 방법
4. 연구 결과
4.1. 프롬프트 전략별 이미지 생성 결과
4.2. 평가 결과 및 비교 분석
4.3. AI 생성 이미지의 전통 예술 표현 정확도 종합 분석
5. 결론
참고문헌
