원문정보
A Process for Developing a Traffic Safety Domain Specific Language Model Using Fine-Tuning and RAG
초록
영어
The field of traffic safety requires policies to be established and implemented based on clear evidence and real-world cases, which limits the applicability of general-purpose large language models (LLMs). This study investigates the feasibility and applicability of domain-specific LLMs for traffic safety and proposes a systematic development process. To this end, a small language model (SLM) was developed using fine-tuning and retrieval-augmented generation (RAG) techniques to generate countermeasures based on traffic accident types and related information. The model’s responses were qualitatively evaluated through actual improvement project cases. Key considerations derived from this process include the structuring of training data, incorporation of multidimensional contextual information, and establishment of a rigorous evaluation framework. This study provides both academic and practical implications by presenting the direction and foundation for developing traffic safety domain-specific SLMs.
한국어
교통안전 분야는 명확한 판단 근거와 실제 사례를 기반으로 정책이 수립되고 시행되는 특 성이 있다. 그렇기에 범용 대규모 언어모델(large language model, LLM)을 활용하는 데는 한계 가 존재한다. 따라서, 본 연구는 교통안전 분야에 특화된 LLM의 구축 가능성과 활용성을 실증 적으로 검토하고, 이를 위한 체계적인 개발 프로세스를 제시하고자 한다. 이에 따라 본 연구에 서는 교통사고 유형과 관련 정보를 기반으로 교통안전대응책을 제시할 수 있도록 파인튜닝 (fine-tuning)과 검색 증강 생성(retrieval-augmented generation) 기법을 적용한 소규모 언어모델 (small language model, SLM)을 개발하고, 실제 개선사업 사례를 통해 모델의 응답을 정성적으 로 평가하였다. 이 과정에서 학습 데이터의 구조화, 다차원적 맥락 정보의 반영, 그리고 정교한 평가체계의 필요성이 핵심 고려사항으로 도출되었으며, 본 연구는 교통안전 분야의 특성과 실무 환경을 반영한 SLM 구축의 방향성과 기반을 마련했다는 점에서 학술적·실무적 의의가 있다.
목차
ABSTRACT
Ⅰ. 서론
1. 연구의 배경 및 목적
2. 연구의 범위 및 절차
Ⅱ. 관련 이론 및 연구 고찰
1. 관련 이론 고찰
2. 관련 연구 고찰
3. 연구의 차별성
Ⅲ. 교통안전 분야 특화 SLM 개발 및 평가
1. 언어모델의 선정
2. 파인튜닝 및 RAG 기법 선정
3. 파인튜닝 및 RAG 데이터 세트 구축
4. 파인튜닝 및 RAG 기법 적용
5. 개별 모델 답변 예시 및 사례 기반 평가
6. 소결
Ⅳ. 교통안전 분야 특화 언어모델 구축 프로세스 제시
1. 교통안전 분야 특화 언어모델 구축 프로세스 제시
2. 교통안전 분야 특화 언어모델 구축 고려사항
Ⅴ. 결론 및 향후 연구과제
ACKNOWLEDGMENTS
REFERENCES
