earticle

논문검색

임베딩 기반 유사도 측정을 통한 수입 물품의 HS 코드 추천 시스템

원문정보

HS Code Recommendation System for Imported Goods Based on Embedding-Based Similarity Measurement

김형욱, 김건우, 최근호

피인용수 : 0(자료제공 : 네이버학술정보)

초록

영어

Recently, AI technologies, especially large language models (LLMs) like ChatGPT, have significantly transformed human-machine interactions. These AI models understand natural language, process diverse data formats, and execute commands. Meanwhile, the rapid expansion of e-commerce and international trade has increased the workload of customs authorities, making accurate HS code classification crucial for fair tariff imposition. However, manual classification requires expert knowledge, leading to inefficiencies in time and cost. This study proposes an automatic HS code recommendation system using SBERT, an LLM-based embedding model, to measure similarity between source data (laws, explanatory notes) and test data without additional training. Comparative analyses were conducted using real-world cases. By applying different SBERT models, this study evaluates accuracy based on model and data characteristics. It addresses challenges such as continuous training requirements and class-specific constraints, offering methodologies to enhance accuracy. The findings are expected to improve customs administration efficiency by supporting AI-driven HS code classification and search systems.

한국어

최근 AI 기술, 특히 ChatGPT와 같은 대규모 언어 모델(LLM)은 인간과 기계 간 상호작용에 큰 변화를 가져왔다. 이러한 AI 모델은 자연어를 이해하고 다양한 데이터 형식을 처리하며 명령을 실행할 수 있다. 한편, 전자상거래와 국제 무역의 급속한 확장으로 인해 세관 당국의 업무량이 증가하면서 정확한 HS 코드 분류는 공정한 관세 부과를 위해 필수적이다. 하지만 수작업 분류는 전문가의 지식이 필요하여 시간과 비용 측면에서 비효율적일 수 있다. 본 연구에서는 SBERT을 활용한 자동 HS 코드 추천 시스템을 제안하였다. SBERT 기반 임베딩을 통해 법령 및 해설서 등 원천 데이터와 테스트 데이터 간 유사도를 측정하여 추가 학습 없이 HS 코드를 추천하는 방식이다. 또한, 실제 사례 데이터를 활용한 비교 분석을 수행하였다. 다양한 SBERT 모델을 적용하여 모델 및 데이터 특성에 따른 정확도를 평가하고, 기존 연구에서 제기된 지속적인 학습 요구와 클래스별 제약 문제를 해결할 방안을 제시하였다. 본 연구의 결과는 AI 기반 HS 코드 분류 및 검색 시스템에 적용되어 세관 행정 업무의 효율성을 높이는 데 기여할 것으로 기대된다.

목차

요약
Ⅰ. 서론
Ⅱ. 관련 연구
2.1 HS코드 자동 추천 시스템
2.2 SBERT(Sentence-BERT)
2.3 선행 연구와의 차별성
Ⅲ. 연구방법
3.1 전체 분석 절차
3.2 데이터 및 전처리
3.3 모델 선정
3.4 추천 알고리즘
Ⅳ. 실험결과
4.1 호 단일추천 결과
4.2 류 추천 기반 호 추천 결과
4.3 키워드 기반 호 추천 결과
Ⅴ. 결론
참고문헌
Abstract

저자정보

  • 김형욱 Hyungwook Kim. ㈜데이터월드 부장
  • 김건우 Gunwoo Kim. 국립한밭대학교 융합경영학과 교수
  • 최근호 Keunho Choi. 국립한밭대학교 융합경영학과 부교수

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 기관로그인 시 무료 이용이 가능합니다.

      • 5,500원

      0개의 논문이 장바구니에 담겼습니다.