earticle

논문검색

Research Article

Improving Reliability and Consistency in Korean–Chinese Legal Translation : Terminology Control and Error Analysis in Neural Machine Translation

원문정보

한–중 법률 번역에서의 신뢰성과 일관성 향상 : 신경망 기계번역에서의 용어 통제와 오류 분석

Yanan Zhang, Gilja So

피인용수 : 0(자료제공 : 네이버학술정보)

초록

영어

Legal translation between Korean and Chinese poses unique challenges due to the complexity of legal terminology, strict requirements for consistency, and the scarcity of domain-specific bilingual resources. While recent advances in neural machine translation (NMT) have improved overall translation performance, issues of terminology reliability and error distribution remain unresolved, limiting the practical applicability of such systems in legal contexts. This study proposes a terminology-aware translation framework that integrates a bilingual legal glossary into both the decoding and post-editing stages of an mBART-based NMT model. In addition, a comprehensive error analysis framework is introduced to classify and quantify common legal translation errors, including semantic inconsistency, grammatical inaccuracies, and terminological deviations. Experiments on a Korean–Chinese legal corpus demonstrate that the proposed approach not only enhances conventional evaluation metrics such as BLEU and TER, but also achieves higher terminology accuracy and consistency compared with baseline systems. These findings highlight the importance of domain-specific terminology control and systematic error analysis in improving the reliability of machine-assisted legal translation, thereby contributing to more trustworthy applications in judicial and legislative contexts.

한국어

한–중 법률 번역은 법률 용어의 복잡성, 일관성에 대한 엄격한 요구, 그리고 도메인 특화 이중언어 자원의 부족으로 인해 고유한 어려움을 가진다. 최근 신경망 기계번역(NMT)의 발전으로 전반적인 번역 성능은 향상되었으나, 용어의 신뢰성과 오류 분포 문제는 여전히 해결되지 않아 법률 분야에서의 실제 적용 가능성을 제한하고 있다. 본 연구는 mBART 기반 NMT 모델의 디코딩 단계와 사후편집 단계에 이중언어 법률 용어집을 통합하는 용어 인식 번역 프레임워크를 제안한다. 또한 의미 불일치, 문법 오류, 용어 일탈 등을 포함한 주요 법률 번역 오류를 분류하고 정량화하기 위한 종합적인 오류 분석 체계를 제시한다. 한–중 법률 코퍼스를 이용한 실험 결과, 제안된 방법은 BLEU 및 TER과 같은 기존 평가 지표를 향상시킬 뿐만 아니라, 기준 시스템에 비해 더 높은 용어 정확도와 일관성을 달성함을 보여준다. 이러한 결과는 도메인 특화 용어 통제와 체계적인 오류 분석이 기계 기반 법률 번역의 신뢰성을 향상시키는 데 핵심적임을 시사하며, 사법 및 입법 분야에서 보다 신뢰할 수 있는 활용을 가능하게 한다.

목차

요약
ABSTRACT
I. INTRODUCTION
II. Related Work
III. Methodology
1. Baseline NMT Model
2. Terminology Glossary Construction
3. Constrained Decoding
4. Post-editing and Terminology Checking
5. Error Analysis Framework
IV. Experiment and Results
1. Experimental Setup
2. Evaluation Metrics
3. Results on Translation Quality
4. Results on Terminology Accuracy
5. Error Distribution Analysis
6. Human Evaluation
7. Discussion of Results
V. Discussion
1. Practical Significance in Legal Translation
2. Contributions Beyond Conventional Metrics
3. Limitations of the Current Framework
4. Future Directions
5. Comparison with LLM-based Legal Translation
V. Conclusion
References

저자정보

  • Yanan Zhang 장아남. Department of Computer and Information Engineering, Youngsan University Yangsan-si
  • Gilja So 소길자. Department of Cyber Security, Youngsan University Yangsan-si

참고문헌

자료제공 : 네이버학술정보

    함께 이용한 논문

      ※ 기관로그인 시 무료 이용이 가능합니다.

      • 4,500원

      0개의 논문이 장바구니에 담겼습니다.