

기획논문 : AI(인공지능)시대의 인문학

생성형 인공지능 발전과 언어 다양성 유지를 위한 도전과 과제


Advancements in Generative AI and the Challenges and Tasks in Preserving Linguistic Diversity


In the age of generative artificial intelligence, low-resource languages that lack sufficient data are becoming marginalized in the digital space, which can have a serious impact on linguistic and cultural diversity. This study aims to examine current cases where AI technology is being utilized to preserve low-resource languages or digital minority languages, and analyze whether such technologies contribute to building sustainable systems. To this end, a case study was reviewed on the development of a machine translator for Jejueo using AI technology and discussed the potential use of AI for regional language preservation in South Korea. Then, efforts by global innovative companies and the Maori community to preserve linguistic diversity were examined, highlighting numerous problems and challenges faced. The study found that with the existing regional language data in South Korea, machine translation for both text-to-text and text-to-speech is possible. Additionally, it was observed that international companies like Google, Meta, OpenAI, and IBM are also making efforts to develop machine translators for minority languages. However, it was concluded that the various forms of AI-based services using digitally marginalized languages are still limited and insufficient to achieve the goal of maintaining linguistic diversity yet. This is because opportunities to naturally use minority languages in the digital environment are rarely seen outside educational contexts. The study also highlighted challenges such as ethical issues with AI-generated content, data collection, creation, ownership, and rights, as well as the practicality, diversity, and accuracy evaluation of AI services based on minority languages. To address these issues, it was suggested that minority and regional language communities should expand education related to AI technology, participate directly in AI service development, and establish systems to review data creation, accuracy, and protection.


생성형 인공지능 시대에 데이터가 부족한 저자원 언어는 디지털 공간에서 소외되고 있으며, 이러한 현상은 언어 다양성과 문화 다양성에 매우 심각한 영향을 미칠 수 있다. 본 연구는 현재 저자원 언어 또는 디지털 소수 언어를 보존하기 위해 인공지능 기술이 활용되는 사례를 살펴보고, 이러한 기술이 지속 가능한 시스템을 구축하고 있는지 고찰하 는 것을 목표로 하였다. 이를 위해 먼저 국내 사례로 AI 기술을 통한 지역어 번역기 개발 연구를 검토하고 지역어 보존을 위한 AI의 사용 가능성을 논의하였다. 그리고 언어 다양성 보존을 위해 글로벌 혁신 기업과 소수 언어 공동체의 노력은 무엇인가를 검토하며 그 문제점과 과제는 무엇인지 논의하였다. 본 연구의 결과, 현재 구축된 국내 지역어 데이터를 기반으로 Text-to-Text와 Text-to- Speech의 기계번역이 가능하다는 것을 파악하였다. 또한 구글, 메타, OpenAI, IBM과 같은 국제기업들도 소수 언어를 활용한 기계번역기를 개발하는 노력을 하고 있음을 알 수 있었 다. 하지만 현재까지 디지털 소수 언어를 사용한 다양한 형태의 AI 기반 서비스는 제한적이며, 언어 다양성 유지라는 큰 목표를 이루기에 부족하다고 판단했다. 이는 디지털 환경 에서 소수 언어를 자연스럽게 사용할 기회가 교육적인 환경 외에는 눈에 띄지 않았기 때문이다. 그리고 AI로 생성된 내용의 정확성 평가와 윤리적인 문제, 데이터의 수집, 생성, 소유, 권리와 관련한 문제, 그리고 소수 언어 기반의 AI 서비스의 실용성과 다양성 확대와 같은 과제가 있음을 지적했다. 이러한 문제점을 해결하기 위해 각 소수 언어 및 지역어 공동체가 인공지능 기술과 관련한 문해력 교육 기회를 확대하고, 직접 AI 서비스를 개발하 고, 데이터의 생성과 정확성을 검토하며 보호하는 데 참여할 수 있는 시스템을 구축할 것을 제언하였다.


1. 서론
2. 생성형 AI 발전과 소외된 언어
3. 지역어와 AI
4. 디지털 소수 언어 보존을 위한 국제적인 노력
5. 문제점, 과제 그리고 제언
6. 결론


  • 양세정 Yang, Sejung. 제주대학교 인문과학연구소 학술연구교수


