원문정보
초록
영어
Big data has created new technical and business environment which change organizations in many ways. It is time for organizations to cope with huge data volume as well as various data types and the speed of data production and utilization. In this context, research on data integration for solving these problems falls short of academic and industry demand. Especially academic research have not provided enough answers on effective decision making support through big data integration. By developing a big data integration framework evaluating such techniques as Hadoop, data federation, and data virtualization as well as infrastructure like parallel data warehouse, cloud systems, logical data warehouse and data lake and analyzing a public sector data integration case, the paper proposes a strategy to select appropriate big data integration approaches in various situations.
한국어
빅데이터라는 새로운 기술 및 경영 환경은 데이터가 조직에서 활용되는 방법에 많은 변화를 초래 하고 있다. 이는 기업들이 이전과 다른 데이터의 규모는 물론 다양한 형태, 그리고 데이터 생산에서 활 용까지 더욱 빠른 속도에 대응해야하기 때문이다. 그러나 빅데이터의 부상과 함께 데이터의 규모가 상 상을 초월할 정도로 커지지는 환경에서 여러 곳에 흩어져 있는 다양한 종류의 데이터를 어떻게 통합하 여 실시간으로 제공해 의사결정을 더욱 효율적이며 효과적으로 할 수 있는지에 대한 연구는 아직까지 매우 초기 수준에 있다. 본 연구는 빅데이터 환경에서 데이터 통합을 위해 사용될 수 있는 다양한 방법 들인 하둡, 데이터 페더레이션, 데이터 가상화, 그리고 이들과 관련된 인프라인 병렬형 데이터웨어하우 스, 논리적 데이터 웨어하우스, 클라우드 시스템, 데이터 호수 등의 특징을 분석해 정리하고 공공기관 의 빅데이터 통합 사례를 통해 비즈니스 상황에 맞는 데이터 통합 방법의 선택 전략을 제시하고자 한다.
목차
Abstract
1. 연구의 목적
2. 이론적 배경
2.1 빅데이터 시대의 데이터 활용 문제점
2.2 규모에 대한 대응 문제
2.3 다양성에 대한 대응 문제
2.4 속도에 대한 대응 문제
2.5 빅데이터와 데이터 통합
2.6 데이터 통합 접근법
2.7 데이터 통합 전략
3. 연구 방법
4. 사례의 선정과 분석
4.1 데이터 통합의 배경
4.2 데이터의 통합의 방법
4.3 데이터 통합의 한계점
4.4 향후 데이터 통합의 대안
5. 결론
References
