멀티미디어 데이터의 고품질화와 사용자의 급증으로 인해 실시간으로 처리해야 할 데이터량이 급증하고 있다. 실시간 멀티미디어 서비스에서 결함으로 서비스가 중단 될 경우 사용자의 만족도가 급감한다. 이를 방지하기 위한 방안으로 물리적 중복기반의 결함허용 기법이 널리 사용되고 있다. 그러나, 중복화 시스템에서는 중복 노드에 발생하는 결함들 사이의 연계성이 존재할 수 있으므로, 중복노드 중 하나에서 결함이 발생한 경우, 짧은 시간 내에 나머지 중복 노드들 역시 동일한 결함으로 고장 날 수 있다. 본 논문에서는 결함 연계성을 고려한 고장 회피 정책에 기반을 둔, 확산성이 높은 결함 상황 감지 및 프로세스 이주기법을 제안한다. 이를 위해 결함 연계성에 따른 수학적 모델링을 제안하고, 확산성이 높은 재난 상황 감지 및 프로세스 이주 알고리즘을 제안한다. 또한, 시뮬레이션을 통해 제안 기법의 성능을 검증한다.

In multimedia services, reasons of failures are complex and impacts of those are catastrophic. Therefore, fault-tolerant systems such as hardware replication techniques are required for high dependable computing. In the hot-standby replication system, the system continues to process its tasks even though one of replicated nodes have failed. Thus, the remaining living nodes should be well-protected against failures when parts of replicated nodes have failed. Design faults or catastrophic disasters may cause chain reactions of common faults on replicated nodes in replication systems. Therefore, failures on the remaining nodes can be effectively suppressed by predicting and preventing the same fault when it has occurred on a replicated node in hot-standby replication system. This paper provides a process migration scheme based on the fault avoidance strategies. For the performance evaluation, we conduct simulations to show that our propose scheme surpass the traditional static scheme.