본 연구는 근거기반 의사결정이 넘쳐나는 동시에 사실보다는 신념과 감정에 근거해 여론이 형성되는 탈진실 시대를 극복하기 위해, 데이터과학을 이용한 진실의 추구는 통계적 경향성 못지않게 서사도 갖춰야 함을 주장한다. 서사는 데이터 생산자의 관점과 동기를 기반으로 구성된 것으로, 데이터 속 서사를 복원하는 것은 사회과학자가 인간 행동을 이해하기 위해 수시로 시도하는 감정이입적 해석 및 가치판단과 유사할 뿐만 아니라, 과학적 활동에서 필수적으로 동원되는 가설적 추론과도 가까운 활동이다. 더불어 이러한 서사의 복원은 데이터과학의 지향점과도 일치하는데, 해석가능성을 보강하여 사회적으로 책임있는 인공지능을 추구하거나 설명가능성을 보강하여 공학적으로 지속가능한 인공지능을 발전시키려는 활동에 부합하기 때문이다. 서사복원적 데이터과학의 구체적 방법을 제시하자면, 첫째 텍스트 데이터의 말뭉치를 구축하고 문장의 의미역 결정(semantic role labeling)을 통해 이야기의 복원이 가능하다. 즉 행위자에서 수동자로 향하는 의미의 총체적 연결망으로 이야기를 복원한다. 둘째로 서사를 구성하는 화자의 복원이 필요한데, 서사별 생산자의 특성을 변수화하여 의미 연결망이나 토픽모델링 등에 결합하면 화자에 따라 다르게 구성되는 서사를 파악할 수 있다. 셋째, 청자에 따라 달리 구성되는 서사를 파악하기 위해서는 청자의 복원이 필요한데, 이는 데이터 생산자의 발화가 이루어지는 맥락을 변수화하거나 추론하는 방식으로 복원할 수 있다. 마지막으로 서사에 숨어있는 은유적 의미를 복원하기 위해 word2vec과 같은 워드 임베딩을 실시한 후 단어들 간의 유추 관계 계산을 활용할 수 있다. 이러한 방법을 통해 데이터과학에서 서사를 복원하려는 시도는 데이터에 존재하는 행위와 사건, 이것들을 해석하는 맥락에서 성찰적인 과정을 수반하며, 이러한 성찰적 진실 추구는 다른 정체성을 가진 이해당사자에 대한 감정이입을 바탕으로 상호 학습으로 나아갈 것으로 기대한다.

We contend that scientific evidence must show both statistical patterns and narratives in social data to solve the uneasy cohabitation between evidence-based decision making and post-truth opinion formation. A narrative is constructed by the viewpoint and motivation of an agent who has produced social data. Restoring narratives is not only related to social scientists’ sense making and value judgment by empathetic interpretations but also similar to abduction in scientific activities. Narrative-driven data mining is also congruent with what data science aims for because it fits the pursuit of accountable AI by reinforcing interpretability and sustainable AI by reinforcing explainability. Its data-scientific methods can unfold into four directions. First, the story can be restored by making a semantic network from triplets of semantic role labelling. Second, restoring the narrator’s view can be achieved by applying narrators’ characteristics as metadata to semantic role labelling and topic modelling. Third, restoring the audience can be tried by inferring and operationalizing the context of the narrator’s storytelling. Forth, emerging metaphors from narratives can be explored by analogy after word embedding by word2vec. We expect that restoring narratives in scientific evidence will facilitate reflective truth-building by mutual learning between various identity groups in a society.