초록 열기/닫기 버튼
본 연구는 자가학습(self-learning) 알고리즘을 이용한 가격 책정이 기업 간의 암묵적 담합을 발생시킬 수 있음을 보인다. 즉, 한 시장에서 경쟁하는 두 기업이 각자의 이윤을 극대화하기 위해 알고리즘을 이용하여 가격을 설정할 때, 사전적인 합의 없이도 다기간의 가격 책정을 통한 상호 작용과 학습을 통해 경쟁을 줄이고 일정 수준의 담합을 달성할 수 있음을 시뮬레이션 분석을 통해 살펴본다. 이를 위해 본 연구에서는 반복적인 죄수의 딜레마(prisoner’s dilemma) 게임을 응용한 환경 하에서, Q-learning 알고리즘을 이용하여 매 기 가격을 선택하는 두 기업을 설정하고, 일정 기간이 지난 후 두 기업 사이에 높은 수준의 담합이 지속적으로 나타남을 확인한다. 이는 두 기업이 대칭적인 경우뿐만 아니라 비대칭 적인 경우, 즉 두기업이 사용하는 알고리즘의 학습 속도나 기억 능력에 차이가 있거나, 하나의 기업이 다른기업의 선택을 모방하는 팃포탯(Tit for Tat) 전략을 사용하는 환경에서도 나타난다. 이러한결과는 담합과 관련한 현재의 규제가 알고리즘을 이용한 새로운 유형의 암묵적 담합에는 유효하지 않을 가능성을 제시한다.
We study collusive outcomes when firms employ self-learning pricing algorithms. Two firms are in a repeated prisoner’s dilemma environment, and they choose their action using Q-learning algorithm. Simulations show that they can reach a significant degree of collusive behavior without explicit agreements. We document how the anti-competitive behavior varies with parameter values of Q-learning algorithm, and discuss the role of parameters on the collusive outcomes. We also consider asymmetric cases where one firm acts differently: one uses Tit-for-tat strategy, a different parameter value for Q-learning algorithm, and different memory capacity.
키워드열기/닫기 버튼
algorithm, collusion, tacit collusion, Q-learning