학술논문

그래프 구조의 구문 담화 정보를 활용하는 대화 상태 추적 시스템 / Dialogue State Tracking System with Graph-structured Syntactic Discourse Information
Document Type
Dissertation/ Thesis
Author
Source
Subject
대화 상태 추적
목적 지향 대화
그래프 어텐션 네트워크
구문 분석 트리
Language
Korean
Abstract
Dialogue State Tracking task is responsible for understanding the dialogue in the task-oriented dialogue system. Dialogue state is essential information in order to achieve the user’s goal. It is presented as a list of slot and value pairs. Nowadays, to effectively track the dialogue state, open-vocabulary based dialogue state tracking method which includes both extractive and generative method has been used. Existing extractive dialogue state tracking models have a drawback that they don’t explicitly consider the syntactic information of the utterances. This drawback causes the model to be vulnerable to values which are unseen during the training phase. In this paper, we propose a dialogue state tracking model that encodes both contextual and syntactic information of the dialogue. Proposed model consists of the dialogue encoding module and the slot-value extraction module. The dialogue encoding module utilizes a dependency tree of each utterance to obtain syntactic information. By connecting all the root nodes of the dependency trees, the syntactic discourse graph is constructed. Then, the node embedding of the syntactic discourse graph is updated by graph attention networks and forms a syntactic discourse dialogue embedding. The slot-value extraction module takes the contextual dialogue embedding from pre-trained language model and the syntactic discourse embedding computed from the syntactic discourse graph. Experimental results on five different task-oriented dialogue datasets show the effectiveness of proposed model. Further, to demonstrate the robustness of the proposed model on out-of-vocabulary values, detailed analysis and case study are conducted. With the quantitative and qualitative analysis, I proved the need of the syntactic discourse information in an extractive dialogue state tracking model.
대화 상태 추적은 목적 지향 대화 시스템에서 대화 이해를 담당하는 부분이다. 대화 상태는 사용자의 목적을 이루기 위해 필요한 정보를 대화에서 수집한 것으로 주로 슬롯-값 쌍으로 표현된다. 대화 상태를 추적하기 위한 방법으로는 추출 혹은 생성 기반의 방법이 존재한다. 기존 사전학습 언어 모델을 활용하는 추출 기반의 시스템들은 문맥 정보만을 활용하여 대화 상태를 추적하며, 이러한 시스템은 새로운 값이나 다른 형태의 발화에 대해 강건하게 대응하지 못한다는 단점을 가지고 있다. 본 연구에서는 구문 담화 정보를 활용하는 추출 기반의 대화 상태 추적 시스템을 제안한다. 제안된 시스템은 대화 인코딩 모듈과 슬롯-값 추출 모듈로 구성되어 있다. 구문 담화 정보는 입력 대화 내 발화들의 구문 분석 트리를 활용하여 그래프 형태로 대화 인코딩 모듈 내에서 구축된다. 구축된 그래프의 노드 임베딩은 그래프 어텐션 네트워크를 통해 업데이트되며 대화에 대한 구문 담화 임베딩을 구성하게 된다. 구문 담화 임베딩은 발화 내 구문 정보뿐만 아니라 대화 내 발화들을 명시적으로 구분하여 담화 정보를 형성한 결과를 담고 있다. 슬롯-값 추출 모듈은 문맥 정보 임베딩과 함께 구문 담화 임베딩을 입력받아 대화 상태를 추적한다. 제안 시스템은 다중 도메인의 목적 지향 데이터셋 MultiWOZ 2.1을 포함한 다섯 가지의 목적 지향 대화 데이터셋에서 평가되었다. 평가 결과, 제안 시스템은 Joint Goal Accuracy와 Slot Accuracy에서 기존 대화 상태 추적 시스템들과 비교하였을 때 높은 성능을 보였다. 제안 시스템의 기여도를 분석하기 위해, 미등록 단어들에 대한 강건성에 대한 분석과 사례 분석이 추가로 진행되었다. 분석 결과를 통해 구문 담화 정보가 값 스팬 예측에서 문맥 정보와 함께 활용될 때, 다른 문맥에서 등장하거나, 훈련 데이터에 포함되지 않은 값에 대해서도 효과적으로 추적할 수 있음이 확인되었다.