학술논문

融合数据增强和注意力机制的中医实体及关系联合抽取 / Entity and relationship joint extraction method for traditional medical text integrating data augmentation and attention mechanism
Document Type
Academic Journal
Source
智能计算机与应用 / Intelligent Computer and Applications. 13(8):186-196
Subject
中医文本
实体及关系联合抽取
数据增强
注意力机制
TM text
joint extraction of entities and relationships
data enhancement
attention mechanism
Language
Chinese
ISSN
2095-2163
Abstract
中医药领域高质量标注数据缺乏,可用作实体及关系联合抽取任务的语料数量偏少.BiLSTM-CRF方法在序列标注上有优势,但对上下文信息与当前信息的关联关注不够,影响模型的性能.针对上述问题,提出一种融合数据增强和注意力机制的中医实体及关系联合抽取方法(DA-BiLSTM-Attention-CRF).该方法首先采用EDA数据增强方法对未标注训练集进行多倍增强,然后将增强后的伪标注数据加入训练集,采用自训练策略进行多次实验.最后,测试集数据通过模型预测得到标注序列并进行三元组提取.在中医语料库上进行实验评估,实体及关系联合抽取F1 值为 82.43%.