所属单位:计算机科学与工程学院
发表刊物:计算机工程与应用
项目来源:自选课题
关键字:关系抽取;联合抽取;片段标注;映射策略
摘要:关系抽取作为知识图谱等诸多领域的上游任务,具有广泛应用价值,近年来受到广泛关注。目前, 关系抽取模型普遍存在暴露偏差问题,抽取文本普遍存在实体嵌套和实体重叠问题,这些问题严重影响了 模型性能。因此,该文提出了一种基于片段标注的实体关系联合抽取模型(Span-Labeling Based Model, SLM),主要包括:将实体关系抽取问题转化为片段标注问题;使用滑动窗口和三种映射策略将词元(Token) 序列进行组合排列重新平铺成片段(Span)序列;使用 LSTM 和多头自注意力机制进行片段深层语义特征 提取;设计了实体关系标签,使用多层标注方法进行关系标签分类。在英文数据集 NYT、WebNLG 上进 行实验,相对于基线模型 F1 值显著提高,验证了模型的有效性,能有效解决上述问题。
第一作者:赵辉
论文类型:期刊论文
页面范围:3
是否译文:否
发表时间:2022-04-12