王鑫,程齐凯,马永强,罗卓然.基于层次注意力网络的论证区间识别研究[J].情报工程,2020,6(3):052-062 |
基于层次注意力网络的论证区间识别研究 |
Research on Argumentative Zoning Recognition Based on Hierarchical Attention Network |
|
DOI:10.3772/j.issn.2095-915X.2020.03.005 |
中文关键词: 层次注意力网络;论证区间;深度学习;文本分类 |
英文关键词: Hierarchical attention network; argumentative zoning; deep learning, text classification |
基金项目:国家自然科学基金面上项目 “ 基于多语义信息融合的学术文献引文推荐研究 ”(7167030644)和国家自然科学基金青年项目 “ 基于深度语义挖掘的引文推荐多样化研究 ”(71704137)。 |
作者 | 单位 | 王鑫 | 1. 武汉大学信息管理学院 武汉 430072;2. 武汉大学信息检索与知识挖掘研究所 武汉 430072 | 程齐凯 | 1. 武汉大学信息管理学院 武汉 430072;2. 武汉大学信息检索与知识挖掘研究所 武汉 430072 | 马永强 | 1. 武汉大学信息管理学院 武汉 430072;2. 武汉大学信息检索与知识挖掘研究所 武汉 430072 | 罗卓然 | 1. 武汉大学信息管理学院 武汉 430072;2. 武汉大学信息检索与知识挖掘研究所 武汉 430072 |
|
摘要点击次数: 2092 |
全文下载次数: 1516 |
中文摘要: |
学术文本论证区间识别是一项论证学术文献内容和分析修辞结构的研究,针对当前研究过多依赖人工经验来构建规则和特征的现状,以及论证区间识别研究存在时效性差、泛化能力弱等问题,本文采用基于层次注意力机制的 HAN 深度学习模型对学术文本论证区间识别进行了研究。本文首先构建了一个基于层次注意力机制的论证区间识别模型,阐述了该模型的整体架构和作用机制。其次,针对生物医学领域提出了一个论证区间 9 分类体系,在 PubMed 生物医学数据集上,用 LSTM 和 SVM两种文本分类算法与 HAN 模型进行对比实验。研究结果表明,本文所采用的 HAN 模型在各个类别的论证区间识别上效果均为最优,F1 值达到了 0.90,能够较好的完成论证区间识别研究。最后,对实验结果进行错误总结和分析,并指出了下一步的研究方向。 |
英文摘要: |
Argumentative zoning recognition of academic texts is an analysis of the argumentation and rhetorical structure of academic literature content. Aiming at the problems that current research mostly relies on traditional artificial experience to build rules and features with poor effect and weak generalization ability in argumentative zoning identification, this paper uses the HAN deep learning model based on the hierarchical attention mechanism to identify argumentative zoning of academic text. The article first introduces the HAN model, and describes the overall structure and mechanism of the model. Secondly, for the biomedicine field, this paper proposes a 9-classification system and compares the text classification algorithms LSTM and SVM with the HAN model on the PubMed biomedical dataset. The results show that the HAN model used in this paper has the best effect, and the F1 value reaches 0.90, which can well complete the research on the recognition of argumentative zoning. Finally, we analyze the misclassification of the experimental results and point out the future research direction. |
查看全文
查看/发表评论 下载PDF阅读器 |
关闭 |