刘志明,于波,欧阳纯萍,余颖,阳小华,翟云.基于主题的SE-TextRank 情感摘要方法[J].情报工程,2017,3(3):097-104 |
基于主题的SE-TextRank 情感摘要方法 |
SE-TextRank Opinion Summarization Method Based On Topic Model |
|
DOI:10.3772/j.issn.2095-915X.2017.03.012 |
中文关键词: 文本摘要, LDA 模型, 余弦距离, SE-TextRank, 特征融合 |
英文关键词: Text summarization, LDA model, cosine distance algorithm, SE-TextRank, feature fusion |
基金项目:本文受国家自然科学基金(61402220,61672178),湖南省哲学社会科学基金(14YBA335,16YBA323),湖南省教育厅科研项目(15C1186)的资助。 |
作者 | 单位 | 刘志明 | 南华大学计算机科学与技术学院 | 于波 | 南华大学计算机科学与技术学院 | 欧阳纯萍 | 南华大学计算机科学与技术学院 | 余颖 | 南华大学计算机科学与技术学院 | 阳小华 | 南华大学计算机科学与技术学院 | 翟云 | 国家行政学院电子政务研究中心 |
|
摘要点击次数: 2619 |
全文下载次数: 1735 |
中文摘要: |
文本情感摘要技术的目的是以简洁的形式准确表达文章的核心情感内容。为解决不同的文档结构及内容特征等问题对摘要结果的影响,提出了一种基于主题的SE-TextRank 情感摘要方法。通过LDA 模型自动获取收敛后的文本主题,利用余弦距离算法进行主题句子分组,使用传统多特征融合以及SE-TextRank 情感摘要算法对组内中心句抽取,最终获取目的摘要。实验表明,采用此方法能够更为高效的获取新闻文本摘要结果。 |
英文摘要: |
The purpose of the text sentiment summarization is to express the content of the article in a concise form. A topic-based SE-TextRank emotional abstract method was proposed in this study to solve the influence of different document structure and content characteristics on abstract results. This study obtained the convergent text theme automatically through LDA model, grouped the sentence topic through the cosine distance algorithm, applied traditional multi feature fusion and SE-TextRank sentiment summary algorithm to extract the central sentence within the group, and ultimately get the purpose summary. Results of the experiment showed that this method can be used to obtain the results of news text more efficiently. |
查看全文
查看/发表评论 下载PDF阅读器 |
关闭 |
|
|
|