文章摘要
揣子昂,耿骞,潘慧瑶,靳健.产业政策知识图谱的自动化构建[J].情报工程,2022,8(3):028-051
产业政策知识图谱的自动化构建
Automatic Construction of Knowledge Graph for Industrial Policies
  
DOI:10.3772/j.issn.2095-915X.2022.03.003
中文关键词: 产业政策;知识图谱;开放域三元组抽取;三元组表示;图数据库
英文关键词: Industrial policy; knowledge graph; open triple extraction; triple representation; graph
基金项目:富媒体数字出版内容组织与知识服务重点实验室开放基金“产业政策图谱构建研究”(ZD2021-11/04);国家社会科学基金重点项目“面向集成管理的政府数据组织与传递机制研究”(19ATQ005)。
作者单位
揣子昂 1. 北京师范大学政府管理学院信息管理系 北京 100875; 
耿骞 1. 北京师范大学政府管理学院信息管理系 北京 100875; 3. 北京师范大学珠海校区政府治理研究中心 珠海 519085 
潘慧瑶 1. 北京师范大学政府管理学院信息管理系 北京 100875; 
靳健 1. 北京师范大学政府管理学院信息管理系 北京 100875; 2. 富媒体数字出版内容组织与知识服务重点实验室 北京 100038; 
摘要点击次数: 1425
全文下载次数: 2737
中文摘要:
      [ 目的/ 意义] 为方便民众和政府工作人员快速了解产业政策中的重要内容,本研究提出了一套自动化的产业政策知识图谱构建框架,用于梳理有关政策文本。[ 方法/ 过程] 具体地,考虑到中文语料的缺乏,本研究利用基于句法分析的三元组抽取模型DSNF 从产业政策中抽取政策实体和关系,并结合政策分析场景的特点对结果进行调整。由于原始三元组的表达较为分散,本研究利用三元组表示模型TransP 和层次聚类模型BIRCH 对原始三元组进行表示和归并。[ 局限] 当前模型的性能尚需要在更大规模的数据集上进行检验,并与已有的方法进行比较。[ 结果/ 结论] 本研究调用并调整了一系列模型用于解决产业政策知识图谱构建过程中的问题,并探索了基于知识图谱的政策分析模式,具有重要的理论和实践意义。
英文摘要:
      [Objective/Significance] To facilitate public and government servants to understand the key points of industrial policies efficiently, an automatic framework for knowledge graph construction is proposed, which aims to improve the readability of the policy. [Methods/Process] Specifically, considering the lack of Chinese corpus, an unsupervised open triple extraction model,named as DSNF which is based on syntactic analysis, is applied to extract entities and relations from industrial policy texts, and the results are further enriched according to the policy analysis scenario. Since the expression of original triples is diversified, the triple representation model TransP and the hierarchical clustering model BIRCH are used to summarize the original triples. Finally, the extracted triples are provided to a graph database, Neo4j, based on which a series of functions are provided for users, including visualization, retrieval, etc. [Limitations] The performance of the proposed model needs to be further evaluated on larger datasets and compared with baselines. [Results/Conclusions] State-of-the-art models are applied and modified to build knowledge graph for industrial policies automatically, and a novel policy analysis method based on knowledge graph is explored,which is of important theoretical and practical implications.
查看全文   查看/发表评论  下载PDF阅读器
关闭

分享按钮