文章摘要
高甦,陶浒,蒋彦钊,贾麒,张德政,谢永红.中医文献的句子级联合事件抽取[J].情报工程,2021,7(5):015-029
中医文献的句子级联合事件抽取
Sentence-level Joint Event Extraction of Traditional Chinese Medical Literature
  
DOI:10.3772/j.issn.2095-915X.2021.05.002
中文关键词: 事件抽取;信息抽取;中医文献;联合事件抽取模型
英文关键词: Event extraction; information extraction; Traditional Chinese Medicine literatures; joint event extraction model
基金项目:国家重点研发计划云计算和大数据专项 “大数据驱动的中医智能辅助诊断服务系统”(2017YFB1002300)。
作者单位
高甦 1. 北京师范大学医院 北京 100875; 
陶浒 2. 北京科技大学计算机与通信工程学院 北京 100083 
蒋彦钊 2. 北京科技大学计算机与通信工程学院 北京 100083 
贾麒 2. 北京科技大学计算机与通信工程学院 北京 100083 
张德政 2. 北京科技大学计算机与通信工程学院 北京 100083 
谢永红 2. 北京科技大学计算机与通信工程学院 北京 100083 
摘要点击次数: 62
全文下载次数: 51
中文摘要:
      [ 目的 / 意义 ] 中医领域存在大量的文献,这些文献中含有大量中医诊疗的知识。但这些知识往往存在于非结构化文本中,通过信息抽取技术将其转化成结构化文本,不仅能够提高效率,还可以进一步推进中医智能辅助诊疗的发展。[ 方法 / 过程 ] 本文使用了联合事件抽取模型,利用 BERT 对中医文献进行字向量表示,并在此基础上加入 Self-Attention 层,最后与 CRF 模型结合,实现了对中医文献的句子级事件的初步抽取。[ 结果 / 结论 ] 通过实验与 Pipeline 模型进行对比,结果显示,本文使用的模型 F1 值较 Pipeline 模型提高了 14.2%。
英文摘要:
      [Objective/Significance] There are many literatures in the field of Traditional Chinese Medicine (TCM), which contain massive knowledge of TCM diagnosis and treatment. However, the knowledge often exists in unstructured text. Transforming it into structured text through information extraction technology can not only improve efficiency, but also further promote the development of intelligent diagnosis and treatment with TCM. [Methods/Process] We use the joint event extraction model, representing the word vector of the TCM literatures with BERT. We add a Self-Attention layer on this basis, and finally combine with the CRF model to achieve the sentence-level events extraction from the TCM literature. [Results/Conclusions] The experiment is compared with the Pipeline model, and the results show that the F1 value of our model is 14.2% higher than that of the Pipeline model.
查看全文   查看/发表评论  下载PDF阅读器
关闭

分享按钮