高甦,陶浒,蒋彦钊,贾麒,张德政,谢永红.中医文献的句子级联合事件抽取[J].情报工程,2021,7(5):015-029 |
中医文献的句子级联合事件抽取 |
Sentence-level Joint Event Extraction of Traditional Chinese Medical Literature |
|
DOI:10.3772/j.issn.2095-915X.2021.05.002 |
中文关键词: 事件抽取;信息抽取;中医文献;联合事件抽取模型 |
英文关键词: Event extraction; information extraction; Traditional Chinese Medicine literatures; joint event extraction model |
基金项目:国家重点研发计划云计算和大数据专项 “大数据驱动的中医智能辅助诊断服务系统”(2017YFB1002300)。 |
作者 | 单位 | 高甦 | 1. 北京师范大学医院 北京 100875; | 陶浒 | 2. 北京科技大学计算机与通信工程学院 北京 100083 | 蒋彦钊 | 2. 北京科技大学计算机与通信工程学院 北京 100083 | 贾麒 | 2. 北京科技大学计算机与通信工程学院 北京 100083 | 张德政 | 2. 北京科技大学计算机与通信工程学院 北京 100083 | 谢永红 | 2. 北京科技大学计算机与通信工程学院 北京 100083 |
|
摘要点击次数: 1746 |
全文下载次数: 1393 |
中文摘要: |
[ 目的 / 意义 ] 中医领域存在大量的文献,这些文献中含有大量中医诊疗的知识。但这些知识往往存在于非结构化文本中,通过信息抽取技术将其转化成结构化文本,不仅能够提高效率,还可以进一步推进中医智能辅助诊疗的发展。[ 方法 / 过程 ] 本文使用了联合事件抽取模型,利用 BERT 对中医文献进行字向量表示,并在此基础上加入 Self-Attention 层,最后与 CRF 模型结合,实现了对中医文献的句子级事件的初步抽取。[ 结果 / 结论 ] 通过实验与 Pipeline 模型进行对比,结果显示,本文使用的模型 F1 值较 Pipeline 模型提高了 14.2%。 |
英文摘要: |
[Objective/Significance] There are many literatures in the field of Traditional Chinese Medicine (TCM), which contain
massive knowledge of TCM diagnosis and treatment. However, the knowledge often exists in unstructured text. Transforming
it into structured text through information extraction technology can not only improve efficiency, but also further promote the
development of intelligent diagnosis and treatment with TCM. [Methods/Process] We use the joint event extraction model,
representing the word vector of the TCM literatures with BERT. We add a Self-Attention layer on this basis, and finally combine
with the CRF model to achieve the sentence-level events extraction from the TCM literature. [Results/Conclusions] The
experiment is compared with the Pipeline model, and the results show that the F1 value of our model is 14.2% higher than that of
the Pipeline model. |
查看全文
查看/发表评论 下载PDF阅读器 |
关闭 |