Toshiaki Nakazawa,Manabu Yaguchi,Kiyotaka Uchimoto,Masao Utiyama,Eiichiro Sumita,Sadao Kurohashi,Hitoshi Isahara,何彦青,刘建辉.ASPEC: 亚洲科学论文摘录语料库[J].情报工程,2017,3(3):040-046 |
ASPEC: 亚洲科学论文摘录语料库 |
ASPEC: Asian Scientific Papers Excerpt Corpus |
|
DOI:10.3772/j.issn.2095-915X.2017.03.006 |
中文关键词: 平行语料库,科学论文,亚洲语言 |
英文关键词: Parallel corpus, scientific paper, Asian languages |
基金项目: |
作者 | 单位 | Toshiaki Nakazawa | 科学技术振兴机构 | Manabu Yaguchi | 科学技术振兴机构 | Kiyotaka Uchimoto | 国家信息与通讯研究所 | Masao Utiyama | 国家信息与通讯研究所 | Eiichiro Sumita | 国家信息与通讯研究所 | Sadao Kurohashi | 京都大学 | Hitoshi Isahara | 丰桥技术科学大学 | 何彦青 | 中国科学技术信息研究所 | 刘建辉 | 河北地质大学 |
|
摘要点击次数: 2681 |
全文下载次数: 1690 |
中文摘要: |
本文详细介绍了ASPEC(亚洲科学论文摘录语料库)。作为首个大规模的科学论文领域内的平行语料库,ASPEC 是由日- 中机器翻译项目于 2006 年至2010 年间利用科技促进专用协作基金构建起来的。它包含约300 万条平行语句的日- 英科学论文摘要语料库(ASPEC-JE)和约68万条平行语句的中- 日科学论文摘录语料库(ASPEC-JC)。ASPEC 被用作机器翻译评测研讨会WAT(亚洲翻译研讨会)的官方数据集。 |
英文摘要: |
In this paper, we described the details of the ASPEC (Asian Scientific Paper Excerpt Corpus), which is the first large-size parallel corpus of scientific paper domain. ASPEC was constructed in the Japanese-Chinese machine translation project conducted between 2006 and 2010 using the Special Coordination Funds for Promoting Science and Technology. It consists of a Japanese-English scientific |
查看全文
查看/发表评论 下载PDF阅读器 |
关闭 |