文章摘要
Toshiaki Nakazawa,Manabu Yaguchi,Kiyotaka Uchimoto,Masao Utiyama,Eiichiro Sumita,Sadao Kurohashi,Hitoshi Isahara,何彦青,刘建辉.ASPEC: 亚洲科学论文摘录语料库[J].情报工程,2017,3(3):040-046
ASPEC: 亚洲科学论文摘录语料库
ASPEC: Asian Scientific Papers Excerpt Corpus
  
DOI:10.3772/j.issn.2095-915X.2017.03.006
中文关键词: 平行语料库,科学论文,亚洲语言
英文关键词: Parallel corpus, scientific paper, Asian languages
基金项目:
作者单位
Toshiaki Nakazawa 科学技术振兴机构 
Manabu Yaguchi 科学技术振兴机构 
Kiyotaka Uchimoto 国家信息与通讯研究所 
Masao Utiyama 国家信息与通讯研究所 
Eiichiro Sumita 国家信息与通讯研究所 
Sadao Kurohashi 京都大学 
Hitoshi Isahara 丰桥技术科学大学 
何彦青 中国科学技术信息研究所 
刘建辉 河北地质大学 
摘要点击次数: 2325
全文下载次数: 1355
中文摘要:
      本文详细介绍了ASPEC(亚洲科学论文摘录语料库)。作为首个大规模的科学论文领域内的平行语料库,ASPEC 是由日- 中机器翻译项目于 2006 年至2010 年间利用科技促进专用协作基金构建起来的。它包含约300 万条平行语句的日- 英科学论文摘要语料库(ASPEC-JE)和约68万条平行语句的中- 日科学论文摘录语料库(ASPEC-JC)。ASPEC 被用作机器翻译评测研讨会WAT(亚洲翻译研讨会)的官方数据集。
英文摘要:
      In this paper, we described the details of the ASPEC (Asian Scientific Paper Excerpt Corpus), which is the first large-size parallel corpus of scientific paper domain. ASPEC was constructed in the Japanese-Chinese machine translation project conducted between 2006 and 2010 using the Special Coordination Funds for Promoting Science and Technology. It consists of a Japanese-English scientific
查看全文   查看/发表评论  下载PDF阅读器
关闭

分享按钮