俄语国家语料库·俄汉平行语料库

俄语国家语料库 (НКРЯ) 是最大、最优质的俄语语料库之一。该语料库包含大量子语料库。这些子语料库是语言研究具体领域(如:句法、重音等)的数据库。其中的 平行语料库 又分成20个俄语-外语语料库。

想了解更多平行语料库的信息请点击 这里.

语料库小史

2016 年我们的语料库上线成为俄语国家语料库网站的一部分。 2019 年语料库以两个版本发布,参见在俄语国家语料库网站的 “旧版入口” 和在俄罗斯国家研究型高等经济大学网站的“新版入口”

2020 年 团队 得到俄罗斯高等经济大学的支持继续进行语料库的开发。

新版俄汉平行语料库并未脱离俄语国家语料库,而与其继续相关联。但由于一些原因,我们在俄罗斯高等经济大学的网站上更新语料库版本会更加轻松,因此会优先在俄罗斯高等经济大学网页发布与新版语料库相关的消息、规定、内容以及成员等信息。

语料库现状

语料库规模超过 230 万字,包括了19-21 世纪俄罗斯和中国作家,如刘震云、陀思妥耶夫斯基、乌利茨卡娅、鲁迅等人的30 篇文学著作文本。

语料库现有俄语和英语版本的界面,汉语界面的开发正在进行。

语料库的使用方法请参阅 搜索界面的说明: 点击页面顶端橙色问号按钮

语料库优势

俄汉平行语料库是俄罗斯现今唯一兼具以下4个实用特点的平行语料库:

  1. 呈现俄汉对应文本;
  2. 支持在线访问;
  3. 具有便捷的搜索系统;
  4. 具有语法标注。

目前已知只有 一个类似项目 正在北京开发。

我们的团队

我们的项目有来自以下单位的学生、教师和研究人员积极参与:

虽然团队已有十余人参与语料库开发工作,但仍有大量问题尚需解决,我们正在寻求积极主动的参与者,如果您对我们的项目感兴趣,请关注 职位需求,期待有识之士的加入!