О параллельных корпусах

Параллельные корпуса: что это?

Параллельный корпус — это частный случай лингвистического корпуса, одного из главных инструментов, которыми пользуются специалисты по языкознанию в XXI в. Как и основная часть лингвистических корпусов, параллельный корпус обычно снабжается т.н. метаинформацией (информацией о каждом тексте — когда он был создан, кем, какого он объема и т.д.), а также разметкой (каждому слову приписана его начальная форма, грамматическая информация и т.д.).

Параллельный корпус — это собрание текстов сразу на двух языках. Важный элемент разметки параллельных корпусов — выравнивание: каждому предложению (как минимум, абзацу) на языке Х соответствует предложение на языке Y. Благодаря выравниванию, параллельный корпус становится полезным инструментом для нескольких категорий пользователей. Это:

Вот самые известные примеры параллельных корпусов: