Опубликованные наборы данных
Корпусы для оценки качества поиска заимствований
| Название | Год | Размер | Задача |
|---|---|---|---|
| Paraplag | 2017 | 5.7 млн. текстов | plagiarism detection, source retrieval |
| Paraplag Lite | 2017 | 11,5 тыс. текстов | text alignment |
| Paraplag v2 | 2021 | 6 млн. текстов | plagiarism detection, source retrieval, text alignment |