Опубликованные наборы данных
Корпусы для оценки качества поиска заимствований
Название | Год | Размер | Задача |
---|---|---|---|
Paraplag | 2017 | 5.7 млн. текстов | plagiarism detection, source retrieval |
Paraplag Lite | 2017 | 11,5 тыс. текстов | text alignment |
Paraplag v2 | 2021 | 6 млн. текстов | plagiarism detection, source retrieval, text alignment |