Проверка оригинальности синонимизированных текстов

  • Михаил Станиславович Смирнов Муромский институт (филиал) ФГБОУ ВО «Владимирский государственный университет имени Александра Григорьевича и Николая Григорьевича Столетовых»

Аннотация

Синонимизация ‒ замена слов в тексте синонимами (словами со схожим смыслом, но различным написанием). Основная цель синонимизации состоит в изменении текстового документа таким образом, чтобы повысить его уникальность, скрыв тем самым факт заимствования. В работе рассматриваются особенности проверки синонимизированных текстов и осуществляется поиск путей повышения качества выявления заимствований. Для обработки синонимизированных текстов предлагается использовать тяжелые синонимы (наиболее частотные, весомые синонимы). Проведенные исследования показали высокую эффективность подхода по сравнению с существующими системами проверки оригинальности. Одной из ключевых особенностей подхода является возможность использования различных алгоритмов информационного поиска для последующей обработки текста – «мешка слов», TF*IDF, N-грамм, шинглов и т.д. Это позволяет давать как статистическую оценку подобия проверяемых документов, так и проводить визуализацию найденных совпадений.

Опубликована
2021-06-18
Как цитировать
СМИРНОВ, Михаил Станиславович. Проверка оригинальности синонимизированных текстов. Методы и устройства передачи и обработки информации, [S.l.], n. 22, p. 60-66, июнь 2021. ISSN 2311-598X. Доступно на: <http://rts-md.com/index.php/MDjornal/article/view/239>. Дата доступа: 29 ноя. 2021
Раздел
Информационные системы и модели