АЛГОРИТМИЧЕСКАЯ И ПРОГРАММНАЯ РЕАЛИЗАЦИЯ ОПРЕДЕЛЕНИЯ ПЛАГИАТА В СИСТЕМАХ УПРАВЛЕНИЯ ОБУЧЕНИЕМ
https://doi.org/10.21122/2309-4923-2018-1-71-78
Аннотация
Основное преимущество применения информационных технологий в образовании, заключающееся в ускорении и упрощении обмена информацией, одновременно является его недостатком, поскольку порождает проблему плагиата. Целью данной работы является разработка программного обеспечения для проверки текста на уникальность в системах управления обучением. Для достижения указанной цели необходимо решить круг задач, связанных с выбором метода определения плагиата, его алгоритмизацией и программной реализацией. В работе рассматриваются методы шинглов, супершинглов, сигнатурные методы, векторные модели представления текста, а также кластерный анализ текстовой информации. Авторами предлагается модификация векторной модели для повышения точности определения схожих документов за счет формирования N-списка каждого документа отдельно. Вследствие этого будет происходить попарное сравнение документов и формирование образа одного документа относительно N-списка другого. Таким образом, в i-й строку матрицы схожести будут записываться коэффициенты схожести всех рассматриваемых документов относительно i-го документа. Предлагаемая модификация также позволит ускорить процесс вычислений, поскольку отсутствует необходимость искать общие термы для всех документов. Для анализа большого количества работ обучающихся с целью проверки их на плагиат авторы предлагают использовать кластерный подход. Его применение показало, что время определения дубликатов для одного документа и для всех документов, входящих в выборку, одинаковое. Т. е. за один и тот же промежуток времени можно получить все варианты одинаковых работ обучающихся. Таким образом, применение кластерного анализа текстовой информации при определении плагиата ощутимо экономит как время преподавателя, так и вычислительные ресурсы. Программная реализация предлагаемых алгоритмов выполнена в виде веб-сервиса на языке Java.
Ключевые слова
Об авторах
Ю. Б. ПоповаБеларусь
Попова Юлия Борисовна - кандидат технических наук, доцент кафедры программного обеспечения вычислительной техники и автоматизированных систем БНТУ.
А. В. Голобурда
Беларусь
Голобурда Александр Вячеславович – магистрант кафедры программного обеспечения вычислительной техники и автоматизированных систем БНТУ.
Список литературы
1. Бобкова, О. В. Плагиат как гражданское правонарушение / Бобкова О. В., Давыдов С. А., Ковалева И. А. // Патенты и лицензии. – 2016. – № 7. – С. 31–41.
2. Голобурда, А. В. Проверка плагиата в веб-приложениях / А. В. Голобурда, Ю. Б. Попова // Информационные технологии в образовании, науке и производстве: IV Международная научно-техническая интернет-конференция, 18–19 ноября 2016 г. Секция Информационные технологии в производстве и научных исследованиях [Электронный ресурс]. – Режим доступа: http://rep.bntu.by/handle/data/27126. – Дата доступа: 25.11.2017.
3. Попова, Ю. Б. Классификация автоматизированных систем управления обучением / Попова Ю. Б. // Системный анализ и прикладная информатика. – 2016. – № 2. – С. 51–58.
4. Broder, A. On the resemblance and containment of documents / Broder A. // Compression and Complexity of Sequences (SEQUENCES’97). – IEEE Computer Society, 1998. – P. 21–29.
5. Зеленкова, Ю. Г. Сравнительный анализ методов определения нечетких дубликатов для Web-документов / Зеленкова Ю. Г., Сегалович И. В. // Труды 9-ой Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции»: сб. работ участников конкурса. – Переславль-Залесский, 2007. – Т. 1. – С. 169–172.
6. Моченов, С. В. Векторная модель представления текстовой информации / С. В. Моченов, А. М. Бледнов, Ю. А. Луговских // Материалы международной научной конференции. – Ижевск, 2006. – С. 133–139.
7. Андреев, А. М. Метод обнаружения дубликатов в потоке текстовых документов / Андреев А. М., Березкин Д. В., Козлов И. А., Симаков К. В. // Труды 16-й Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции». – Дубна, 2014. – С. 310–321.
8. Антонова, А. Ю. Об использовании мер сходства при анализе документации / Антонова А. Ю., Клышинский Э. С. // Труды 13-й Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции». – Воронеж, 2011. – С. 134–138.
9. Баранов, М. А. Модификация жадного алгоритма кластеризации / Баранов М. А. // Прикладная информатика. – 2013. – № 2. – С. 78–88.
10. Барахнин, В. Б. Кластеризация текстовых документов на основе составных ключевых термов / Барахнин В. Б., Ткачев Д. А. // Вестник Новосибирского государственного университета. Серия: Информационные технологии. – 2010. – № 2. – С. 5–14.
Рецензия
Для цитирования:
Попова Ю.Б., Голобурда А.В. АЛГОРИТМИЧЕСКАЯ И ПРОГРАММНАЯ РЕАЛИЗАЦИЯ ОПРЕДЕЛЕНИЯ ПЛАГИАТА В СИСТЕМАХ УПРАВЛЕНИЯ ОБУЧЕНИЕМ. Системный анализ и прикладная информатика. 2018;(1):71-78. https://doi.org/10.21122/2309-4923-2018-1-71-78
For citation:
Popova Y.B., Goloburda A.V. ALGORITHMIC AND PROGRAM IMPLEMENTATION OF THE PLAGIARISM DEFINITION IN LEARNING MANAGEMENT SYSTEMS. «System analysis and applied information science». 2018;(1):71-78. (In Russ.) https://doi.org/10.21122/2309-4923-2018-1-71-78