Проведён круглый стол с представителем Юрий Викторовичем

advertisement
www.antiplagiat.ru
Особенности проверок
диссертаций с помощью
системы Антиплагиат
Юрий Викторович Чехович, к.ф.-м.н.
18 февраля 2016 года, г. Бишкек, Республика Кыргызстан
www.antiplagiat.ru
СИСТЕМА АНТИПЛАГИАТ. КОРОТКО
• Антиплагиат – это специализированная поисковая система
• Поисковый запрос – документ (любой формат, любой размер)
• Ответ на запрос – документ запроса, в котором «подсвечен»
заимствованный текст, показаны источники, рассчитан «процент
оригинальности»
• Сайт www.antiplagiat.ru – общедоступная ограниченная версия
• Антиплагиат.Корп, Антиплагиат.ВУЗ (*.antiplagiat.ru) – версии
для организаций и учебных заведений, учитывающие
специфику процессов организаций
18 февраля 2016 года
г. Бишкек
2
www.antiplagiat.ru
АНТИПЛАГИАТ. КАК ЭТО РАБОТАЕТ
18 февраля 2016 года
г. Бишкек
3
www.antiplagiat.ru
АНТИПЛАГИАТ. КАК ЭТО РАБОТАЕТ
21-24 октября 2014 года
«Образовательная среда-2014»
г. Москва
4/14
www.antiplagiat.ru
АНТИПЛАГИАТ. КАК ЭТО РАБОТАЕТ
21-24 октября 2014 года
«Образовательная среда-2014»
г. Москва
5/14
www.antiplagiat.ru
АНТИПЛАГИАТ. КАК ЭТО РАБОТАЕТ
21-24 октября 2014 года
«Образовательная среда-2014»
г. Москва
6/14
www.antiplagiat.ru
АНТИПЛАГИАТ. КАК ЭТО РАБОТАЕТ
18 февраля 2016 года
г. Бишкек
7
www.antiplagiat.ru
НАЧАЛО ПРОЕКТА
• 2005 год:
– Вузам нужна система для проверки работ студентов
– Разработчик алгоритмов: Вычислительный центр РАН
•
•
•
•
академик РАН Ю.И. Журавлев
член-корреспондент РАН К.В. Рудаков
доктора и кандидаты наук – сотрудники ВЦ РАН
молодые ученые МФТИ, МГУ
– Разработчик системы: компания «Форексис»,
– Запуск сайта www.antiplagiat.ru
– Организована компания «Антиплагиат»
• 2006 год:
– Зарегистрирован торговый знак: Антиплагиат®
18 февраля 2016 года
г. Бишкек
8
www.antiplagiat.ru
ПРИЗНАНИЕ ПРОЕКТА
•
•
•
•
•
•
•
•
•
•
2006: победа в Конкурсе русских инноваций, первое внедрение в вузе
2007: топ 10 Премии Рунета, внедрение в ГУ ВШЭ
2008: внедрение в Российской государственной библиотеке
2009: финалист премии имени Владимира Зворыкина
2010: внедрение в Минобрнауки РФ, 16 вузов
2011: ВАК Кыргызстана – первое зарубежное внедрение, внедрение в
ГК «Росатом», 52 вуза
2012: Премия Правительства РФ в области образования, внедрение в
ЦИТиС, 140 вузов
2013: внедрение в Дирекции НТП, 240 вузов
2014: резидент «Сколково», внедрение в НЭБ eLIBRARY.RU, 350 вузов,
больше 3 миллионов студентов, номинант Премии Рунета
2015: 510 вузов России, Казахстана, Кыргызстана, Беларуси
18 февраля 2016 года
г. Бишкек
9
www.antiplagiat.ru
АНТИПЛАГИАТ СЕЙЧАС. ЦИФРЫ
• ~ 10 секунд на проверку
среднего документа
• > 200 тысяч проверок в сутки
(в 2016 году ожидаем 300
тысяч)
• >20 миллионов проверенных
документов в год
• ~ 110 миллионов существенно
разных источников
• > 510 вузов России и ближнего
зарубежья
• ~ 2 000 000 пользователей
18 февраля 2016 года
• 40 участников команды:
математики, программисты,
инженеры
• 2 территориальноразнесенные площадки:
до 8 серверов в пике
• 2 площадки партнеров:
РГБ, eLIBRARY.RU
• Еженедельное обновление
индекса
• Постоянное
совершенствование системы
г. Бишкек
10
www.antiplagiat.ru
ЧТО МОЖЕТ АНТИПЛАГИАТ?
• Проверять тексты на любых языках
• Исправлять замены сходных по написанию букв
• Обнаруживать перестановки предложений, абзацев,
страниц и т.п.
• Корректно обрабатывать вставку, удаление, замену
форм слов
• Оповещать о попытках «обхода» системы
18 февраля 2016 года
г. Бишкек
11
www.antiplagiat.ru
ЧЕГО НЕ МОЖЕТ АНТИПЛАГИАТ?
• Проверять изображения, формулы, графики, сложные
таблицы
• Обнаруживать текст, переписанный «своими словами»
• Заменить человека в принятии решения о качестве
проверяемого документа
18 февраля 2016 года
г. Бишкек
12
www.antiplagiat.ru
ГДЕ ИЩЕТ АНТИПЛАГИАТ?
• Интернет (>92 млн.) на русском, английском, украинском, казахском,
белорусском, киргизском языках :
–
–
–
–
–
–
Журналы ВАК
Ученые советы
Патенты России и СССР
Arxiv.org
Cyberleninka.ru
Другие открытые сайты (рефераты, аналитика, СМИ)
•
•
•
•
Диссертации и авторефераты РГБ (843 тыс.)
Полные тексты научных статей НЭБ eLibrary.ru (>11 млн.)
Юридические и нормативные документы Лекспро (11,5 млн.)
Собственная коллекция (неограниченный объем, возможности
автоматического пополнения)
• Кольцо Вузов
18 февраля 2016 года
г. Бишкек
13
АНТИПЛАГИАТ
Исследование
Тема: изучение структуры заимствований
в текстах диссертаций, защищенных по
историческим наукам, хранящимся в
электронной коллекции полных текстов
диссертаций РГБ
Цель: исследование применимости
системы «Антиплагиат» для массового
анализа на заимствования
специализированных узкотематических
коллекций объемных документов
Исторические диссертации
АНТИПЛАГИАТ
1
2
3
4
Обрабатывались 14 256 текстов по специальностям 07.ХХ.ХХ
Суммарный объем текста – 7,2 млрд. символов,
около 3,6 миллионов условных страниц
2204 докторских, 12052 кандидатских диссертации
Проблемы оцифровки: переносы, сноски, номера страниц
Этапы исследования
АНТИПЛАГИАТ
1
Предобработка данных: удаление некорректных файлов
(пустые, ошибочные, неправильная кодировка), построение
индекса
2
Построение отчетов о заимствованиях по принципу «каждый
со всеми» (длительная операция)
3
Постобработка отчетов: фильтрация по году защиты, удаление
малообъемных заимствований и объединение блоков, учет
корректного цитирования, учет расположения заимствований
4
Анализ и интерпретация результатов
Исторические рамки
АНТИПЛАГИАТ
Количество диссертаций
1400
1200
Период защит с 1965 по 2012
Более 90% диссертаций защищено после 1999
1000
800
600
400
200
2012
2011
2010
2009
2008
2007
2006
2005
2004
2003
2002
2001
2000
1999
1998
1997
1996
1995
1994
1993
1992
1991
1990
1989
1988
1987
1986
1985
1984
1983
1982
1981
1980
0
АНТИПЛАГИАТ
Структура заимствований
АНТИПЛАГИАТ
Объемы заимствований
Более 10% диссертаций
имеют значимые
заимствования
Страница 10 из 12
АНТИПЛАГИАТ
Направление заимствований
АНТИПЛАГИАТ
Влияние нормативной базы
www.antiplagiat.ru
СПАСИБО ЗА ВНИМАНИЕ!
Компания «Антиплагиат»
+7 (495) 223-23-84
chehovich@antiplagiat.ru
Чехович Юрий Викторович
22
Download