Автоматизированное выявление потенциальных

advertisement
Автоматизированное выявление потенциальных
коррупциогенных факторов в проектах НПА
Романов Д.А., доцент НИУ ВШЭ
Васильченко Ю.Л., зав.кафедрой правовой информатики МГЮА
Применение методов компьютерной лингвистики для анализа текстов юридической
тематики – давнее и популярное направление исследований [1,2]. Юридические документы во всём мире отличает высокая степень формализации, строгости изложения и структурированности, что уже более 25 лет делает их интереснейшим объектом для развития
прикладных технологий искусственного интеллекта [10]. Успешно решаются задачи формализация и классификация правовых норм, поиск прецедентов, выявление правовых
пробелов и коллизий. Несмотря на свою актуальность, проблематика применения методов
компьютерной лингвистики как эффективной технологии обработки русскоязычного правового контента для целей законотворчества была долгое время обделена вниманием исследовательского сообщества. Семантический анализ правовых текстов проводился, главным образом, для улучшения качества поиска релевантных документов в справочных правовых системах. Наделение органов государственной власти функциями антикоррупционной экспертизы на фоне роста количества законопроектов, вносимых изменений и дополнений в действующее законодательство, часто недостаточной подготовки экспертов, делает актуальной задачу экспертной поддержки законотворческой деятельности с помощью
средств автоматизированной интеллектуальной юридико-лингвистической обработки текстов проектов нормативных правовых актов (НПА).
Рассмотрим существующий процесс антикоррупционной экспертизы, проводимой квалифицированным экспертом. На вход эксперт получает текст проекта НПА. Анализируя
представленный текст, эксперт выделяет в тексте некорректные формулировки, которые,
по его мнению, либо сами по себе, либо в комплексе с другими правовыми нормами приводят к возникновению потенциального коррупциогенного фактора. Выделяться может
отдельное слово, словосочетание, предложение или абзац или даже более крупный структурный элемент - пункт, подпункт, статья и т.п. По каждой выделенной некорректной
формулировке эксперт подготавливает замечание, в котором поясняет свою позицию и
ссылается на тот или иной пункт Методики, указывая тем самым на конкретный тип коррупциогенного фактора. Итоговым результатом работы эксперта является отчет о проведении антикоррупционной экспертизы, в котором собраны все высказанные экспертом
замечания. Основной целью данного исследования являлась разработка алгоритмов авто-
матизированной юридико-лингвистической обработки текстов нормативных правовых актов при проведении антикоррупционной экспертизы.
Постановлением Правительства РФ № 96 от 26.02.2010 утверждена Методика проведения
антикоррупционной экспертизы нормативных правовых актов и проектов нормативных
правовых актов [3]; последние изменения и дополнения были приняты Постановлением
Правительства РФ №732 от 18 июля 2015 г. Методикой рекомендуется выявлять двенадцать коррупциогенных факторов, разделенных на две группы: (а) факторы, устанавливающие для правоприменителя необоснованно широкие пределы усмотрения или возможность необоснованного применения исключений из общих правил (в т.ч. широта дискреционных полномочий, определение компетенции по формуле "вправе", выборочное изменение объема прав, наличие коллизий-противоречий и др.); (б) факторы, содержащие неопределенные, трудновыполнимые и (или) обременительные требования к гражданам и
организациям (наличие завышенных требований, злоупотребление правом заявителя,
юридико-лингвистическая неопределенность – употребление неустоявшихся, двусмысленных терминов и категорий оценочного характера). Очевидно, что данная классификация не является окончательной и единственно возможной. Так, в ряде публикаций критиковалось неоправданное сокращение количества коррупциогенных факторов по сравнению с предыдущей редакцией Методики от 2009 года [4], нечеткость формулировок и отсутствие целеполагания в описании коррупциогенных факторов [5]. Поэтому задача автоматизации процесса антикоррупционной экспертизы осложняется как отсутствием однозначного и устоявшегося толкования перечня и формулировок коррупционных факторов,
так и сохраняющейся дискуссионностью самого понятия. Отметим также, что простейший
формальный подход к автоматизации процесса антикоррупционной экспертизы, основанный на поиске в проектах НПА отдельных ключевых слов даёт весьма высокий уровень
шума – система будет отмечать как потенциально коррупциогенные многочисленные
предложения, содержащие корректные правовые нормы. Например, ключевое слово
"вправе" часто используется в текстах большинства НПА, не создавая при этом какихлибо коррупциогенных факторов. Поэтому для достижения приемлемого для практического использования уровня точности работы системы автоматизированного проведения
антикоррупционной экспертизы требуются более точные методы.
В компьютерной лингвистике решение различных прикладных задач анализа текста осуществляется чаще всего с помощью двух основных подходов: (а) использование
статистических методов и машинного обучения и (б) использование систем, основанных
на правилах и шаблонах. Применение методов машинного обучения для автоматизированного выявления потенциальных коррупциогенных факторов затруднено, поскольку от-
сутствует достаточная обучающая выборка исходных примеров и образцов текстов документов с выделенными экспертами коррупциогенными факторами (в наличии десятки и
сотни примеров при необходимых десятках и сотнях тысяч). Кроме того, сам процесс антикоррупционной экспертизы связан с многозначностью и неопределенностью экспертных оценок. Поэтому для достижения поставленной цели в данной работе была применена
уникальная методика построения и применения контекстно-зависимых лексических шаблонов для юридико-лингвистической обработки текста правового акта при проведении
правовой экспертизы. Данный подход был отработан ранее на примере задач выявления
экспертных компетенций [6] и формализации учебных материалов для студентов юридических вузов [7]. Анализ текстов отчетов о проведении антикоррупционных экспертиз
позволил выявить ряд семантических конструкций, характерных для формулировок потенциальных коррупциогенных факторов некоторых типов. Важно, что никакое отдельное
ключевое слово или словосочетание само по себе не является коррупционенным фактором, необходимо принимать во внимание его употребление в контексте формулируемой
правовой нормы. Каждый лексический шаблон как раз и описывает употребление характерных для коррупциогенных факторов слов и словосочетаний в некотором определенном
контексте. В ходе проведённого исследования были выявлены и использованы для построения более чем ста лексических шаблонов конструкции, содержащие: явное упоминание потенциального коррупциогенного фактора в наиболее коррупциогенных сферах; категории оценочного характера; определения компетенции по формуле "вправе"; бланкетные нормы; необоснованные исключения из общего порядка. Так, например, конструкции,
содержащие категории оценочного характера, описываются лексическими шаблонами
трех типов:
 Оценочное прилагательное в составе n-граммы именных групп (при недостаточном
владении иностранным языком, отсутствие надлежащего оформления, обоснованные предложения и замечания, при определенных условиях, …);
 Оценочное наречие с глаголом (незамедлительно принимает меры, регулярно информирует, своевременно предоставляет, …);
 Оценочное существительное в составе n-граммы именных групп (невостребованность муниципального имущества, материалы, обеспечивающие полноту и достоверность информирования граждан, …).
На основе выделенных лексических шаблонов была разработана автоматизированная информационная система для проведения антикоррупционной экспертизы проектов НПА.
Данная система стала развитием системы правового мониторинга АИС «Мониторинг»,
используемой в МВД России [8]. В состав системы входят: пополняемая база примеров
текстовых фрагментов, содержащих коррупциогенные формулировки; блок настраиваемых лексических шаблонов и правил проверки текстов; аналитический блок для морфологического и синтаксического анализа текста и выделения некорректных формулировок по
лексическим шаблонам; блок визуализации результатов экспертизы.
Задача аналитического блока состоит в том, чтобы c помощью заданных алгоритмов,
настроек и базы действующего законодательства выполнить для эксперта предварительную подготовительную работу и выделить в тексте проекта НПА подозрительные формулировки, которые, возможно, связаны с потенциальными коррупциогенными факторами.
Эксперт, проводящий антикоррупционную экспертизу,
рассматривает предварительно
обработанный текст и может либо принять результат работы аналитического блока, согласившись с отнесением формулировки к некорректным, либо отвергнуть его, посчитав
существующую формулировку корректной (ложная тревога), либо дополнить или исправить результат работы аналитического блока, если, например, по мнению эксперта необходимо выделить больший или меньший фрагмент текста с некорректной формулировкой,
изменить тип потенциального коррупциогенного фактора, добавить дополнительные пояснения и т.п. Кроме того, эксперт может отметить как некорректный текстовый фрагмент
проекта НПА, который не смогли обнаружить алгоритмы аналитического блока автоматизированной системы антикоррупционной экспертизы (пропуск цели). По результатам проверки система формирует проект отчета о проведении антикоррупционной экспертизы, в
который эксперт также может внести необходимые уточнения и дополнения.
По аналогии с метриками информационного поиска можно ввести метрики, характеризующие качество работы аналитического блока:
 точность выделения коррупциогенных факторов - это отношение числа выделенных системой релевантных (подтвержденных, и, возможно, поправленных экспертом) некорректных формулировок к общему числу всех найденных системой некорректных формулировок;
 полнота выделения коррупциогенных факторов - это отношение числа выделенных
системой релевантных (подтвержденных, и, возможно, поправленных экспертом)
некорректных формулировок к общему числу всех замечаний в итоговом отчете.
Также можно ввести метрику аккуратности (отношение числа некорректных формулировок, принятых экспертом без изменений к общему числу всех выделенных системой релевантных некорректных формулировок) и F-меру (среднее гармоническое точности и полноты).
Важно отметить, что система не заменяет человека, а помогает ему, сокращает трудозатраты и время проведения экспертизы, снижает риск пропуска коррупуциогенных факто-
ров. По сравнению с использовавшимся ранее подходом, основанном на поиске ключевых
слов и словосочетаний, использование лексических шаблонов позволило значительно повысить точность и полноту выделения потенциальных коррупциогеных факторов в проектах НПА. Необходимо учитывать, однако, что не все из представленных в Методике типов
коррупциогенных факторов могут быть выявлены с помощью лексических шаблонов. Если коррупциогенный фактор возникает во взаимосвязи правовой нормы из проверяемого
проекта НПА и действующего законодательства, анализ текста одного только проекта
НПА не даст результата. Так, лексические шаблоны не смогут обнаружить установление
общеобязательных правил поведения в подзаконном акте в условиях отсутствия закона.
Поэтому автоматизированная система должна рассматриваться, прежде всего, как удобный вспомогательный инструмент, расширяющий и дополняющий возможности человека,
берущий на себя трудоемкие рутинные задачи антикоррупционной экспертизы проектов
НПА [9].
Литература
1) McCarty, L. Thorne. "Deep semantic interpretations of legal texts." Proceedings of the 11th
international conference on Artificial intelligence and law. ACM, 2007.
2) Francesconi, Enrico, et al., eds. Semantic processing of legal texts: Where the language of
law meets the law of language. Vol. 6036. Springer, 2010.
3) Постановление Правительства РФ от 26.02.2010 N 96 "Об антикоррупционной экспертизе нормативных правовых актов и проектов нормативных правовых актов". Собрание законодательства РФ. – 2010. – N 10. - Ст. 1084.
4) Епихин В. П. "Роль и место прокуратуры при производстве антикоррупционной экспертизы." Вестник Волгоградского государственного университета. Серия 5: Юриспруденция 1.5-14 (2011).
5) Будатаров С.М. "Коррупциогенные факторы: понятие, виды, проблемы их практического применения." Мониторинг правоприменения, 2 (2013).
6) V.Molokanov, D.Romanov, V.Tsibulsky "Enhanced Algorithms for Enterprise Expert
Search System", in: Proc. of International Conference on Graphic and Image Processing
(ICGIP 2012). Singapore : SPIE, 2013. Ch. 8768-36. P. 146-150.
7) Васильченко Ю.Л., Романов Д.А. "Анализ и систематизация правовых дефиниций в
учебном процессе юридического ВУЗа". Сб. науч. работ ИГП РАН– М.: ИГП РАН –
Издательство «Канон+» РООИ «Реабилитация», 2015 – 280 с.
8) Дюков А.В., Зыков А.А., Ищенко Т.Ю., Ковалев Д.А., Романов Д.А., Цибульский В.В.,
Черников В.В. "Система сбора правовой информации и ее анализа для выявления
проблемных вопросов и недостатков нормативного правового регулирования." Патент
на полезную модель RUS 115095 23.09.2011.
9) "Антикоррупционная экспертиза проектов нормативных правовых актов: научнопрактическое пособие". Отв. ред.: Ю. А. Тихомиров. М. : Анкил, 2012.
10) Bench-Capon, Trevor, et al. "A history of AI and Law in 50 papers: 25 years of the international conference on AI and Law." Artificial Intelligence and Law 20.3 (2012): 215-319.
Download