МиН Бачурина Е.Пx - Сибирский федеральный университет

advertisement
УДК 735.29
ПРИМЕНЕНИЕ ПОРОЖДАЮЩИХ ГРАММАТИК ДЛЯ ГЕНЕРАЦИИ
УЧЕБНЫХ МАТЕРИАЛОВ ПО ИНОСТРАННОМУ ЯЗЫКУ
Бачурина Е.П.
Научный руководитель канд. техн. наук Личаргин Д.В.
Сибирский федеральный университет
В работе рассматривается применение порождающих грамматик при
составлении автоматически генерируемых обучающих материалов для студентов и лиц,
изучающих иностранные языки.
Проблему генерации порождающими грамматиками давно и широко
исследовали различные авторы, в частности Хомский, Монтегю и др.
Исследования проводятся на стыке таких наук, как информатика, лингвистика,
компьютерная лингвистика, математика и математическая логика. Однако улучшение
качества генерации строк требует дополнительных исследований в рамках принципов
упорядочения множества правил порождающих грамматик.
Основная идея работы состоит в построении принципа работы порождающих
грамматик с упорядоченным набором правил и в применении этого подхода к проблеме
генерации фонетических шаблонов в образовательных целях.
Порождающая грамматика позволяет выводить (порождать) цепочки языка из
некоторой начальной цепочки с помощью определенных правил замены (или правил
подстановки).
Как известно, стандартные порождающие грамматики над строками имеют вид
четверки: G<S, T, N, R>, где S – начальный символ порождающей грамматики, T –
множество терминальных символов, N – множество нетерминальных символов, и R –
множество правил трансформации одной строки в другую.
Порождение есть пошаговый процесс, в котором на каждом шаге из цепочки,
уже полученной на предыдущем шаге (в частности, из начальной), можно путем
применения к ней правил замены получить новую цепочку.
А. Хомский предложил теорию, которая стала называться трансформационной
грамматикой. По мнению Хомского, язык — это не набор единиц языка и их классов, а
механизм, создающий правильные фразы. Хомский полагал, что в основе механизма
порождения фраз лежит перевод глубинных структур в поверхностные. Глубинная
структура формирует смысл предложения, а поверхностная — является звуковым
воплощением этого смысла.
Хомский вводит ряд правил перехода глубинной структуры в поверхностную
(правила подстановки, перестановки, произвольного включения одних элементов,
исключения других элементов), а также предлагает 26 правил трансформации
(пассвизация, субституция, пермутация, негация, адъюнкция, эллипс и др.). Таким
образом, система правил существует как способность порождать и понимать
бесконечное число предложений.
Сторонники порождающей грамматики придерживаются идеи, что
грамматический строй можно условно рассматривать не как результат
коммуникативной функции и изучения сложной системой личности в процессе
обучающего взаимодействия с окружающей средой, а как результат преобразований на
основе набора формальных правил. Этим порождающая грамматика отличается от
подходов,
принятых
в
когнитивной
грамматике,
функционалистской и
бихевиористской теориях.
На основе порождающих грамматик авторами [1] были разработаны правила для
генерации транскрипции иностранных языков, а также функции, реализующие
генерацию верной и неверной транскрипций, что решает проблему составления
вариантов ответов к тестам электронных курсов. Создание таких правил решало
актуальную проблему, появившуюся в связи с широким распространением подходов по
проверке знаний учеников в электронной форме.
Рисунок 1 - Пример генерации осмысленных фраз языка в программе
«Генератор материалов по методу И.Франка»
Была создана программа генерации правильной и неправильной транскрипции и
составления на их основе заданий с верными и неверными вариантами ответов для
учебных тестов. Предложенная программа позволяет выбирать язык генерации из
предложенных, перевести введенное слово или текст в корректную и некорректную
транскрипцию, с помощью которых возможно составить тесты, что может значительно
упростить процесс контроля успеваемости у студентов и школьников, изучающих
иностранный язык. При порождении фраз порождающей грамматикой используются
различные синтаксические формы, в частности, указание на параллельную замену
подстрок.
В перспективе на основе использования рекурсивных порождающих грамматик
с привлечением семантических моделей языка можно более эффективно решать задачи
порождения грамматически и семантически осмысленной речи.
Необходимо отметить, что предшествующие типы порождающих грамматик не
всегда справляются с задачей учета более широкого контекста и нуждаются в большем
упорядочении внутренней структуры множеств правил. Необходимо учесть
традиционное отсутствие их деления на классы или группы. Предлагается использовать
принцип упорядочения правил порождающей грамматики, разбивать правила на
группы, группы – на уровни, уровни – на иерархии различных типов.
Упорядочение множеств заключается в определении на элементах этого
множества отношения больше, меньше или равно, в задании на множествах
трансформируемых друг в друга классов эквивалентности.
Приведем пример использования предлагаемого вида упорядочений правил
порождающей грамматики:
{Clause  Subject + Predicate + Object} ≺ {Clause  Subject + Predicate + Object
+ Modifier} ≺ {Predicate + Predicate + Object  Predicate-Food + Object-Food} ≺
{Object-Food  Dish} ≺ {Predicate-Food  Cook} ≺ {Dish  Salad}.
Приведем пример генерируемых на основе таких правил иерархии фраз.
 «The» + «girl» + «like»+ «-(e)s» + «to» + «cook» + «the» + «dish»;
o «The» + «girl» + «like»+ «-(e)s» + «to» + «cook» + «the» + «salad»;
 «The» + «nice» + «girl» + «like»+ «-(e)s» + «to» + «cook» + «the» + «dish» +
«in» + «the» + «kitchen»;
o «The» + «nice» + «girl» + «like»+ «-(e)s» + «to» + «cook» + «the» + «salad»+
«in» + «the» + « kitchen».
Фрагменты схемы алгоритмической реализации решения проблемы генерации
фонетической транскрипции и разметки приводится ниже.
В правилах порождающей грамматики слева стоит символ, который должен
быть преобразован в символ стоящий справа. Например,
state  стЕйт
significant  сэгнИфикэнт
Siberia  сайбИриэ
Siberian  сайбИриэн
Различные типы отношений порядка, реализующие различные принципы
обработки строк на основе последовательно извлекаемых из классификации правил,
необходимо реализовывать на основе методологических принципов или (более
формально) на основе векторов классификаций, что упрощает работу по
трансформации строк и увеличивает вероятность генерации более осмысленных и
естественных для восприятия фраз языка.
В рамках данного исследования система генерации пространства состояний
генерируемой строки описывается моделью последовательного вызова правил
определенного класса или подкласса для конкретных уровней генерации с
возможностью семантизации этих уровней. Данный подход является частью работы по
формализации естественного языка с акцентом на его семантику и решение проблемы
генерации осмысленной речи.
Таким образом, предложен общий подход по упорядочению системы правил
порождающих грамматик для учебных целей. Предложены принципы задания
отношений порядка на множестве правил порождающих грамматик определенной
предметной области, позволяющие реализовать базовый функционал порождающих
грамматик с упорядоченным набором правил.
Список использованных источников:
1.
Личаргин Д.В., Трушакова А.И., Сафонов К.В., Бачурина Е.П. Разработка
системы рекурсивных порождающих грамматик для решения задачи автоматического
построения интонационных шаблонов языковых выражений // Вестник СибГАУ. №4,
2014. №5. с. 88-100.
2.
Личаргин Д.В. К вопросу об упорядочении многоуровневой
семантической сети на дереве семантической классификации / Личаргин Д.В., Сафонов
К.В., Егорушкин О.И. и др. // Вестник СибГАУ. 2014. №2. С. 44-50.
3.
Личаргин Д.В. Методы и средства порождения семантических
конструкций естественно языкового интерфейса программных систем. Диссертация.
Кандидат технических наук: 05.13.17. / Д.В. Личаргин. Защищена 05.07.2004, Утв.
10.12.2004; №137428. Красноярск, 2004. - 154 с.
4.
Личаргин Д.В., Бачурина Е.П. Обобщенная иерархическая структура учебного
электронного курса и рассмотрение на ее основе электронных курсов обучения английскому
языку//Информатизация образования и науки.№3(15)2012.– с. 20-36.
Download