Признаки классификации. Вектор признаков классификации

advertisement
УДК 81-13
ВЕКТОРНЫЕ ПОРОЖДАЮЩИЕ ГРАММАТИКИ И ИХ ПРИМЕНЕНИЕ ДЛЯ
ГЕНЕРАЦИИ УЧЕБНЫХ МАТЕРИАЛОВ ПО ФОНЕТИКЕ ЯЗЫКА
Сотникова В.В., Усова А.А., Личаргин Д.В.
научный руководитель канд.техн. наук Личаргин Д.В.
Сибирский федеральный университет
Современный уровень развития технического и программного обучения
предоставляет широкие возможности в использовании компьютеров в сфере
образования. Трудно переоценить значимость компьютерных технологий в
дистанционном обучении. Электронные образовательные ресурсы являются одной из
самых ценных составляющих образовательной информационной среды. Именно в
образовательных ресурсах концентрируется содержательная составляющая учебного
процесса.
В настоящее время невозможно назвать дисциплину, при обучении которой, так
или иначе, не использовались бы электронные издания или ресурсы. Процесс нарастания
интеграции электронных образовательных ресурсов в обучение вызывает необходимость
совершенствования традиционного учебного класса на основе сетевых технологий.
Разработка электронных обучающих ресурсов требует от преподавателя
увеличения затрат времени на создание учебного материала, что затрудняет реализацию
индивидуальной траектории обучения студентов. При этом студенты, изучающие
иностранные языки, также испытывают трудности с изучением правил чтения текстов на
иностранных языках. В процессе создания современных систем электронного обучения
требуется интеграция знаний из разнородных источников и решение задач
тиражирования знаний. Возникла задача максимально сократить время разработки
курсов и материалов.
В данной работе рассматривается использование векторных порождающих
грамматик при генерации учебных материалов по фонетике языка.
Исследования затрагивают такие аспекты предметных областей, как
информатика, компьютерная лингвистика, математика и математическая логика. Однако
вопрос нуждается в дальнейшем исследовании, так как векторный метод улучшит
качество генерации строк.
Классическим способом определения языков через порождающую процедуру
является определение их с помощью порождающих грамматик, или грамматик
Хомского.
«Порождающие грамматики были введены Н. Хомским в конце 1950-х годов как
средство описания формальных языков (точнее, как средство описания формальных
моделей естественных языков)».
Порождающая грамматика нужна для порождения (вывода) цепочки языка из
некоторой начальной цепочки с помощью определенных правил замены. Порождение
это пошаговый процесс, в котором на каждом шаге из цепочки, уже полученной на
предыдущем шаге, путем применения к ней правил замены можно получить новую
цепочку.
Порождающая грамматика задается четверкой: G<S, T, N, R>, где S – начальный
символ порождающей грамматики G, T – множество терминальных символов (совпадает
с алфавитом языка, задаваемого грамматикой), N – множество нетерминальных
символов, R – множество правил трансформации одной строки в другую.
Рассмотрим использование векторного представления для порождающих
грамматик.
Векторное представление слова
— параметризованная
функция, отображающая слова из некоторого естественного языка в векторы большой
размерности.
Векторные представления слов и фраз способны значительно улучшить качество
работы некоторых методов автоматической обработки естественного языка.
Был разработан ресурс, который может помочь студентам и лицам, изучающим
иностранные языки, овладеть навыками чтения текста на иностранном языке за
минимальное время, на основе опоры в виде практической и/или международной
транскрипции.
Ввод текста и автоматический или пользовательский
выбор языка транскрибирования
Проверка на вхождение слов словаря в текст
Тип вхождения фрагмента
текста
Подходит
морфологическая
производная
Подходит
собственно
слово
Слово неизвестно
Генерация
транскрипции по
аналогии с другим
словом
Генерация остаточной
части слова по правилам
Добавление фрагмента в массив вывода
Рис. 1. Блок-схема алгоритма генерации транскрипции
Основная идея работы заключается в использовании векторного метода для
порождающих грамматик, позволяющей переводить без словаря с учетом
вариативности интонации.
«В связи с дифференциацией звуков по напряженности в голосовой щели, с
которой связана и дифференциация их по громкости, а также в связи с дифференциацией
способов произнесения каждого отдельного звука, слогообразование может приобретать
более сложные и разнообразные формы, которые в той или другой мере наблюдаются в
различных языках».
Поэтому важно учитывать данные критерии при составлении транскрипции слов:
напряженность, резкость, временной компонент (время до и после произнесения звука) и
слитность (с плавными переходами между звуками).
Из данных критериев составляется вектор признаков классификации. Признаки
одного ряда имеют тождественные элементы, определяющие связи и логику
классификации, выраженную в виде семантической формулы определяемых понятий.
Значения каждого элемента вектора являются понятиями другой классификации.
Единицы слова разного уровня – буквы с различными признаками. Каждая
классификация генерирует понятия для создания ряда признаков последующих
классификаций. Каждую из классификаций задает свой вектор семантических признаков.
T=
t1[напряженность,
резкость,
временной
компонент,
слитность],
t2[напряженность, резкость, временной компонент, слитность],…, tn[напряженность,
резкость, временной компонент, слитность], где T – слово языка, t1… tn – буква с рядом
критериев.
Признаки классификации. Вектор признаков классификации задается
перечислением множества значений элементов семантического для каждого уровня
классификации, то есть для каждого элемента вектора отдельно.
Приведем некоторые примеры использования векторных порождающих
грамматик. Грамматики Хомского традиционно имевшие вид AB..CDE..F, могут быть
записаны в виде: AijBij..CijDijEij..Fij. Значения элементов векторов могут быть как
константы, так и переменные. Например: [напряженность, x…y, z...w]  [резкость, x…y,
q…r] + [временной компонент, x…y, z…w].
В рамках данной работы предложено использование векторных порождающих
грамматик при генерации учебных материалов по фонетике языка.
Подчеркивается важность продолжения исследований по теме порождающих
грамматик при генерации учебных материалов.
В заключении необходимо отметить, что векторные порождающие грамматики,
могут явиться эффективным средством порождения, позволяющим генерировать
транскрипцию с учетом вариативности интонации и особенностей произношения.
Список использованных источников:
1. Личаргин Д.В., Трушакова А.И., Бачурина Е.П. К проблеме разработки
вариантов ответов для системы генерации тестовых заданий по фонетике иностранного
языка /Материалы Х Юбилейной Всероссийской с международным участием научнотехнической конференции «Молодежь и наука» – Красноярск, 2014 [эл.ресурс].
2. Личаргин Д.В., Бачурина Е.П. Обобщенная иерархическая структура учебного
электронного курса и рассмотрение на ее основе электронных курсов обучения
английскому языку // Информатизация образования и науки, № 3(15) 2012 – с.20-36.
3. Личаргин Д.В. Порождение фраз естественного языка в рамках задачи
построения естественно-языкового интерфейса с программным обеспечением //
Материалы восьмой всероссийской конференции «Проблемы информации региона» ПИР
2003. Том 2. – Красноярск: ИПЦ КГТУ, 2003. – С 152-156.
4. Sievers E., GrundzügederPhonetik, Lpz., 1901 (главы 25—27); Jespersen
O.,LehrbuchderPhonetik, 2 Aufl., Lpz., 1913 (глава XIII); Grammont M., Traitédephonétique,
P., 1933 (Premièrepartie, XII); Абеле А., Квопросуослоге, «Slavia», III, 1, 1924; Соссюр Ф.,
де, Курсобщейлингвистики, М., 1933 (фр. изд., 1916);Приложениеквведению.
Download