МОДЕлЬ УСТНОй РЕЧИ

advertisement
БИОНИКА ИНТЕЛЛЕКТА. 2010. № 1 (72). С. 94–97
хнурЭ
УДК 519.7
МОДЕЛЬ УСТНОЙ РЕЧИ
Н. Е. Русакова1
1ХНУРЭ,
г. Харьков, Украина
Статья посвящена разработке методов формального описания структуры естественного языка с
помощью алгебры предикатов и алгебры предикатных операций, а также аппарата логических сетей;
рассматривается модель устного языка на примере звукового варианта склонения полных непритяжательных имен прилагательных. Актуальность этой темы определяется перспективностью применения
полученных методов для разработки систем общения с компьютером на естественном языке.
АЛГЕБРА ПРЕДИКАТОВ, ЛОГИЧЕСКАЯ СЕТЬ, ЕСТЕСТВЕННЫЙ ЯЗЫК, ПАРАДИГМАТИЧЕСКАЯ ТАБЛИЦА
Введение
В настоящее время все более совершенствуется компьютерная обработка естественного языка.
Лингвистические труды содержат неформализованные описания морфологических явлений, которые непросто перевести на математический язык.
Эти описания адресованы для понимания человеку.
Математические же описания морфологии языка
адресованы вычислительной машине, они должны
быть понятны ей. В качестве объектов математического описания будем рассматривать тексты, то
есть представленные в виде строчек знаковые речевые сообщения, которыми люди обмениваются
в процессе интеллектуальной деятельности. Важно
то, что далеко не любая строчка, составленная из
знаков, может быть признана текстом [1].
Целью работы является развитие формальных
средств описания естественного языка – разработка методов алгебрологического аппарата логических сетей, а также их применение для формализации морфологических структур на примере
построения логической сети для звукового варианта склонения полных непритяжательных имен
прилагательных.
1. Звуковой вариант склонения полных
непритяжательных имен прилагательных
В статье [2] для примера рассматривается, формально описывается на языке алгебры предикатов и
доводится до воспроизведения на логической сети
механизм склонения полных непритяжательных
имен прилагательных. Здесь предлагается письменный вариант, который более прост по сравнению со звуковым. Это обусловлено тем, что звуковая речь более древняя, чем письменная и вполне
может обходиться без письменной, в то время как
письменная без звуковой обойтись не может. Звуковой вариант предельно регулярен, правила его
достаточно просты, этот механизм языка уникален,
благодаря своей простоте и привычности для любого человека. Исследование письменного варианта
склонения имён прилагательных невозможно без
привлечения факторов звуковой речи (ударностьбезударность, твердость-мягкость). Исследование
же звукового варианта возможно без опоры на элементы письменного языка. Предшественники до
94
сих пор поступали наоборот, рассматривали письменный вариант, а звуковым вообще не интересовались. Грамматика русского языка как академическая, так и школьная, строятся по следующему
принципу: вначале немного говорится о звуковом
варианте речи, а затем всё описание механизма
языка ведется для варианта письменной речи.
Для рассмотрения выбираем полные непритяжательные имена прилагательные. Достаточно
основательная проработка этого раздела производится в языкознании. Притяжательные прилагательные сложнее, поскольку имеют беглость,
например лисий-лисья, и несколько типов склонения. В полных непритяжательных прилагательных
всего лишь один тип склонения, имеющий семь
четких вариантов склонения. Склонение полных
непритяжательных имен прилагательных образуют в грамматике компактный раздел морфологии
языка [3]. Склонение происходит с помощью парадигматической таблицы, которая для звукового
варианта представлена табл. 1.
Таблица 1
Падеж, x3
именительный
родительный
дательный
винительный
творительный
предложный
Число, x2
Единственное
Род, x1
мужской женский средний
слабый_
слабайя
слабойе
слабово
слабой_
слабово
слабому
слабой_
слабому
слабый_
слабуйю
слабойе
слабово
слабой_
слабым_
слабым_
слабойю
слабом_
слабой
слабом_
Множественное
слабыйе
слабых_
слабым
слабыйе
слабых_
слабыми
слабых_
Вводим необходимые для формального описания предметные переменные: x4 – признак одушевленности формы слова со значениями О – одушевленный, Н – неодушевленный; x1 – род формы
слова со значениями М – мужской, Ж – женский,
С – средний; x2 – число формы слова со значениями Е – единственное, М – множественное;
x3 – падеж формы слова со значениями И – именительный, Р – родительный, Д – дательный, В – винительный, Т – творительный, П – предложный.
МОДЕЛЬ УСТНОЙ РЕЧИ
В ячейках таблицы указаны формы слова в зависимости от их рода x1 , числа x2 и падежа x3 . Таблица составлена для конкретного слова слабый.
Для полных имен прилагательных имеются
типы склонений [3]. Ниже приведены таблицы
окончаний (табл. 2-7) для всех типов склонения с
указанием их номеров, которые сопровождаются
примерами слов, склоняемых по данному типу.
В звуковом варианте получилось меньше типов
склонения – не 7, а 6. Исчез 4-й тип склонения.
Если ударная основа оканчивается на звуки ж,
ш, то слово склоняется по 3-му типу. Если основа
оканчивается на ч, щ, то слово склоняется по 5-му
типу. В парадигматических таблицах опеределяем
для каждого склонения переменные: y1 – последний звук основы слова, y2 – признак ударностибезударности, y3 – мягкости-твердости, u – первичный класс последнего звука основы слова.
Рассмотрим формирование первичных, вторичных и третичных классов последнего звука основы
слова.
Первичные классы:
y1б ∨ y1в ∨ y1д ∨ y1з ∨ y1л ∨ y1м ∨ y1п ∨ y1m = uб ;
y1н ∨ y1p ∨ y1c = u н ;
y1ж ∨ y1ш = u ж ;
y1ц = uц ;
y1ч ∨ y1щ ∨ y1_ = uч ;
y1г ∨ y1к ∨ y1x = u г .
Вторичные классы:
uж = v ж ;
u ж ∨ uц = v ц ;
uб ∨ u н = v б ;
u н ∨ uч = v ч ;
uг = v г .
Таблица 2
ый_
ово
ому
ый_
ово
ым_
ом_
1 – слабый
айя
ойе
ой_
ово
ой_
ому
уйю
ой_
ойю
ой_
ыйе
ых_
ыми
ыйе
ых_
ым_
ыми
ий_
ево
ому
ий_
его
ом_
ых_
им_
ойе
y1 ∈{б,в,д,з, л,м,п,т,н,р,с};
y2 = y; y3 = m; u = б
Таблица 3
2 – чужой
айя
ойе
ыйе
ово
ой_
ово
ых_
ому
ой_
ому
ыми
уйю
ойе
ово
ым_
ом_
ой
ойю
ой_
ом_
4 – строгий
айя
ойе
ой_
ово
ой_
ому
уйю
ой
ойю
ой_
ойе
ыйе
ых_
ым_
ыми
ом_
ых_
y1 ∈{б,в,д,з,м,п,т,н,р,с,ж,ш};
y2 = б ; y3 = т; u = ж
им_
ими
ом_
их_
y1 ∈{г,к,х }; y2 = y; y3 = м; u = г
ой_
ово
ому
ой
ово
им_
ом_
5 – тугой
айя
ойе
ой_
ово
ой_
ому
уйю
ой_
ойю
ой_
ойе
ий_
3 – горячий
айя
ейе
ийе
ево
ей_
ево
их_
ему
ей_
ему
ими
юйю
ейе
ими
ом_
их_
y1 ∈{г,к,х }; y2 = б ; y3 = m; u = г
ево
им_
ем
ей_
ейю_
ей_
Таблица 7
их_
ый_
эво
эму
ый_
эво
им_
ими
ым_
ем_
их_
эм_
ыйе
y1 ∈{н,р,с,ч,щ,_}; y2 = y; y3 = м; u = ч
ийе
их_
ими
ийе
их_
им_
Таблица 4
ий_
ийе
их_
ими
ийе
их_
Таблица 6
ой_
ой_
Таблица 5
7 – куцый
айя
эйе
эй_
эво
эй_
эму
уйю
эй_
эйю
эй_
эйе
ыйе
ых_
ыми
ыйе
ых_
ым_
ыми
эм_
ых_
y1 ∈{ж,щ,ц}; y2 = y; y3 = m; u = ц
95
Н. Е. Русакова
Третичные классы:
б
б
v =w ;
vб ∨ vж = wж ;
vц = wц ;
vг = wг ;
vч = wч .
Производим нумерацию ячеек парадигматической таблицы. Полученные номера ячеек в дальнейшем будут использованы для обозначения влияний
контекста. Некоторые из влияний контекста получат более одного имени. Однако от этого недостатка мы впоследствии постараемся избавиться. Для
каждой ячейки парадигматической таблицы вводим свой номер r (табл.8).
Таблица 8
x3
x2
x1
И
Р
Д
В
М Е
Ж Е
С Е
- М
1
2
3
4
5
8
9
10
15
16
17
11
18
21
22
23
24
25
Т
6
П
7
12
13
14
19
26
20
27
x4
x5
Выразим номера r ячеек парадигматической
таблицы через признаки x1 - x5 .
Преобразование блока контекста слова имеет
следующий вид:
x1M x2E x3И = r 1 ; x1M x2E x3P = r 2 ; x1M x2E x3Д = r 3 ;
5
M E T
6
x1M x2E x3B = r 4 ; x1M x2E x3B xO
4 = r ; x1 x 2 x3 = r ;
x1M x2E x3П = r 7 ; x1Ж x2E x3И = r 8 ; x1Ж x2E x3P = r 9 ;
x1Ж x2E x3Д = r 10 ; x1Ж x2E x3B = r 11 ; x1Ж x2E x3T x5C = r 12 ;
x1Ж x2E x3T x5A = r 13 ; x1Ж x2E x П = r 14 ; x1C x2E x3И = r 15 ;
x1C x2E x3P = r 16 ; x1C x2E x Д = r 17 ; x1C x2E x3B = r 18 ;
x1C x2E x3T = r 19 ; x1C x2E x П = r 20 ; x2M x3И = r 21 ;
x2M x3P = r 22 ; x2M x Д = r 23 ; x2M x3B x4Н = r 24 ;
Cвязь внешних переменных представлена в
виде сети (рис. 1).
Рис. 1. Логическая сеть
2. Классификация первых звуков окончания
Механизм языка иерархичен, следовательно,
исследование языка необходимо вести в определенном порядке [4]. Механизм устной речи, появляющийся при склонении имён прилагательных,
можно описать, не привлекая письменную речь, в
то время как для изучения письменной речи нужны признаки смягчения и ударности звука. Если
изучать сначала письменный вариант склонения
имен прилагательных, то создаётся впечатление,
что буквы е и о противопоставлены друг другу:
ом-ем, ого-его и т.д. Но если рассмотреть сначала
устный вариант, то становится ясным, что звук е
противопоставлен звуку э, а звук о – звуку ё. Звук ё
из письменного варианта склонения прилагательных вовсе исключен. Но необходимость в звуке ё
возникает при рассмотрении потенциального варианта письменной речи для склонения прилагательных. После изучения устного варианта речи
легче понять её письменный вариант и глубже его
изучить. Гласные звуки явно соединяются в пары
родственных звуков, которые противопоставлены друг другу по признаку y3 (твердый-мягкий).
Появилась необходимость выделить пять звуков.
Обозначим их переменной L со значениями а, о,
у, ы, э. Классификация этих звуков представлена
в табл. 10.
Таблица 10
25
M T
26
M П
27
x2M x3B xO
4 = r ; x 2 x = r ; x 2 x3 = r .
Составляем таблицу типов склонений в зависимости от признаков y2 , y3 , где s – тип склонения.
Таблица 9
У Т У М Б Т Б М
w
б
1
–
–
–
ж
–
–
2
–
ч
–
3
–
–
ц
6
–
–
–
г
–
4
5
–
В итоге получаем блок слова, имеющий вид:
w б y У yT = s 1 ; w ж y Б yT = s 2 ; w ч y У y M = s 3 ;
г
У
M
4
г
Б
T
5
ц
У
T
6
w y y =s ; w y y =s ; w y y =s ,
который зависит от последнего звука основы слова
и признаков ударности-безударности и твердостимягкости.
96
y3
a
o
у
ы
э
T
a
o
у
ы
э
M
я
ё
ы
и
е
L
z1
В соответствии с классификацией первого звука окончания можно произвести классификацию
окончания в целом (табл. 11).
Таблица 11
Т
айя
уйю ыми
эйе
ойе
ыйе
ый_
ой_
эй_
М
яйя
юйю ими
ейе
ёйе
ийе
ий_
ёй_
ей_
Т
эво
ово
эму
ому
ым_
эм_
ом_
ых_
М
ево
ёво
ему
ёму
им_
ем_
ём_
их_
Т эйю
ойю
М ейю
ёйю
МОДЕЛЬ УСТНОЙ РЕЧИ
Окончание z расчленяется естественным образом на левую ( z л ) и правую ( zп ) части. Основанием для разделения окончания на левую и правую
части является то, что правая часть окончания
определяется исключительно влиянием контекста
(признаки x1 - x5 ), тогда как левая часть окончания
определяется, кроме того, еще и типом склонения
слова s . Левая часть окончания состоит из первой
буквы окончания. Правая же часть окончания состоит из двух компонентов – второй и третьей букв
окончания.
Теперь рассмотрим зависимость правой части
окончания от первого звука окончания (табл. 12), а
также расчленим правую часть окончания на звуки
(табл. 13).
Таблица 12
z1
йа
а
айя
у
ы
э
о
–
–
–
–
йю
ми
йе
й_
во
му
м_
х_
–
–
–
–
–
–
–
–
–
ый_
эй_
ой_
–
–
эво
ово
уйю
–
–
– ыми ыйе
эйю
–
эйе
ойю
–
ойе
–
–
–
– ым_ ых_
эму эм_
–
ому ом_
–
Таблица 13
z 2 z3
я
ю
и
е
_
о
у
й
м
в
х
йя
–
–
–
йю
–
–
–
–
ми
–
–
йе
–
–
–
й_
м_
–
х_
–
–
во
–
–
му
–
–
Проведя классификацию звуков окончания и
рассмотрев связь звуков между собой, можно записать в формульном виде эту связь.
z 1 = z1a z 2й z3я ; z 2 = z1я z 2й z3я ;
z 3 = z1y z 2й z3ю ; z 4 = z1ю z 2й z3ю ;
z 5 = z1ы z 2м z3и ; z 6 = z1и z 2м z3и ;
z 7 = z1э z 2й z3e ; z 8 = z1e z 2й z3e ;
z 9 = z1o z 2й z3e ; z 10 = z1ы z 2й z3e ;
z 11 = z1и z 2й z3e ; z 12 = z1ы z 2й z3_ ;
z 13 = z1и z 2й z3_ ; z 14 = z1э z 2й z3_ ;
z 15 = z1e z 2й z3_ ; z 16 = z1o z 2й z3_ ;
z 17 = z1э z 2в z3o ; z 18 = z1e z 2в z3o ;
z 19 = z1o z 2в z3o ; z 20 = z1э z 2м z3y ;
z 21 = z1e z 2м z3y ; z 22 = z1o z 2м z3y ;
z
23
=
z1ы z 2м z3_ ;
z
24
=
z1и z 2м z3_ ;
z 25 = z1э z 2м z3_ ; z 26 = z1e z 2м z3_ ;
z 27 = z1o z 2м z3_ ; z 28 = z1ы z 2x z3_ ;
z 29 = z1u z 2x z3_ ; z 30 = z1э z 2й z3ю ;
z 31 = z1e z 2й z3ю ; z 32 = z1o z 2й z3ю .
Выводы
Для построения моделей механизмов естественного языка нужны более мощные алгебрологический аппарат и методы формального описания, чем
те, которые разработаны к настоящему времени.
Поэтому в статье уделяется внимание описанию
применяемых в этой модели существующих алгебрологических средств и разработке новых. В работе
алгебрологические методы не только применяются
на практике, но и развиваются далее до того уровня, при котором моделирование механизмов языка
становится возможным. Главными ограничивающими факторами при моделировании языка являются недостаточное развитие алгебрологических
средств и недостаточное развитие методов физического (объективного) исследования механизмов
естественного языка.
В процессе рассмотрения методов можно делать
вывод, что мы разрабатываем не актуальный, а потенциальный вариант устного склонения прилагательных. Потенциальный вариант разделяется на
ближний (псевдослова), более далекий (введение
звука ф в конце слова) и еще более далёкий (введение ё в качестве первого звука окончания).
В дальнейшем предполагается исследование
совершенной дизъюнктивной нормальной формы
предиката модели звукового варианта склонения
полных непритяжательных имен прилагательных.
Список литературы: 1. Широков, В. А. Феноменологія
лексикографічних систем [Текст] / В. А. Широков. – К.:
Наукова думка, 2004. –327 с. 2. Бондаренко, М. Ф. Модели
языка [Текст] / М. Ф. Бондаренко, Ю. П. Шабанов-Кушнаренко // Бионика интеллекта: научн.-техн. журнал.
– 2004. – № 1. – С. 27-37. 3. Бархударов, С. Г. Учебник
русского языка [Текст] / С. Г. Бархударов, С. Е. Крючков.– М.: Просвещение, 1970. – 296 с. 4. Зализняк, А. А.
Грамматический словарь русского языка [Текст] / А. А. Зализняк. – М.: Русский язык, 1977. – 879 с. 5. Бондаренко,
М. Ф. О бионике интеллекта [Текст] / М. Ф. Бондаренко,
Ю. П. Шабанов-Кушнаренко // Бионика интеллекта
научн.-техн. журнал. – 2006 – № 1. – С. 3-5.
Поступила в редколлегию 29.03.2010 г.
УДК 519.7
Модель усної мови / Н. Є. Русакова // Біоніка інтелекту: наук.-техн. журнал. – 2010. – № 1 (72). – С. 94–97.
В статті розглядається проблема формалізації поняття тексту та його математичного описання, тобто
представлення тексту у вигляді рядків знакових мовних
повідомлень, якими люди обмінюються в процесі інтелектуальної діяльності. Розглядається модель усної мови
на прикладі звукового варіанта відмінювання прикметників.
Табл. 13. Іл. 1. Бібліогр.: 5 найм.
UDC 519.7
Model of verbal speech / N. E. Rusakova // Bionics of Intelligence: Sci. Mag. – 2010. – № 1 (72). – P. 94–97.
In the article the problem of formalization of concept
of text is examined and him mathematical description, that
presentation of text is as lines of sign linguistic reports, which
people change in the press of intellectual activity. The model
of verbal language is examined on the example of voice variant
of conjugation of adjectives.
Tab. 13. Fig. 1. Ref.: 5 items.
97
Download