Аннотация.doc - NeoOffice Writer - Институт русского языка им. В

advertisement
17 мая на очередном заседании семинара с докладом «Лексическая динамика
русской прозы XIX в.» выступил д. ф. н. А. Я. Шайкевич.
В докладе был представлен анализ лексики, употребляемой в русской прозе XIX
века. Материалом исследования послужил корпус русской прозы 1815–1904 гг. (от
Булгарина до Бунина) общим объемом 25 миллионов словоупотреблений. Для анализа
были взяты 2000 самых частых слов и 500 самых частых бинарных словосочетаний.
В нижеследующих таблицах показана относительная частота (на 100 тысяч
словоупотреблений) в восьми десятилетиях XIX в.1
Обратимся к словам, у которых хронологические колебания минимальны.
1820
1830
1840
1850
1860
1870
1880
Табл. 1
1890
90
449
18
479
92
486
15
480
97
443
16
464
91
424
15
433
114
475
13
446
104
476
17
483
98
459
12
462
100
497
12
489
ДОРОГА
58
ЛОШАДЬ
41
КВАРТИРА, КОМНАТА,
229
ДВЕРЬ, СТЕНА, ПОЛ,
ОКНО, СТОЛ
54
43
256
44
38
269
41
48
231
43
41
251
34
33
194
41
42
202
48
37
250
есть*
за
зато
по
Такая стабильность вполне ожидаема у первой четверки служебных слов, но
достойна удивления у следующих за ними знаменательных слов — это свидетельство
замечательного постоянства прозы.
Табл. 2
1820
1830
1840
1850
1860
1870
1880
1890
однако же
нежели
любезный*
поутру
столь
другой день
30
29
20
18
21
20
42
20
14
8
16
14
24
11
7
7
5
11
11
5
5
6
5
14
11
5
3
3
9
12
11
3
3
3
15
8
5
3
2
1
7
7
1
1
1
1
4
9
вроде
серьезно
вообще
из-за
1
1
8
11
3
1
9
15
5
3
19
14
9
8
24
19
9
11
24
22
9
10
21
25
12
10
26
30
14
11
23
33
В верхнем регистре даются леммы; по умолчанию частота глагольных форм прош. вр., муж. рода
включает и частоту форм женского рода. Астериском (*) отмечены следующие уточнения: есть* —
без то есть; любезный* — без любезный друг; СЕЙ* — без сих пор; ТОТ* — без тем и то;
ЭТОТ* — без это; более* — без более или и тем более; далее* — без так далее; точно* — без
точно так; едва* — без едва ли и едва не; чуть* — без чуть ли и чуть не; надо* — без надо мной;
СТАТЬ* — без стало быть; совсем* — без не совсем и совсем не; только* — без как только, лишь
только и только что; друг* — без друг друга и т.п, без любезный друг, мой друг и друг мой; честь*
— без честь имею и имею честь; -с* — без да-с, нет-с и ну-с; -то* — кроме неопределенных
местоимений и местоименных наречий (типа что-то, почему-то).
1
точно*
МАЛЕНЬКИЙ
все-таки
все равно
ТОН
16
21
6
5
3
27
28
10
7
5
40
38
13
10
7
44
45
28
11
13
45
36
41
16
17
40
41
42
16
17
74
43
35
17
17
99
71
38
20
20
ДИВАН
пальто
2
...
5
2
11
5
14
6
13
4
10
8
7
12
10
Глядя из XXI века, можно ожидать сокращение частоты у более или менее
очевидных архаизмов, значительно труднее априорно предсказать рост частоты слов
вроде, серьезно, вообще, из-за, маленький, тон, ведь живое ощущение их новизны в XIX в.
нам не дано, оно может возникнуть лишь при экстенсивном чтении тогдашней прозы.
Появление и дальнейший рост частоты слова пальто можно предсказать, зная историю
вещей, но слово диван априорно было бы отнесено к последней группе таблицы 1, если бы
не резкий скачок 1840-х гг.
Хронологические изменения частоты становятся особенно выразительными при
изучении пар и целых групп синонимов:
1820
1830
1840
1850
1860
1870
1880
Табл. 3
1890
1055
1204
1257
1250
1295
1421
1257
1286
298
345
250
240
236
225
102
107
23%
22%
17%
16%
16%
14%
8%
8%
более*, далее*
больше, дальше
115
33
110
25
79
61
75
79
83
89
75
86
58
98
46
111
Я, ТЫ, МЫ, ВЫ
МОЙ, ТВОЙ, НАШ,
ВАШ
4059
1274
3527
981
3712
722
3999
637
3792
580
3290
576
2835
510
3204
499
24%
22%
16%
14%
13%
15%
15%
13%
прежде
раньше
55
2
36
1
41
2
42
3
45
5
47
7
32
15
20
21
беспрестанно
постоянно
17
2
13
2
20
9
18
12
9
13
3
10
2
10
2
11
довольно
достаточно
66
3
38
2
52
4
49
4
42
9
40
6
25
11
24
8
ДОБРЫЙ
ХОРОШИЙ
87
18
60
17
55
32
43
37
39
35
49
37
39
42
40
50
1820
1830
1840
1850
1860
1870
1880
1890
234
36
20
9
15
36
15
12
чтобы, бы, между, ли,
же, али, перед, через
чтоб, б, меж, ль, ж, аль,
пред, чрез
СЕЙ*
25%
395
321
34%
3,4%
369
665
62%
2,4%
313
485
59%
1,0%
294
619
67%
1,3%
359
737
67%
3,3%
391
662
61%
1,7%
294
586
65%
1,3%
291
599
66%
70
65%
27
11
21
22%
52
12
15
14%
75
20
8
6%
94
22
12
10%
82
31
17
13%
74
34
10
9%
69
32
8
8%
60
32
57
33%
34
5
75
16
11%
30
10
83
28
12%
56
15
146
24
8%
58
18
214
26
9%
57
10
183
26
11%
42
11
162
10
6%
28
4
127
9
5%
29
5
134
32
39%
5
41
5
23
33%
13
27
6
14
21%
14
31
8
14
19%
8
39
11
10
14%
7
33
13
5
9%
7
27
14
2
3%
7
50
18
2
2%
8
46
25
возразил
отвечал
ответил
16
132
1
1%
17
114
1
1%
15
85
2
2%
34
140
8
4%
13
69
23
22%
15
79
47
32%
7
29
39
52%
9
45
55
50%
вскричал
закричал
крик
крикнул
воскликнул
56
14
10
1
12
29
24
10
2
22
6
27
11
9
17
8
12
5
11
21
8
12
5
16
21
6
7
6
21
35
1
6
4
16
10
1
9
6
28
23
ОТЕЦ
батюшка
папа
127
30
1
88
23
1
80
31
2
70
28
11
74
27
5
109
21
7
89
12
5
90
11
9
МАТЬ
маменька
матушка
мама
57
1
15
64
7
12
2
80
14
25
1
74
12
15
3
59
6
16
9
73
5
28
8
55
6
19
14
71
3
7
ТОТ*
ЭТОТ*
ибо
потому что
так как
весьма
совершенно
чрезвычайно
очень
подле
возле
около
рядом
Достойно внимания некоторое увеличение доли устаревающих слов (сей, ибо,
весьма, столь) в 1870–х гг. Хорошо известно, что многие архаизмы сохраняются в особых
стилистических "нишах". В данном случае это стилизованная проза вообще и особенно
проза, насквозь проникнутая иронией. Не ограничиваясь 1870–ми гг., а обращаясь ко
всему творчеству писателя, обнаружим следующие частоты подобных слов у СалтыковаЩедрина (ибо 31, сей 44, столь 21) и у Лескова (весьма 23, сей 44, столь 23). В меньшей
степени сохранность некоторых архаизмов наблюдается в историческом романе,
например, в текстах Мордовцева: сей — 59.
Если сравнить динамику частот многих слов в прозе и в драме, то обнаружится
замечательная корреляция: слова, чья употребительность в прозе нарастает, одновременно
демонстрируют еще более высокую частоту в драме (эта частота дается справа в
квадратных скобках).
Табл. 4
1820
1830
1840
1850
1860
1870
1880
1890
ныне
нынче
теперь
сейчас
6
2
137
22
28
8
139
15
5
8
165
35
1
16
148
47
5
15
203
66
8
14
196
57
3
12
176
61
2
10
186
72
[3]
[41]
[284]
[134]
и
да
а
4090
169
619
3812
304
519
4115
371
777
3933
304
791
4284
340
911
4438
372
1037
4441
272
1011
5013
249
1025
[3040]
[766]
[1493]
собой,
мной,
тобой,
рукой,
головой
собою,
мною...
26
61
104
133
138
116
108
146
[212]
179
151
100
68
65
61
62
55
[43]
87%
72%
49%
33%
32%
34%
36%
27%
[20%]
33
103
13
3
331
74
56
174
8
19
112
51
168
13
6
361
80
63
248
17
14
126
57
252
20
10
483
125
98
268
34
15
153
87
225
21
20
483
133
168
297
35
32
142
101
251
30
20
593
151
197
312
35
39
169
77
239
26
15
560
129
165
298
31
38
203
77
223
24
11
456
123
141
293
29
33
174
93
243
23
18
490
128
184
306
34
44
166
[898]
[658]
[49]
[53]
[902]
[227]
[580]
[361]
[58]
[91]
[289]
да (утв.)
вот
вон
пожалуйста
же
ничего
ну
только*
просто
значит
ДЕЛО
Общая тенденция очевидна — начиная с 1840-х гг. проза все более сближается с
разговорной речью, звучащей со сцены. Впрочем, противоположное влияние книжной
речи тоже иногда проявляется, но реже и в меньшем масштабе, ср.:
Табл. 5
конечно
ведь
пожалуй
разумеется
очевидно
1820
1830
1840
1850
1860
1870
1880
1890
30
24
8
11
1
24
34
8
13
1
25
89
16
25
8
46
111
20
25
6
40
131
22
25
12
50
124
24
27
13
42
101
16
17
17
43
109
14
10
14
[71]
[304]
[40]
[26]
[2]
повидимому
видимо
4
7
9
6
7
11
11
9
[1]
...
3
5
10
12
13
8
11
[2]
надобно
проценты
надо*
нужно
придется,
пришлось
приходится,
-лось
55
65%
12
12
5
27
27%
39
24
7
32
23%
48
44
10
27
19%
71
29
10
13
8%
92
46
12
9
5%
99
32
16
4
2%
86
52
22
1
1%
99
51
21
[17]
[5%]
[163]
[117]
[11]
1
1
7
7
8
9
17
16
[6]
Пять таблиц, рассмотренных выше, так или иначе соотнесены с диахронической
или жанрово-стилистической окраской слов, которая могла быть замечена лингвистами.
Некоторые тенденции обусловлены не движением языка, а движением литературы. Такова,
например, тенденция сокращения доли притяжательных местоимений в общей частоте
местоимений 1 и 2 лица. Нижеследующие таблицы ограничены сферой прозы как таковой,
лингвистический материал выступает в ней лишь как средство, подчиненное задачам
разработки темы, построения сюжета, ориентации на тот или иной стилистический
регистр.
Табл. 6
1820 1830
1840
1850 1860 1870
1880
1890
итак
между тем
наконец
27
43
83
13
51
89
11
36
129
6
30
82
5
31
82
4
27
71
4
21
50
3
16
45
признаюсь
ИМЯ
11
51
9
60
10
26
8
20
4
24
5
26
2
24
1
27
ДОЧЬ, СЫН
ДЕДУШКА,
ТЕТУШКА
МАЛЬЧИК,
ДЕВОЧКА
130
8
92
9
67
21
52
23
57
10
60
2
58
5
62
3
8
13
29
22
21
27
29
44
РАБОТА
8
14
22
17
18
19
26
30
БАБА
МУЖИК
3
6
5
8
18
23
12
26
18
33
13
21
19
29
20
24
друзья
друг*
13
39
12
32
4
12
4
13
5
14
3
13
5
13
5
13
честь*
24
31
15
9
11
11
10
9
знак
бросился
12
29
12
23
5
23
3
13
4
15
4
15
4
12
4
13
о!
БЕДНЫЙ
55
50
48
56
29
48
17
23
27
24
30
28
18
25
24
22
СЕРДЦЕ
СЛЕЗЫ
ЛЮБОВЬ
СТРАСТЬ
ДУША
131
53
77
16
77
163
52
109
24
130
100
54
61
15
81
72
40
58
11
60
56
32
46
15
51
65
31
36
9
59
55
32
37
9
58
60
36
38
9
75
где-то, как-то,
кто-то, что-то,
почему-то
42
72
107
119
132
132
140
182
СТАТЬ*
84
110
137
115
162
150
158
170
засмеялся,
УЛЫБАТЬСЯ,
УЛЫБКА,
СМЕХ,
УЛЫБНУТЬСЯ
29
39
56
63
66
65
60
95
Монотонные тренды не единственная возможность в лексической динамике
литературы. Можно представить себе пик частоты слова или группы слов, приходящийся
на одно или два десятилетия, или двухвершинное распределение в пределах изучаемого
периода, ср.:
Табл. 7
182
0
183
0
184
0
185
0
186
0
187
0
188
0
1890
коня
14
14
4
1
4
4
3
4
ВЕЛИКИЙ
России
РУССКИЙ
54
12
62
81
22
110
20
6
45
14
6
24
20
9
44
37
12
46
38
7
37
26
6
31
над, под, вокруг
ВОДА, ВЕТЕР, ЗЕМЛЯ,
БЕРЕГ, МОРЕ, НЕБО,
СОЛНЦЕ, ОГОНЬ
176
187
242
248
176
184
149
130
171
111
162
129
189
196
226
275
В русской прозе XIX в. довольно часто наблюдается распределение с одной
вершиной, приходящейся на середину периода, ср.:
Табл. 8
1820
1830
1840
1850
1860
1870
1880
1890
ГОСТИНАЯ 6
9
10
22
14
10
14
12
перебил
4
9
13
8
8
4
5
1
прибавил
8
20
22
41
31
31
15
18
стало быть
1
2
8
14
19
15
8
7
впрочем
18
29
51
54
43
41
29
21
даже
72
84
145
194
189
239
155
140
насчет
про
это
5
15
285
9
24
429
8
35
438
14
47
593
17
59
703
20
80
633
13
46
539
12
38
575
уж
-то*
-с*
37
46
1
88
33
19
147
154
59
164
205
78
167
240
97
132
249
65
107
176
40
110
162
33
[22]
[65]
[942]
Последние три слова подкреплены не только данными прозы, но и частотами в
драме, ср.:
Табл. 9
1830-1840
370
796
179
уж
-то
-с*
1850-1870
373
636
213
1880-1890
161
354
26
Создается впечатление, что русская литература, с 1840–х гг. качнувшаяся в сторону
разговорности, к 1880–м гг. пресытилась этими приемами. (Частица -с* уходит из языка
вообще.)
Новая лексическая картина статистически мало менялась на протяжении трех
десятилетий. В последние два десятилетия XIX в. мы видим признаки социальных и
собственно лингвистических инноваций, ср.:
БАРИН
ли
полно
30
232
[
12
[
23
266
341
11
26
31
231
357
17
27
28
213
181
13
4
27
195
]
9
]
21
209
12
153
Табл. 10
11
153
9
5
5
Материал самых частых слов дает основания для выделения некоторых рубежей:
1831 г., 1841 г. (главный рубеж) и 1881 г. Собственно возрастные поколения в какой-то
степени соотнесены с этими датами, но лексические предпочтения отдельных авторов
настолько разнообразны, что четкую картину обнаружить здесь очень трудно. Степень
адаптации к общим тенденциям эпохи сильно варьирует от автора к автору.
Download