А. Я.Шайкевич A. Ya. Shaikevich ЛЕКСИЧЕСКАЯ ДИНАМИКА РУССКОЙ ПРОЗЫ XIX в.

advertisement
А. Я.Шайкевич
A. Ya. Shaikevich
ЛЕКСИЧЕСКАЯ ДИНАМИКА РУССКОЙ ПРОЗЫ XIX в.
LEXICAL EVOLUTION OF 19th CENTURY RUSSIAN PROSE
Аннотация. В докладе излагаются результаты статистического исследования корпуса русской прозы XIX в. общим объемом 25 млн словоупотреблений. Показаны основные тенденции лексических изменений на
протяжении века, обусловленных лингвистическими, литературными и
социальными причинами.
Abstract. The paper presents the results of statistical analysis of lexical
vocabulary changes in Russian prose of 19th century. The size of the corpus
under study is about 25 million words. The main tendencies due to linguistic,
literary, and social factors are shown.
Настоящая статья представляет некоторые результаты
анализа русской прозы 1815–1904 гг., полученные на корпусе
объемом 25 млн словоупотреблений. Нижеследующие таблички
показывают относительную частоту лексем (на 100 тысяч словоупотреблений) в восьми десятилетиях XIX в.
Начнем со слов, у которых хронологические колебания
минимальны.
есть
за
зато
по
дорога
лошадь
1820 1830 1840 1850 1860 1870 1880 1890
90
92
97
91 114 104
98 100
449 486 443 424 475 476 459 497
18
15
16
15
13
17
12
12
479 480 464 433 446 483 462 489
58
54
44
41
43
34
41
48
41
43
38
48
41
33
42
37
Такая стабильность вполне ожидаема у первой четверки
служебных слов, но достойна удивления у следующих за ними
знаменательных слов – свидетельство замечательного постоянства некоторых тем прозы.
Глядя из XXI века, можно ожидать сокращение частоты у
более или менее очевидных архаизмов.
однако же
нежели
любезный
поутру
столь
другой день
1820 1830 1840 1850 1860 1870 1880 1890
30
42
24
11
11
11
5
1
29
20
11
5
5
3
3
1
20
14
7
5
3
3
2
1
18
8
7
6
3
3
1
1
21
16
5
5
9
15
7
4
20
14
11
14
12
8
7
9
Значительно труднее априорно предсказать рост частоты
следующих слов, ведь живое ощущение их новизны в XIX в. нам
не дано, оно может возникнуть лишь при экстенсивном чтении
тогдашней прозы.
вроде
серьезно
вообще
из-за
точно
маленький
все-таки
все равно
тон
1820 1830 1840 1850 1860 1870 1880 1890
1
3
5
9
9
9
12
14
1
1
3
8
11
10
10
11
8
9
19
24
24
21
26
23
11
15
14
19
22
25
30
33
16
27
40
44
45
40
74
99
21
28
38
45
36
41
43
71
6
10
13
28
41
42
35
38
5
7
10
11
16
16
17
20
3
5
7
13
17
17
17
20
Хронологические изменения частоты становятся особенно
выразительными при изучении пар и целых групп синонимов:
прежде
раньше
1820 1830 1840 1850 1860 1870 1880 1890
55
36
41
42
45
47
32
20
2
1
2
3
5
7
15
21
беспрестанно 17
13
20
18
9
3
2
2
постоянно
2
2
9
12
13
10
10
11
довольно
достаточно
66
3
38
2
52
4
49
4
42
9
40
6
25
11
24
8
добрый
хороший
87
18
60
17
55
32
43
37
39
35
49
37
39
42
40
50
ибо
потому что
так как
70
27
11
21
52
12
15
75
20
8
94
22
12
82
31
17
74
34
10
69
32
8
60
32
весьма
совершенно
чрезвычайно
очень
57
34
5
75
16
30
10
83
28
56
15
146
24
58
18
214
26
57
10
183
26
42
11
162
10
28
4
127
9
29
5
134
подле
возле
около
рядом
32
5
41
5
23
13
27
6
14
14
31
8
14
8
39
11
10
7
33
13
5
7
27
14
2
7
50
18
2
8
46
25
16
132
1
17
114
1
15
85
2
34
140
8
13
69
23
15
79
47
7
29
39
9
45
55
56
14
10
1
12
29
24
10
2
22
6
27
11
9
17
8
12
5
11
21
8
12
5
16
21
6
7
6
21
35
1
6
4
16
10
1
9
6
28
23
возразил
отвечал
ответил
вскричал
закричал
крик
крикнул
воскликнул
Если сравнить динамику частот многих слов в прозе и в
драме, то обнаружится замечательная корреляция: слова, чья
употребительность в прозе нарастает, одновременно демонстри-
руют еще более высокую частоту в драме (эта частота дается
справа в квадратных скобках).
ныне
нынче
теперь
сейчас
1820- 1840- 1860- 18801830 1850 1870 1890
21
3
6
3
6
12
15
11
138
160
200
181
17
41
62
66
[ 3]
[ 41]
[284]
[134]
да (союз)
а
266
552
338
784
356
975
260
1018
[766]
[1493]
вот
же
ничего
ну
просто
значит
146
351
78
61
14
16
238
483
129
133
34
24
245
577
140
181
33
39
233
473
126
163
31
38
[658]
[902]
[227]
[580]
[ 58]
[ 91]
Общая тенденция очевидна – начиная с 1840-х гг. проза все
более сближается с разговорной речью, звучащей со сцены.
Рассмотренный до сих пор материал так или иначе
соотнесен с диахронической или жанрово-стилистической окраской слов, которая могла быть замечена лингвистами. Некоторые
тенденции обусловлены не движением языка, а движением
литературы. Нижеследующие примеры ограничены сферой прозы
как таковой, лингвистический материал выступает в ней лишь
как средство, подчиненное задачам разработки темы, построения
сюжета, ориентации на тот или иной стилистический регистр.
итак
между тем
наконец
1820 1830 1840 1850 1860 1870 1880 1890
27
13
11
6
5
4
4
3
43
51
36
30
31
27
21
16
83
89 129
82
82
71
50
45
признаюсь
имя
работа
баба
мужик
честь
знак
бросился
о!
бедный
сердце
слезы
любовь
страсть
душа
11
51
8
3
6
24
12
29
55
50
131
53
77
16
77
9
60
14
5
8
31
12
23
48
56
163
52
109
24
130
10
26
22
18
23
15
5
23
29
48
100
54
61
15
81
8
20
17
12
26
9
3
13
17
23
72
40
58
11
60
4
24
18
18
33
11
4
15
27
24
56
32
46
15
51
5
26
19
13
21
11
4
15
30
28
65
31
36
9
59
2
24
26
19
29
10
4
12
18
25
55
32
37
9
58
1
27
30
20
24
9
4
13
24
22
60
36
38
9
75
Монотонные тренды не единственная возможность в лексической динамике литературы. Можно представить себе пик частоты слова или группы слов, приходящийся на одно или два десятилетия, или двухвершинное распределение в пределах изучаемого периода, ср.
1820 1840 1860 1880
1830 1850 1870 1890
великий
68
17
28
32
русский
94
34
45
34
над, под, вокруг
220 163 166 208
вода, ветер, земля, берег, море,
небо, солнце, огонь
228 157 120 235
В русской прозе XIX в. довольно часто наблюдается распределение с одной вершиной, приходящейся на середину периода,
ср.
1820 1830 1840 1850 1860 1870 1880 1890
гостиная
перебил
прибавил
стало быть
впрочем
даже
насчет
про
уж
-то
-с
6
1
8
1
18
72
5
15
37
46
1
9
4
20
2
29
84
9
24
88
33
19
10
9
22
8
51
145
8
35
147
154
59
22
13
41
14
54
194
14
47
164
205
78
14
8
31
19
43
189
17
59
167
240
97
10
8
31
15
41
239
20
80
132
249
65
14
4
15
8
29
155
13
46
107
176
40
12
5
18
7
21
140
12
38
110
162
33
Последние три слова подкреплены не только данными
прозы, но и частотами в драме, ср.
уж
-то
-с
1830-1840
370
796
179
1850-1870
373
636
213
1880-1890
161
354
26
Создается впечатление, что русская литература, с 1840-х гг.,
качнувшаяся в сторону разговорности, к 1880-м гг. пресытилась
этими приемами. (Частица -с уходит из языка вообще.)
Материал наших таблиц указывает на то, что между 1820-ми
и 1830-ми гг., между 1870-ми и 1880-ми гг. обнаруживаются различия, основной же водораздел приходится на границу 1830-х и
1840-х гг. Десятилетие 1830-х гг. отмечено тенденцией избавиться от ярких архаизмов (сей, поутру, добрый, ибо, весьма,
вскричал), в собственно литературном отношении оно сохраняет
или усиливает колорит 1820-х гг. (ср. такие слова, как наконец,
имя, честь, сердце, слезы, любовь, душа).
Десятилетие 1840-х г.г. резко сокращает частоту этих слов,
главное же – происходит кардинальный поворот к разговорности
(уж, -то, -с) и к новым социальным сферам (особенно баба и
мужик).
Новая лексическая картина статистически мало менялась на
протяжении трех десятилетий. В последние два десятилетия
XIX в. мы видим признаки социальных и собственно лингвистических инноваций, ср.
барин
ли
полно
1820 1830 1840 1850 1860 1870 1880 1890
30
23
31
28
27
21
12
11
232 266 231 213 195 209 153 153
12
11
17
13
9
9
5
5
Возрастные поколения в какой-то степени подчиняются
общим тенденциям, но лексические предпочтения отдельных
авторов настолько разнообразны, что четкую картину обнаружить здесь очень трудно. Степень адаптации к общим тенденциям эпохи сильно варьирует от автора к автору. Пушкин или
Толстой выглядят языковыми консерваторами, Даль или Достоевский шагают в ногу со временем.
Download