AEK et al corrected 2020 (1)

ιϛϞϗϛϏϞϗϕϖϐϛϞϠϑύϝϞϟϏϒϚϚϨϖϠϚϕϏϒϝϞϕϟϒϟϕϙϒϚϕιίθϛϙϛϚϛϞϛϏύ ρϕϘϛϘϛϐϕϤϒϞϗϕϖϡύϗϠϘϩϟϒϟ ηύϡϒϑϝύϟϒϛϝϒϟϕϤϒϞϗϛϖϕϜϝϕϗϘύϑϚϛϖϘϕϚϐϏϕϞϟϕϗϕ ίίβαβκεβίκέπηπλόδψηβ έβηϕώϝϕϗϕϑϝ ιϛϞϗϏύ ήϠϗϕίϒϑϕ УДК 811 ББК 81 Печатается по постановлению издательско-редакционного совета филологического факультета МГУ имени М. В. Ломоносова Рецензенты: ак. РАН А. М. Молдован, ак. РАН В. А. Плунгян Введение в науку о языке / А. Е. Кибрик и др.; под ред. О. В. Федоровой и С. Г. Татевосова – М.: Буки Веди, 2019. – 672 с. – ISBN 978-5-4465-2188-3. Издание представляет собой учебник для студентов, обучающихся по специальности «Фундаментальная и прикладная лингвистика». В нем освещается широкий диапазон вопросов в области теоретической, прикладной и компьютерной лингвистики, взаимодействие языкознания и когнитивной науки, вопросы языкового разнообразия и языкового родства, а также история языкознания. В оформлении обложки использованы рукописные материалы из архива А. Е. Кибрика. На фронтисписе использована фотография А. Е. Кибрика работы Анны Лауринавичюте. ISBN 978-5-4465-2188-3 © Коллектив авторов, 2019 К 80-летию Александра Евгеньевича Кибрика От редакторов-составителей От редакторов-составителей Этот учебник подготовлен коллективом авторов, в который входят сотрудники и выпускники отделения теоретической и прикладной лингвистики филологического факультета МГУ имени М. В. Ломоносова — старейшего профильного отделения по данной специальности в нашей стране. Отделение ТиПЛ было создано в 1960 г., одноименная кафедра образовалась в 1961 г., ее первым заведующим был Владимир Андреевич Звегинцев (1911–1988). В 1992–2012 гг. кафедру ТиПЛ возглавлял Александр Евгеньевич Кибрик (1939–2012). В последние годы жизни Александр Евгеньевич работал над учебным пособием «Введение в науку о языке». Идея пособия выросла из курса «Введение в специальность», который он читал первокурсникам отделения ТиПЛ. К сожалению, Александр Евгеньевич не успел его дописать. Мы, сотрудники и выпускники кафедры ТиПЛ, коллективными усилиями завершили эту работу. Содержание и структура книги в большой степени определяется содержанием и структурой образовательной программы «Фундаментальная и прикладная лингвистика» на отделении ТиПЛ. Эта программа, формирование которой продолжается с момента основания отделения, отражает наши представления о существе высшего профессионального лингвистического образования. Это прежде всего фундаментальная теоретическая подготовка по всем дисциплинам, образующим сумму знаний об основных уровнях языка — фонетике и фонологии, морфологии, синтаксисе, дискурсе и семантике. Успешное усвоение программы предполагает ознакомление со всеми имеющимися в современной лингвистике направлениями теоретизирования и приемами описания и объяснения языковых фактов. Программа не предполагает ориентации на ту или иную систему в качестве единственно верной. Напротив, у студентов есть возможность ознакомиться с разными системами, оценить аргументы за и против каждой из них и тем самым добиться осознанного теоретического самоопределения. Это, далее, междисциплинарная ориентация программы, которая в первую очередь предполагает ознакомление с дисциплинами, в которых языкознание соприкасается с когнитивной наукой. Язык — важнейшая когнитивная система, которой его носители обладают в силу принадлежности к биологическому 8 От редакторов-составителей виду Homo sapiens и которая тесно взаимодействует с другими когнитивными системами. Изучению этого аспекта языка в программе отводится исключительно важная роль; ему посвящены сразу несколько дисциплин — от усвоения языка до нейролингвистики. Это, кроме того, представление о лингвистике как об эмпирической науке, которая генерирует новое знание, исследуя данные конкретных языков, обнаруживая в этих данных закономерности и предлагая им объяснение. Такой подход требует наличия двух взаимодополняющих компонентов образовательной программы. Во-первых, обучающийся должен составить представление об эмпирической сложности и многообразии предмета — естественного языка. Этой цели служат дисциплины, описывающие языковое разнообразие, исторические аспекты существования языка, его функционирование в социальной среде. Вовторых, важнейшее значение приобретает ознакомление с методологией лингвистики как эмпирической науки, которой необходимы выверенные процедуры работы с данными, принципы моделирования исследуемого объекта и экспериментальные приемы проверки теоретических гипотез. Наконец, это ориентация на изучение современных приложений лингвистической науки, которые позволяют исследовать язык как объект математического моделирования, разрабатывать технологии его автоматической обработки и многое другое. Эта область лингвистики образует естественное целое с соответствующими областями математики, которые традиционно играют ключевую роль в подготовке квалифицированных специалистов рассматриваемого профиля (теория множеств, математическая логика, теория вероятностей, статистика, теория алгоритмов, основы программирования и т. д.). Таким образом, программа «Фундаментальная и прикладная лингвистика», введение в которую предлагает настоящий учебник, стремится охватить все существенные аспекты современного языкознания и обеспечить студента необходимыми знаниями и навыками для плодотворной научной и практической деятельности. «Введение в науку о языке» открывает основополагающая статья А. Е. Кибрика «Язык», написанная для Лингвистического энциклопедического словаря, первое издание которого вышло в 1991 г. По воспоминаниям Антонины Ивановны Коваль, жены А. Е. Кибрика, главный редактор словаря Виктория Николаевна Ярцева сказала про эту статью так: «Если кто-нибудь может написать лучше, пусть напишет». Учебник состоит из шести частей и 32 глав (нумерация глав сквозная). Первая — самая объемная — часть «Теория языка» посвящена описанию «уровневых» языковых явлений — звуковой стороны языка и речи (глава 1 «Фонетика и фонология»), различных аспектов внутренней структуры слова (глава 2 «Мор фология»), правил образования языковых единиц, больших, чем слово, — сло- От редакторов-составителей 9 восочетаний и предложений (глава 3 «Синтаксис»), свойств дискурса и его частей (глава 4 «Дискурс»). Глава 5 «Семантика» посвящена описанию того, как при помощи естественного языка осуществляется передача информации. Часть II «Язык и познание» объединяет семь глав, которые описывают когнитивное измерение языка. Глава 6 «Лингвистика в контексте когнитивных наук» знакомит читателя с областью междисциплинарных исследований познания, понимаемого как совокупность процессов приобретения, хранения, преобразования и использования знаний живыми и искусственными системами. В главе 7 «Когнитивная лингвистика» описывается направление лингвистики, которое связывает язык с широким кругом явлений, относящихся к познанию. Глава 8 «Психолингвистика» посвящена описанию процессов порождения и понимания речи. Механизмы усвоения языка рассматриваются в главах 9 и 10 (соответственно «Усвоение родного языка» и «Усвоение второго языка»). В главе 11 «Нейролингвистика» описываются мозговые механизмы речевой деятельности. В завершающей эту часть главе 12 «Невербальная коммуникация» обсуждаются просодия и язык тела — жесты, мимика, направление взгляда. Часть III «Языковое многообразие» посвящена сходствам и различиям языков мира. Глава 13 «Языки мира и языковое разнообразие» содержит общее введение в проблематику. В главе 14 «Сравнительно-историческое языкознание» описывается раздел лингвистики, который занимается установлением родства языков, построением генеалогических классификаций языковых семей, а также реконструкцией незасвидетельствованных языковых состояний. Раздел лингвистики, описанный в главе 15 «Типология», занимается сравнением и классификацией языков с точки зрения их структуры. В главе 16 «Социолингвистика» язык рассматривается в его связи с социальными функциями и механизмами. Наконец, в главе 17 «Кросс-культурная прагматика» описывается совокупность дисциплин, изучающих воздействие различных социокультурных факторов на языковую структуру и языковую деятельность. Часть IV «Методы» посвящена современным методам языкознания. В главе 18 «Интроспекция» обращение к интуиции говорящего рассматривается как элемент исследовательской методологии. В главе 19 «Эксперимент» вводится понятие научного эксперимента и описывается его использование в лингвистике. В главе 20 «Полевая лингвистика» рассматривается комплекс эвристических методов исследования и описания языка, которым исследователь не владеет и всю информацию о котором получает от его носителей. Глава 21 «Корпусная лингвистика» разрабатывает общие принципы и методы создания лингвистических корпусов и использования корпусных данных. В главе 22 «Моделирование» на языковом материале описывается еще один метод исследования — построение модели некоторого явления, не поддающегося непосредственному наблюдению. Глава 23 «Транскрибирование устной речи» посвящена представ- 10 От редакторов-составителей лению устной речи в виде транскриптов. Глава 24 «Квантитативные методы» предлагает описание исследований, в которых оценивается частотность зависимостей между лингвистическими и экстралингвистическими параметрами, способными влиять на дистрибуцию языковых данных. Часть V «Прикладная и компьютерная лингвистика» посвящена приложениям теоретической лингвистики — созданию словарей (глава 25 «Лексикография»), накоплению информации о естественных языках, а также методам ее сбора, хранения и распространения (глава 26 «Документация»), разработке письменностей (глава 27 «Алфабетизация»), фиксации звучащей речи и передачи письменной речи средствами другой графической системы (глава 28 «Транслитерация и транскрипция»). Современным компьютерным методам анализа устной речи и текста посвящены соответственно глава 29 «Автоматиче ская обработка звучащей речи» и глава 30 «Автоматическая обработка текста». В главе 31 «Извлечение информации из текста» описана смежная задача — автоматический анализ контента. Последняя шестая часть книги и одноименная глава 32 «История языкознания» посвящены описанию лингвистических традиций от I тысячелетия до н. э. до наших дней. Для кого предназначен этот учебник? Чем он отличается, например, от классического учебника «Введение в языковедение» А. А. Реформатского, который рекомендован в качестве учебника для студентов филологических специальностей? Учебник А. А. Реформатского был написан в 1947 г., а последнее уточненное прижизненное издание вышло в 1967 г. За прошедшие 50 лет лингвистика претерпела огромные изменения. Некоторые ее разделы наполнились принципиально новым содержанием (например, синтаксис), а многие другие и вовсе сложились как самостоятельные дисциплины после конца 1960-х гг. (например, дискурсивный анализ, когнитивные исследования, в значительной степени компьютерная лингвистика). Другая популярная книга, рекоменду емая в качестве учебника — «Введение в языкознание» Ю. С. Маслова (первое издание 1975 г., последнее переработанное издание 1987 г.) также заметно устарела. В качестве введения в предмет для студентов общефилологического профиля оба учебника по-прежнему незаменимы, однако отсутствие специализированного пособия по специальности «Фундаментальная и прикладная лингвистика» все более воспринималось как существенная лакуна, которую, как мы надеемся, хотя бы отчасти заполнит это издание. Учебник будет полезен двум категориям читателей. Во-первых, это студенты, получающие образование по программе подготовки «Фундаментальная и прикладная лингвистика». Учебник отражает опыт преподавания на Отделении теоретической и прикладной лингвистики МГУ имени М. В. Ломоносова, но будет, как мы надеемся, полезен преподавателям и студентам других отделе- От редакторов-составителей 11 ний с такой же программой, реализуемой сейчас более чем в 20 классических и технических университетах по всей России — в Санкт-Петербурге, Воронеже, Владивостоке, Махачкале, Саратове, Перми и т. д. Студенты бакалавриата смогут использовать учебник в первую очередь при освоении курса «Введение в специальность», а также при подготовке к выпускным экзаменам. Студенты магистратуры и аспирантуры, поступающие на отделения ТиПЛ/ФиПЛ из других учебных заведений, смогут подготовиться к вступительным экзаменам. Учебник может быть полезен и аспирантам, которым предстоит экзамен по кандидатскому минимуму. Во-вторых, учебник задуман как энциклопедическое издание, в котором важная и актуальная информация по основным направлениям современной лингвистики снабжена многочисленными библиографическими ссылками. Мы надеемся, что в этом качестве книга окажется востребованной широким кругом студентов, аспирантов и исследователей разных специализаций. В заключение мы хотим выразить благодарность всем, кто участвовал в создании этой книги. Идея написания коллективного учебника к 80-летию Александра Евгеньевича сформировалась у нас меньше года назад. Мы признательны всем нашим авторам — их 23 человека — которые в столь сжатые сроки смогли перенести на бумагу основные положения своих учебных курсов. Мы благодарим А. М. Молдована и В. А. Плунгяна за благожелательные рецензии, В. Ю. Гусева за верстку, Е. В. Моргунову за библиографическое редактирование и Кс. П. Семёнову за оформление обложки. Мы признательны филологическому факультету МГУ имени М. В. Ломоносова и его декану М. Л. Ремневой за поддержку нашего начинания. Мы рады, что учебник выходит в свет накануне 80-летия Александра Евгеньевича Кибрика. Мы посвящаем эту книгу его памяти. Ольга Федорова, Сергей Татевосов февраль 2019 г. Введение Язык 1 А. Е. Кибрик Язык — основной объект изучения языкознания. Под языком прежде всего имеют в виду естественный человеческий язык (в оппозиции к искусственным языкам и языку животных), возникновение и существование которого неразрывно связано с возникновением и существованием человека — homo sapiens. Термин «язык» имеет по крайней мере два взаимосвязанных значения: 1) язык вообще, язык как определенный класс знаковых систем; 2) конкретный, так называемый этнический, или «идиоэтнический», язык — некоторая реально существующая знаковая система, используемая в некотором социуме, в некоторое время и в некотором пространстве. Язык в первом значении — это абстрактное представление о едином человеческом языке, средоточии универсальных свойств всех конкретных языков. Конкретные языки — это многочисленные реализации свойств языка вообще. Язык вообще есть естественно (на определенной стадии развития человеческого общества) возникшая и закономерно развивающаяся семиотиче ская (знаковая) система, обладающая свойством социальной предназначен ности, — это система, существующая прежде всего не для отдельного индивида, а для определенного социума. Кроме того, на эту знаковую систему наложены ограничения, связанные с ее функциями и используемым субстанциальным (звуковым) материалом. Существенно, что язык, обладая внутренней целостностью и единством, является полифункциональной системой. Среди его функций важнейшими можно считать те, которые связаны с основными операциями над информацией (знаниями человека о действительности) — созданием, хранением и передачей информации. Язык является основной общественно значимой (опосредованной мышлением) формой отражения окружающей человека действительности и самого себя, т. е. формой хранения знаний о действительности (эпистемическая функция), а также средством получения нового знания о действительности (познавательная, или когнитивная, функция). Эпистемическая функция Впервые опубликовано как: Кибрик А.Е. 1991. Язык // Лингвистический энциклопедический словарь. М.: Наука. 1 16 А. Е. Кибрик связывает язык с действительностью (в единицах языка в виде гносеологических образов закрепляются элементы действительности, выделенные, отображенные и обработанные сознанием человека), а познавательная — с мыслительной деятельностью человека (в единицах языка и их свойствах материализуются структура и динамика мысли), т. е. языковые единицы приспособлены как для номинации элементов действительности (и, далее, хранения знаний), так и для обеспечения потребностей мыслительного процесса. В то же время язык является основным средством человеческого общения (коммуникативная функция), средством передачи информации от говорящего к слушающему (адресату). В силу этого свойства языка естественным образом согласованы с потребностями и условиями протекания коммуникативной деятельности человека, составляющей важнейший аспект его социального поведения, так как общественная, в т. ч. трудовая деятельность человека, невозможна без обмена информацией. Субстанциальный материал — звуковая (акустическая) природа языка также накладывает значительные ограничения на общие свойства языка, в частности предопределяет наличие незнаковых единиц (фонем — звуков) и линейную организацию знаковых единиц (морфем, слов, словосочетаний, предложений). Различают следующие основные социальные формы существования конкретных языков: идиолект — индивидуальный язык одного конкретного носителя языка; говор — множество структурно очень близких идиолектов, обслуживающих одну небольшую территориально замкнутую группу людей, внутри которой не обнаруживается никаких заметных (территориально характеризуемых) языковых различий; диалект — множество говоров (в частном случае — единичное), в котором сохраняется значительное внутри структурное единство (в отличие от говора территориальная непрерывность распространения диалекта не является его обязательным признаком); язык — это, как правило, множество диалектов, допустимые различия между которыми могут в значительной мере варьировать и зависеть не только от чисто языковых факторов, но и от социальных параметров (языкового самосозна ния носителей языка, наличия или отсутствия единой письменности, социальной престижности диалектов, численности носителей отдельных диалек тов, традиции и т. д.). На определенном этапе национального и/или социального развития некоторые стихийно существующие и развивающиеся языки вступают в высшую форму своего существования — форму литературного языка, характеризующегося социально регламентированной нормированностью и наличием более или менее широкого диапазона функциональных стилей. Язык 17 Если в фиксированный момент времени число индивидуальных реализаций языка — идиолектов не меньше (а, учитывая двуязычие, больше) числа говорящих на земном шаре людей (исчисляется миллиардами), то живых языков в социально признанном смысле насчитывается от трех до семи тысяч (колебания связаны не только с неполнотой инвентаризации конкретных языков, но и с различиями в принципах их разграничения). Множественность человеческих языков нельзя считать случайной. Независимо от решения проблемы происхождения языка требует объяснения непреложная тенденция языка к изменению. При отсутствии специальной нормирующей деятельности, направленной на консервацию языкового состояния (ср. классический арабский язык), языки постоянно претерпевают изменения во всех звеньях своей структуры, происходит их непрерывное историческое развитие. Конкретные причины этого процесса не вполне выявлены, но несомненно, что они заложены, во-первых, в принципах самого устройства языка и, во-вторых, в функциональном механизме его использования. В эпоху научно-технической революции множественность языков продолжает пока еще довольно успешно противостоять усиливающейся социальной потребности в едином языке. Более того, в современную эпоху наблюдается укрепление и возрождение многих языков, когда это подкреплено определенными национальными и государственными процессами (например, в Африке), наряду с давно известным процессом исчезновения некоторых малых языков, не имеющих письменности и достаточного уровня социального престижа. Все существующие и существовавшие ранее человеческие языки могут быть разбиты на группы по принципу родства, т. е. происхождения от определенной языковой традиции, так называемых праязыков. Близкое родство часто является очевидным для самих носителей языков (например, родство русского, болгарского и польского), отдаленное — требует специального научного доказательства. Принято говорить о родственных языках (родство которых доказано) и неродственных языках (родство которых доказать не удается). Относительность этого противопоставления демонстрирует ностратическая гипотеза, согласно которой ряд отдельных языковых семей объединяется на более глубоком этапе реконструкции в одну ностратическую «сверхсемью». Внутренняя структура языка (т. е. собственно язык) не дана в непосредственном наблюдении, и о ней можно судить лишь по ее проявлениям и косвенным свидетельствам, а именно наблюдая продукты языковой (или, иначе, речевой) деятельности — тексты, т. е. исследуя использование конкретных языков в конкретных речевых ситуациях. Путь познания языка через речь 18 А. Е. Кибрик приводил часто или к неразличению языка и речи, или, напротив, к игнорированию самой речи (речевой деятельности) и ее фундаментального влияния на собственно язык. Между тем понимание принципиального противо речия между конечностью языка (как устройства, механизма, системы) и его бесконечным использованием в бесконечно разнообразных речевых ситуациях имеет далеко идущие последствия для правильного понимания природы языка, поскольку это противоречие преодолевается прежде всего в самом языке, в принципах его устройства: все элементы языковой структуры адаптированы к их использованию в речи. Семиотическая сущность языка состоит в установлении соответствия между универсумом значений (всем мыслимым мыслительным содержанием всех возможных высказываний) и универсумом звучаний (совокупностью потенциально возможных речевых звуков). Звуковая материя является первичной субстанцией человеческого языка, по отношению к которой все другие существующие субстанциальные системы, в частности системы письменности, вторичны. Репертуар звуков и составляющих их признаков при всем их богатстве ограничен возможностями речевого аппарата человека. В каждом языке в той или иной степени используется достаточно представительная часть звуковых признаков, но в системные звуковые оппозиции включается лишь ограниченное их число (так называемые различительные признаки — строительный материал инвентаря фонем). Устойчивые для данного языка комбинации звуковых признаков задают множество допустимых в данном языке звуков (и фонем), из которых строится множество допустимых звуковых последовательностей (оболочек знаковых единиц). Универсум значений, в свою очередь, определенным образом членится каждым языком на стандартные, типовые для этого языка смысловые блоки. Каждый такой смысловой блок является внутренне сложно организованным, т. е. разложимым семантическим объектом, однако, вступая в знако образующую связь с означающим, он может использоваться говорящим как единая элементарная сущность, исходный материал для построения более сложных смысловых структур. Смысловые блоки, которым соответствуют относительно цельные и самостоятельные означающие (словесные оболочки), называют лексическими значениями, смысловые блоки, означающие которых лишены цельности и/или самостоятельности, называют грамматическими значениями (в широком смысле слова). Типичными носителями лексических значений являются слова (лексемы) и семантически несвободные сочетания слов (фразеологизмы), типичные носители грамматических значений — служебные морфемы, синтаксические конструкции (словосоче- Язык 19 тание, предложение), а также всевозможные операции над этими единицами (грамматические правила). Смысловые блоки одного языка неэквивалентны смысловым блокам другого (в частности, объемы значений одноименных грамматических категорий и, более того, практически любых соотносимых в двуязычных словарях пар слов не совпадают), еще более языки различаются по способам деления универсума значений на лексические и грамматические значения. Однако, при всем удивительном разнообразии лексических и грамматических значений, в конкретных языках обнаруживается в то же время и удивительная их повторяемость. Языки как бы заново открывают одни и те же элементы смысла, придавая им различное оформление, что позволяет говорить, в применении к различным языкам, о тех или иных фиксированных смысловых блоках универсума значений (предопределяемых в конечном счете свойствами отражаемого в мышлении человека и независимо от него существующего мира предметов, событий, отношений и т. п.): о категориях частей речи, именных классов, значений числа, референциальной соотнесенности, о каузативной связи между парами событий, о типовых ролях участников ситуации (ср. падежи), о способах реализации типового события (ср. вид, способ действия), о значениях времени, причины, условия, след ствия (ср. соответствующие типы сложных предложений) и т. п. Поэтому несопоставимость семантических членений естественных языков не следует преувеличивать. Во-первых, при обращении к данным многих языков обнаруживается, что степень покрытия универсума значений и принципы его членения не произвольны и не беспредельно разнообразны, и, во-вторых, что более важно, — в реальной речевой деятельности эта неэквивалентность членений в большинстве случаев ситуативно снимается, что создает, в частности, принципиальную возможность перевода с языка на язык (если снизить требования к тождеству эстетических функций речевых произведений, наиболее ярко представленных в поэтической речи). Мир лексических значений закреплен в знаменательной лексике языка. Слово является простейшим языковым средством номинации фрагмента действительности (предмета, свойства, явления, события), поскольку в нем самом осуществляется связь между означаемым (лексическим значением) и означающим (звуковой оболочкой). Однако язык едва ли выполнял бы свое назначение, если бы располагал только лексическими средствами номинации, т. к. потребовалось бы столько слов, сколько существует разных фрагментов действительности, о которых можно помыслить. Механизм многократного применения процедуры номинации обеспечивает грамматика. Грамматика, в отличие от статичного словаря, является динамическим меха- 20 А. Е. Кибрик низмом, состоящим из грамматических значений и системы правил, которые строят из элементарных смысловых блоков сложные смысловые структуры и в то же время ставят этим структурам в соответствие определенные звуковые последовательности. Словарь и грамматика — два тесно связанных и согласованных компонента структуры языка. Их согласованность определяется общностью их основных функций, а их различия, помимо отмеченных выше различий в структуре, связаны прежде всего с различием хранения смысловых единиц в языковой памяти: словарные единицы хранятся как готовые к употреблению, автоматически воспроизводимые двусторонние сущности, в то время как единицы, в образовании которых участвуют грамматические правила, в готовом виде в памяти отсутствуют и специально строятся в соответствии с некоторым коммуникативным заданием. Согласованность словаря и грамматики способствует постоянному возникновению в речи единиц промежуточной природы, например, таких, в которых осуществляется переход от свободного, грамматически организованного сочетания слов к устойчивому словосочетанию, эквивалентному слову (воспроизводимому по памяти, а не по правилам). Аналогичным образом словообразовательные процессы, созда ющие новые слова средствами грамматики, в том или ином фрагменте словарного состава постепенно угасают по мере узуального закрепления нового слова в словаре и его окончательного превращения в единицу лексики. Грамматические правила, устанавливающие связь между значением и звучанием, различаются по конечному результату их применения. Наиболее известны и изучены предписывающие правила. Они применяются обязательно и эффективно, если выполнены определенные условия (условия применимости). Например, в русском языке правилом-предписанием является правило согласования в атрибутивной синтагме («новый дом», но «новое строение») или правило маркировки существительного по числу независимо от счетности/несчетности его семантики («молоко» — ед. ч., «сливки» — мн. ч., «мнение» — ед. ч., «мнения» — мн. ч.). Применение этих правил обязательно приводит к некоторому положительному результату (к образованию некоторой языковой формы). Кроме того, в языке существует значительное количество разрешающих правил, правил-советов, которые устанавливают не реальное, а потенциальное соответствие между значением и звучанием. Специфика этих правил состоит в том, что формирование связи между значением и звучанием обеспечивается не одним таким правилом, а системой правил. Разреша ющие правила действуют в тех частях грамматики, где одна и та же языковая форма служит означающим для множества разнородных означаемых, Язык 21 не находящихся в дополнительному распределении. Типичным примером такой ситуации является выбор одного из актантов предиката на роль подлежащего. В эту систему входят разрешающие правила типа «Агенс может быть подлежащим», «Тема может быть подлежащим», «Конкретно-референтная именная группа скорее может быть подлежащим, чем нереферентная именная группа» и т. д. Данные правила формируют множество актантов-кандидатов на роль подлежащего, но сами по себе не предопределяют окончательную форму высказывания (ср. «Директор издал приказ» — «Приказ был издан директором»). Система разрешающих правил предполагает существование процедуры выбора из множества разрешенных альтернатив, создающих ситуацию неопределенности, конфликта, т. е. такую ситуацию, когда одновременно могут быть применены несколько разрешающих правил. Конфликтно-разрешающие правила опираются на прагматический принцип приоритета, при котором выбор в конфликтной ситуации осуществляется в пользу максимально приоритетной альтернативы. Принцип приоритета, наряду с принципом экономии, заимствован языком из практики речевой и, шире, мыслительной деятельности и демонстрирует онтологическую связь языка с мышлением. Большинство грамматических правил непосредственно используется в формировании смысла строящегося высказывания, т. е. несет определенную информацию. В частности, правило согласования прилагательных с существительным в атрибутивной синтагме манифестирует наличие атрибутивной связи и не является чисто формальным. Существуют, однако, и формальные грамматические правила, направленные на приведение звуковой последо вательности к стандартному виду. Таковы в основном морфологические и фонетические правила типа всевозможных сандхи, редукции предударных гласных и т. п. Не всем значимым языковым сущностям соответствует некоторая сегментная звуковая оболочка. Значительная доля смысла высказывания выражается супрасегментными средствами. В языке существуют также нулевые знаки, не имеющие означающего, например нулевая связка в русском языке. В ряде случаев означающим является не звук, а некоторое грамматическое правило, например операция конверсии, переводящая слово из одной части речи в другую. Особенно распространено явление компрессии, когда в одном означающем слито несколько означаемых. По этому принципу организована словоизменительная морфология флективных языков (например, служебной морфеме «у» в русском языке соответствуют значения «1‑е лицо», «единственное число», «настоящее время»). Синтаксическое членение 22 А. Е. Кибрик предложения (в тех языках, где имеются члены предложения) также служит для компрессии в одном означающем (члене предложения) нескольких означаемых. Не имеют специального внешнего формального выражения так называемые пресуппозиции, составляющие существенную часть значения всякого высказывания. Все такого рода «отклонения» от простого соответствия между значением и звучанием обеспечивают языку наибольшую эффективность в выполнении им его основных функций, хотя в то же время значительно осложняют процесс исследовательской деятельности лингвиста. Но эти исследователь ские трудности не следует отождествлять со сложностью самого объекта. Наоборот, чем проще объект устроен (т. е. чем непосредственнее его структура отражает его функции), тем сложнее его познать (в особенности при недоучете функционального аспекта). В языкознании сосуществует достаточно большое количество интегральных концепций (моделей) языка, описывающих его устройство с разной степенью конкретности, детальности и в конечном счете достоверности. Эти модели во многом противопоставлены друг другу и существуют на правах альтернативных гипотез, но часто представление о языке приравнивается к той или иной модели, хотя число общих свойств, приписываемых языку всевозможными его моделями, сравнительно невелико. В целом практически все существующие модели языка, как статические (классическая традиционная грамматика языка, концепция Ф. де Соссюра, Л. Ельмслева и другие), так и динамические (генеративная грамматика, модель «Смысл—текст» и другие), страдают недоучетом функциональной предопределенности языка, производности его от речевой деятельности и прагматических условий его использования. В большинстве моделей языка постулируется уровневая структура. Количество выделяемых уровней и системные межуровневые связи трактуются в разных моделях по-разному, но наиболее общепринятым можно считать выделение фонетики, морфологии, синтаксиса, семантики. Фонетика относится к уровню звучаний, семантика — к уровню значений, а синтаксис (и морфология — в тех языках, где она развита) обеспечивает соответствие между звуками и значениями. Каждый уровень характеризуется специфическим составом конституирующих его единиц. К основным языковым единицам обычно относят фонему, морфему, слово, словосочетание, предложение. Конкретные представители одной и той же единицы (фонемы, морфемы и т. д.) находятся между собой в парадигматических и синтагматических Язык 23 отношениях. Парадигматические отношения — это отношения в инвентаре, в системе, отличающие одну единицу данного типа от всех других подобных. Синтагматические отношения — сочетаемостные (грамматические), устанавливающиеся между однотипными единицами в речевой цепи. Единицы разных типов находятся в иерархических отношениях (морфема — упорядоченная последовательность фонем, слово — упорядоченная последователь ность морфем и т. д.). В процессе речепроизводства парадигматические отношения используются в основном на этапе номинации — выбора альтер нативных способов означивания фрагментов действительности, синтагматические и иерархические отношения участвуют в процессе вербализации и линеаризации — при построении смысловой структуры и соответствующей ей правильной линейной звуковой последовательности. Ввиду наличия единой универсальной базы, предопределяющей границы возможного разнообразия в устройстве конкретных языков, естественно, что внутренние структуры конкретных языков обладают большим или меньшим числом сходных или тождественных черт. Языки, устройство которых обнаруживает структурную общность в отношении тех или иных характеристик, образуют одну структурную группу (типологический класс). Классификация языков по типам может осуществляться по разным основаниям в зависимости от того, какие характеристики языковой структуры лежат в основе сравнения. В соответствии с этим один и тот же язык может входить в разных классификациях в разные типы (и, соответственно, группировки языков). Так, русский язык с точки зрения формально-морфологической классификации попадает во флективный тип в отличие от аналитического типа английского языка, в то время как синтаксически они входят в один тип номинативных языков, противопоставленных языкам эргативного, активного, нейтрального типа. Хотя типологическая классификация, в отличие от генетической, не всегда отражает реальные связи между конкретными языками, она является одним из существ. инструментов индуктивно-дедуктивного изучения и представления сущностных свойств языка вообще. I . Т е о р и я я зы к а 1. Фонетика и фонология 1 А. В. Архипов, П. В. Иосад, П. Д. Староверов Фонетикой в широком смысле называют раздел лингвистики, изучающий звуковую сторону языка и речи. В узком смысле различают ф о н е т и к у как изучение звуков р е ч и (тж. «субстанциальная фонетика») и ф о н о л о г и ю, изучающую функционирование звуковых средств в системе я з ы к а (тж. «функциональная фонетика»). Фонетику часто относят к дескриптивной лингвистике, в то время как фонологию — к теоретической лингвистике. Развиваются также исследования на стыке фонетики и фонологии (напр., направление лабораторной фонологии). 1.1. Фонетика 1.1.1. Артикуляторная фонетика Артикуляция. Строение речевого аппарата Артикуляторные классификации звуков Инструментальные методы исследования артикуляци 1.1.2. Акустическая фонетика Звуковые колебания в речи Акустичская теория речеобразования Акустические свойства основных классов звуков. Форманты 1.1.3. Перцептивная фонетика Слуховой аппарат человека Психоакустические шкалы Экспериментальные методы исследования восприятия 1.1.4. Сегментная и супрасегментная фонетика 1.1.5. Фонетическая транскрипция 1.2. Фонология 1.2.1. Введение: что такое фонология и зачем она нужна 1.2.2. Фонология и морфология. Правила, уровни представления 1.2.3. Порядок правил 1.2.4. Единицы фонологии Литература для дальнейшего чтения: Кривнова, Кодзасов 2001; Князев, Пожарицкая 2011. Раздел 1.1 написан А. В. Архиповым, раздел 1.2 — П. Д. Староверовым и П. В. Иосадом. 1 28 А. В. Архипов, П. В. Иосад, П. Д. Староверов 1.1. Фонетика Говорящий Слушающий Коммуникативный замысел Понимание мысль мысль Лингвистический синтез сообщения Язык Лингвистический анализ < лексикон, грамматика > сообщения фонология фонетическое представление сообщения фонетическое представление сообщения Артикуляция Акустика Слуховой анализ действия речевых органов звуковой сигнал восприятие и распознавание сигнала ВОСПРИЯТИЕ РЕЧИ ПОРОЖДЕНИЕ РЕЧИ Три основных раздела фонетики (в узком смысле) соответствуют процессам, происходящим при порождении речи говорящим (артикуляторная фонетика), распространении звукового сигнала (акустическая фонетика) и восприятии речи слушающим (перцептивная фонетика); см. рис. 1.1. Фонетика изучает как отдельные звуки, или с е г м е н т ы (сегментная фонетика), так и признаки, распространяющиеся на последовательности звуков — слоги, слова и даже целые высказывания (супрасегментная фонетика, или просодия). Наиболее широко применяемая на практике форма фонетического анализа — фонетическая транскрипция. Существуют различные виды транс крипции, различающиеся целями и областью применения, степенью детализации и используемыми обозначениями. Одной из важнейших транскрипционных систем является М е ж д у н а р о д н ы й ф о н е т и ч е с к и й а л ф а в и т (МФА). ПЕРЕДАЧА РЕЧЕВОГО СИГНАЛА Рисунок 1.1. Общая схема порождения и восприятия звучащей речи 1.1.1. Артикуляторная фонетика Артикуляцией называют совокупность процессов, в результате которых говорящий п о р о ж д а е т р е ч е в о й с и г н а л, т. е. произносит конкретные звуки, образующие высказывание. Органы, использующиеся при артикуляции, образуют р е ч е в о й а п п а р а т человека. Все органы речевого аппарата имеют и неречевое назначение (дыхание, питание и т. д.). Совокупность полостей речевого аппарата называют р е ч е в ы м т р а к т о м. Фонетика и фонология 29 Речевой аппарат состоит из трех основных отделов. Л е г к и е создают воздушный поток в нижних дыхательных путях (п о д с в я з о ч н ы й о т д е л). Через трахею (дыхательное горло) и г о р т а н ь — сложную систему хрящей, мышц и связок — воздух проходит в глотку и далее в ротовую полость. Находящиеся в гортани г о л о с о в ы е с в я з к и под действием воздушного потока могут колебаться, возбуждая периодические колебания воздуха в речевом тракте — г о л о с. Активные органы, находящиеся выше гортани (н а д с в я з о ч н ы й о т д е л), — я з ы к, г у б ы, з у б ы, н е б н а я з а н а в е с к а, н а д г о р т а н н и к, — изменяя свое положение и взаимодей ствуя с другими (пассивными) органами, либо позволяют воздуху свободно проходить, либо создают на его пути ш у м о о б р а з у ю щ и е п р е г р а д ы; небная занавеска открывает или закрывает проход в носовую полость. На свойства образующегося звука влияет форма и размеры полостей над связочного тракта, выступающих в качестве а к у с т и ч е с к о г о р е з о н а т о р а — глотки, ротовой и носовой полости, — поэтому движения активных органов могут изменять звучание гласных звуков, не образуя шума. 1. Губы 2. Зубы 3. Альвеолы 4–6. Твердое небо 7–8. Мягкое небо (небная занавеска) 9. Увула (язычок) 10. Глотка 11. Вход в гортань 12. Голосовые связки 13–15. Язык 13. Кончик языка 14. Спинка языка 15. Корень языка ϜϝϠϝϑϏϮ ϞϝϚϝϠϡϫ ϟϝϡϝϑϏϮ ϞϝϚϝϠϡϫ ϜϏϓϒϝϟϡϏϜϜϗϙ ϒϝϟϡϏϜϫ ϒϝϚϝϠϝϑϪϔϠϑϮϖϙϗ ϡϟϏϤϔϮ ϞϗϨϔϑϝϓ Рисунок 1.2. Общая схема речевого аппарата 30 А. В. Архипов, П. В. Иосад, П. Д. Староверов Указанные три процесса: создание воздушного потока (и н и ц и а ц и я), наложение на постоянный поток периодических колебаний, т. е. голоса (ф о н а ц и я), создание источников шума и изменение резонаторных свойств надсвязочной части тракта (а р т и к у л я ц и я в узком смысле) — могут распределяться между отделами речевого аппарата и по-другому. Так, гортань имеет чрезвычайно сложное устройство и может участвовать как в артикуляции (например, г о р т а н н о й с м ы ч к и), так и в инициации (т. н. а б р у п т и в н ы х и и м п л о з и в н ы х согласных). Существует также класс звуков (т. н. щелчки, или к л и к и), у которых инициация происходит в ротовой полости. Однако ни в одном языке не используются все артикуляционные возможности сразу. Так, в русском литературном языке нет звуков с нестандартной (не легочной) инициацией, хотя клики могут использоваться говорящими как неречевые знаки (напр., «щелкнуть языком», «причмокнуть губами»). Артикуляторные классификации звуков. Звуки речи делятся на два основных типа — гласные и согласные. Г л а с н ы е образуются только при помощи голосового источника звука, у с о г л а с н ы х голосовой компонент или отсутствует — есть только шумовой (у г л у х и х ш у м н ы х), — или сочетается с шумовым (у з в о н к и х ш у м н ы х), или ослабляется за счет образования неполной преграды (у с о н о р н ы х). Гласные характеризуются основными признаками р я д а, п о д ъ е м а и о г у б л е н н о с т и. Ряд и подъем описывают положение языка в простран стве ротовой полости. Огубленность (лабиализация) соответствует округлению губ и/или вытягиванию их вперед. Следует отметить, что в русском языке признаки огубленности и ряда взаимно обусловливают друг друга: все гласные заднего ряда [o] <о>, [u] <у> являются огубленными, и наоборот. Во французском языке, с другой стороны, огубленные гласные имеются и в переднем, и в заднем ряду; таким образом, гласные переднего ряда могут быть как неогубленными [i, e, ɛ], так и огубленными [y, ø, œ]. Подъем верхний средний нижний Ряд передний центральный задний i <и> e <э> ɨ <ы> u <у> o <о> a <а> Таблица 1.1. Признаки ряда и подъема для ударных русских гласных Фонетика и фонология 31 Рисунок 1.3. Рентгенограммы русских гласных [a] <а>, [i] <и>, [u] <у> (прорисовки) Основными признаками согласных являются м е с т о о б р а з о в а н и я и с п о с о б о б р а з о в а н и я, а также ряд ларингальных (связанных с работой гортани) признаков, включая г л у х о с т ь / з в о н к о с т ь (наличие/отсутствие голоса) и п р и д ы х а т е л ь н о с т ь. По способу образования звуки различаются в зависимости от степени сужения в речевом тракте и характера возникающей преграды. У с м ы ч н ы х ход воздуха полностью перекрывается преградой (например, сомкнутыми губами или языком, прижатым к небу). При этом давление воздуха позади преграды нагнетается потоком, идущим из легких, который в конце концов обычно разрывает преграду с резким коротким шумом — взрывом (в з р ы в н ы е). Если же преграда разрывается плавно, переходя в щель, такой смычный называется а ф ф р и к а т о й. У щ е л е в ы х звуков сужение не бывает полным и шум образуется на всем протяжении артикуляции щели. А п п р о к с и м а н т ы (полугласные) являются переходным классом между щелевыми согласными и гласными — воздушный проход у них недостаточно широкий, чтобы образовать полноценный по интенсивности и тембру гласный, но и недостаточно узкий, чтобы возник заметный шум; это один из типов сонорных. Кроме аппроксимантов, к сонорным также относятся н о с о в ы е, б о к о в ы е и д р о ж а щ и е. Носовыми называются смычные, при образовании которых открыт носовой проход, благодаря чему не происходит взрыва, а участие носовой полости как резонатора придает им характерное звучание. При образовании боковых преграда образуется в центре ротовой полости, тогда как по бокам проход воздуха остается свободным. При образовании дрожащих смычка создается на короткое время и разрывается без сильного взрыва, причем этот цикл может повторяться. 32 А. В. Архипов, П. В. Иосад, П. Д. Староверов Рисунок 1.4. Рентгенограммы русских согласных [k] <к>, [ʃ] <ш>, [n] <н> (прорисовки) По месту образования звуки различаются в зависимости от сочетания а к т и в н о г о и п а с с и в н о г о а р т и к у л я т о р о в. Например, при образовании г у б н о - з у б н ы х звуков типа русских [f] <ф>, [v] <в> нижняя губа (активный артикулятор) прикасается к верхним зубам (пассивному артикулятору), создавая шумообразующую преграду (щель). Для грубой классификации бывает достаточно указать один артикулятор (обычно активный): так, различают широкие классы г у б н ы х, п е р е д н е я з ы ч н ы х, с р е д н е я з ы ч н ы х (или по пассивному органу — п а л а т а л ь н ы х) и з а д н е я з ы ч н ы х, ф а р и н г а л ь н ы х (пасс.) и л а р и н г а л ь н ы х звуков. Для более точной дифференциации близких артикуляций, особенно переднеязычных, может понадобиться указание нескольких специальных признаков: напр., а п и к а л ь н ы й или л а м и н а л ь н ы й (по участию кончика или лопатки языка), п л о с к о щ е л е в о й или к р у г л о щ е л е в о й (по поперечной форме щели), з у б н о й или а л ь в е о л я р н ы й (по зоне пассивного артикулятора), и т. д. И согласные и гласные могут характеризоваться признаками д о п о л н и т е л ь н о й а р т и к у л я ц и и (например, н а з а л и з а ц и и у гласных, п а л а т а л и з а ц и и у согласных), а также д о л г о т ы или н а п р я ж е н н о с т и / с и л ы. Кроме того, и гласные и согласные могут иметь сложную комбинированную артикуляцию (так, дифтонги сочетают две последовательных гласных артикуляции; среди согласных встречается, например, сочетание губной и заднеязычной артикуляции, как в широко распространенном аппроксиманте [w] или в более редком смычном [kp]). Фундаментальным свойством естественной человеческой речи является постоянная и плавная перестройка речевых органов во время артикуляции. Четкие временные границы между а р т и к у л я ц и о н н ы м и ж е с т а м и, соответствующими отдельным звукам, как правило отсутствуют. В силу того, что разные органы имеют различную подвижность и скорость реаги- Фонетика и фонология Рисунок 1.5. Рентгенограмма русского твердого (веляризованного) губного [p] <п> 33 Рисунок 1.6. Рентгенограмма русского мягкого (палатализованного) губного [pʲ] <п’> рования на нервные импульсы, отдельные элементы артикуляции конкретного звука в потоке речи могут начинаться заранее, на предшествующих звуках, или, наоборот, с задержкой, или же сохраняться на последующих звуках. Кроме того, в беглой речи, не ориентированной на особую четкость произнесения, целевые положения артикуляторов, характерные для идеализированного произнесения звука, обычно не достигаются даже в середине артикуляции (в фазе а р т и к у л я ц и о н н о й в ы д е р ж к и). Временнáя координация компонентов артикуляционного жеста между собой является важным элементом языкового навыка говорящих на конкретном языке, и отличия от общепринятых для данного языка схем создают впечатление иноязычного акцента. Инструментальные методы исследования артикуляции. Помимо самонаблюдения (интроспекции) и визуального наблюдения за работой артикуляторов (в т. ч. с использованием видеосъемки), в современной фонетике разработан широкий спектр методов, позволяющих фиксировать те или иные артикуляторные параметры, однако большинство из них требуют специального оборудования, подчас весьма сложного и дорогостоящего. Различные варианты п а л а т о г р а ф и и (с использованием красителей и фото-/ видеофиксации, электрических датчиков — т. н. «искусственного неба») фиксируют зоны соприкосновения активных и пассивных артикуляторов, в первую очередь языка и неба. П н е в м о о с ц и л л о г р а ф ы регистрируют изменения воздушного потока. Ф о т о - и к и н о р е н т г е н о г р а ф и я позволяет получать качественные изображения речевого тракта, но сопряжена с риском для здоровья испытуемого. Э л е к т р о м а г н и т н ы е а р т и к у л о г р а ф ы (EMA) — приборы, записывающие с большой подробно стью пространственные координаты нескольких миниатюрных датчиков, 34 А. В. Архипов, П. В. Иосад, П. Д. Староверов которые закрепляются обычно на языке и губах. Приборы для у л ь т р а з в у к о в ы х и с с л е д о в а н и й (УЗИ, UTI), будучи менее дорогими, более портативными и менее инвазивными (т. е. причиняя меньше неудобств говорящему), позволяют получать контуры движущегося языка и отчасти других артикуляторов. С помощью м а г н и т н о - р е з о н а н с н о й т о м о г р а ф и и (МРТ, MRI) легче всего исследовать статичные артикуляции, которые говорящий может растягивать существенно дольше, чем в обычной речи (напр., гласные или щелевые). Данные МРТ дают комплексное представление об укладе всех основных речевых органов, но плохо отражают быстрые его изменения. Э л е к т р о г л о т т о г р а ф и я (EGG) — неинвазивный метод изучения работы голосовых связок с помощью двух электродов по бокам горла; он может использоваться в сочетании с другими методами, напр. УЗИ или артикулографией. Более сложным методом является л а р и н г о с к о п и я, при которой производится видеосъемка гортани сверху с помощью миниатюрной камеры, вводимой через носоглотку или ротовую полость. 1.1.2. Акустическая фонетика Звуковые колебания в речи. Акустическая фонетика изучает физические свойства звуков речи, их связь с особенностями артикуляции и восприятия. Центральный раздел акустики составляет а к у с т и ч е с к а я т е о р и я р е ч е о б р а з о в а н и я. Ее задача — выявить и количественно описать аэродинамические и акустические процессы, которые происходят в речевом тракте при артикуляции. Основы этой теории были заложены еще в XIX в. Г. фон Гельмгольцем; фундаментальные работы XX века — «Акустическая теория речеобразования» Г. Фанта (1964), и «Анализ, синтез и восприятие речи» Дж. Фланагана (1968). Звуковые колебания в речи представляют собой быстрые изменения давления воздуха относительно некоторого базового значения (например, нормального атмосферного давления). Важнейшее для речи различие проходит между периодическими колебаниями (которые человек воспринимает как голос или музыкальный тон) и непериодическими (воспринимающимися как шум). Периодические колебания могут быть простыми и сложными. Простые периодические колебания совершает, например, камертон; в речи фактически представлены только сложные колебания, которые можно математически представить как одновременное наложение некоторого количества простых колебаний. Простое гармоническое колебание имеет график в виде синусоиды (см. рис. 1.7) и три основных параметра: амплитуду (размах колебаний), частоту (обратно пропорциональную периоду колебаний) и Фонетика и фонология 35 фазу (момент начала колебаний). Любое периодическое колебание можно представить в виде суммы простых гармонических колебаний со своими амплитудами, частотами и фазами; такое представление называется спектром звука. В речевой акустике исследуются преимущественно амплитудночастотные спектры, поскольку фазы мало влияют на восприятие звука. При слуховом восприятии амплитуда колебаний (точнее, ее квадрат) соотносится с громкостью звука, а частота — с высотой тона. Простые гармонические колебания в составе сложного называются его гармониками. Гармоника с самой низкой частотой называется основным тоном, а эта частота — частотой основного тона (fundamental frequency). Известно, что частоты прочих гармоник пропорциональны частоте основного тона: так, для основного тона 110 Гц более высокие гармоники будут иметь частоты 220 Гц, 330 Гц, 440 Гц и т. д. Рисунок 1.7. Простые гармонические колебания с различными частотами, амплитудами и фазами Рисунок 1.8. Сложное периодическое колебание Акустическая теория речеобразования рассматривает наблюдаемый речевой сигнал как результат взаимодействия и с т о ч н и к а в определенной точке речевого тракта и р е з о н а н с н ы х с в о й с т в речевого тракта (иначе, п е р е д а т о ч н о й ф у н к ц и и речевого тракта). Участок речевого тракта выше источника звука рассматривается как акустическая труба, которая в силу своих геометрических свойств усиливает или подавляет те или иные составляющие сигнала из источника (но не может добавлять новых, которых не было в источнике), т. е. играет роль фильтра; по этой причине данную теорию также называют «м о д е л ь “ И с т о ч н и к - Ф и л ь т р”». 36 А. В. Архипов, П. В. Иосад, П. Д. Староверов Одно из важных теоретических допущений состоит в том, что акустические свойства источника (например, голосового) и фильтра не зависят друг от друга. К настоящему времени хорошо известно, что независимость голосового источника и фильтрующих свойств речевого тракта может рассматриваться только как грубое приближение, соответствующее действительности только в те моменты, когда голосовые связки смыкаются и воздух через них не проходит. Однако для многих практических целей этого приближения оказывается вполне достаточно, благодаря чему акустические модели, построенные на модели «Источник-Фильтр», имеют чрезвычайно широкое применение (например, в вокодерах, при помощи которых речевой сигнал передается по каналам мобильной связи). Основными формами графического представления звука в акустике являются осциллограммы (waveform) и спектрограммы — статические (спектральные срезы) и динамические. Осциллограмма непосредственно отображает колебания звукового давления, регистрируемые записывающим устройством. Она дает представление о классе звуков (в зависимости от задействованных акустических источников), длительности звуков и отдельных фаз их артикуляции (таких как смычка или придыхание), соотношении звуков по амплитуде. По осциллограмме также можно определить период основного тона (и, следовательно, частоту) и отслеживать его изменения на протяжении высказывания. Для более подробного анализа акустических свойств звуков необходимо обращаться к спектральной информации, в которой наглядно представлены отдельные составляющие сложного колебания. Изобретение электрических спектрографов в середине 1940‑х гг. дало мощный импульс развитию акусти ки; другим мощным толчком она обязана непрерывному развитию цифровых технологий и инструментов компьютерного анализа звука с конца XX в. Спектр может быть вычислен с помощью разных алгоритмов, и в зависимости от выбора алгоритма и его параметров может содержать различную информацию. Так, для построения динамических спектрограмм наиболее широко используется т. н. метод разложения Фурье. Для спектров Фурье характерно следующее ограничение: спектрограмма может давать либо очень точную информацию по частотным составляющим, но плохо учитывать изменения сигнала во времени (т. н. узкополосная спектрограмма); либо, напротив, отражать очень быстрые изменения сигнала, но при этом давать размытую частотную характеристику (широкополосная спектрограмма). Первые дают хорошую информацию об отдельных гармониках и об их изменении со временем, что важно, в частности, для изучения интонации. Вторые хорошо передают информацию о формантах (см. ниже) и о быстрых шумах. Фонетика и фонология 37 Рисунок 1.9. Попробуйте определить, на какой из двух осциллограмм представлено произнесение слова «снег», а на какой — слова «дождь» Акустические свойства основных классов звуков. Форманты. В спектре гласных наиболее ярко проявляются форманты — частотные области, в которых колебания (идущие от голосового источника) усиливаются благодаря резонансным свойствам речевого тракта. Именно благодаря меняющимся формантам разные положения артикуляторов (языка, челюстей, губ) создают разное звучание (тембр) гласных. При изменении конфигурации артикуляторов, если характеристики голоса остаются неизменными, изменяется только соотношение между гармониками по амплитуде: те гармоники, частоты которых попадают в область какой-либо форманты, усиливаются, остальные не усиливаются или ослабляются. Наоборот, при изменении высоты голоса вместе с частотой основного тона повышаются или понижаются частоты всех гармоник; при этом, если уклад артикуляционных органов не меняется, качество гласного (тембр) сохраняется, поскольку наиболее интенсивно звучат гармоники, попадающие в одни и те же формантные диапазоны. Форманты были впервые обнаружены Германом фон Гельмгольцем (1863); первоначально считалось, что у каждого гласного имеется одна или 38 А. В. Архипов, П. В. Иосад, П. Д. Староверов две форманты. Впоследствии выяснилось, что у каждого гласного потенциально неограниченное число формант, однако только первые 3–4 из них отчетливо слышны и используются для различения звуков речи (а наиболее важными, действительно, являются первая и вторая форманты). В Таблице 1 приведены примерные значения первых двух формант для русских гласных полного образования. F2, Гц 2500–2000 2000–1600 и 1400–1300 900–800 ы э 600–500 у о а F1, Гц 300 500 700 Таблица 1.2. Примерные значениия частот первой (F1) и второй (F2) формант для ударных русских гласных (Гц) Существует определенная связь между частотами формант и артикуляционными признаками ряда, подъема и огубленности, хотя эта связь нетривиальна. В целом первая форманта связана с подъемом гласных (чем выше частота F1, тем ниже подъем), а вторая — с рядом (чем выше частота F2, тем ближе артикуляция гласного к переднему ряду). Однако признак огубленности, например, связан с понижением частот всех формант, поскольку при округлении и вытягивании губ вперед удлиняется выходное отверстие рече вого тракта и надсвязочная часть тракта в целом. Третья форманта особенно значима для некоторых дополнительных артикуляций, как, например, «эризация» (р-образная окраска гласного, как перед <r> в американском английском) и некоторые типы фарингализации. Особая формантная структура свой ственна носовым гласным (например, во французском языке): в их спектре появляются дополнительные так называемые «форманты назализации». 1.1.3. Перцептивная фонетика Слуховой аппарат человека. В задачи перцептивной фонетики входит исследование восприятия звука в условиях речевого общения. Сюда относятся не только вопросы физиологии слуха и устройства слухового аппарата, но и вопросы дальнейшей обработки сигналов, принятых рецепторами слуха, в нервной системе человека, их связь с общими процессами восприятия и интерпретации языковых сообщений, с условиями речевого общения, с механизмами усвоения языка и восприятием иноязычной речи. Восприятие Фонетика и фонология 39 Рисунок 1.10. Русские гласные [i] <и>, [e] <э>, [a] <а>, [o] <о>, [u] <у> в изолированном произнесении: узкополосная спектрограмма Рисунок 1.11. Русские гласные [i] <и>, [e] <э>, [a] <а>, [o] <о>, [u] <у> в изолированном произнесении: широкополосная спектрограмма звучащей речи проходит в несколько этапов: прием акустического сигнала и первичный анализ органами слуха; выделение акустических событий и признаков; лингвистическая интерпретация (идентификация фонем и просодических признаков). Наружное ухо (ушная раковина и слуховой проход) обеспечивают улавливание колебаний воздуха и небольшое усиление частот в речевом диапазоне. Механизм среднего уха — барабанная перепонка и слуховые косточки — обеспечивают механическое усиление колебаний воздуха и их передачу в жидкую среду внутреннего уха. Во внутреннем ухе колебания передаются базилярной мембране (внутри заполненной жидкостью улитки). Разные части мембраны имеют разную ширину, толщину и упругость, и поэтому поразному реагируют на те или иные частоты в спектре сигнала (см. рис. 1.13). Чувствительные волосковые клетки, расположенные вдоль базилярной мембраны, реагируют на колебания отдельных ее участков и генерируют электрические импульсы, которые передаются на слуховой нерв, состоящий из приблизительно 30 000 нейронов. На дальнейших этапах анализа вычленяются отдельные ключевые признаки сигнала: появление или прекращение 40 А. В. Архипов, П. В. Иосад, П. Д. Староверов стремечко наковальня полукружные каналы кость молоточек вестибулярный нерв слуховой нерв улитка ушная раковина преддверие кость хрящевая ткань слуховой проход барабанная перепонка Евстахиева труба круглое окно полость среднего уха овальное окно кость Рисунок 1.12. Наружное, среднее и внутреннее ухо человека периодических колебаний в тех или иных частотных диапазонах, изменение частоты звука, кратковременные (импульсные) шумы и т. п. Психоакустические шкалы. Психоакустика занимается вопросами способностей человека к восприятию и различению звуков с заданными акустическими свойствами. Экспериментально обоснованные психоакустические шкалы отражают зависимость между определенными физическими параметрами звука (такими как амплитуда/интенсивность, частота (или спектр), длительность) и признаками, воспринимаемыми человеком — громкостью, тембром, высотой и т. д. Известно, что восприятие основных физических свойств сигнала во многом описывается логарифмической зависимостью. Так, разницу по высоте между чистыми тонами частотой 100 и 200 Гц, 200 и 400 Гц, 400 и 800 Гц человек слышит как примерно одинаковую. На этом основаны и музыкальные шкалы: так, тональный диапазон в одну октаву соответствует двукратной разнице по частоте тона. Экспериментальные методы исследования восприятия. Наиболее распространенные типы экспериментов в перцептивных исследованиях — Фонетика и фонология 41 ϙβϥ 1 ϙβϥ 20 βϥ ϙβϥ 500 βϥ ςϟϝϑϔϜϫ ϖϑϢϙϝϑϝϒϝ ϓϏϑϚϔϜϗϮ, ϓΰ Рисунок 1.13. Чувствительность разных зон базилярной мембраны (внутри улитки) к колебаниям разной частоты ξϝϟϝϒϠϚϪϧϗϛϝϠϡϗ φϏϠϡϝϡϏ, βϥ Рисунок 1.14. Зависимость уровня громкости (в фонах) от звукового давления и частоты (кривые равной громкости) эксперименты на классификацию стимулов и на различение стимулов. С помощью подобных методик исследуется, например, связь между восприятием определенных звуков и фонологической системой языка. Так, носители определенного языка склонны разбивать стимулы на столько типов, сколько категорий различается в этом языке, и не различать стимулы, отнесенные к одной категории, даже при больших физических различиях между ними. Наоборот, стимулы, отнесенные к разным категориям, испытуемые не смешивают даже при малых физических различиях. А. В. Архипов, П. В. Иосад, П. Д. Староверов ϑϪϠϝϡϏ (ϛϔϚ) 42 ϦϏϠϡϝϡϏ (βϥ) Рисунок 1.15. Шкала мелов, характеризующая высоту звука, и ее связь с частотой (Гц) Оказывается, что эта категориальность восприятия не определяется только фонемным инвентарем языка. Эксперименты с новорожденными детьми, а также с животными — грызунами, макаками, шиншиллами — показали, что некоторые изменения в сигнале имеют тенденцию восприниматься скачкообразно даже в отсутствие фонологических ограничений, специфичных для того или иного языка. 1.1.4. Сегментная и супрасегментная фонетика До сих пор речь шла о фонетических свойствах отдельных звуков (сегментов). Но существуют также и свойства, которые характеризуют не отдельный звук, а более протяженный отрезок речи — слог, слово, группу слов или целое высказывание. Такие свойства называют супрасегментными, а соответствующий раздел фонетики — супрасегментной фонетикой, или просодией. Различают, напр., слоговую, словесную и фразовую просодию. К их ведению относятся такие явления, как слоговые тоны (в тональных языках), словесное ударение (в языках с ударением), фразовая интонация. В языках с ударением, включая русский, каждое слово имеет в своей структуре один наиболее выделенный, т. е. ударный, слог. Остальные слоги могут также различаться по выделенности; обычно в цепочке слогов слабые и сильные элементы по определенным закономерностям чередуются — это называют метрической структурой слова. Фонетические проявления ударе- Фонетика и фонология 43 ния и метрической структуры могут быть различными. Традиционно выделяется несколько типов ударения: динамическое (экспираторное), квантитативное (количественное), музыкальное (тональное). На самом деле ударный слог обычно характеризуется комбинацией нескольких физических параметров, в разных языках различной. В отличие от языков с ударением, где один слог в слове (ударный) противопоставляется всем остальным, в тональных языках каждый слог может нести один из двух или нескольких контрастирующих тонов. Тон как различительный (фонологический) признак может быть реализован целым комплексом фонетических признаков, включая не только тональные, но и фонационные, тембровые и др. — в этом смысле правильнее говорить о «слоговых просодиях», чем о «тонах». Существует два основных типа тональных систем в языках мира, уровневые и контурные. В уровневых системах (основной регион распространения — Африка южнее Сахары) различаются от двух до пяти уровневых (регистровых) тонов (высокий — низкий, высокий — средний — низкий, и т. д.); в некоторых из них встречаются также контурные (скользящие) тоны. Например, в языке дан-гуэтá (семья мандé) выделяются пять регистровых тонов и три контурных (все три — падающие). Наиболее типичные уровневые системы включают всего два фонологических тона, высокий и низкий. Для контурных систем, наиболее известных по языкам Юго-Восточной Азии, наоборот, типично иметь несколько тонов, большинство из которых являются контурными (падающими, восходящими и более сложными), но обычно хотя бы один ровный (чаще высокий). Например, в пекинском китайском выделяется четыре тона: ровный высокий (1‑й), восходящий (2‑й), нисходяще-восходящий (3‑й) и падающий (4‑й); во вьетнамском — шесть тонов. 1.1.5. Фонетическая транскрипция Самой распространенной формой представления фонетического анализа является фонетическая транскрипция — условная запись, отражающая фонетические свойства исследуемых языковых выражений или отдельных звуков. Существует множество транскрипционных систем. Широко применяемым стандартом является система транскрипции Международной фонетической ассоциации (МФА, IPA) — международный фонетический алфавит. Система МФА предназначена для того, чтобы иметь общепринятый способ для выражения любого фонетического признака, который является фонологически значимым (смыслоразличительным) хотя бы в одном языке мира. Важно понимать, что один и тот же фрагмент звучащей речи, одно и то же 44 А. В. Архипов, П. В. Иосад, П. Д. Староверов Рисунок 1.16. Международный фонетический алфавит (2018) языковое выражение могут быть по-разному затранскрибированы даже в одной системе обозначениий (в т. ч. в системе МФА), если иметь в виду разные цели транскрипции и соглашения о степени ее детальности. Фонетика и фонология 45 1.2. Фонология 1.2.1. Введение: что такое фонология и зачем она нужна Фонологией принято называть раздел грамматики, отвечающий за функционирование звуковых единиц в составе слов. Чтобы понять, что скрывается за таким достаточно темным определением, нам придется уточнить несколько основных понятий. Во-первых, что скрывается за понятием «звуковая единица» и чем такие единицы отличаются от просто «звуков»? Следует помнить, что фонология, в отличие от фонетики, — это раздел грамматики. На практике это означает, что предмет фонологии — не физические события, связанные с производством и восприятием речи, а более абстрактные закономерности устройства языковой структуры. Фонология изучает не конкретные свойства звуков, но свойства абстрактных структур, которым этим звуки соответствуют, или фонологические представления конкретных звуковых явлений. Во-вторых, мы говорим о функционировании этих фонологических пред ставлений в составе слов. Здесь мы встречаемся с очень важным свойством человеческого языка, которое (вслед за французским лингвистом Андре Мартине) принято называть двойным членением (double articulation). Свойство это заключается в том, что высказывания могут быть разделены как на языковые единицы, обладающие собственным значением («первое членение» по Мартине), так и на единицы, которые сами по себе значением не обладают, но при этом способны создавать различия между значимыми единицами. Если признать существование двойного членения, то следует признать и то, что несомненно значимые единицы (такие как целые высказывания, словосочетания или слова) можно проанализировать двумя способами. С одной стороны, их можно разложить на меньшие по размеру значимые элементы: так, словосочетания состоят из слов, а слова — из морфем. С другой стороны, даже неразложимые единицы первого членения (морфемы) в действительности состоят из незначимых элементов. Системными закономерностями того, как устроены эти незначимые, но различающие значения элементы, и занимается фонология. Итак, предмет фонологии — особенности функционирования звуковых единиц в составе слов. Какого же рода бывают такие особенности? Какими явлениями интересуются фонологи? Поскольку цель фонологической теории — объяснительно адекватный анализ человеческого языка вообще и отдельных языков в частности, этот вопрос можно поставить и по-другому: какими могут быть различия между 46 А. В. Архипов, П. В. Иосад, П. Д. Староверов фонологическими системами разных языков? В целом эти различия можно объединить в три важнейшие группы: — Набор фонологических единиц — Распределение и сочетаемость фонологических единиц — Чередования Различия в наборе фонологических единиц — пожалуй, наиболее очевидный образец фонологического варьирования. Всякому, кто изучал иностран ный язык, доводилось сталкиваться с тем, что не все звуки родного языка присутствуют в иностранном и наоборот. Например, в русском языке есть только один звук типа [i], а в английском различаются [pʰit͡ʃ] (peach) и [pʰɪt͡ʃ] (pitch). Какие звуковые различия могут использоваться в языках мира для различения слов, а какие — нет? Разные языки используют доступное «акустическое пространство» по-разному. Пределы типологического варьирования здесь достаточно широки: например, в области вокализма2 часто встречаются языки, различающие всего три гласных (обычно, хотя и не всегда, [i u a]), но нередки системы с пятью или семью гласными (напр., в испанском и итальянском соответственно), а в датском языке можно насчитать до двадцати пяти различных гласных (Basbøll, 2005). Тем не менее варьирование это не является неограниченным. Например, известны языки типа английского, где есть противопоставление двух [i]-образных гласных по напряженности (так принято называть свойство, отличающее [i] от [ɪ]), и языки типа русского, где такого противопоставления нет, но (пока) неизвестны языки, различающие три степени напряженности таких гласных, хотя в принципе ничего невозможного в такой системе нет: например, шведский язык, как и английский, использует это противопоставление, но при этом произношение шведского ненапряженного [ɪ] существенно отличается от английского [ɪ]. В принципе ничто не мешает ситуации, когда один язык различал бы [i], «английский» [ɪ] и «шведский» [ɪ], но такие языки пока неизвестны. Определение универсалий и границ варьирования в том, что касается набора фонологических единиц, — одна из важнейших задач фонологии. Еще одна сфера варьирования — распределение фонологических единиц и их сочетаемость. Так, например, в русском языке отсутствуют словоформы, оканчивающиеся на звонкий шумный согласный: слова типа раб произносятся с глухими согласными [p] на конце — в то время как в близкород ственном украинском такого ограничения нет, и произносится [rab]. Легко привести и такие примеры, где русский допускает больше свободы по срав2 Это слово обозначает систему гласных звуков. Фонетика и фонология 47 нению с украинским: например, русский допускает на конце слова мягкие губные согласные (семь, восемь), а украинский — нет (сім, вісім). Существуют также и ограничения на сочетаемость фонологических единиц. Например, в русском языке последовательности двух шумных согласных бывают только двух типов: такие, где все согласные звонкие, и такие, где все согласные глухие3. В украинском допустимы еще сочетания, где звонкий согласный предшествует глухому ([rʲidko] при русском [ˈrʲetkɐ]), но не наоборот: сочетания типа *[kd] запрещены и в украинском (но допустимы, к примеру, в немецком языке). Такие ограничения на распределение и сочетаемость фонологических единиц называют фонотактическими. Знание фонотактики несомненно является одним из аспектов знания отдельного языка: например, носители часто могут давать суждения о том, могло бы предъявленное им придуманное слово существовать в языке. Русская фонотактика довольно-таки свободна, но даже в русском языке скорее невозможны слова типа [prt͡skvna] (как в грузинском) или (с поправкой на невозможность отдельных сегментов) [tkʷ] (как в салишском языке нухалк). Как бы то ни было, фонотактика, как и варьирование в наборе фонологических единиц, входит в сферу интересов фонологической теории. Несмотря на то что и различия в наборе (часто еще говорят «инвентаре») фонологических единиц, и ограничения на их распределение и сочетаемость представляют для фонологии существенный интерес, в качестве источника данных о функционировании фонологического компонента грамматики они обладают важным недостатком: из них сложно извлечь информацию о том, какие операции наличествуют в фонологической грамматике каждого конкретного языка. Из одного только факта, что в русском языке отсутствуют, например, эйективные согласные или последовательности вроде [dk], нельзя заключить, что в фонологической грамматике русского языка присутствует механизм, обеспечивающий их отсутствие. Для того чтобы постулировать его наличие, нужно исключить гипотезу, что такие пробелы являются случайными. Отличить случайные пробелы — связанные, например, с особенностями исторического развития языка — от принципиально обусловленных грамматическими механизмами можно, если продемонстрировать, что запрещенные структуры активно избегаются в каких-либо грамматических процессах. В случае пробелов в инвентаре или фонотактических закономерностей такие механизмы иногда поддаются прямому или косвенному наблюдению: например, при освоении заимствований или в экспериментах, где участни3 Исключение здесь составляют [v] (и [vʲ]), ср. [ˈtvʲordɨi ̯], но [ˈdvʲerʲ]. 48 А. В. Архипов, П. В. Иосад, П. Д. Староверов ки дают прямые суждения о допустимости определенных структур или, например, выучивают «игрушечные» искусственные языки и затем воспроизводят новые слова. Однако же самый надежный источник сведений о фонологической системе — это чередования. 1.2.2. Фонология и морфология. Правила, уровни представления Мы исходим из того, что каждая смысловая единица или м о р ф е м а (см. главу 2 в наст. изд.) соответствует некоторой последовательности звуковых единиц — это словарное представление морфемы, оно является частью лексикона. На практике многие морфемы звучат по-разному в зависимости от контекста. Например корень со значением ‘корова’ перед гласными произносится [kɐˈrov], поэтому в именительном падеже с окончанием [-ɐ] имеем [kɐˈrovɐ]. Однако перед глухими согласными тот же корень имеет глухой конечный согласный [kɐˈrof], поэтому с уменьшительным суффиксом [-k] имеем [kɐˈrofkɐ]. Подобные регулярные изменения в звуковой форме морфем называются ч е р е д о в а н и я м и и описываются в рамках фонологии (а не морфологии). Причина, по которой произношение корня ‘корова’ меняется с контекстом, никак не связана с данным конкретным корнем: в русском языке внутри слова вообще не встречаются последовательности шумных согласных, которые бы различались по глухости/звонкости. Отсутствие слов, содержащих последовательность звуков [vk], и наличие слов, содержащих [fk] в русском, таким образом, следует из более общего д и с т р и б у т и в н о г о о б о б щ е н и я (см. выше). Задача фонологии — точно сформулировать набор звуковых единиц, дистрибутивных обобщений и чередований, оперирующих в языке. Поскольку фонология описывает регулярные чередования, мы также исходим из того, что морфология этого не делает. Морфология оперирует со словарными представлениями морфем, и для большинства морфем такое представление (то есть набор звуков, записанных в лексиконе) только одно — это представление также называют г л у б и н н ы м п р е д с т а в л е н и е м (англ. underlying representation) и записывают внутри косых черт, например, мы можем предварительно постулировать /kɐˈrov/ для ‘корова’. Некоторые с у п п л е т и в н ы е морфемы могут иметь по нескольку несвязанных глубинных представлений в разных формах (например, корень ‘человек’ во множественном числе имеет форму /lʲudʲ/), но в целом морфологический компонент практически никак не изменяет звуковую форму морфем. Именно поэтому глубинное представление многоморфемного слова можно получить просто приписав друг к другу глубинные представления составляющих его морфем, напр., ‘корова-dim-nom’ /kaˈrov-k-a/. Фонетика и фонология 49 Для каждого слова в языке фонология описывает переход от глубинного к п о в е р х н о с т н о м у п р е д с т а в л е н и ю (surface representation, записывается внутри квадратных скобок). При каждом произнесении/восприятии слова поверхностное представление реализует/декодирует фонетиче ский компонент, с учетом конкретной речевой ситуации (см. раздел 1.1). Фонологические чередования применяются при переходе от глубинного к поверхностному представлению, и их можно описать при помощи фонологических п р а в и л. Правило ассимиляции по глухости-звонкости в русском языке обобщает ряд чередований, таких как в примере (1). (1) Ассимиляция по глухости-звонкости: некоторые примеры a. b. Основа: ном.ед.ч. Диминутив: ном.ед.ч. kɐˈrovɐ pɐˈgodɐ rɐˈbotɐ kətɐˈstrofɐ kɐˈrofkɐ pɐˈgotkɐ rɐˈbotkɐ kətɐˈstrofkɐ В первом приближении, мы можем сформулировать это правило следу ющим образом: «звонкие шумные согласные становятся глухими перед глу хим шумным согласным». Данное правило изменит глубинное представление /kaˈrov-k-a/ в поверхностное представление [kɐˈrofkɐ], и будет применяться для других аналогичных примеров. Более того, данное правило никак не связано с суффиксом диминутива, оно применяется во всех случаях, когда глубинный звонкий согласный встречается перед глухим, ср., напр., /gorod/: родительный падеж [ˈgorədɐ] с [d], но прилагательное [gərɐtˈskoj] с [t]4. Примеры в (1) также иллюстрируют важный вид фонологических чередований: н е й т р а л и з а ц и ю к о н т р а с т а, или ситуацию когда несколько разных глубинных сущностей на поверхностном уровне реализуются одинаково. Перед гласными в русском языке встречаются как глухие, так и звонкие согласные, но перед глухими согласными — только глухие. Поэтому, например, по одной только форме диминутива невозможно определить, заканчивается ли его основа в глубинном представлении на звонкий, как в примере [pɐˈgotkɐ], или на глухой, как в примере [rɐˈbotkɐ]. В случае примера (1), нейДля сравнения, русский диминутив /-k/ также вызывает применение более узких правил, которые ограничены только некоторыми морфологическими контек стами: напр., конечный велярный взрывной п а л а т а л и з у е т с я в постальвеолярный фрикативный: [dɐˈrogɐ] ~ [dɐˈroʂkɐ]. 4 50 А. В. Архипов, П. В. Иосад, П. Д. Староверов трализация возникает в результате применения правила ассимиляции. Это правило можно сформулировать чуть более формально как в примере (2). (2) [+voi] → [–voi] / __ [–voi] Правила описывают звуковые изменения в терминах ф о н о л о г и ч е с к и х п р и з н а к о в, о которых мы подробнее поговорим в разделе 1.2.4. Признак [±voi] описывает глухость/звонкость. Общий формат записи правил приводится в (3). (3) B → C / A__D Где B называется ф о к у с п р а в и л а ; B → C — с т р у к т у р н о е и з м е н е н и е; A__D — к о н т е к с т п р а в и л а, л е в ы й (А) и п р а в ы й (D) соответственно (последовательность ABD называют еще с т р у к т у р н ы м о п и с а н и е м). Как видно на примере (2), контекст может быть пустым. Относительно правила (2) следует сделать несколько замечаний. Во-первых, формально наше правило упоминает только признак [voi]. Мы исходим из того, что теория фонологических признаков гарантирует, что признак [voi] есть только у шумных согласных. Во-вторых, такая формулировка правила весьма предварительная — она не описывает тот факт, что глухие согласные также становятся звонкими перед звонкими. Нейтрализация контраста в примерах (1) обусловлена последующим согласным, но часто за нейтрализацию отвечают не соседние звуки, а просто положение сегмента в слове. В языках мира особенно часто встречается нейтрализация в т.н. с л а б ы х позициях: на конце слова (перед паузой) и в безударных слогах. Обе позиции отвечают за нейтрализацию и в русском. Например, русские гласные /a/ и /o/ в большинстве диалектов контрастируют только в ударных слогах. Русские согласные на конце слова оглушаются, см. примеры в (4). (4) Оглушение: нейтрализация по глухости/звонкости на конце слова Глубинное представление a. b. /xlʲeb/ /ˈɡorod/ /mag/ /voz/ /xaˈlop/ /ˈvorot/ /mak/ /ˈgolos/ Номинатив ед. ч. Генитив ед. ч. ˈxlʲep ˈɡorət ˈmak ˈvos xɐˈlop ˈvorət ˈmak ˈgoləs ˈxlʲebɐ ˈɡorədɐ ˈmagɐ ˈvozɐ xɐˈlopɐ ˈvorətɐ ˈmakɐ ˈgoləsɐ Фонетика и фонология 51 Оглушение на конце слова в русском языке можно описать с помощью правила (5). (5) [+voi] → [–voi]/ __# Примеры в (4) также иллюстрируют одно из важных расхождений между фонологией и морфологией. Фонологическое глубинное представление совершенно необязательно совпадает с базовой формой слова. Хотя слово хлеб в базовой форме номинатива единственного числа произносится как [ˈxlʲep], глубинное представление этого слова должно иметь на конце сегмент /b/, поскольку иначе невозможно было бы объяснить, почему в генитиве имеем [ˈxlʲebɐ], а не *[ˈxlʲepɐ]. Фонологическим глубинным представлением морфемы является такая ее форма, исходя из которой можно предсказать все поверхностные формы этой морфемы. Такая наиболее информативная форма морфемы совершенно необязательно будет встречаться в словарной или эталонной форме, такой как номинатив единственного числа для существительных. 1.2.3. Порядок правил Фонологические правила могут взаимодействовать друг с другом и применяться в определенном порядке. О взаимодействии правил принято говорить в тех случаях, когда одно правило создает возможность для применения другого правила или, наоборот, убирает такую возможность. Рассмотрим следующий пример из баскского языка (Hualde 1991). Во многих баскских диалектах действует правило, согласно которому гласный нижнего подъема /a/ превращается в [e], если ему предшествует гласный верхнего подъема [i] или [u]. Это правило (назовем его правилом гармонии гласных) можно записать так: (7) Гармония гласных в баскском [+low] → [–back –low] / [+high] C0 __ («гласный нижнего подъема становится передним гласным ненижнего подъема, если ему предшествует глас ный верхнего подъема и, возможно, последовательность согласных») Действие этого правила можно наблюдать, например, в алломорфии определенного артикля /a/: например, в диалекте региона Бастан gizon ‘человек’ [ɡis̪on], c артиклем gizona [ɡis̪ona], но txakur ‘пес’ [t͡ʃakur], с артиклем txakurra [t͡ʃakure]. Еще одно правило предполагает подъем всех средних гласных непо средственно перед другим гласным5. (8) Подъем гласных в зиянии 5 Последовательность нескольких гласных иногда называют з и я н и е м (hiatus). 52 А. В. Архипов, П. В. Иосад, П. Д. Староверов [–high –low] → [+high] / __V («гласный среднего подъема становится гласным верхнего подъема перед любым другим гласным») Например, в том же диалекте asto [as̻to] ‘осел’, с артиклем astoa [as̻tua]. Где же здесь взаимодействие правил? Заметим, что в форме [as̻tua], строго говоря, присутствует контекст для правила гармонии гласных (7): подчерк нутая последовательность [ua] соответствует структурному описанию этого правила. Тем не менее эта форма не превращается в *[as̻tue]. Это можно объяснить, если предположить, что правило гармонии гласных применяется до правила подъема средних гласных в зиянии, когда глубинное представление /as̻toa/ еще не отвечает структурному описанию правила гармонии, см. (9). (9) Порядок правил: диалект региона Бастан ГП Гармония Подъем ПП /t͡ʃakur-a/ /t͡ʃakure/ Правило неприменимо [t͡ʃakure] /as̻to-a/ Правило неприменимо /as̻tua/ [as̻tua] Такое решение описывает данные бастанского диалекта, но остается неясным, можно ли принципиально ограничить порядок применения правил: почему сначала происходит гармония, а затем подъем средних гласных? Возможны ли языки, в которых эти правила применяются в ином порядке? Оказывается, да: в других баскских диалектах засвидетельствована именно такая ситуация. Например, в диалекте города Маркинья гармонию вызывают все верхние гласные: как присутствующие в глубинном представлении, так и созданные правилом подъема. В этом диалекте мы наблюдаем как формы типа [t͡ʃakure], так и формы типа [as̻tue]. (10) Порядок правил: диалект г. Маркинья ГП Подъем Гармония ПП /t͡ʃakur-a/ Правило неприменимо /t͡ʃakure/ [t͡ʃakure] /as̻to-a/ /as̻tua/ /as̻tue/ [as̻tue] На примере диалектов баскского мы видим, что порядок применения правил непосредственно влияет на результат и что разные языковые системы могут применять одни и те же правила в разном порядке. Таким образом, кроме глубинного и поверхностного уровней, в фонологии также могут существовать промежуточные уровни представления, которые возникают в ходе применения нескольких правил, связанных между собой. Такие промежуточные представления необходимы, чтобы объяснить, почему одно из Фонетика и фонология 53 правил применяется несмотря на кажущееся отсутствие контекста для него в поверхностной форме (в таких случаях говорят о «переприменении» правила, overapplication) или, как в случае бастанского диалекта баскского языка, почему правило не применяется, даже если контекст для него присутствует («недоприменение», underapplication). Для ситуаций переприменения и недоприменения правил используется еще общий термин н е п р о з р а ч н о с т ь (opacity), и существование непрозрачных дериваций — важный аргумент в пользу фонологических теорий, оперирующих промежуточными представлениями. 1.2.4. Единицы фонологии В предыдущих разделах мы подробно рассмотрели, как фонологическая грамматика может изменять звуковой облик морфем. Несложно увидеть, что подобный подход к фонологическому компоненту может объяснить и существование по крайней мере некоторых фонотактических ограничений. Например, если в языке есть правило оглушения конечных звонких шумных, создающее соответствующие чередования, и при этом в нем также отсутствуют слова, оканчивающиеся на звонкий шумный, то можно заключить, что это ограничение объясняется применением соответствующего правила6. Сосредоточившись на правилах, мы обошли стороной вопрос о том, из чего именно состоят глубинные, промежуточные и поверхностные представ ления. В разделе 1.2.1 мы говорили о «фонологических единицах». Какова природа этих единиц? Какую роль они играют в построении теории фонологического компонента грамматики? Какими свойствами они обладают? В рамках большинства распространенных теорий существенно то, что правила могут менять с в о й с т в а фонологических единиц, но не их природу: если, например, правило конечного оглушения [+voi] → [-voi] / __# переписывает последовательность /ɡorɐd#/ в /ɡorɐt#/, оно приводит к изменению /d/ в /t/, но при этом и /d/, и /t/ являются единицами одного рода. Мы называем их с е г м е н т а м и. Понятие сегмента очень важно для фонологической теории: как мы видели выше в разделе 1.2.2, правила манипулируют именно ими. Следовательно, нам необходима и теория того, какими бывают фонологические сегменты. В современной фонологии обычно принято считать, что сегменты не Вопрос о том, как анализировать фонотактические ограничения, не связанные с активными чередованиями, остается в современной фонологической теории открытым; ср. недавний обзор в Booij 2011. 6 54 А. В. Архипов, П. В. Иосад, П. Д. Староверов являются минимальными, неделимыми единицами представлений; вместо них эту роль играют р а з л и ч и т е л ь н ы е п р и з н а к и. Всякий сегмент можно представить в виде набора таких признаков: во многих теориях сегменты, собственно, и не имеют особого теоретического статуса, а представляют собой короткую запись так называемой п р и з н а к о в о й м а т р и ц ы. В современной фонологии существует много различных признаковых теорий. Одна из наиболее распространенных была предложена в знаменитой работе Ноама Хомского и Морриса Халле «Звуковой строй английского языка» (Chomsky, Halle 1968)7. В рамках этой теории сегменты состоят из ряда признаков, описывающих в основном их артикуляторные свойства. Эти признаки являются б и н а р н ы м и: каждому признаку приписано одно из двух значений, + или –. Например, нам уже знаком признак «звонкости» [±voi]: сегменты, описываемые как [+voi], произносятся с вибрацией голосовых связок, а сегменты с признаком [–voi] — без нее. Теория различительных признаков играет важную роль в фонологиче ской архитектуре. Во-первых, набор признаков считается универсальным, единым для всех человеческих языков. Из этого следует, в частности, что любые сегментные различия, существенные для фонологических процессов, должны описываться с помощью одного из признаков, входящих в универсальный набор. Это ограничение позволяет объяснить, например, почему различие между [i] и [ɪ] может быть фонологически релевантным (как в английском или шведском языке), а различие между «английским» и «шведским» [ɪ] — нет: первое укладывается в систему универсальных признаков (для него существует признак «напряженности» ([±tense]))8, а для двух вариантов [ɪ] такого признака нет, и это различие остается фонологически «невидимым». Таким образом, теория признаков одновременно является и теорией возможных фонологических различий. Во-вторых, теория фонологических признаков представляет собой и теорию того, какие к л а с с ы сегментов могут участвовать в фонологических процессах. Как несложно видеть из примеров в разделе 1.2.2, фонологиче ские правила обычно описываются с помощью значений одного или нескольких признаков: такие наборы значений можно наблюдать и в фокусе правил, и в их структурных изменениях, и в контекстах. Каждое сочетание значений одного или нескольких признаков описывает множество сегменВо многом эта система представляет собой переработку признаковой теории, предложенной ранее Р. О. Якобсоном в соавторстве с Гуннаром Фантом и тем же Моррисом Халле (Jakobson et al. 1951). 8 Иногда «напряженность» рассматривается как вариант признака «продвинутый корень языка» (advanced tongue root). 7 Фонетика и фонология 55 тов, которое иногда называют е с т е с т в е н н ы м к л а с с о м. Так, например, в русском языке в естественный класс, описываемый как [+voi], входят все звонкие сегменты, а, например, в класс [–syllabic; +high; –back] — все мягкие согласные. Поскольку любой естественный класс по крайней мере потенциально может фигурировать в фонологических правилах, набор различительных признаков и правила их сочетаемости9 описывают группы сегментов, которые могут участвовать в фонологических закономерностях, и возможные структурные изменения, предусматриваемые правилами. Именно поэтому признаковая теория является важной составляющей общей фонологической теории. Наконец, несмотря на то что до сих пор мы рассматривали все сегменты как равноправные составляющие фонологической структуры, оказывается, что не все фонологические закономерности, описываемые с помощью правил, имеют вполне одинаковый статус. Для каждого языка можно определить набор сегментов, которые присутствуют как в поверхностных представлениях (то есть в наблюдаемых формах), так и в глубинных. Самый простой способ установить, что два сегмента возможны в глубинных представлениях, а не порождаются с помощью правил, — найти пару слов, различающихся только на эти два сегмента (такие пары называются м и н и м а л ь н ы м и). Так, напр., русские слова дом [dom] и том [tom] идентичны друг другу, за исключением [d] ≠ [t]. Существование минимальной пары показывает, что (по крайней мере в этом контексте) распределение [d] и [t] не регулируется никаким правилом: если бы такое правило (напр., «начальное оглушение») существовало, оно было бы применено и устранило один из членов пары из поверхностного представления. Поскольку распределение этих сегментов непредсказуемо, различие между ними должно отражать различие между сегментами /t/ и /d/ в глубинном представлении. При этом в русском языке различие между [d] и [t], как и различие между любыми двумя шумными по звонкости, в глубинном представлении возможно практически в любой позиции, а вот в поверхностных — нет: в русском языке нет слов, которые различались бы тем, что одно оканчивается на звонкий шумный, а другое — на соответствующий ему глухой. Причина этому заключается в описанном выше правиле оглушения конечных звонких. Как мы уже видели, в таких случаях мы говорим о н е й т р а л и з а ц и и противопоставления шумных по звонкости в определенной позиции (в нашем случае: в конце слова). А они тоже необходимы: например, в стандартной теории принято считать, что значения [+high] и [+low] не могут сочетаться в одном сегменте, поскольку язык не может одновременно находиться в позиции верхнего и нижнего подъема. 9 56 А. В. Архипов, П. В. Иосад, П. Д. Староверов Другие правила, напротив, не создают сегментов, которые можно было бы постулировать для глубинных представлений. Например, в русском языке действует правило редукции безударных гласных, в соответствии с которым ударный [a] чередуется с [ə] в непервом предударном слоге: ср. грамота [ˈɡramətɐ], но грамотей [ɡrəmɐˈtʲej]. Несмотря на то что такое чередование вполне регулярно и может быть описано фонологическим правилом, в русском языке нет минимальных пар, которые различали бы [a] и [ə]. Более того, эти звуки н и к о г д а не встречаются в одинаковом контексте: [a] наблюдается только в ударных слогах, в которых не встречается [ə] (поскольку сегмент [ə] возможен только как результат правила редукции, которое в ударных слогах не действует); напротив, [ə] встречается в безударных слогах, в которых невозможно [a] (по той простой причине, что /a/ в безударном слоге подпадает под действие правила редукции). В таких случаях принято говорить, что два сегмента находятся в д о п о л н и т е л ь н о м р а с п р е д е л е н и и. В нашем случае [a] и [ə] находятся в дополнительном распределении потому, что к глубинному /a/ применяется правило, которое в некоторых контекстах превращает его в [ə]10. Сегменты, возможные в глубинных представлениях морфем данного языка, часто называют ф о н е м а м и. Таким образом, в русском языке есть, например, фонемы /t/ и /d/, но нет фонемы /ə/, поскольку во всех случаях, где мы наблюдаем в поверхностном представлении [ə], он является производным от других фонем. Набор сегментов, производных в данном языке от каждой фонемы, называют еще множеством а л л о ф о н о в этой фонемы: в русском языке, например, у фонемы /a/ есть аллофоны [ɐ] (в первых пред ударных слогах), [ə] (в непервых предударных слогах после твердых согласных), [i] (в безударных слогах после мягких согласных) и т. п. Соответственно, правила, которые создают сегменты, являющиеся в данном языке фонемами (как, например, оглушение конечных согласных), называют еще н е й т р а л и з у ю щ и м и, а правила, которые таких сегментов не создают, — а л л о ф о н и ч е с к и м и. Определение набора фонем — это не просто техническая тонкость. Как мы видели выше, уровень глубинного представления (который и содержит фонемы) является наиболее информативным, поскольку из него исключаются предсказуемые аспекты фонологических процессов. Более того, оказывается, что многие важные обобщения, касающиеся, например, ограничений на применение правил, аспектов психолингвистических процессов (напр., восприятия звучащей речи) или исторических изменений языка, В действительности в русском языке система, конечно, несколько сложнее, но для наших целей такое упрощение допустимо. 10 Фонетика и фонология 57 оперируют единицами именно этого уровня, что и обусловливает его важность для фонологической теории. Описанное выше понимание фонемы характерно для большинства вариантов порождающей фонологии. Иные фонологические теории, не оперирующие набором упорядоченных правил, тем не менее также признают важность фонемных представлений. В отсутствие теории, допускающей различие между глубинными и поверхностными представлениями, критерием фонемного статуса часто оказывается возможность создания смысловых различий («(лексических) контрастов»), определяемая часто с помощью минимальных пар. Именно такие критерии применяются, в частности, во многих знакомых русскоязычному читателю работах — в первую очередь выполненных в рамках Московской и Ленинградской фонологических школ. Во многих случаях результаты, полученные с помощью таких методов, совпадают с результатами порождающей фонологии, или очень близки к ним11. Источники иллюстраций Рис. 1.3 — 1.6 — H. Koneczna, W. Zawadowski. 1956. Obrazy rentgenograficzne głosek rosyjskich. Warszawa. Рис. 1.2, 1.12 — Encyclopædia Universalis France. Рис. 1.13 — Sgbeer (Wikimedia Commons). Рис. 1.14 — Monedula (Wikimedia Commons). Рис. 1.15 — Krishna Vedala (Wikimedia Commons). Рис. 1.16 — Małgorzata Deroń, Patricia Keating, International Phonetic Association. Тем не менее это не всегда так; см. ценный обзор различных представлений о том, какими бывают лексические контрасты и каков их теоретический статус, в работе Hall 2013. 11 2. Морфология С. Г. Татевосов Морфология — лингвистическая дисциплина, которая занимается изучением различных аспектов внутренней структуры слова, выделяя в нем минимальные значащие элементы, или м о р ф е м ы, и исследуя их свойства. Например, русское слово столиками содержит в себе три морфемы — стол, -ики -ами. Первая обозначает объекты внеязыковой действительности с вертикальными ножками и горизонтальной поверхностью, вторая передает идею небольшого размера, а третья выражает значения множественного числа и творительного падежа. Ни один из этих элементов нельзя подвергнуть дальнейшему разложению на значащие компоненты. Конечно, столиками состоит из девяти фонем и четырех слогов, однако фонемы и слоги значением не обладают, и их изучение — задача фонологии. Морфемы стол, -ик- и -ами можно встретить не только в составе выражения столиками, но и отдельно друг от друга. Морфема -ик, например, представлена в словах ключ-ик, карандаш-ик, гроб-ик, и всякий раз она, как и в слове столиками, создает существительные с предсказуемым значением. Ключик, карандашик и гробик обозначают предметы того же типа, что и ключ, карандаш и гроб, но при этом указывает, что их размер меньше того, который считается стандартным для ключей, карандашей и гробов. Важное свойство морфемы -ик состоит в том, что ее способности соединяться с другими морфемами очень ограничены: в русском языке нет, например, существительных *коровик ‘маленькая корова’ или *дверик ‘маленькая дверь’. Морфема -ами указывает на то, что существительное (как и его зависимые, образующие вместе с ним именную группу) характеризуются свойствами «множественное число» и «творительный падеж». Важнейшая задача морфологии, таким образом, — описать и объяснить, каким образом носители естественного языка могут создавать слова со сложной внутренней структурой из отдельных значащих элементов, как они распознают такие элементы в составе слов, построенных другими носителями, и каковы ограничения на возможность объединять элементы в целое. 2.1. Эмпирическая область морфологии 2.1.1. Морфологические единицы 2.1.2. Морфологические операции 2.1.3. Морфологические контрасты Морфология 59 2.2. Морфологические модели 2.3. Морфология в ряду других лингвистических дисциплин 2.3.1. Морфология и фонология 2.3.2. Морфология и синтаксис 2.3.3. Морфология и семантика Дополнительная литература: Spenser 1991; Zwicky, Spenser eds. 1998; Плунгян 2016; Audring, Masini eds. 2018. 2.1. Эмпирическая область морфологии 2.1.1. Морфологические единицы. Для многих исследователей морфо логии центральным ее понятием выступает с л о в о, а основной задачей — исследование его структуры. Носители русского языка, даже не имеющие специальных лингвистических знаний, согласны, напр., с тем, что слепить, слепил, слепящий — слова русского языка. В обыденном языке, однако, слово слово имеет двойственный смысл. С одной стороны, оно обозначает выражения, которые мы встречаем в конкретных предложениях и словосочетаниях, как в (1a-b): (1) a. Утренний свет слепил ему глаза. b. Слепящий свет ударил с крыльца по глазам. С другой стороны, слово — это абстрактная единица словаря, содержащая список его лексических свойств, общих для выражений слепил, слепить, слепящий и т. д. Чтобы убедиться в реальности слова в этом втором значении, достаточно провести простой мысленный эксперимент. Рассмотрим предложение: (2) Утренний свет расонил ему глаза. Любому носителю интуиция подсказывает, что выражение расонил не является словом русского языка. Если носитель сомневается в своей интуиции, он обращается к словарю, и пытается найти там нужное слово. Однако в случае с (2) он проверяет словарь не на предмет наличия в нем слова расонил. Он ищет нечто более общее — выражение расонить, которое выступает своего рода общей этикеткой для расонил, расонит и любых других возможных форм этого не существующего в реальности слова. Точно так же, в русских словарях нет слов слепил, слепит, слепящий, а только слепить. Это подводит нас к важному уточнению. Слово слово в обыденном языке обозначает и абстрактную единицу словаря — такую, как слепить, — и ее конкретные формы, такие как слепил, слепит, или слепить. Чтобы устранить эту неоднозначность, присущую слову слово, в морфологии вводятся два бо- 60 С. Г. Татевосов лее технических понятия. Слово как единицу словаря называют л е к с е м о й, а его конкретные реализации, встречающиеся в предложениях и словосочетаниях, — с л о в о ф о р м а м и этой лексемы. Выражение расонил в (2) — словоформа несуществующей лексемы расонить, а слепил — реальной лексемы слепить. Здесь и далее, чтобы отличать лексемы от словоформ, мы используем простое орфографическое соглашение: имена лексем записываются шрифтом малые прописные. Следует обратить внимание, что в русском языке выражение типа слепить имеет двойственный характер: это и конкретная словоформа, называемая инфинитивом, или неопределенной формой глагола, и словарная форма, обозначающая лексему слепить. В том, что слепил — словоформа лексемы слепить, а, например, столом — словоформа лексемы стол, согласны все существующие описания русской морфологии. Однако ответить в общем виде на вопрос, представляют ли собой объекты М1 и М2 в произвольном языке словоформы одной лексемы или разных лексем, оказывается крайне трудно, если вообще возможно. Можно ли, например, сказать, что столик — словоформа лексемы стол, а делать — словоформа лексемы (с)делать? Чтобы ответить на этот вопрос, теория должна сделать критерии выделения лексем и их словоформ максимально общими и применимыми к материалу любого языка. В качестве одного из таких критериев можно, например, предложить р е г у л я р н о с т ь (см. в частности Зализняк 1968). Мы говорим, что для признания объектов М1 и М2 словоформами одной лексемы, а не отдельных лексем, должно выполняться следующее условие: контраст, выражаемый с помощью М1 и М2, регулярно воспроизводится на открытом естественном классе единиц. В русском языке так же, как стол и столом, различаются слон и слоном, комната и комнатой, мышь и мышью и бессчетное количество других единиц, относящихся к классу лексем, который называется существительные. Существительных, у которых этот кон траст не выражается, напротив, ничтожно мало. Чтобы убедиться в этом, достаточно попытаться найти любое выражение типа столом, для которого невозможно подобрать надлежащую пару типа стол, или наоборот. В соответствии с таким критерием, стол и столом — словоформы одной и той же лексемы стол. Царь и царица, напротив, представляют разные лексемы. Отнюдь не любое существительное имеет пару, описывающую сущность противоположного пола. Даже среди существительных, обозначающих различающихся по полу живых существ, этот контраст, по-видимому, недостаточно регулярен. Хотя в русском языке есть пары типа князь — княгиня, ткач — ткачиха, слон — слониха, кот — кошка и т. д., для многих, а возможно и для большинства Морфология 61 релевантных слов ничего подобного не наблюдается, ср. например, названия животных типа як или синица, а также названия профессий типа токарь или прачка. Соответственно, никто никогда не признает царь и царица словоформами одной лексемы. Морфологические единицы и операции, которые создают словоформы одной лексемы, называют с л о в о и з м е н и т е л ь н ы м и, а соответству ющую область морфологических явлений — с л о в о и з м е н е н и е м. Сюда относится, например, образование словоформы творительного падежа единственного числа комнатой лексемы комната или словоформы первого лица единственного числа настоящего времени читаю лексемы читать. Процессы, приводящие к образованию новых лексем, относятся к с л о в о о б р а з о в а н и ю, а соответствующие единицы и операции называются с л о в о о б р а з о в а т е л ь н ы м и, или д е р и в а ц и о н н ы м и. Деривационными отношениями связаны, в частности, лексемы царь и царица. Существуют, однако, многочисленные случаи, где имеющиеся критерии (и, в частности, критерий регулярности) не дают четкой картины. Многие годы длится дискуссия о том, являются ли словоформами одной лексемы читать и прочитать или подписать и подписывать. Прийти к однозначному выводу мешает тот факт, что контраст, выражаемый таким образом, довольно регулярен, но далеко не стопроцентно регулярен. Для очень многих глаголов, таких, как побросать (все камни в воду) и прождать (три часа), например, нет побрасывать и прожидать. Иными словами, регулярность — понятие недостаточно дискретное, и поэтому, кроме ясных случаев, всегда есть и некоторая серая зона. Дискретной картины не дают и другие критерии разграничения словообразования и словоизменения, обсуждаемые, в частности, в Haspelmath 2002, а также их комбинации. Затруднения такого рода побуждают целый ряд исследователей принять минималистичное исходное допущение, делающее сам вопрос о противопоставлении лексемы и словоформы теоретически несущественным: (3) Единицами словаря выступают морфемы Если (3) верно, лексема теряет статус абстрактной единицы словаря, по скольку этот статус закрепляется за морфемой. В таком случае в значительной степени, а в некоторых теориях — полностью устраняется фундаментальное различие между образованием новых единиц, имеющих статус лексемы (то есть словообразованием) и образованием словоформ уже представленных в лексиконе лексем (то есть словоизменением). И то и другое становится операцией над морфемами, создающей более сложные их конфигурации из более простых. 62 С. Г. Татевосов Такой взгляд на вещи подкрепляется некоторыми эмпирическими аргументами, которые указывают как на проблематичность понятия лексемы, так и на невозможность провести четкую границу между словообразованием и словоизменением. В карачаево-балкарском языке (Лютикова и др. 2006) представлено явление к а у з а т и в и з а ц и и, иллюстрируемое в (4): (4) a. et eri-di. мясо таять-pst.3sg Мясо оттаяло. b. alim et-ni eri-t-ti. Алим мясо-ACC таять-CAUS-PST.3SG Алим разморозил мясо. (4a) — непереходное предложение, описывающее изменение состояния единственного участника ситуации. (4b) обозначает к а у з а ц и ю этого изменения, которую осуществляет другой участник. Контраст между (4a) и (4b) имеет морфологическое выражение: элемент -t-/-tir-, который отсутствует в (4a), но присутствует в (4b) (выбор между двумя вариантами морфемы определяется фонологическими соображениями). Если учесть, что глаголы в (4a) и (4b) имеют разные толкования и обозначают ситуации с разным количеством участников, кажется естественным признать их разными лексемами, а -t- рассматривать как элемент системы словообразования. В словарных описаниях карачаево-балкарского языка действительно принята такая практика: мы находим в словарях и глагол эрирге ‘таять’ и глагол эритирге ‘растапливать, размораживать’. Глагол эритирге ‘растапливать, размораживать’, однако, может подвергаться дальнейшей каузативизации, в результате чего образуется двойной или даже тройной каузатив: (5) alim Алим kerim-ge Керим-dat et-ni мясо-acc eri-t-tir-di. таять-caus-caus-pst.3sg Алим попросил Керима разморозить мясо. (6) alim kerim-den Алим Керим-abl fatima-ʁa et-ni Фатима-dat мясо-acc eri-t-tir-t-ti. таять-caus-caus-caus-pst.3sg Алим попросил Керима, чтобы он попросил Фатиму разморозить мясо. Следует ли признать эриттирирге ‘просить разморозить’ в (5) и эриттиртирге ‘просить просить разморозить’ в (6) отдельными лексемами? Если и дальше следовать лексикографической практике, принятой для карачаевобалкарского и аналогичных языков, ответ оказывается отрицательным: двойные и тройные каузативы практически не обнаруживаются в словарях. Морфология 63 За таким подходом стоит (возможно, неосознанная) интуиция: перечислять все такие каузативы в словаре бессмысленно примерно по той же причине, которая удерживает лингвистов от составления словаря предложений. Кажется весьма правдоподобным, что процесс каузативизации не имеет принципиальных грамматических ограничений и полностью рекурсивен: к глаголу в (5) можно присоединить еще одну морфему -tir/t-, а к тому, что получится после этого, — еще одну. Результат присоединения все новых и новых морфем полностью предсказуем: в структуре предложения появляется еще один актант, а в его семантическую интерпретацию добавляется информация еще об одном каузирующем событии. Тот факт, что мы не встречаем в текстах на карачаево-балкарском языке глаголов с десятью каузативными показателями, отражает, вероятно, экстраграмматические ограничения: многоморфемные рекурсивные комплексы создают затруднения для когнитивных систем, ответственных за их интерпретацию. Эти соображения указывают на то, что грамматика, которое дает для каузативов простые правила, описывающие последствия присоединения каузативной морфемы («добавь каузирующее событие и его участника»), оказывается существенно более эмпирически адекватной по сравнению с огромным словарем, перегруженным тысячами каузативных лексем. Устранение лексемы из понятийного аппарата морфологии снимает эту проблему. Тем не менее, несмотря на то, что целый ряд языковых явлений делает понятие лексемы проблематичным, полный отказ от него может обернуться существенными эмпирическими потерями. Существует целый ряд процессов, для адекватного описания которого оказывается релевантными понятие словоформы (или понятий, производных от словоформы). Во многих языках, например, есть явление гармонии гласных, состоящее в том, что в пределах словоформы допускаются только сегменты с одинаковыми значениями определенных признаков. Так происходит, например, в чукотском языке, где словоформа может содержать сегменты только одного из двух наборов в (7); сегменты из первого набора исследователи чукотского языка иногда называют рецессивными, второго — доминантными: (7) I (рецессивный) II (доминантный) e a i e u o Рецессивные и доминантные сегменты различаются по признаку подъема (Krause 1980), а их дистрибуция описывается следующим правилом: любой доминантный сегмент запускает понижение всех рецессивных сегментов в словоформе. 64 С. Г. Татевосов В (8) показано, как комитативный аффикс ma ‘с’ с доминантным гласным приводит к появлению доминантных гласных в корне. Исходный облик корня можно увидеть в другой форме, которая называется абсолютивом. (8) комитатив ɣa-tete-ma ɣ-otta-ma ɣa-melota-ma ɣa-rʔaw-ma абсолютив titi-ŋə uttu-ut milute-t rʔew ‘игла’ ‘дерево’ ‘кролик’ ‘кит’ В (9), напротив, доминантные сегменты корня воздействуют на сегменты аффикса эргативного падежа в словах ‘нож’ и ‘дом’: (9) ɣe-milɣger-e ‘ружье’ ɣe-kupre-te ‘сеть’ ɣa-rarka-ta ‘нож’ ɣ-otra-ta ‘дом’ Наконец, (10) показывает случай, когда гармония гласных происходит в структуре, содержащей два корня (так называемая инкорпорация прилагательного). Гласные рецессивных прилагательных teŋ ‘хороший’ и tur ‘новый’, оказавшись в одной словоформе с доминантным корнем, понижаются. (10) teŋ-kurpe-n ‘хорошая сеть’ taŋ-kawkaw ‘хороший сахар’ tor-kojŋ-ən ‘новая чашка’ tur-kupre-n ‘новая сеть’ Во всех этих случаях словоформа выступает той единицей, которая фигурирует в ключевых эмпирических обобщениях о рассматриваемом делении («только доминантные гласные в пределах словоформы»). Без обращения к понятию словоформы эти обобщения попросту невозможно сформулировать. Однако как только речь заходит о словоформах, с неизбежностью встает и вопрос о лексемах — как объектах, возникающих посредством абстракции отождествления словоформ. 2.1.2. Морфологические операции. Две основополагающие морфологические операции — а ф ф и к с а ц и я и о с н о в о с л о ж е н и е. Первая представляет собой соединение в целое двух элементов — а ф ф и к с а и о с н о в ы. Основа, в свою, очередь, также может состоять из аффикса и (меньшей) основы. Аффиксация, тем самым, — рекурсивная операция, создающая иерархические структуры, упорядоченные отношением части — целого. Словоформа подзавели (часы), например, образуется соединением показате- Морфология 65 ля множественного числа -и и основы подзавел-, которая, в свою очередь, представляет собой комбинацию основы подзавед- и показателя временной референции к прошлому -л. Полная структура словоформы подзавели показана в (11): (11) под л и за вед Основа, не содержащая в своем составе аффиксов, называется к о р н е м. В подзавели, в частности, корень — это вед-, все остальные морфемы — аффиксы. Хотя различие аффиксов и корней имеет фундаментальный характер, предложить универсальные критерии их различения в произвольном языке крайне трудно (см., напр., Плунгян 2016). Одно из самых значимых различий состоит в том, что аффиксальные морфемы образуют закрытый (и чаще всего относительно компактный) список, тогда как корневые морфемы представляют собой открытый класс единиц. Корневые морфемы проявляют ограничения на сочетаемость с аффиксальными, в большой степенью обусловленные их л е к с и ч е с к о й к а т е г о р и е й. Основные лексические категории в языках мира — г л а г о л, с у щ е с т в и т е л ь н о е, п р и л а г а т е л ь н о е и н а р е ч и е; в конкретных языках могут отсутствовать некоторые контрасты, например, морфологическое противопоставление прилагательных и наречий. Будучи, существительным, например, корень стол способен соединяться с именными аффиксами, таким, как уменьшительный аффикс -ик, аффикс -ов-, преобразующий существительные в прилагательные, или падежно-числовой аффикс -ами. Напротив, он не способен к соединению с глагольным префиксом вы-, показателем страдательного причастия -м- или прошедшего времени -л. Как правило, ограничения такого рода описываются как селективные ограничения, которые аффиксы накладывают на лексическую категорию основы, с которой соединяются. Для корней во многих морфологических теориях вводится дополнительная характеристика — с в я з а н н о с т ь. Корень является с в я з а н н ы м, если в любой словоформе, частью которой он выступает, представлен, кроме него, по меньшей мере один аффикс. В противном случае корень является автономным. Например, корень пис- глагола писать не может образовать словоформу без помощи аффиксов и тем самым является связанным. Корень стол, на первый взгляд, автономен, поскольку образует словоформу стол. Возможно, однако, следует принять анализ, согласно которому любая 66 С. Г. Татевосов словоформа существительного в русском языке представляет собой комбинацию основы и падежно-числового показателя, который в именительном падеже единственном числа имеет нулевой план выражения. В таком случае корень стол также оказывается связанным, как и любой русский именной корень. Противопоставление связанных и свободных корней в таком случае делается для русского языка бессодержательным. Поэтому в понятие «связанный корень» часто вкладывают более узкий смысл: связанными признаются корни, которые требуют определенного класса словообразовательных аффиксов. Тогда связанным, например, оказывается корень -у-, который нуждается в префиксах об- и раз- (обуть, разуть); большинство других глагольных корней делаются автономными. А ф ф и к с ы, согласно, определению, — это такие объекты, которые представлены в составе целого только наряду с основой. Это неотвратимо делает их связанными морфемами. В зависимости от расположения аффиксов по отношению к корню, выделяются их частные разновидности — п р е ф и к с ы (размещаются перед корнем), с у ф ф и к с ы (после корня), и н ф и к с ы (внутри корня в одном месте), т р а н с ф и к с ы (внутри корня в нескольких местах), ц и р к у м ф и к с ы (вокруг корня), и ряд других. Примером префикса является от- в слове от-кры-ва-ть, примером суффикса — -ва- в этом же слове. Как циркумфикс некоторые исследователи анализируют выражение раз-ся в слове разбежаться (Вася разбежался). Поскольку в русском языке нет ни глагола бежаться (*Вася бежался) ни глагола разбежать (*Вася разбежал (Петю), заключают они, разбежаться образуется от бежать с помощью сложной морфемы раз-ся. Примеры инфиксов можно найти в языке улва, в котором морфемы, обозначающие принадлежность, размещаются внутри корня: sú:lu ‘собака’, sú:-ki-lu ‘моя собака’, sú:-ma-lu ‘твоя собака’, sú:-ka-lu ‘его/ее собака’. Трансфиксы — характерная особенность семитских языков. В арабском языке глагольные корни состоят исключительно из согласных, а аффиксы, обозначающие залог и вид — исключительно из гласных, и вторые размещаются внутри первых. Например, расположив между согласными корня ktb со значением ‘писать’ гласные а, мы получаем форму katab со значением совершенного вида и активного залога (‘написать’). С помощью гласных u и a образуется форма uktab несовершенного вида пассивного залога (‘писаться’). Такие явления, как инфиксация и трансфиксация, во многих морфологических теориях рассматриваются в одном ряду с другими типами н е к о н - Морфология 67 к а т е н а т и в н о й м о р ф о л о г и и. В широком понимании неконкатенативная морфология включает в себя любые явления, когда соединение двух морфологических объектов в целое нельзя описать как их простое линейное соположение. Помимо разрывных морфем, сюда включаются разнообразные «з н а ч а щ и е ч е р е д о в а н и я » (ср. англ. sit ‘сидеть’ и sat ‘сел’), т о н о в а я м о р ф о л о г и я (грамматические контрасты выражаются с помощью тонов), ш а б л о н н а я м о р ф о л о г и я (морфологические объекты имеют фиксированную просодическую структуру), с у б т р а к т и в н а я м о р ф о л о г и я (грамматические контрасты выражаются удалением материала) и некоторые другие. Т о н о в а я м о р ф о л о г и я иллюстрируется в (12) из языка дида (семья кру, Кот д’Ивуар) (Sande 2017): (12) a. e4 li3 ɟa-be3.1 kubə3.1 1sg.nom есть.ipfv кокос-sg вчера ‘Вчера я съел кокос’. b. e4 li2 ɟa31 koko4.4 1sg.nom есть.pfv кокос постоянно ‘Я постоянно ем кокосы’. Этот язык различает четыре степени высоты тона, которые подписаны верхним индексом к каждой словоформе в виде цифр от 1 до 4 (нескольким тонам в пределах словоформы соответствует несколько цифр; если они реализуются в разных слогах, то разделяются точкой). Предложения (12a) и (12b) различаются видо-временными характеристиками: (12a) описывает однократную ситуацию в прошлом, достигшую кульминации (‘съел’), (12b) обо значает систематическое повторение таких ситуаций, имеющее место на интервале, который включает момент речи (‘ем’). Единственное различие между (12a) и (12b), на счет которого можно отнести этот видовременной контраст, — различие в тоне: в имперфективном (12b) он на одну ступень ниже. Другой характерный пример неконкатенативной морфологии — редупликация. При редупликации используется морфема, которая имеет фиксированную просодическую структуру, но нефиксированный сегментный состав. Например, в языке илокано так образуется множественное число: púsa ‘кот’ — pus-púsa, kláse ‘класс’ — klas-kláse ‘классы’. В этом случае все, что известно о показателе множественного числа, — это его просодический шаблон, а именно, тяжелый слог. Сегментное содержание слога (в первом случае /pus/, во втором /klas/) копируется у исходного слова. 68 С. Г. Татевосов Образец субтрактивной морфологии можно найти в некоторых диалектах немецкого, напр., нусбахском (Köhnlein 2018), в котором множественное число некоторых существительных образуется удалением конечного консонантного сегмента: /hund/ ‘собака’ и /hun/ ‘собаки’, ср. форму литературного немецкого Hunde. Выражение столиками содержит ровно один корень — стол. В общем случае, однако, естественные языки допускают и более одной корневой морфемы в составе слова. В русском языке пример такой возможности — слова типа человеколюбие или деревообработка, в которых имеется по два корня, образующих единое морфологическое целое. В таких случаях принято говорить о с л о в о с л о ж е н и и, или о с н о в о с л о ж е н и и. 2.1.3. Морфологические контрасты. Если предположить, что проблеме определения границ лексем, описанной в предыдущем разделе, удалось найти приемлемое решение, каждой лексеме можно сопоставить набор ее словоформ. Общее свойство таких наборов состоит в том, что словоформы в их составе различаются значением одной и более с л о в о и з м е н и т е л ь н ы х г р а м м а т и ч е с к и х к а т е г о р и й. Например, словоформы столом и столами имеют разные значения категории числа, а столом и столе — категории падежа. Значения грамматических категорий, или г р а м м е м ы, такие, как д а т е л ь н ы й п а д е ж или м н о ж е с т в е н н о е ч и с л о, отражают к о н т р а с т ы в дистрибуции и семантике соответствующих словоформ. Граммемы числа, например, указывают на количественный контраст между сущностями, обозначаемыми именными группами (‘одна сущность’ vs. ‘одна и более сущностей’). Граммемы падежа различают, среди прочего, типы синтаксических конфигураций, в которых допускается та или иная именная группа. Именная группа, возглавляемая словоформой существительного в творительном падеже, например, может выступать агентивным дополнением в предложениях типа Наполеон был разбит союзниками при Ватерлоо, а именная группа в дательном падеже не может. Грамматическая категория является словоизменительной д л я н а б о р а с л о в о ф о р м, если среди них хотя бы две несут разные ее граммемы. Например, категория числа в русском языке является словоизменительной для набора словоформ лексем слон и большой, и, более того, для набора словоформ любых существительных и прилагательных. Чтобы убедиться в этом, достаточно сравнить, например, словоформы типа слон и слоны, а также большой и большие. Категория рода является словоизменительной только для большой и других прилагательных (ср. большой и большая). Среди Морфология 69 с уществительных не находится таких, словоформы которых различались бы по роду. Все словоформы лексемы слон — мужского рода. Для набора словоформ этой лексемы, как и для всех остальных существительных, род — с л о в о к л а с с и ф и ц и р у ю щ а я к а т е г о р и я. Эти примеры показывают, среди прочего, что применительно к русскому языку в целом бессмысленно задавать вопрос, выступает ли род словоклассифицирующей или словоизменительной категорией. Отношение между словоформами лексемы и грамматическими категориями характеризуется несколькими важным свойствами. Во-первых, граммемы по преимуществу являются взаимоисключающими. Одна и та же словоформа в нормальных условиях не может быть одновременно словоформой единственного и множественного числа или прошедшего и будущего времени. Отклонения от этой тенденции весьма немногочисленны. Один из характерных случаев — множественное падежное маркирование, когда одно и тоже имя получает поверхностно выраженную падежную морфологию из разных источников. Такое наблюдается в танкийском языке лардил, обсуждавшемся в работах К. Хейла, Н. Ричардса и Д. Песецкого. (13) Ngada я derlde сломал marun-ngan-i wangalk-i. мальчик-gen-acc бумеранг-acc ‘Я сломал бумеранг мальчика’. (Pesetsky 2013, цит. Richards 2007) В (13) словоформа существительного ‘мальчик’ в качестве посессора в именной группе ‘бумеранг мальчика’ содержит показатель генитива. В качестве компонента прямого дополнения оно содержит также показатель аккузатива, поскольку в этом языке падеж маркируется не только на вершине именной группы, но и на всех ее зависимых. Во-вторых, в общем случае неверно, что любая словоформа содержит какую-то граммему каждой из грамматических категорий, являющихся для данного набора словоформ словоизменительными. Например, для набора словоформ любого русского глагола словоизменительными являются категории числа, лица и рода (ср. читаю и читаешь, читаю и читаем, читал и читала, читал и читали). Однако нельзя сказать, что любая глагольная словоформа — это словоформа какого-то лица и рода, поскольку читал, читала и т. д. не содержат информацию о лице, а читаю, читаешь и т. д. — о роде. Это тот случай, когда словоизменительная грамматическая категория характе ризует не все множество словоформ, а лишь его собственное подмножество. Особый случай возникает тогда, когда создаваемый словоизменительной грамматической категорией контраст оказывается не эквиполентным, а п р и в а т и в н ы м. Контраст в этом случае возникает не между двумя разными свойствами, как в случае с числом или падежом, а между наличием 70 С. Г. Татевосов свойства и его отсутствием. Характерный пример — категория эвиденциальности в татарском языке. Часть глагольных форм в этом языке допускается только в том случае, если говорящий не был непосредственным свидетелем описываемой ситуации, а получил информацию о ней из внешнего источника, см. Татевосов 2017. Одна такая форма показана в (14). (14) zinnur jɤkl-a-gan. Зиннур спать-st-pfct Зиннур (по)спал. {*Я видел его спящим // OKМне рассказали об этом.} Есть, однако, и другие формы, одна из которых иллюстрируется в (15): (15) zinnur jɤkl-a-dɤ. Зиннур спать-st-PST Зиннур (по)спал. { Я видел его спящим // Мне рассказали об этом.} Как видно из (15), последняя совместима с любым источником информации об описываемой ситуации — и непосредственным и опосредованным. Для таких случаев открывается две возможности описать характер контраста (с эмпирической точки зрения, впрочем, они эквивалентны). Во‑первых, эвиденциальность в татарском языке можно понимать как словоизменительную категорию с двумя граммемами ‘косвенная засвидетель ствованность’ и ‘отсутствие информации о засвидетельствованности’, которая определена для всего множества словоформ. Во-вторых, можно принять соглашение, что эвиденциальность — это категория с одной граммемой, которая характеризует собственное подмножество словоформ. Точно такая же дилемма возникает в случае с деривационными категориями, выражаемыми словообразовательной морфологией. Во многих языках, включая русский, имеются деривационные морфемы, которые создают из существительных новые существительные, обозначающие тот же тип сущностей, но с размером, отличным от стандарта — д и м и н у т и в ы (‘размер меньше стандарта’) и а у г м е н т а т и в ы ‘размер больше стандарта’, ср. дом — дом-ик — дом-ищ-е. Существительное дом обозначает любые дома, в том числе домики и домищи и тем самым не содержит в себе информации о размере. В этом смысле домик соотносится с дом точно так же, как (14) соотносится с (15). Следует ли в таком случае приписать слову дом граммему ‘отсутствие информации о размере’, не имеющую к тому же никакой морфологической реализации? Соображения общеметодологического характера подсказывают выбор: отсутствие информации и ее материального носителя следует понимать как отсутствие самой граммемы. Традиционно важное место в морфологических исследованиях занимает вопрос об однозначном соответствии граммем и морфем. В области имен- Морфология 71 ной морфологии, например, ситуация, наблюдаемая в русском языке, систематически воспроизводится в сотнях генетически и ареально независимых языков: один показатель несет в себе информацию о двух граммемах — падежа и числа. Такова, например, морфема -ами в слонами. Существует и огромное количество языков, где на каждую граммему приходится по морфеме. Например, в бурятском языке словоформа инструменталиса множественного числа существительного буу ‘ружье’ выглядит как буу-нууд-аар, где -нууд — показатель множественного числа, а -аар — инструменталиса. Наблюдения такого рода привели к появлению известной и до сих пор популярной классификации, выделяющей среди языков, среди прочего, «ф л е к т и в н ы е» и «а г г л ю т и н а т и в н ы е». И те и другие характеризуются кластером свойств, и одно из важнейших — именно характер соответ ствия граммем и морфем. В агглютинативных языках типа бурятского оно будто бы одно-однозначно, тогда как во флективных имеет место совмещенное выражение граммем единой морфемой. Несмотря на привлекательную простоту, классификация, восходящая к В. фон Гумбольдту, в действительности отражает лишь очень поверхностные наблюдения о небольшом фрагменте грамматики небольшого числа языков. В типологических исследованиях последних десятилетий накоплена значительная сумма наблюдений, указывающая, что в реальности для выделения таких классификационных единиц, как «флективные языки» или «агглютинативные языки» имеется очень мало эмпирических оснований. Выяснилось, например, что агглютинативность может присутствовать в одной части языковой системы и отсутствовать в другой. Даже такие образцово агглютинативные языки как алтайские (к числу которых относится и бурятский) последовательно агглютинативны лишь в именной подсистеме; в глагольной этот идеал серьезно нарушается. Лицо и число в бурятском глагольной словоизменении выражается точно так же, как в русском, — показателями, совмещено обозначающими и то и другое. Не имеют отдельных показателей и глагольные вид и время. В других языках также наблюдается значительное варьирование: одно-однозначное соответствие между граммемами и морфемами может быть представлено в одной части системы, но отсутствовать в другой, а разные параметры, вместе составляющие понятие «язык алллютинативного/флективного строя», могут варьировать независимо (Haspelmath 2009). 2.2. Морфологические модели В морфологической теории имеется несколько направлений теоретизирования, каждое из которых характеризуется собственным набором исход- 72 С. Г. Татевосов ных допущений о том, что есть корни и аффиксы и как они соединяются в целое. При известном огрублении диапазон имеющихся возможностей можно свести к двум бинарным противопоставлениям (см., напр., Stump 2001). Первое противопоставление разделяет теории на л е к с и ч е с к и е и и н ф е р е н т и в н ы е. Оно определяется тем, рассматриваются ли аффиксы как э л е м е н т ы с л о в а р я или они возникают в результате п р и м е н е н и я п р а в и л а. Лексические теории подходят к аффиксам как к единицам, имеющим план содержания, в частности, набор граммем некоторой грамматической категории. Словоформа столами при таком подходе образуется в результате соединения двух морфем, имеющих сходную природу, — стол и -ами; к аффиксу -ами привязаны граммемы ‘творительный падеж’ и ‘множественное число’. К этому классу теорий относятся любые теории, наделяющие аффиксы статусом з н а к а — со всеми последствиями, к которым ведут имеющиеся соображения о его семиотической природе. Такова, например, популярная в России морфологическая теория И. А. Мельчука (Мельчук 1998), который наделяет аффиксы планом выражения, планом содержания и синтактикой. Инферентивные теории не рассматривают аффиксы как элементы сло варя. Аффиксация — это не соединение двух единиц с одинаковым семиотическим статусом, а п р о ц е с с, происходящий с корнем. Этот процесс может описываться правилом, связывающим лексему и словоформу, или, иначе, обеспечивающим в ы в о д (отсюда название «инферентивные теории») нужной словоформы для данной лексемы. Например, инферентивный характер имеют школьные описания словоизменения вида (16), где, правда, допущены некоторые отступления от школьной терминологии. (16) Чтобы получить форму творительного падежа множественного числа лексемы стол, необходимо добавить к ее корню последовательность сегментов /ами/. Первое обсуждение противопоставления лексических и инферентивных теорий, состоялось, по-видимому, еще в 1950-е годы в работе Ч. Хокетта (Hockett 1954, см. также Anderson 1992), который использовал для их обозначения термины Item-and-Arrangement и Item-and-Process. Первый термин отражает интуицию, согласно которой морфология — это упорядочивание (arrangement) корневых и аффиксальных единиц (items). Второй рассматривает морфологию как науку о процессах (processes), происходящих с корневыми единицами. Другое противопоставление разбивает морфологические теории на и н к р е м е н т а л ь н ы е и р е а л и з а ц и о н н ы е. За ним стоит два возмож- Морфология 73 ных ответа на вопрос о том, происходит ли при аффиксации приращение информации. Положительный ответ характерен для инкрементальных теорий: словоформа столами приобретает граммемы ‘творительный падеж’ и ‘множественное число’ б л а г о д а р я аффиксу -ами. Реализационные теории исходят из противоположного допущения: граммемы ассоциируются с лексемой некоторым независимым механизмом, а аффикс лишь обеспечивает их планом выражения, или, иными совами, р е а л и з у е т их. Будучи независимыми, два противопоставления создают пространство из четырех возможностей в (17): (17) a. лексическая инкрементальная теория b. лексическая реализационная теория c. инферентивная реализационная теория d. инферентивная инкрементальная теория Покажем, как могут различаться четыре теории, на искусственных (и очень упрощенных) примерах. Эти примеры не следует воспринимать как работающий анализ падежно-числовых словоформ русского существительного; они сконструированы исключительно в иллюстративных целях. Образец анализа словоформы дательного падежа единственного числа комнате на языке теории типа (17а) показан в (18): (18) Лексическая инкрементальная теория a. Словарь:  /комнат/ ‘комната’; N  /е/ ‘dat, sg’; NAff b. Грамматика: N ⊕ NAff c. Что происходит:  ⊕  = /комнат/ ‘комната’ ⊕ /е/ ‘dat, sg’ = /комнате/ ‘комната; dat, sg’ В (18а) в словаре содержатся две морфемы — корень и падежно-числовой аффикс, а при них — вся необходимая грамматическая и семантическая информация. Как минимум, это лексическое значение для корня, грамматическое значение для аффикса, и для обоих — некоторая информация об их дистрибутивном классе. (В (18а) она достаточно произвольным образом записана как N «существительное» или NAff «именной аффикс»). В более полном и менее иллюстративном анализе русской системы, безусловно, надо учесть еще и тот факт, что падежно-числовые показатели для разных морфологических классов существительных («типов склонения») различны и что информация о морфологическом классе также является преимущественно словарной. Для наглядности и простоты мы полностью выносим этот сюжет за скобки. 74 С. Г. Татевосов В грамматике хранится информация, предписывающая соединить существительное с именным аффиксом. В (18b) эта информация, опять же произвольным образом, представлена как N ⊕ NAff, где ⊕ — операция конкатенации. В (18c) показано применение этой операции к словарным единицам из (18a): фонологические цепочки объединяются в целое; лексическое значение соединяется с грамматическим, и на выходе получается словоформа конкретного существительного с граммемами дательного падежа и единственного числа. В таком морфемоцентричном духе устроен морфологический компонент получившей широкую известность в России модели «Смысл — текст» (Мельчук 1998), а также в еще целом ряде морфологических теорий, например, в Lieber 1992. (Подчеркнем важность оговорки «в таком духе»: (18) не воспроизводит буквально ни анализ И. А. Мельчука, ни анализ Р. Либер, которые отличаются и от (18), и друг от друга. Эта же оговорка распространяется и на другие аналогичные примеры ниже.) Возможный вариант лексической реализационной теории показан в (19): (19) Лексическая реализационная теория a. Словарь:  /комнат/ ‘комнат’  /е/ ‘[+marg], sg’ b. Грамматика: Приписывание граммем:  ⊕ dat [+marg, -quant, +dir], sg Правило реализации: словарная единица M реализует набор граммем σ, если лексически привязанный к ней набор признаков — подмножество σ c. Что происходит:  ⊕ dat [+marg, -quant, +dir], sg = /комнат/ ‘комнат’ ⊕ dat [+marg, -quant, +dir], sg ⇓  /е/ ‘[+marg], sg’ Главная особенность такой теории по сравнению с вариантом в (18) — ее «реализационность», которая заключена в (19b). В (19b) граммемы падежа и числа возникают у существительного не благодаря аффиксу. Напротив, аффикс появляется как ответ на потребность реализовать граммемы, возникшие у существительного независимым образом. В (19b) грамматический процесс, в результате которого существительное приобретает грамматиче ское значение, обозначен как «приписывание граммем». О том, как именно это происходит, существует огромное множество теоретических предположений, большинство которых сходится в том, что за это отвечает процесс Морфология 75 синтаксической деривации. (Обсуждение деталей, однако, увело бы нас в сторону.) Отдельный компонент грамматики — принципы реализации, которые описывают, как определенный набор граммем получает поверхностное выражение. Пример в (19) иллюстрирует одну из возможностей: чтобы реализовать набор граммем σ, следует воспользоваться такой словарной единицей M, свойства которой соотносятся с σ как подмножество и объемлющее множество. В нашем случае набор граммем состоит из двух элементов — дательный падеж и единственное число. (19b) опирается на анализ падежа, предложенный Р. О. Якобсоном (Якобсон 1985). Р. О. Якобсон предположил, что падеж представляет собой комбинацию значений трех признаков — объемности [± quant], направленности [± dir] и периферийности [± marg]. Датив — это периферийный необъемный направленный падеж [+marg, -quant, +dir]. (Конкретное содержание этих признаков сейчас несущественно; заинтересованному читателю мы рекомендуем обратиться к первоисточнику.) Именно эту комбинацию, а также признак единственного числа и следует реализовать, подобрав в словаре подходящую словарную единицу. В словаре (среди прочих, которые не показаны в (19a)) имеется единица /е/. Однако в отличие от варианта в (18а), ее нельзя назвать показателем дательного падежа единственного числа. В ее словарном представлении задан только признак периферийности [+marg], но ничего не говорится о [± quant] и [± dir]. При такой спецификации единица /е/, согласно (19b), делается пригодной для реализации любого периферийного падежа единственного числа — не только датива, но и например, предложного падежа. (И действительно: как мы знаем, дательный и предложный падежи существительных типа комната имеют одинаковый план выражения. Такое положение вещей называется п а д е ж н ы м с и н к р е т и з м о м.) В соответствии с (19с), единица  из (19a) реализует набор граммем, приписанный единице  в (19b) (реализация в (19c) показана стрелкой), и на выходе получается словоформа /комнате/ с подобающим набором граммем. Для теорий такого типа характерны, как мы видим, аффиксальные словарные единицы, лексическая спецификация которых отлична от реализу емой. (Например, единица в  в (19a) характеризуется н е д о с п е ц и ф и ц и р о в а н н о с т ь ю.) Подход такого рода принят в частности, в т е о р и и р а с п р е д е л е н н о й м о р ф о л о г и и (Halle and Marantz 1993, 1994 и по следующая литература), а также в теории, получившей известность под именем н а н о с и н т а к с и с а (Starke 2010). (Необходимо сделать ту же ого- 76 С. Г. Татевосов ворку, что и в предыдущем случае: (19) отражает общую идею, но не является ни распределено-морфологическим, ни наносинтаксическим анализом словоформы комнате.) Сохранив теорию реализационной, как в (19), превратим ее из лексиче ской в инферентивную, сообразно (17c). Образец такой теории показан в (20): (20) Инферентивная реализационная теория a. Словарь:  комната /комнат/ ‘комната’ b. Грамматика: Приписывание граммем:  ⊕ dat, sg = комната, dat, sg Правило реализации: F…, DAT, SG, … (X, σ) = S(X)е где Х — лексема, S(X) корень лексемы, а σ — набор ее граммем c. Что происходит: F…, DAT, SG, … ( ⊕ dat, sg) = F…, DAT, SG, … (комната, dat, sg) = /комнате/ Главное отличие этой теории от предыдущих — отсутствие словарной единицы, соответствующей аффиксу. В словаре хранятся лексемы, а не морфемы (в (20а) лексема, как и прежде, показана шрифтом малые прописные). Вместо словарной единицы, соответствующей аффиксу, имеется правило образования датива единственного числа в (20b), которое представляет собой функцию в (18): (21) F…, DAT, SG, … — это функция, которая, применяясь к лексеме Х с набором граммем σ, присоединяет к ее корню S(X) сегмент е. Как и в любой реализационной теории, в частности, в (19), приписывание граммем — процесс, предшествующий аффиксации и независимый от нее, (20b). Правило (21) получает на вход лексему с уже приписанным ей набором граммем и определенным образом модифицирует корень этой лексемы, а именно: прибавляет к нему справа сегмент е. Тем самым образование словоформы — это не комбинирование единиц, имеющих знаковую природу, как в лексических теориях, а п р о ц е с с, к о т о р ы й п р о и с х о д и т с л е к с е м о й. В (20b) правило опирается на информацию лишь о падеже и числе, которые подписаны к символу F нижним индексом. В реальности правило должно учитывать больше параметров — в частности, как отмечалось выше, информацию о синтаксическом и морфологическом классе лексемы Х. (Отсутствующие, но подразумеваемые параметры помечены отточиями.) Представителями инферентивных реализационных теорий выступают м о р ф о л о г и я п а р а д и г м а т и ч е с к и х ф у н к ц и й (Stump 2001; Морфология 77 Bonami, Stump 2017), а также имеющая несколько более ограниченное распространение с е т е в а я м о р ф о л о г и я (Corbett, Fraser 1993; Brown, Hippisley 2012). Идеи о необходимости инферентивного подхода к морфологии стали циркулировать в литературе, впрочем, намного раньше (см. Matthews 1972; Aronoff 1994; Zwicky 1985; Anderson 1992). Имея представленные выше примеры, нетрудно представить себе, как может выглядеть теория четвертого типа в (17d) — инферентивная, но не реализационная, а инкрементальная. Мы оставляем это читателю в качестве упражнения. У п р а ж н е н и е. Пользуясь форматом из (18)–(19), сконструируйте образец инферентивной инкрементальной теории. Какими соображениями можно руководствоваться при выборе из двух пар возможностей, охарактеризованных выше? За последние десятилетия специалисты по морфологии накопили внушительный объем эмпириче ских аргументов за и против каждой из них. В качестве примера приведем два стандартных аргумента. Стандартный аргумент против инкрементальных теорий — явление множественного выражения одной граммемы в пределах словоформы. (22) иллюстрирует частичную глагольную парадигму мертвого изолирующего языка тимукуа (Müller 2007): (22) a. ho-ini-ta-la b. ni-huba-so-si-bo-te-la 1.nom-быть-asp-loc ‘Я есмь.’ c. ci-huba-so-te-le ‘Ты любишь.’ Ø -hewa-na-no ‘Мы любим друг друга.’ d. ci-huba-so-bo-te-le 2.nom-любить-tr-asp-loc e. ano 1.nom-любить-tr-rec-1/2.nom.pl-asp-loc 2.nom-любить-tr-1/2.nom.pl-asp-loc ‘Вы любите.’ f. Ø -ini-ma-bi-la человек 3.nom-говорить-asp-loc 3.nom-быть-3.nom.pl-asp-loc ‘Человек говорит’. ‘Они суть’. В этом языке имеются префиксальные согласовательные показатели, выбор которых определяется синтаксической ролью глагольного аргумента, а также его лицом. Имеются также суффиксальные показатели, которые отражают лицо и число этого же аргумента. Инвентарь показателей из (22) собран в таблице (23): 78 С. Г. Татевосов (23) Префиксальные и суффиксальные показатели sg & pl pl 1 ho-/ni-bo 2 ci3 ∅ -ma Из (23) видно, что информация о лице представлена в глагольной словоформе при помощи и префиксального и суффиксального показателя. (Правда, префиксы различают первое и второе лица, а суффиксы нет.) Критики теорий инкрементального типа отмечают, что с точки зрения этих теорий такая и аналогичная системы намного менее ожидаемы, чем с точки зрения реализационных теорий. Инкрементальный взгляд на вещи предполагает, что граммема лица привносится в структуру аффиксами и не возникают независимо от них. Материал типа (19) в таком случае требует признать, что при деривации глагольной словоформы задействуются единицы, выражающие один и тот же семантический компонент, и что этот компонент входит в деривацию дважды. Такое положение дел часто описывается как я з ы к о в а я и з б ы т о ч н о с т ь (см. Воейкова 2010). Если признать, что в языке есть универсальная тенденция избегать избыточности (а в сфере сочетаемости лексических единиц такая тенденция, хотя и с оговорками, действительно проявляется, ср. большую или меньшую аномальность выражений типа начальные азы или трудоустройство на работу), данные тимукуа начинают выглядеть для инкрементальных теорий проблематично. Реализационный подход избыточности не предполагает. Любая граммема представлена в деривации ровно один раз, а тот факт, что она р е а л и з о в а н а более чем в одной позиции в словоформе как будто не противоречит никаким известным ограничениям на языковую структуру. Если это так, реализационные теории получают эмпирическое преимущество. Второй аргумент — аргумент в пользу инферентивных теорий («аффиксы суть правила») против лексических («аффиксы суть языковые единицы»). Суть аргумента сводится к тому, что лексические теории обладают недостаточной выразительной силой, чтобы объяснить весь наблюдаемый диапазон морфологичских явлений. Он опирается на многочисленные наблюдения о том, что во многих языках многие такие явления выглядят не как объединение двух отдельных в сущностей в целое, а как процесс, происходящий с единственной сущностью. В первую очередь это разнообразные неконкатенативные явления, кратко охарактеризованные выше. Еще один пример приводится в (24). Морфология 79 В филиппинском языке каллахан так называемый «неперфектный вид» образуется геминацией («удвоением») согласного (Inkelas 2008). Геминации подвергается согласный, который непосредственно следует за ближайшим к левому краю словоформы открытым слогом. В результате этот слог приобретает коду и делается закрытым. При отсутствии в словоформе такого слога геминации не происходит: (24) Выражение видового контраста в каллахан Основа pili duyag Форма с субъектным фокусом um-pilli um-duyyag Форма с объектным фокусом pilli duyyag Форма с инструментальным фокусом ʔi-ppili ʔi-dduyag ʔagtu man-ʔagtu ʔagtu ʔi-ʔʔagtu duntuk um-duntuk duntuk ʔi-dduntuk Процессный характер инферентивных теорий («возьми Х и преобразуй его определенным образом»), как предполагается, делает их значительно более эмпирически адекватными, чем лексические теории, при анализе явлений такого порядка. Образование «неперфектного вида» в (24) можно сформулировать в инференциальных терминах (например, в виде правила «Неперфектный вид образуется устранением ближайщего к левом краю словоформы открытого слога посредством геминации следующего за ним согласного»). Для лексической теории этот материал намного труднее. Если показатель неперфектного вида — это словарная единица, как выглядит эта единица и каковы ее свойства? Сфера применимости лексических теорий, утверждают их противники, опираясь на примеры типа (24), естественным образом ограничена явлениями типа аффиксации в русском языке, когда словоформа образуется линейным соположением двух хорошо вычленимых объектов. У инферентивных теорий есть, однако, уязвимое место: их выразительная сила с л и ш к о м велика. Принципиальных ограничений на то, как могут быть устроены правила и какие манипуляции с материалом они могут производить, не существует. Можно вообразить, например, правила вида (25) (Baker, Bobalijk 2002): (25) a. Чтобы образовать форму будущего времени, следует удвоить первый согласный и последний гласный сегмент глагола. b. Чтобы образовать каузатив, следует выстроить сегменты в противоположном порядке. Таких морфологических процессов не засвидетельствовано, однако инферентивные теории вряд ли могут объяснить, почему. Именно поэтому в последние годы значительные усилия многих морфологов были нацелены на то, чтобы объяснить неконкатенативные явления в конкатенативном 80 С. Г. Татевосов духе. Появление автосегментной фонологии Дж. Голдсмита (Goldsmith 1976) дало значительный импульс к расширению представлений о возможном аффиксе: возникли аффиксы в виде сегментных признаков, тоновые аффиксы, аффиксы в виде просодических шаблонов и т. д. Дж. Маккарти (McCarthy 1979) показал возможные пути конкатенативного анализа семитской трансфиксации. Идеи о том, как избавить морфологическую теорию от инферентивности, продолжают циркулировать и в последующей литературе — см. примечательные образцы в Zimmerman 2013 и Köhnlein 2018. 2.3. Морфология в ряду других лингвистических дисциплин В качестве теории, которая описывает и объясняет внутреннее устрой ство слов и словоформ, морфология тесно взаимодействует с другими лингвистическими дисциплинами — с и н т а к с и с о м, ф о н о л о г и е й и с е м а н т и к о й. Это взаимодействие имеет отчасти эмпирический, отчасти теоретический характер. 2.3.1. Морфология и фонология. Эмпирическая область взаимодействия морфологии и фонологии весьма обширна. Мы сталкиваемся с ней всякий раз, когда применение морфологических правил и операций (напр., аффиксация) регулируется фонологическими факторами. В тагальском языке, например, имеется показатель так называемого акторного фокуса -um-, который в комбинации с некоторыми основами представляет собой префикс, тогда как с другими — инфикс: (26) a. um+abot ‘доставать’ → um-abot b. um+tawag ‘звать’ → t-um-awag c. um + gradwet → gr-um-adwet Особенность тагальского языка, которую иллюстрируют примеры типа (26), состоит в следующем (Prince, Smolensky 1993; Kager 1999). -Um- — это префикс, однако префиксация в тагальском отличается от той, к которой привыкли носители языков типа русского. В русском она имеет безусловный характер: весь фонологический материал префикса обязан предшествовать материалу корня. У тагальской словоформы есть более важный приоритет: оптимальная слоговая структура словоформы, а именно, такая структура, в которой минимизировано количество закрытых слогов. Показатель -umрасполагается настолько близко к левому краю основы, насколько позволяет это фонологическое ограничение. Для формы umabot в (26а) оптимальная структура (выделена подчеркиванием) достигается при линейном предшест вовании показателя, в (26b-c) этот же аффикс реализуется как инфикс: Морфология (27) Форма a. u.ma.bot a.um.bot a.bu.mot 81 Количество закрытых слогов 1 2 1 Удаленность от левого края основы (в сегментах) 0 1 2 b. um.ta.wag tu.ma.wag ta.um.wag ta.wu.mag 2 1 2 1 0 1 2 3 c. um.grad.wet gum.rad.wet gru.mad.wet gra.umd.wet gra.dum.wet 3 3 2 2 2 0 1 2 3 4 Явление, иллюстрируемое тагальским языком, показывает, таким образом, эмпирически наблюдаемое положительное взаимодействие морфологии и фонологии, при котором обе они вносят собственный вклад в построение языковой структуры. Компонент грамматики тагальского языка, описывающий дистрибуцию показателя -um-, имеет и фонологическую часть («Создай оптимальную слоговую структуру») и морфологическую («Будь настолько префиксом, насколько возможно»). Другой характер взаимодействия наблюдается в тех случаях, когда отнесение языкового явления к ведению той или другой дисциплины оказывается взаимоисключающим. Он проявляется прежде всего в том, какие объяснения предлагаются явлению а л л о м о р ф и и, при котором морфема имеет более одной фонологической реализации. В (28) иллюстрируется парадигма финитных форм русского глагола писать: (28) пишу пишешь пишет пишем пишете пишут писал писала писало писали В этой парадигме представлено два алломорфа глагольного корня — писи пиш-. Чем определяется их дистрибуция? В зависимости от ответа на этот вопрос, анализ алломорфии оказывается либо фонологическим, либо морфологическим. Одна из возможностей опирается на предположение в (29): (29) В русском языке не сущетвует фонологических правил, позволя ющих вывести алломорфы, различающиеся на сегменты /с/ и /ш/, из общего исходного представления. 82 С. Г. Татевосов Если верно (29), то словарная статья глагола писать должна, среди прочего, содержать информацию о том, что его корень имеет указанные алломорфы. К этому должны прилагаться правила, описывающие распределения алломорфов по клеткам парадигмы. (Примерно такими же правилами, напр., должно описываться и распределение алломорфов ид- и шед- у глагола идти.) Это морфологическое описание алломорфии в корне глаголов типа писать. Теория, которая не рассматривает (29) как верное обобщение о русской фонологической системе, возлагает на себя бремя объяснения д е р и в а ц и и алломорфов пис- и пиш- из общего исходного представления. Пример такой деривации (Lightner 1965 c незначительными упрощениями) показан в (30): (30) a. b. c. d. e. Исходное представление: pīs + ō + e + t Преобразование напряженного гласного перед ненапряженным в j: pīs + j + e + t Переходная палатализация pīš’ + j + e + t Удаление j pīš’ + e + t Депалатализация ш и ч pīš + e + t (30) предполагает, что словоформа складывается из четырех элементов — корня, тематического элемента -а (фонологическая форма: /ō/), показателя времени -e- и показателя лица и числа -t. Основополагающие фонологиче ские процессы, которые, как предполагает этот анализ, активны в системе современного русского языка, — это преобразование напряженного гласного в j перед ненапряженным и переходная палатализация (то есть трансформация комбинации с j, затрагивающая основную артикуляция сегмента). Именно они обеспечивают появление алломорфа пиш- в соответствующих клетках парадигмы. Это сугубо фонологическое объяснение алломорфии. Выбор одной из этих двух возможностей — в очень существенной степени теоретическое, а не эмпирическое решение. Оно зависит от того, готов ли исследователь принять в качестве допущения, что правила, перечисленные в (30) — часть фонологической системы современного русского языка. Такие допущения чаще всего невозможно однозначно принять или отклонить по независимым эмпирическим основаниям. Против (30b), например, говорит некоторая артикуляторно-акустическая неестественность перехода напряженных гласных в j. Зато в пользу анализа в (30) в целом можно привести материал окказиональных отыменных глаголов (заламиначу от заламинатить ‘покрыть ламинатом’), показывающих, что переходная палатализация Морфология 83 сохраняет продуктивность в современном русском языке. Соответственно, при выборе анализа важнейшую роль начинают играть внутритеоретические соображения, например, соображения парсимонии или более общие ограничения на состав и структуру глубинных представлений. 2.3.2. Морфология и синтаксис. Примерно такую же двойственный — эмпирический и теоретический — характер имеет и в з а и м о д е й с т в и е м о р ф о л о г и и и с и н т а к с и с а. С одной стороны, существуют явления, морфологические единицы и морфологические операции, адекватное описание которых возможно исключительно или преимущественно в синтаксических терминах. Они столь многочисленны и разнообразны, что полная каталогизация представляется невозможной, и мы ограничимся двумя (достаточно произвольно выбранными) иллюстрациями. В татарском языке (мишарский диалект) дистрибуция морфологического аккузатива зависит от синтаксической структуры именной группы, занимающей позицию прямого дополнения (Лютикова 2017). Аккузативное маркирование возникает, только если именная группа имеет полностью развернутую синтаксическую структуру и содержит позиции для указательных местоимений, некоторых кванторных слов, генитивного посессора и т. п. Если это условие не выполнено, и именная группа имеет неполную структуру, аккузативный показатель на прямом дополнении невозможен. Синтаксические соображения играют ключевую роль и в дистрибуции глагольных словоформ, отражающих согласование глагола с одним или более актантами. В арабском языке в конфигурации, где подлежащее линейно предшествует глаголу, (31a), последний согласуется с ним по роду и числу, при обратном линейном порядке, (31b) — только по роду. В этом случае выбирается дефолтная глагольная словоформа третьего лица единственного числа: (31) a. ʔal-ʔawlaadu qaraʔu / *qaraʔa art-мальчики.nom читать.3.pl.m b. qaraʔa / *qaraʔu читать.3.sg.m читать.3.sg.m d-dars-a art-урок-acc l-ʔawlaad-u d-dars-a читать.3.pl.m art-мальчики-nom art-урок-acc ‘Мальчики выучили урок’ Данные такого рода, широко представленные в языках мира, указывают на то, что дистрибуция значительного количества морфологических единиц обусловлена синтаксическими ограничениями и имеет синтаксические проявления. Обусловленности такого рода иногда выделяют в особый круг явлений, называемых морфосинтаксическими, а их изучение, соответственно, обозначают как морфосинтаксис. 84 С. Г. Татевосов Теоретическое взаимодействие морфологии и синтаксиса как разделов грамматической теории выстраивается в первую очередь вокруг проблемы их демаркации («где кончается морфология и начинается синтаксис»). Решение этой проблемы критически зависит от ответа на вопрос о том, в какой степени «законы синтаксиса» и «законы морфологии» — это разные законы, а слова создаются из морфем иначе, чем предложения из слов. Это же относится к используемым двумя лингвистическими дисциплинами исходным теоретическим допущениям, единицам анализа и т. д. Система взглядов на морфологию, при которой она мыслится как языковой модуль, полностью отдельный от синтаксиса, известна как л е к с и к а л и з м. Противоположная система, исторически более поздняя, в которой морфология и синтаксис представляют собой нерасчленимое целое, выстраивается в большой степени как отрицание лексикализма и называется, соответственно, а н т и л е к с и к а л и з м. Как и во многих других случаях, разрешить эту дилемму на эмпириче ских основаниях крайне трудно, поскольку многие из напрашивающихся простых эмпирических аргументов при ближайшем рассмотрении могут показывать не совсем то, для чего привлекаются. Очень часто, например, говорят, что правила соединения морфем в слова и слов в предложения не могут быть идентичными, поскольку предложения и слова имеют слишком разные свойства. Слова, из которых составляются предложения, п е р е с т а в и м ы, по крайней мере, в языках типа русского. Как (32а), так и (32b) представляют собой предложения русского языка, причем, по всей видимости, с одинаковыми условиями истинности: (32) a. Вася пришел. b. Пришел Вася. Единицы, составляющие словоформу пришел, непереставимы. Морфема при-, занимающая любую позицию, кроме префиксальной, создает невозможное слово: (33) a. При-ше-л b. *Ше-при-л c. *Ше-л-при Глядя на элементарные примеры типа (32)–(33), мы готовы заключить, что «законы синтаксиса» и «законы морфологии» действительно различны. Несмотря на кажущуюся очевидность, в этом рассуждении есть изъян. Асимметрия в (32)–(33) может иметь более одного источника. Первая возможность: о п е р а ц и и, соединяющие морфемы в слова и слова в предложения действительно различны. (33b-c) невозможны потому, что «законы Морфология 85 морфологии», отличные от «законов синтаксиса», действие которых проявляется в (32), не дают им явиться на свет. (33b-c) требуют деривации, невозможной с точки зрения морфологического компонента русской грамматики. Но есть и второе объяснение. Законы морфологии и законы синтаксиса одинаковы, однако они применяются к объектам с разными исходными свойствами. Как аффиксы при- и -л, так и корень шед- — связанные морфемы. Эта информация — неустранимая часть их словарного описания, как и информация, что при- стремится к левому краю словоформы (т. е. представляет собой префикс), а -л к правому (т. е. выступает суффиксом). Тогда можно предполагать, что невозможность (33b-c) вытекает именно из этого. Деривация (33b-c), нельзя исключить, вполне допустима; некорректен ее результат. Некорректность — следствие того, что префикс оказался в непрефиксальной позиции. Переставимость в (32) не подвержена этому ограничению: ни Вася ни пришел не являются связанной морфемой. Такой взгляд на вещи полностью совместим с идеей, что морфология и синтаксис представляют собой единый модуль, деривация в (32) и (33) происходит одинаково, и часть этого единого модуля — ограничения, под которые подпадают структуры в (33), но не структуры в (32). Учитывая, что факты в (32)-(33) совместимы более чем с одним объяснением, оказывается, что примеры такого рода не показывают, что морфологическая и синтаксическая деривация устроены по-разному. (33) может быть аргументом в пользу лексикализма только в том случае, если есть веские основания отвергнуть второе объяснение как неверное. В противном случае (32)–(33) ничего не говорят ни за лексикализм, ни против него. Не менее трудно обосновать и противоположную, антилексикалистскую позицию. Известно, что засвидетельствованные в языках ограничения на порядок аффиксов в словоформе можно объяснить действием грамматиче ского принципа, получившего название п р и н ц и п з е р к а л ь н о с т и (Baker 1985). Согласно этому принципу, порядок аффиксов отражает иерархическую организацию синтаксической структуры, в которой аффиксы занимают отдельные позиции. Например, морфологические показатели каузатива систематически располагаются ближе к корню, чем показатели пассива, а показатели пассива ближе, чем показатели прошедшего времени, потому, что грамматический элемент, ответственный за временную интерпретацию, находится в иерархической синтаксической структуре выше, чем элемент, который осуществляет пассивизацию, а тот выше, чем элемент, отвечающий за каузативизацию. В (34a-b) показана словоформа карачаевобалкарского языка и соответствующая ей синтаксическая структура, в кото- 86 С. Г. Татевосов рой обозначены позиции для показателей каузатива (-tɨr), пассива (-ɨl) и временной референции (-dɨ). (30) a. kerim cap-tɨr-ɨl-dɨ. Керим бегать-caus-pass-pst.3sg Керима заставили бегать. b. TP T VoiceP время dɨ Voice CausP залог ɨl Caus VP каузация глагол tɨr и его актанты cap Поверхностная цепочка cap-tɨr-ɨl-dɨ образуется при помощи операции, известной как передвижение вершины, когда глагольная морфема перемещается снизу вверх, последовательно соединяясь с вышерасположенными морфемами. Поскольку каузативный элемент размещается прямо над глаголом, глагол в первую очередь соединяется с ним, и соответствующий показатель оказывается ближайшим к корню. Затем наступает очередь морфемы, выражающей залог, и так далее. Взаиморасположение аффиксов в словоформе, таким образом, непосредственно считывается с синтаксической структуры предикации. Есть, однако, и альтернативное объяснение, которое опирается не на идеи о синтаксической структуре, а исключительно на соображения о том, как могут и как не могут семантические элементы, обозначаемые морфемами, соединяться в осмысленное целое. Эта линия анализа эксплицитно представлена в литературе по меньшей мере начиная с Bybee 1985. Глагол и его актанты создают дескрипцию ситуации, поставляя информацию о ее характере и участниках. Каузатив модифицирует дескрипцию ситуации, добавляя к ней каузирующее событие и его участника. Залог определенным образом «настраивает» эту дескрипцию, принимая решение о том, кто из участников станет в предложении подлежащим. Наконец, последней приходит информация о том, как все перечисленное расположено во времени. Нетрудно показать, что вхождение этих элементов в любом другом порядке создает объект, проблематичный с точки зрения семантической интерпретации. Например, если каузативная семантика появляется после временной, Морфология 87 предложение останется без информации о том, как каузирующее событие расположено во времени. Таким образом, верный порядок морфем выводится исключительно из семантики, без опоры на какую-либо синтаксическую инфорацию. Таким образом, в выборе между лексикалисткой и антилексикалистской позициями, который определяет характер представлений о взаимодействии морфологии и синтаксиса, ведущую роль начинают играть не эмпириче ские, а теоретические соображения — такие, как описательная и объяснительная адекватность возникающей в результате системы. 2.3.3. Морфология и семантика. Объем общих теоретических и эмпирических интересов морфологии и семантики обширен и с трудом поддается исчерпывающему описанию. Предмет морфологии — языковые единицы, имеющие план содержания, а именно — морфемы и составленные из них объекты, обладающие упорядоченной внутренней структурой. Соответ ственно, весь объем задач, который возникает при исследовании значащих компонентов естественного языка, возникает и в области исследования морфологических единиц и явлений. Самая важная из них — дать эксплицитную семантическую характери стику морфологическим показателям, задействованным в словообразовании и словоизменении. Учитывая, что в языках мира практически любая грамматическая информация может выражаться связанными морфемами, для семантического анализа морфологических единиц оказывается релевантной практически вся нелексическая семантика. В области именной морфологии это в первую очередь семантика грамматического числа, выражение которого, как показывают типологические исследования, близко к универсальному. Учитывая, что многие показатели пространственных отношений имеют аффиксальную реализацию, исследование их семантики также возникает на морфологическом горизонте. Во многих языках аффиксальный характер имеют и кванторные выражения, например, кванторы со значением всеобщности типа ‘каждый’, и, соответ ственно, в орбиту исследования вовлекается семантика кванторных именных групп. В области глагольной морфологии речь идет в первую очередь об исследовании грамматического времени, вида, модальности и эвиденциальности. Изучение их значений давно превратилось в самодостаточные области семантической индустрии. Кроме того, в разных языках могут получать морфологическое выражение практически все известные семантические операторы сентенциального уровня — такие, как отрицание и вопрос, также 88 С. Г. Татевосов привлекающие колоссальное внимание исследователей. Очень значительная литература накоплена в последние десятилетия и по семантике кон струкций, создаваемых сравнительной и превосходной степенями сравнения прилагательных. Огромен объем плохо исследованных деривационных категорий имени и глагола. Эти категории подвержены значительному межъязыковому варьированию и частно-языковым ограничениям, которые в большой степени еще только предстоит понять. В именной области делаются попытки предложить эксплицитные семантические описания для диминутивов и аугментативов. Исследователи глагольных дериваций достигли некоторого прогресса в понимании показателей, которые воздействуют на структуру описываемых событий, меняя их количественные характеристики, а также состав и свойства участников. Один из крайне немногочисленных типов морфологических единиц, которые, как предполагается, не вносят вклада в интерпретацию — согласовательные морфемы, такие как лично-числовые показатели русского глагола. Подводя итог, отметим, что хотя в лингвистике продолжаются оживленные дискуссии о том, где в точности проходит граница между различными частными дисциплинами, есть общее понимание того, что именно их взаимодействием в конечном итоге обеспечивается решение главной задачи — построения целостной объяснительной теории естественного языка. 3. Синтаксис Е. А. Лютикова С и н т а к с и с (от др.-греч. σύνταξις ‘построение вместе’) — раздел лингви стики, изучающий и моделирующий правила образования языковых объектов, более протяженных, чем слово — словосочетаний и предложений. Синтаксическое описание языка состоит из таксономии исходных единиц и правил, которые указывают, единицы каких категорий могут соединяться друг с другом и какого типа объекты получаются в результате соединения. Синтаксис, наряду с морфологией, традиционно считается одним из компонентов грамматики. 3.1. Синтаксис и другие языковые модули Уровневая, генеративная и параллельная архитектура грамматики Синтаксис и морфология Синтаксис и семантика Синтаксис и фонология 3.2. Специфика синтаксических объектов и структура синтаксической модели Свойства синтаксических объектов: неперечислимость, рекурсия, контекстная свобода Общая структура синтаксической модели Модель зависимостного синтаксиса Модель непосредственных составляющих . Структурный приоритет (с-командование) 3.3. Основные синтаксические домены Глагольная область Область функциональной структуры клаузы Область типирования клауз Именная группа Дополнительная литература: А.Е. Кибрик 1992, 2003; Тестелец 2001; Митренина и др. 2012; Haegeman 1991; Carnie 2002; Radford 2004. 3.1. Синтаксис и другие языковые модули Модульный подход к теории языка предполагает модель языка, в которой отдельные компоненты теории — модули — характеризуются внутрен- 90 Е. А. Лютикова ней автономией, то есть собственными видами объектов и правилами манипуляции с объектами, на которые не могут оказывать влияние внешние по отношению к данному модулю факторы. При таком подходе синтаксис образует отдельный языковой модуль; его связи с другими модулями и характер этих связей определяются моделью грамматики. Наиболее разработанными и востребованными являются два типа моделей грамматики: традиционная для лингвистики у р о в н е в а я м о д е л ь и м о д е л ь с ц е н т р а л ь н ы м п о л о ж е н и е м с и н т а к с и с а, принятая в генеративной грамматике. На рубеже ХХ–ХХI веков в работах Р. Джекендоффа (Jackendoff 1997 и посл.) в качестве альтернативы генеративной модели была предложена п а р а л л е л ь н а я м о д е л ь. Все эти модели выделяют синтаксис как самостоятельный модуль языка, однако его отношение к другим модулям выглядит по-разному. У р о в н е в а я м о д е л ь предполагает, что языковые модули образуют пирамиду, выстроенную в соответствии с типом исходных и производных единиц каждого модуля (см. рис. 3.1). Каждый модуль принимает в качестве исходных единиц результат работы предыдущего модуля и передает результаты собственной работы следующему модулю. В такой модели синтаксис занимает промежуточное положение между морфологией и дискурсом: получая на входе продукт действия морфологических правил — слово, синтаксис строит из слов словосочетания и предложения, а предложения далее становятся исходными единицами для следующего модуля — дискурса. Примером модели, в которой эксплицитно используется уровневое упорядочивание языковых модулей, является модель «Смысл ↔ Текст» (Мельчук 1974/1999)1. Предложение → Связный текст Дискурс: Слово → Предложение Синтаксис: Морфология: Морфема → Слово Фонема → Комбинация фонем Фонология: Рисунок 3.1. Уровневая модель языка М о д е л ь с ц е н т р а л ь н ы м п о л о ж е н и е м с и н т а к с и с а последовательно реализуется в различных версиях генеративной грамматики, начиная как минимум с монографии (Chomsky 1981: 17) и оставаясь среди ее В модели «Смысл ↔ Текст» синтаксический уровень завершает иерархию усложнения языковых единиц; над ним доминирует семантический уровень, сопо ставляющий синтаксической структуре предложения семантическую структуру — формализованный способ представления значения предложения. 1 Синтаксис 91 аксиоматических положений в минимализме (Chomsky 2000, 2001). Эта модель получила название (перевернутой) Y-модели (inverted Y model) из-за своего графического сходства с перевернутой буквой Y (см. рис. 3.2). Цен тральное положение синтаксиса в Y-модели обусловлено тем, что именно синтаксис является единственным генеративным (т. е. порождающим) языковым модулем, составляющим из лексических единиц, хранящихся в лексиконе, предложение, характеризующееся определенной синтаксической структурой. Два других модуля — фонологический и семантический — являются интерпретирующими: они сопоставляют синтаксической структуре фонетическую репрезентацию (phonetic form, PF) и семантическую репрезентацию (logical form, LF). Репрезентации, создаваемые интерпретирующими модулями, предназначены для внеязыковых когнитивных систем: акустико-перцептивной (PF) и концептуально-интенциональной (LF), вследствие чего они считаются интерфейсными, то есть обеспечивающими взаимодействие между языком и другими когнитивными системами человека. лексикон Синтаксис синтаксическая структура ↙ ↘ Фонологический Семантический модуль модуль фонетическая репрезентация (PF) семантическая репрезентация (LF) Рисунок 3.2. Модель с центральным положением синтаксиса Следует отметить, что и уровневая, и Y-модель предполагают определенные связи между модулями языка и строящимися репрезентациями. Так, например, в уровневой модели, строящейся по принципу «от простого к сложному», синтаксическая информация не может оказывать влияние на работу морфологического модуля, а морфологическая информация, напротив, может быть видима для синтаксических правил. Наиболее рестриктив- 92 Е. А. Лютикова ная в этом отношении Y-модель предусматривает независимость синтаксической структуры от фонологической и семантической информации; фонологический и семантический модули имеют доступ к синтаксической структуре, но не к результатам работы друг друга. По-видимому, асимметрич ность во взаимной доступности информации между языковыми модулями действительно имеет место. Тем не менее были обнаружены разнообразные языковые феномены, которые оказывается затруднительно интерпретировать при однонаправленных связях (или отсутствии непосредственных связей) между модулями. К таким феноменам относятся, например, взаимосвязь между фокусом (семантика), порядком слов (синтаксис) и фразовым ударением (просодия); линейная позиция клитик, зависящая от их позиции в синтаксической структуре и от их просодического класса; влияние лексической семантики предиката на его синтаксические связи; и т. п. Определенные трудности вызывает и «вычисление» интерфейсных репрезентаций на основе синтаксических: наиболее известный пример — видимое отсутствие изоморфизма между синтаксической и просодической структурой (Selkirk 1984): кажется, что синтаксическая и интонационная структуры предложения в примере (1) строятся независимо друг от друга по собственным правилам (иерархического вложения синтаксических групп SyntP и конкатенации интонационных групп IntP), а затем сопоставляются друг другу. (1) a. b. синтаксическая структура [SyntP Это была [SyntP кошка, [SyntP которая поймала [SyntP мышку, [SyntP которая съела сыр]]]]]. интонационная структура [IntP Это была кошка], || [IntP которая поймала мышку], || [IntP которая съела сыр]. Опираясь на такого рода соображения, Р. Джекендофф (Jackendoff 1997, 1998, 2002, 2007) развивает п а р а л л е л ь н у ю м о д е л ь архитектуры грамматики, в которой три модуля — фонологический, синтаксический и семантический (концептуальный) — строят независимые репрезентации на основе правил, специфичных для данного модуля. Грамматика содержит также правила соответствия между парами репрезентаций, ограничивающие возможные комбинации фонологической, синтаксической и концептуальной структур в одной языковой единице (см. рис. 3.3). Несмотря на то, что параллельная модель с легкостью решает проблему разнонаправленных связей между языковыми модулями, богатство ее выразительной силы и отсутствие каких-либо ограничений, заложенных в самой архитектуре системы, делает ее менее предпочтительной по сравнению с более ограничительными моделями. Синтаксис Фонология (фонологические правила) ↓ фонологические структуры Синтаксис (синтаксические правила) ↓ синтаксические структуры 93 Семантика (семантические правила) ↓ концептуальные структуры Рисунок 3.3. Параллельная модель Р. Джекендоффа Синтаксис и морфология. Для европейской лингвистики, развивавшейся в русле античной лингвистической традиции (и на материале языков с богатой словообразовательной и словоизменительной морфологией), характерно четкое противопоставление морфологии и синтаксиса, основывающееся на представлении о слове как о максимальном морфологическом объекте и минимальном синтаксическом объекте. Среди бросающихся в глаза отличий между словом и предложением можно назвать следующие факты: предложение, но не слово, способно к неограниченному распространению; предложение допускает более сложную иерархическую структуру; правила комбинации слов в предложении менее идиоматичны, чем правила комбинации морфем в слове; наконец, предложение соотносится с единицей речи — высказыванием, а слово, в общем случае, нет. Эти отличия получают естественную имплементацию, если предположить, что правила морфологического модуля устроены не так, как правила синтаксического модуля, и поэтому свойства их продуктов — слова и предложения — различаются. Такая картина, однако, представляется идеализированной. Начнем с того, что граница слова не всегда может быть однозначно определена. Далее, те признаки, которые противопоставляют слово и предложение, имеют не абсолютный, а относительный характер: слово чаще идиоматично и имеет более простую и фиксированную внутреннюю структуру, чем предложение, но в общем случае слова способны к практически неограниченному усложнению (ср. названия химических элементов или композиты в немецком языке), порядок морфем внутри слова может варьировать, сопровождаясь регулярными отличиями в значении (ср. последовательность глагольных деривационных морфем, кодирующих акциональные и актантные преобразования в ряде уральских языков), и наоборот, несвободная структура и идиоматичность могут характеризовать и более крупные объекты, чем слово (ср. фразовые идиомы). Соответственно, выбор между противопоставлени- 94 Е. А. Лютикова ем или объединением синтаксиса и морфологии сводится к выбору между «обычно» и «в общем случае». Наконец, следует принять во внимание и следующее соображение: и морфологические, и синтаксические правила по сути выполняют одну и ту же операцию — создают из простых объектов сложные, соединяя их вместе; в теоретической перспективе более простой и тем самым предпочтительной является модель, в которой определяется одна операция соединения (возможно, над объектами разных типов), чем модель, в которой для разных объектов требуются разные операции соединения (подробнее об этом см. Marantz 1997). Тем не менее, при моделировании структуры языковых выражений зачастую приходится постулировать операции, невозможные в таких рестриктивных моделях синтаксиса, как генеративная граматика. Например, различные виды п о н и ж е н и я (lowering), то есть операций, в которых передвижение языковых объектов происходит не в более высокую, а в более низкую позицию в структуре, невозможны в синтаксисе и моделируются как пост-синтаксические (морфологические, просодические) передвижения (Embick, Noyer 2001). Синтаксис и семантика. Необходимость доступа к синтаксической структуре языкового выражения для правильного вычисления его значения — основополагающий принцип «взаимоотношений» синтаксиса и семантики, который называется п р и н ц и п о м к о м п о з и ц и о н а л ь н о с т и, или, по имени его автора, принципом Фреге: значение составного выражения — это функция значений его частей и способа их соединения в синтаксическую структуру. В соответствии с принципом композициональности, для того, чтобы узнать значение языкового выражения ABC, нужно знать не только значение единиц А, В и С по отдельности, но и порядок соединения (композиции) этих единиц: соединяются ли сначала A и B, а затем образовавшийся объект AB соединяется с С, или же сперва соединяются В и С, а затем А соединяется с ВС (см. рис. 3.4). [[AB]C] [A[BC]] [AB] A B C A [BC] B Рисунок 3.4. Варианты композиции выражения ABC C Синтаксис 95 Действие принципа композициональности можно легко обнаружить на материале с и н т а к с и ч е с к и о м о н и м и ч н ы х к о н с т р у к ц и й — конструкций, допускающих различный синтаксический анализ и вслед ствие этого имеющих разные значения. Синтаксическая омонимия является чрезвычайно полезным явлением для прояснения синтаксической структуры языковых выражений. Великий русский синтаксист А. М. Пешковский предлагает такой пример: предложение Вели ему помочь имеет два значения — Вели ему, чтобы он помог, и Распорядись, чтобы ему помогли (Пешковский 1928). Эти значения А. М. Пешковский связывает с различными син таксическими структурами, которые могут быть сопоставлены этому предложению. Отличия между ними состоят в том, от чего зависит ему — от вели или от помочь. Еще один яркий пример, принадлежащий А. Е. Кибрику2, представлен в (2). Семантический контраст в этом предложении связан с возможной интерпретацией причастного оборота обитающие в Южной Америке как рестриктивного или как аппозитивного, что, в свою очередь, определяется порядком композиции двух модификаторов — препозитивного прилагательного в превосходной степени и постпозитивного причастного оборота — с существительным (см. рис. 3.5). (2) В музее представлены самые крупные бабочки, обитающие в Южной Америке. Рестриктивная интерпретация возникает, когда сперва существительное бабочки объединяется с причастным оборотом — получаются бабочки, обитающие в Южной Америке, а затем, при соединении с суперлативом, из южноамериканских бабочек отбираются самые крупные. Обратим вимание, что такая интерпретация совместима, например, с таким положением вещей, что самые крупные бабочки в мире обитают в Африке: при указанном порядке композиции суперлативный оператор применяется не ко всем бабочкам, а только к южноамериканским. Если же порядок композиции модификаторов с существительным другой — сперва суперлатив, затем причастный оборот — возникает аппозитивная интерпретация. При соединении суперлатива с существительным возникает дескрипция самые крупные бабочки: суперлатив выбирает из множества всех бабочек, независимо от их места обитания, самых крупных. Причастный оборот, присоединяясь позже, уже не может повлиять на свойства множества, из которого выбирает суперлатив; он интерпретируется как сообщающий некую дополнительную, фоновую информацию о месте обитания самых крупных в мире бабочек. 2 Этот пример разбирался А. Е. Кибриком на лекциях по общему синтаксису. 96 Е. А. Лютикова Рестриктивная интерпретация: [[самые крупные] [бабочки, [обитающие в Южной Америке]]] Аппозитивная интерпретация: [[[самые крупные] бабочки], [обитающие в Южной Америке]] Рисунок 3.5. Варианты композиции модификаторов в примере (2) С и н т а к с и с и ф о н о л о г и я. Характер связей между синтаксическим и фонологическим модулями относится к весьма актуальной и дискуссионной проблематике современной лингвистической теории. Следует отметить, что «сфера ответственности» фонологического модуля может пониматься достаточно широко и включать все механизмы и правила, связанные с озвучиванием синтаксической структуры, то есть с сопоставлением синтаксической репрезентации фонологической (или даже фонетической) строки. Кроме того, в отсутствие морфологии как отдельного модуля на фонологический компонент ложится часть нагрузки по «сборке» словоформ из морфем (или формальных признаков). Здесь мы упомянем лишь несколько направлений в исследовании синтактико-фонологического интерфейса. Чрезвычайно важная с теоретиче ской точки зрения проблематика — взаимодействие синтаксиса и фонологии в формировании п о р я д к а с л о в. В синтаксических исследованиях выдвигаются разные гипотезы о том, до какой степени синтаксическая структура предопределяет линейный порядок — от идеи о полной независимости синтаксической связи и линейного порядка через параметризацию их соотношения при помощи таких понятий, как п р а в о - и л е в о с т о р о н н е е в е т в л е н и е до г и п о т е з ы а н т и с и м м е т р и ч н о с т и (Kayne 1994), предполагающей, что синтаксическая структура однозначно задает линейный порядок. Если синтаксическая репрезентация не содержит никакой информации о линеаризации (например, представляет собой нерасположенное дерево, как в модели «Смысл ↔ Текст»), то линейное упоря- Синтаксис 97 дочивание элементов такой репрезентации входит в задачи фонологического модуля. Еще одна группа вопросов связана с неполными (фрагментированными) конструкциями, такими, как, например, фрагментированные ответы на вопрос (— Куда уехал Костя? — В Нальчик), односоставные предложения с определенно-личным подлежащим (Расскажу вам одну историю), номинативные предложения (Мороз), сочиненные конструкции разной структуры (Где ты покупал клубнику и огурцы? Огурцы я купил на рынке, а клубнику — в палатке). Теоретическая интерпретация фонетического пробела может быть и синтаксической, и фонологической. Часть неполных конструкций возникает в результате собственно синтаксической деривации (такой анализ предпочтителен, например, для номинативных предложений). С другой стороны, пробел может быть представлен на уровне синтаксической структуры, но получать нулевое фонологическое выражение. Н у л е в ы м и с и н т а к с и ч е с к и м и е д и н и ц а м и обычно оказываются невыраженные подлежащие как финитных, так и различных нефинитных клауз, например, инфинитивных или деепричастных оборотов. Наконец, большая группа случаев предполагает э л л и п с и с — фонологический процесс, состоящий в удалении совпадающего материала при наличии эллиптического контекста: — Куда уехал Костя? — Костя уехал в Нальчик; Огурцы я купил на рынке, а клубнику я купил в палатке. Выбор между указанными интерпретациями неполных кон струкций не всегда тривиален: так, например, предложение Где ты покупал клубнику и огурцы? может быть получено как чисто синтаксическими сред ствами, сочинением существительных клубника и огурцы, так и быть результатом эллипсиса: Где ты покупал клубнику и где ты покупал огурцы? Заметим, что с выбором варианта анализа оказывается связан и возможный формат ответа: при сочинении существительных предполагается одно место покупки, а при сочинении предложений с эллипсисом ожидается список пар продукта и места покупки. Эллипсис является чрезвычайно мощным инструментом синтаксической диагностики. Дело в том, что требование совпадения удаляемого материала с эллиптическим контекстом распространяется не только на фонологически выраженную строку, но и на различные невидимые элементы синтаксической структуры, например, нулевые единицы. Поэтому эллипсис позволяет проводить очень тонкое сравнение омонимичных языковых выражений и выявлять их отличия. В примерах (3a-b) мы видим два типа инфинитивных конструкций при предикате ready ‘готов’: подлежащее главной клаузы может совпадать с подлежащим инфинитивного оборота (3а) или с дополнением инфинитивного оборота (3b). Если сочинены конструк- 98 Е. А. Лютикова ции одного типа, то эллипсис возможен (3a-b). Однако в паре конструкций разных типов эллипсис не происходит (3с). Это означает, что при внешнем сходстве субъектная и объектная конструкции при предикате ready ‘готов’ имеют разную синтаксическую структуру и поэтому не могут служить эллиптическим контекстом друг для друга. В (3d) показан один из возможных синтаксических анализов рассматриваемых выражений. Объектная конструкция возникает в результате п о д ъ е м а — синтаксического передвижения дополнения инфинитива в позицию подлежащего главной клаузы (след от передвижения дополнения обозначен символом t (trace), коиндексированным с передвинувшейся группой); подлежащее инфинитивного оборота выражено особым нулевым местоимением, PRO с произвольной референцией. Субъектная конструкция образуется при подъеме подлежащего инфинитива в позицию подлежащего главной клаузы (след от передвижения располагается в позиции подлежащего инфинитивного оборота), еще одна нулевая единица — нулевое анафорическое местоимение — выступает в роли дополнения инфинитива. Очевидно, что выделенные подстроки не сопадают, поэтому эллипсис невозможен. (3) a. b. c. d. Mary is ready to run, and Bill is ready to run, too. ‘Мэри готова бежать, и Билл тоже’. The chicken is ready to eat, and the rice is ready to eat, too. ‘Цыпленок готов (для еды), и рис тоже’. *The chicken is ready to eat, and the children are ready to eat, too. Ожид.: ‘Цыпленок готов (для еды), и дети тоже (готовы есть)’. The chickeni is ready PRO to eat ti, and the childrenj are ready tj to eat pro, too. ‘Цыпленок готов (для еды), и дети тоже готовы есть’. Не только эллипсис, но и многие другие фонологические процессы оказываются чувствительны к синтаксической структуре. Один из часто приводимых примеров — стяжение глагола want ‘хотеть’ и инфинитивной частицы to в английском языке (wanna-contraction). Примеры (4a-b) показывают, что нулевое местоимение PRO «пропускает» стяжение, а след от передвижения относительного местоимения препятствует стяжению. (4) a. New Haven is the place where I want to / wanna go next. (a=a′) ‘В следующий раз я хочу отправиться в Нью-Хейвен’. (= ‘Нью-Хейвен — это место, куда я хочу отправиться в следующий раз’.) a′. New Haven is the place where I want PRO to go next. Синтаксис 99 b. Fred is the guy who I want to / *wanna go next. (b=b′) ‘Я хочу, чтобы следующим пошел Фред’. (= ‘Фред — это парень, который я хотел бы, чтобы пошел следующим’.) b′. Fred is the guy whoi I want ti to go next. Интереснейшие вопросы ставятся в исследованиях синтактико-просодического интерфейса. Взаимодействие синтаксических, коммуникативных и просодических характеристик языковых единиц особенно очевидно при изучении такого феномена, как и н ф о р м а ц и о н н а я с т р у к т у р а предложения. Специфика коммуникативных категорий, для выражения которых используются и синтаксические, и просодические средства, причем зачастую они оказываются взаимозаменимы (ср. примеры фокусных конструкций в (5)-(6)), требует серьезного осмысления как в отношении их локализации в процессе деривации предложения, так и в отношении стоящих за ними формальных признаков. (5) a. Сейчас пел Яша. b. Яша сейчас пел. (инверсия) (сдвиг рематического акцента) (6) a. It was John who made the hamburger. (клефт) (a=b) ‘Гамбургер сделал Джон’. b. John made the hamburger. (сдвиг рематического акцента) 3.2. Специфика синтаксических объектов и структура синтаксической модели Чтобы понять, как может быть устроена модель синтаксиса естественного языка, нужно выявить такие свойства синтаксических объектов, которые могут накладывать ограничения на возможную структуру модели. Самое очевидное свойство синтаксических объектов — их б е с к о н е ч н о е к о л и ч е с т в о. Под бесконечностью подразумевается отсутствие процедуры, позволяющей представить все возможные синтаксические объекты в виде конечного (пусть и очень длинного) списка3. Бесконечность множества синтаксических объектов тесно связана с другим их свойством — При математическом моделировании синтаксиса естественного языка обычно принимается модель, в соответствии с которой допустимые синтаксические объекты образуют с ч е т н о е м н о ж е с т в о, то есть множество, равномощное множеству натуральных чисел. Возможность полного описания естественного языка при помощи такой модели опирается на допущение о к о н т е к с т н о й с в о б о д е порождающих язык правил (см. ниже). 3 100 Е. А. Лютикова способности к н е о г р а н и ч е н н о м у у с л о ж н е н и ю. Любое синтаксиче ское выражение может быть расширено — без ущерба для грамматичности — одним из двух способов: добавлением (еще одного) зависимого к какомулибо компоненту исходного выражения либо подчинением всего исходного выражения новой вершине. Многие синтаксические объекты допускают оба вида расширения. Например, синтаксическое выражение Костя уехал в Наль чик может быть усложнено и первым способом (Костя после обеда уехал в Нальчик; Костя уехал в Нальчик на автобусе; Костя уехал в Нальчик, где его уже ждал Арсен), и вторым (Я не знал, что Костя уехал в Нальчик; Гости пришли, когда Костя уехал в Нальчик; Если Костя уехал в Нальчик, дома никого нет). Способность к неограниченному усложнению предполагает, что синтаксические объекты потенциально бесконечны: нельзя назвать такое число n, чтобы объекты из n слов были допустимыми синтаксическими выражениями, а объекты из n+1 слова — нет. Конечно, в речи все предложения (и даже тексты) имеют конечную длину, но важно понимать, что это ограничение накладывается не синтаксическими правилами языка, а обстоятельствами его использования. Выше мы уже упоминали о том, что синтаксические объекты имеют и е р а р х и ч е с к у ю с т р у к т у р у: сложные объекты могут быть разложены на совокупность более простых объектов, а те, в свою очередь — на еще более простые объекты, пока декомпозиция не достигнет уровня терминаль ных (т. е. минимальных, нечленимых с точки зрения синтаксиса) единиц. При последовательном представлении синтаксических единиц как состоящих из других синтаксических единиц возникает и е р а р х и я в л о ж е н и я. Например, предложение (7) может быть проанализировано как иерархическая структура, изображенная на рис. 3.6. Терминальные единицы обозначены прямоугольниками с затемненным фоном, нетерминальные — прямоугольниками с белым фоном. (7) Я знаю, что ты знаешь, что я знаю. Другой способ описания структуры синтаксического объекта опирается на отношение с и н т а к с и ч е с к о й з а в и с и м о с т и, устанавливаемое между терминальными синтаксическими единицами. Синтаксическая зависимость представляет собой антисимметричное, антирефлексивное, нетранзитивное бинарное отношение на множестве словоформ некоторого синтаксического выражения. Используя известные из школьного курса понятия, можно сказать, что в отношение синтаксической зависимости вступают главное и зависимое слово словосочетания, а также сказуемое и подле- Синтаксис 101 Я знаю, что ты знаешь, что я знаю. Я знаю, что ты знаешь, что я знаю. знаю что ты знаешь, что я знаю. что ты знаешь, что я знаю. ты знаешь, что я знаю. знаешь что я знаю. что я знаю. я знаю. Рисунок 3.6. Иерархическая структура предложения (7) (иерархия вложения) 102 Е. А. Лютикова жащее предложения4. Отношение зависимости также создает и е р а р х и ю, но не иерархию отрезков синтаксического выражения, как иерархия вложения, а иерархию подчинения друг другу терминальных синтаксических единиц. И е р а р х и я п о д ч и н е н и я для предложения (7) представлена на рис. 3.7; отношение синтаксической зависимости обозначено стрелками, ведущими от главного к зависимому. знаю я что знаешь ты что знаю я Рисунок 3.7. Иерархическая структура предложения (7) (иерархия подчинения) В отношение синтаксической зависимости могут вступать не только полнозначные, но и служебные лексемы; в этом существенное отличие излагаемого здесь подхода от системы анализа, принятой в традиционной русистике. 4 Синтаксис 103 Аналоги иерархии вложения и иерархии подчинения можно легко обнаружить и вне лингвистики. Например, иерархию вложения образуют воинские подразделения (армия состоит из корпусов, корпус — из дивизий, дивизии — из бригад, бригады — из полков, полки — из батальонов, батальоны — из рот, роты — из взводов, взводы — из отделений, отделение — из солдат); иерархию подчинения образует отношение «быть подчиненным» на множестве сотрудников некоторого учреждения или отношение «быть дочерью» на множестве кровных родственников женского пола. При помощи иерархии вложения можно обнаружить еще одну важную характеристику синтаксических объектов — их р е к у р с и в н ы й х а р а к т е р. Рекурсивность, или рекурсия — это свойство объекта, состоящее в том, что его части подобны ему самому. При процедурном представлении объектов, то есть представлении объектов через создающую их процедуру, рекурсивность может быть описана как итеративное применение некоторого правила или группы правил к объекту, который является результатом работы этого правила (группы правил). Например, правило A → bAb (читается как «замени символ А на последовательность символов bAb») является рекурсивным, поскольку может применяться к результату своей работы — последовательности bAb, содержащей A. Аналогичным образом, рекурсивной является цепочка правил A → bB, B → Аa: после применения этой цепочки правил мы получим выражение bAa, содержащее A — условие для применения первого правила данной цепочки. Рекурсивность — одно из базовых свойств многих математических, природных и творческих объектов. Рекурсивно задаются функции, вычисля ющие конечные и бесконечные ряды, например, последовательность Фибоначчи (1, 1, 2, 3, 5, 8, …; каждый следующий элемент последовательности равен сумме двух предшествующих), функция вычисления факториала (для n>0 n!=n(n-1)!) и т. д. Примеры рекурсивных объектов в живой природе показаны на рис. 3.8. Рекурсия как художественный прием используется в литературе, изобразительном искусстве, кинематографе («рассказ в рассказе», «картина в картине»). Визуальная форма рекурсии известна как эффект Дросте (Droste effect) — изображение, включающее последовательность уменьшенных копий самого себя; это название данный тип рекурсии получил от изображения на упаковках какао голландской фирмы Droste, см. рис. 3.9. Рис. 3.10 представляет собой фотографию с эффектом Дросте (заметим, что и языковое описание этого объекта также рекурсивно). 104 Е. А. Лютикова Рисунок 3.8. Примеры рекурсивных объектов: бронхиальное дерево человека, лист папоротника, соцветие капусты романеско Рекурсивность синтаксических выражений наиболее очевидна при анализе иерархии вложения. Вернемся к рис. 3.6 и рассмотрим придаточное предложение что ты знаешь, что я знаю. Это синтаксическое выражение можно отнести к определенному классу — классу придаточных изъяснительных предложений. Заметим, что в него вложено другое синтаксическое выражение т о г о ж е к л а с с а — придаточное изъяснительное что я знаю. Важно подчеркнуть, что лексический состав вложенного и объемлющего синтаксических объектов не обязан совпадать — речь идет о совпадении синтаксических типов, классов объектов. Рекурсия в синтаксисе, таким образом, может быть определена как способность синтаксического выражения класса X включать в свой состав другое синтаксическое выражение класса X. Синтаксис Рисунок 3.9. Эффект Дросте Рисунок 3.10. Пример визуальной рекурсии: фотография Морриса Халле и Ноама Хомского, которые держат фотографию себя, которые держат фотографию себя. (Morris Halle and Noam Chomsky holding a 1988 picture of them holding a 1951 picture of them. Recursion at MIT.) 105 106 Е. А. Лютикова Нужно понимать, что не любая иерархическая структура, реализующая иерархию вложения, является рекурсивной. Так, рассмотренная выше система классов воинских подразделений (армия > корпус > дивизия > бригада > полк > батальон > рота > взвод > отделение ) образует иерархию вложения, однако рекурсия в ней отсутствует. Чтобы сделать такую систему рекурсивной, достаточно допустить, например, что бригада может включать в свой состав корпус. Рекурсивные объекты порождаются рекурсивными процедурами. Рассмотрим простейшую систему п р а в и л п е р е п и с ы в а н и я (rewriting rules) в (8), позволяющую из начального символа S (Sentence) получить бесконечное количество предложений, и в том числе — предложение (7). Будем считать, что мы всегда начинаем работу с начального символа S и применяем любые подходящие правила в любом порядке до тех пор, пока промежуточные символы — названия классов объектов (SUBJ ‘подлежащее’, PRED ‘сказуемое’, V ‘глагол’, ES ‘придаточное предложение’, С ‘подчинительный союз’) — не будут заменены на лексемы (которые набраны курсивом). Система правил (8) позволяет получить, например, предложения Я знаю (применяем правила (1), (2), (5), (7)), Я знаю, что я знаю (правила (1), (5), (3), (7), (4), (9), (1), (2), (5), (7)), и т. д.5 (8) S → SUBJ PRED PRED → V PRED → V ES ES → C S SUBJ → я SUBJ → ты V → знаю V → знаешь С → что (1) (2) (3) (4) (5) (6) (7) (8) (9) Легко видеть, что возможность вложения придаточного изъяснительного внутрь другого придаточного изъяснительного задается цепочкой правил (1), (3) и (4): они образуют замкнутый цикл, который может выполняться неограниченное число раз (и предложения будут неограниченное число раз вкладываться друг в друга). Система правил в (8) перепорождает (overgenerates), то есть порождает «лишние», неправильные для русского языка предложения *Ты знаю, *Я знаешь, что ты знаю и т.д. Чтобы учесть предикативное согласование, наша грамматика должна быть устроена несколько сложнее. 5 Синтаксис 107 Грамматики естественных языков допускают рекурсию не только таких синтаксических объектов, как предложение, но и синтаксических объектов других классов (или, как говорят синтаксисты, с и н т а к с и ч е с к и х к а т е г о р и й). Важнейшей рекурсивной категорией является именная группа (NP, noun phrase) — синтаксическая единица, состоящая из имени существительного и всех его зависимых. Одна именная группа может непосредственно входить в состав другой именной группы: [NP портрет [NP жены [NP худож ника]]] (эта запись читается следующим образом: «именная группа художника входит в состав именной группы жены художника, которая в свою очередь входит в состав именной группы портрет жены художника»). Обеспечить такую рекурсию можно при помощи одного правила NP → N NP («именная группа состоит из существительного и другой именной группы; при соединении существительного с именной группой получается именная группа»). К опосредованному вложению (то есть вложению, задаваемому рекурсивной цепочкой) способны все синтаксические категории. Рекурсия синтаксических объектов осознанно или неосознанно используется носителями языка в различных языковых играх. В качестве примера часто приводится английское шуточное стихотворение «Дом, который по строил Джек», известное нам в переводе С. Я. Маршака; последняя строфа этого стихотворения показана в (9). В ней мы можем выделить 10 именных групп и 9 предложений, которые, чередуясь, вкладываются друг в друга по одной и той же модели: в предложение в качестве дополнения может быть вложена именная группа, а в именную групу — придаточное определительное предложение. Потенциально бесконечный характер языковых объектов, порождаемых рекурсивной процедурой, обыгрывается в так называемых докучных сказках («У попа была собака») или в известном монологе «Справка» в исполнении А. И. Райкина: Дайте мне справку, что вам нужна справка, что им нужна справка… (9) [S1 Вот [NP1 два петуха, [S2 Которые будят [NP2 того пастуха, [S3 Который бранится с [NP3 коровницей строгою, [S4 Которая доит [NP4 корову безрогую, Лягнувшую [NP5 старого пса без хвоста, [S5 Который за шиворот треплет [NP6 кота, [S6 Который пугает и ловит [NP7 синицу, [S7 Которая часто ворует [NP8 пшеницу, [S8 Которая в [NP9 темном чулане {хранится} В [NP10 доме, [S9 который построил Джек]]]]]]]]]]]]]]]]]]]. 108 Е. А. Лютикова Итак, именно рекурсивность системы правил приводит к тому, что на основе конечного словаря мы можем строить бесконечное количество языковых выражений, способных к неограниченному усложнению. Требования к модели синтаксиса, основанные на эмпирически наблюдаемом противоречии между конечностью языковых средств и бесконечностью языковых выражений, впервые были эксплицитно сформулированы в ранних работах Н. Хомского: “Returning now to the question of competence and the generative grammars that purport to describe it, we stress again that knowledge of a language involves the implicit ability to understand indefinitely many sentences. Hence, a generative grammar must be a s y s t e m o f r u l e s t h a t c a n i t e r a t e t o generate an indefinitely large number of structures” («Возвращаясь к вопросу о языковой компетенции и генеративных грамматиках, имеющих своей целью ее описание, подчеркнем еще раз, что знание языка предполагает имплицитную способность понимать бесконечное число предложений. Следовательно, генеративная грамматика должна представлять собой с и с т е м у п р а в и л , к о т о р ы е м о г у т п р и м е н я т ь ся итеративно, порождая бесконечное количество с т р у к т у р » (Chomsky, 1965: 15-16), перевод мой — Е. Л.). Наконец, следует обсудить еще одно важное свойство синтаксических объектов, накладывающее определенные ограничения на формат правил, — их к о н т е к с т н у ю с в о б о д у. Контекстная свобода синтаксического объекта заключается в том, что его внутренняя структура не зависит от объ емлющего синтаксического контекста. Пояснить принцип контекстной свободы проще всего на конкретном примере. Рассмотрим такую синтаксическую категорию, как именная группа в русском языке. Опираясь на соб ственные знания языка (и н т р о с п е к ц и ю) или воспользовавшись любым грамматическим описанием, например, академической Русской грамматикой (1980), можно установить, какие компоненты могут входить в состав именной группы в качестве зависимых, или, иными словами, как может р а з в е р т ы в а т ь с я именная группа. Неполный список возможных типов зависимых приводится в (10a-f); разумеется, возможны также различные комбинации двух, трех и т. д. зависимых разных типов (10g). (10) a. только вершина: учитель b. другая именная группа: учитель математики c. прилагательное: новый учитель d. притяжательное местоимение: наш учитель e. предложная группа: учитель по призванию f. придаточное определительное: учитель, которого нам рекомендовали (NP → N) (NP → N NP) (NP → A N) (NP → POS N) (NP → N PP) (NP → N S) Синтаксис 109 g. любые комбинации этих зависимых: новый учитель математики, которого нам рекомендовали; наш новый учитель… Объединяя правила развертывания (10a-f), получаем единое правило развертывания NP → (POS) (A) N (NP) (PP) (S), где скобки обозначают факультативный характер зависимого. Теперь исчислим синтаксические контексты, в которых может появляться именная группа (список в (11) также не исчерпывающий): (11) a. подлежащее: X вошел в класс b. дополнение глагола: Мы встретили X c. дополнение предлога: Я посмотрел на X d. зависимое в именной группе: отец X e. именной компонент сказуемого: Это был X f. зависимое компаратива: Он был умнее Х Принцип контекстной свободы гласит, что правило развертывания может применяться независимо от того контекста, в который попадет именная группа. Например, если именную группу учитель математики возможно поместить в позицию подлежащего (Учитель математики вошел в класс), то она будет допустима и в других контекстах, перечисленных в (11). Важность принципа контекстной свободы для моделирования синтаксиса трудно переоценить: он позволяет анализировать внутреннюю структуру любого синтаксического объекта вне зависимости от его синтаксического окружения. Чтобы понять, насколько усложнилась бы синтаксическая модель для к о н т е к с т н о -з а в и с и м ы х языков, представим себе грамматику, в которой у существительного может быть определение-прилагательное только в том случае, когда именная группа вложена в предложную группу, а притяжательное местоимение — только если эта именная группа находится в составе другой именной группы. Для того, чтобы формализовать такую грамматику, нам потребуется использовать контекстно-зависимые правила развертывания, левая часть которых содержит не только развертываемую синтаксическую категорию (в данном случае NP), но и контекст, в котором происходит развертывание определенного типа: в контексте предложной группы P NP → P (A) N; в контексте именной группы N NP → N (POS) N. Всегда ли принцип контекстной свободы соблюдается в естественном языке? Можно ли полностью описать язык при помощи контекстно-свободных правил? Случаи нарушения контекстной свободы хотя и редко, но встречаются. Рассмотрим в качестве примера ограничения на развертыва- 110 Е. А. Лютикова ние групп прилагательного в английском языке. Английские прилагательные могут присоединять синтаксические зависимые двух типов: препозитивные наречия меры и степени (very proud ‘очень гордый’; AP → Adv A) и постпозитивные предложные группы — дополнения (proud of his son ‘гордый своим сыном’; AP → A PP). Синтаксические контексты, в которых может находиться группа прилагательного, включают атрибутивную позицию (препозитивное зависимое в именной группе, an X man) и предикативную позицию (именной компонент сказуемого, He is X). В атрибутивной позиции, однако, английский язык допускает только препозитивные зависимые прилагательных: (12) a. He is [AP very proud]. ‘Он очень гордый’. b. He is [AP proud of his son]. ‘Он гордится своим сыном’. c. a [AP very proud] man ‘очень гордый человек’ d. *a [AP proud of his son] man Ожид.: ‘гордый своим сыном человек’ Материал такого рода лингвисты стремятся проанализировать, не прибегая к контекстно-зависимым правилам. Возможная аналитическая альтернатива здесь связана с допущением об отсутствии тождества синтаксиче ской категории прилагательного с препозитивным и постпозитивным зависимым; в таком случае для единиц первого типа доступны оба контек ста, а для единиц второго типа — только предикативный контекст, и принцип контекстной свободы соблюдается. Итак, рассмотренные выше свойства синтаксических выражений приводят нас к определенным допущениям о возможном у с т р о й с т в е с и н т а к с и ч е с к о й м о д е л и. Для моделирования синтаксического компонента языка нам необходимы исходные синтаксические единицы и система рекурсивных правил, позволяющих строить более крупные синтаксические объекты из более мелких. Исходные элементы поступают из л е к с и к о н а — хранилища минимальных синтаксических единиц, обладающих определенными ф о р м а л ь н ы м и (грамматическими) п р и з н а к а м и. Важнейшим формальным признаком единицы лексикона является ее с и н т а к с и ч е с к а я ч а с т е р е ч н а я к а т е г о р и я. Именно на частеречную категорию в первую очередь опираются правила соединения; кроме того, от нее во многом зависит набор словоизменительных грамматических категорий лексической единицы. Следует отметить, что частеречная таксономия распространяется не только на исходные синтаксические единицы, но и на Синтаксис 111 производные синтаксические объекты: имя существительное при соединении со своими зависимыми образует именную группу, прилагательное — группу прилагательного, и т. д. Среди синтаксических категорий выделяются лексические категории, соответствующие основным частеречным классам знаменательных лексем, и функциональные категории — носители нелексического значения, играющие важную роль в построении синтаксических объектов разного уровня (например, вспомогательные глаголы, подчинительные союзы и др.). С и с т е м а синтаксических п р а в и л определяет возможность и результат соединения синтаксических единиц в более сложные объекты. Правила опираются на формальные признаки синтаксических единиц и на их основе соединяют синтаксические единицы в более крупные, вычисляя при этом формальные признаки полученных выражений. Например, правила русского языка позволяют соединить предлог с именной группой и устанавливают синтаксическую категорию полученного объекта как предложную группу, а также фиксируют падежную характеристику именной группы в соответствии с управлением предлога. При синтаксическом анализе словосочетаний и предложений в рамках некоторой синтаксической модели им сопоставляется с и н т а к с и ч е с к а я с т р у к т у р а — теоретический конструкт, описывающий деривацию синтаксического объекта из минимальных синтаксических единиц и определяющий на нем отношения зависимости и/или вложения. Существует два основных способа графического представления синтаксической структуры: дерево зависимостей, используемое в теориях зависимостного синтаксиса, и дерево непосредственных составляющих, используемое в грамматиках составляющих. Г р а м м а т и к а з а в и с и м о с т е й основывается на введенном выше отношении с и н т а к с и ч е с к о й з а в и с и м о с т и, обобщая до него все возможные виды синтаксического соединения (в том числе и симметричное соединение, такое как сочинение, соединение подлежащего и сказуемого, соединение служебных словоформ со знаменательными) и формализуя и е р а р х и ю п о д ч и н е н и я. Синтаксическая зависимость устанавливается между минимальными синтаксическими единицами — словоформами. Ф о р м а л ь н ы м и с р е д с т в а м и выражения зависимости традиционно считаются управление и согласование. Например, в русском адъективноименном словосочетании голубой туман зависимое прилагательное согласуется с вершиной-существительным по определенному набору морфологических категорий, а в предложно-именном словосочетании за туманами вершина-предлог управляет зависимым существительным и определяет 112 Е. А. Лютикова значение его падежного признака. Традиционная русистика использует понятия согласования, управления и примыкания для классификации синтаксической зависимости: среди зависимых выделяются непересекающиеся классы согласуемых, управляемых и примыкающих (то есть не-согласуемых и не-управляемых) зависимых. Неадекватность такого подхода как в межъязыковом аспекте, так и применительно к русской грамматике убедительно показана в А.Е. Кибрик 1977c, 1992. А. Е. Кибрик доказывает, что согласование и управление — это независимые феномены, которые могут быть одновременно представлены в словосочетании. Например, в татарском языке синтаксическое отношение между обладаемым и посессором получает двойное морфосинтаксическое кодирование (пример (13)): посессор оформляется генитивом (управление), а обладаемое согласуется с посессором в лице и числе (согласование). Аналогичное кодирование получает в русском языке отношение между подлежащим и сказуемым: именительный падеж подлежащего определяется финитностью сказуемого (управление), а предикативное согласование копирует признаки лица, числа и рода на сказуемое (согласование). Таким образом, нет формальных оснований усматривать особый тип синтаксической связи между подлежащим и сказуемым: отношение между ними, как и отношение в татарской посессивной конструкции, можно определить как отношение синтаксической зависимости. (13) а. укытучы-нын̡ китаб-ы учитель-gen книга-3 я.gen книга-1sg ‘книга учителя’ b. минем ‘моя книга’ китаб-ым Согласование далеко не всегда сигнализирует о синтаксической зависимости и ее направлении. Согласование может быть как однонаправлено, так и разнонаправлено с отношением синтаксической зависимости (ср. русскую адъективно-именную синтагму и татарскую посессивную конструкцию); более того, согласование возможно между словоформами, не связанными непосредственно отношением синтаксической зависимости. А. Е. Кибрик (1992: 109) приводит пример из арчинского языка, где один из аргументов экспериенциального глагола любить — местоимение я в дательном падеже — согласуется по категории именного класса со вторым аргументом этого глагола: Синтаксис (14) a. Д=ез бува 113 кьIан. II=я.dat мать(II) любить.prs ‘Я мать люблю’. b. В=ез дийа кьIан. I=я.dat отец(I) ‘Я отца люблю’. любить.prs Таким образом, согласование в общем случае не может служить морфологическим критерием синтаксической зависимости. Напротив, управление обычно верно указывает и на наличие синтаксической зависимости, и на ее направление. Возвращаясь к отношению между подлежащим и сказуемым, мы можем использовать управление для установления направления синтаксической зависимости — от сказуемого к подлежащему. Анализ структуры предложения в грамматике зависимостей сопоставляет ему д е р е в о з а в и с и м о с т е й — формальный объект, в узлах которого находятся словоформы предложения, а соединяющие их стрелки обозначают отношение синтаксической зависимости между словоформами. На дерево зависимостей накладываются следующие ограничения: (1) все словоформы в предложении связаны непосредственно или опосредованно (отсут ствуют «непривязанные» словоформы и замкнутые контуры); (2) в каждый узел входит не более одной стрелки; (3) существует единственный (корневой) узел, в который не входит ни одной стрелки. Дерево зависимостей особенно удобно для представления синтаксической структуры н е п р о е к т и в н ы х языковых выражений. П р о е к т и в н о с т ь — это формальное свойство предложения, определяемое на его дереве зависимостей. Предложение является проективным, если стрелки, обо значающие отношение зависимости, будучи проведены по одну сторону от прямой, на которой записано предложение, не пересекаются, и ни одна из стрелок не обрамляет корневой узел — абсолютную вершину предложения. Говоря неформально, проективность характеризует «гармоничное» соотношение синтаксической и линейной структуры предложения, при котором каждое синтаксическое зависимое примыкает к своей вершине, а разделять их могут либо другие непосредственные и опосредованные зависимые этой вершины, либо непосредственные и опосредованные зависимые этого за висимого. Непроективные структуры часто возникают при изменении «базового» порядка слов под воздействием как грамматических (например, передвижение вопросительного местоимения в начало предложения), так и коммуникативных (например, топикализация) факторов. Один из наиболее известных примеров непроективности, вызванной внешними факторами — непроек- 114 Е. А. Лютикова тивность латинского стиха, в котором порядок слов подчинен ритмической структуре строки. В (15) приводится первое предложение из поэмы Овидия «Метаморфозы», которое А. Е. Кибрик всегда разбирал со студентами, демонстрируя нарушения проективности и существенные трудности, возникающие при попытке представить его синтаксическую структуру при помощи альтернативного формализма. (15) In nova fert animus mutatas dicere formas corpora. ‘Дух влечет рассказать о формах, превращенных в новые тела’. В (15) обнаруживаются многочисленные нарушения проективности — 4 случая пересечения стрелок и 3 случая обрамления корневого узла. Для сравнения в (16) и (17) приводятся примеры того же предложения с проективным порядком слов. (16) Animus formas mutatas (17) Animus fert dicere formas in nova corpora dicere fert. mutatas in nova corpora. Дерево зависимостей может быть дополнительно размечено; разметка включает уточнение характера синтаксического отношения между словоформами (например, определительное, обстоятельственное) и/или его ранг по сравнению с другими подчинительными связями вершины. Например, в выражении резко распахнул дверь отношение между распахнул и дверь — комплетивное (то есть присоединяющее дополнение), а отношение между распахнул и резко — обстоятельственное. Комплетивное отношение имеет более высокий ранг по сравнению с обстоятельственным. Подробнее о классификации синтаксических отношений в дереве зависимостей см. (Мельчук 1974/1999). Г р а м м а т и к а н е п о с р е д с т в е н н ы х с о с т а в л я ю щ и х формализует и е р а р х и ю в л о ж е н и я. Основным понятием является понятие с о с т а в л я ю щ е й, которое получает индуктивное определение: (1) все лексические единицы, входящие в предложение, являются составляющими; (2) если X и Y — составляющие, то [XY] (результат соединения X и Y, квадратные скобки обозначают границы составляющей) — составляющая. Максимальной составляющей оказывается всё предложение. Отношение, обратное Синтаксис 115 отношению вложения — д о м и н а ц и я. Составляющая A доминирует над составляющей B, если В вложена в А. Операция соединения моделируется как бинарная; таким образом, все составляющие, кроме терминальных, делятся без остатка на д в е н е п о с р е д с т в е н н ы е с о с т а в л я ю щ и е. X является непосредственной составляющей Y-a, если Y доминирует над Х-ом и не существует такого Z, что Z доминирует над X-ом, а Y доминирует над Z-ом. Составляющие являются единицами, в терминах которых формулируются синтаксические правила. Помимо операции соединения, составляющие могут подвергаться разного рода передвижениям (например, передвижение вопросительной составляющей, топикализация), фрагментированию (выступать неполным ответом на вопрос), сочинению, замене на проформы (например, местоимения он, где, выражение do so в английском языке, клитики en и y во французском). Ф о р м а л ь н ы м с р е д с т в о м выражения структуры составляющих можно считать распространение значений грамматических категорий в пределах составляющей. Например, в предложении (18), помимо терминальных составляющих, совпадающих со словоформами, выделяются составляющие армейского офицера, жизнь армейского офицера и жизнь армейского офицера известна; последняя составляющая совпадает с предложением. Мы видим, что в составляющей армейского офицера — именной группе (NP1) — происходит распространение признака рода, фиксированного у существительного, на прилагательное. Когда NP1 вкладывается в следующую составляющую, NP2 жизнь армейского офицера, она получает родительный падеж; признак падежа также распространяется на всю NP1. Наконец, при соединении подлежащего со сказуемым род и число составляющей жизнь армейского офицера распространяются на все предложение и выражаются в именном сказуемом. (18) [S [NP2 Жизнь [NP1 армейского офицера]] известна]. Подобное понимание согласования позволяет объяснить случаи согласования между словоформами, не вступающими в синтаксическое отношение (пример (14) из арчинского языка). Можно считать, что признаки именной группы в номинативе распространяются на всё предложение, и затем реализуются как согласовательные на тех составляющих, которые способны к выражению этих признаков. Еще более наглядный пример копирования признаков в пределах составляющей — так называемые н а к л а д ы в а ю щ и е с я п а д е ж и (case stacking) в танкийских языках Австралии. Структура составляющих предложения (19) из языка каядильт считывается по «падежным» показателям (не все категории, по которым происходит согласование и показатели которых 116 Е. А. Лютикова включаются в падежную цепочку, являются падежами; часть из них — предикативные категории, такие как время или модальность). Рассмотрим самую длинную цепочку показателей на словоформе dangka-karra-nguni-naantha ‘мужчины’. Показатель генитива сигнализирует о включении данной именной группы в именную синтагму (сеть мужчины). Следующий показатель — инструменталиса — маркирует роль инструмента у именной группы сеть мужчины; заметим, что, в отличие от русского языка, данный показатель появляется не только на вершине (сетью мужчины), но и копируется на зависимое поверх показателя генитива. Далее в этом примере можно выделить составляющую, соответствующую группе сказуемого (показатель аблатива); в нее входит глагол-сказуемое, именная группа — дополнение и именная группа — инструмент. Все неглагольные словоформы имеют показатель аблатива; выбор этого показателя определяется категорией времени, выраженной в глаголе. Наконец, все словоформы этого предложения несут на себе показатель обликвуса, выражающий модальность (должно быть, поймала). Таким образом, цепочка dangka-karra-nguni-naa-ntha ‘мужчины’ сигнализирует о вложении этой словоформы в именную группу, группу сказуемого с определенным значением признака времени и в предложение с определенным значением признака модальности. (19) maku-ntha woman-obl [yalawu-jarra-ntha catch-pst-obl [[dangka-karra-nguni-naa-ntha] man-gen-instr-abl-obl yakuri-naa-ntha fish-abl-obl mijil-nguni-naa-nth]]. net-instr-abl-obl ‘Женщина, должно быть, поймала рыбу сетью мужчины’. (Kayardild; Evans 1995) Графическое представление структуры составляющих осуществляется при помощи д е р е в а н е п о с р е д с т в е н н ы х с о с т а в л я ю щ и х, или дерева НС. В дереве НС показаны все операции соединения, ведущие к деривации предложения. Пример дерева НС показан в (20). Согласно (20), предложение Хозяйственные упражнения скоро его утешили состоит из двух НС — хозяйственные упражнения (группа подлежащего) и вскоре его утешили (группа сказуемого). Группа подлежащего делится на НС хозяйственные и упражнения; это терминальные составляющие. В группе сказуемого мы сперва отделяем обстоятельство от сочетания глагола и дополнения (НС скоро и его утешили); затем мы делим составляющую его утешили на НС его и утешили. Можно читать дерево НС и снизу вверх, начиная с терминальных составляющих и последовательно собирая все более крупные составляющие, вплоть до целого предложения. Синтаксис 117 (20) Хозяйственные упражнения скоро его утешили. Возможна и более компактная запись структуры составляющих — при помощи квадратных скобок. Например, всю информацию дерева НС в (20) можно представить скобочной записью (21). Скобочная запись, однако, крайне неудобна, если линейный порядок слов разрывает составляющие. Так, в примере (9) составляющая темный чулан в доме, который построил Джек (NP9) разорвана не принадлежащем ей материалом — глаголом хранится. Его приходится отдельно помечать как не принадлежащий данной составляющей, однако нет очевидного способа указать в этой записи, в какую составляющую он входит. (21) [[[Хозяйственные] [упражнения]] [[скоро] [[его] [утешили]]]]. Разрывные составляющие характерны для непроективных структур. Рассматривавшийся выше латинский пример из Овидия в своей исходной форме дает структуру составляющих в (22): очевидно, что все составляющие этого предложения, кроме терминальных и максимальной (самого предложения), являются разрывными. Напротив, проективному примеру (17) соответствует дерево НС в (23), не содержащее разрывных составляющих. (22) In nova fert animus mutatas dicere formas corpora (23) Animus fert dicere formas mutatas in nova corpora. 118 Е. А. Лютикова Дерево НС может быть подвергнуто дальнейшей разметке, проясняющей синтаксическую категорию составляющих. Терминальные узлы размечаются в соответствии с их частеречными категориями, например, N (noun — существительное), V (verb — глагол), A (adjective — адъектив), P (preposition — предлог), и т. п. Важным уровнем категориальной разметки является уровень г р у п п (phrase) — максимальных составляющих, возглавляемых соответ ствующей вершиной, например, NP (noun phrase — именная группа), VP (verb phrase — глагольная группа), и т. п. Так, выражению formae mutatae in nova corpora ‘формы, превращенные в новые тела’ можно сопоставить размеченную структуру составляющих (24): (24) NP N formae AP A mutatae PP P in NP AP N corpora A nova Структура непосредственных составляющих особенно ценна тем, что в ней содержатся все синтаксические единицы — от минимальных (терминальные составляющие) через промежуточные к максимальным (всё предложение). В структуре зависимостей промежуточные синтаксические единицы не представлены непосредственно — полное поддерево (то есть все зависимые и зависимые этих зависимых) каждого узла является составля ющей, однако не все составляющие представлены полными поддеревьями. На структуре составляющих определяется важнейшее синтаксическое понятие — понятие с т р у к т у р н о г о п р и о р и т е т а, или с-командования (читается «си-командование», от англ. с(onstituent) command). Структурный приоритет — это независимое от линейного порядка слов отношение между составляющими А и В, удовлетворяющее следующему определению: А с-командует В, если составляющая, непосредственно доминирующая над А, доминирует также и над B, и ни А, ни B не доминируют друг над другом. В дереве (24) предлог in с-командует именной группой nova corpora, адъек- Синтаксис 119 тивной группой и прилагательным nova и существительным corpora; именная группа nova corpora с-командует предлогом in; адъективная группа и прилагательное nova, а также существительное corpora не с-командует предлогом in; именная группа nova corpora не с-командует ни адъективной группой и прилагательным nova, ни существительным corpora. Структурный приоритет является условием большинства синтаксических процессов, связанных с взаимодействием двух синтаксических единиц — передвижения, управления, согласования, связывания. Простейший пример, показыва ющий значимость структурного приоритета — отличия в возможной интерпретации анафорического местоимения в предложениях (25а) и (25b). В (25а) местоимение она может относиться к любой другой участнице (референциальный индекс i), но не к Наташе (индекс *j). В (25b) она может обозначать и другую участницу (i), и Наташу (j). Разгадка заключается в том, что референциальные выражения, такие как Наташа, не могут иметь одинаковый референциальный индекс с с-командующей составляющей (это один из важнейших принципов т е о р и и с в я з ы в а н и я, действующий в подавляющем большинстве языков). В (25а) составляющая она с-командует составляющей Наташу, поэтому их коиндексация невозможна. В (25b), напротив, между составляющими её и Наташу с-командования нет, и их коиндексирование не приводит к нарушению принципов теории связывания. (25) a. Онаi,*j еще не знает, что мы пригласили Наташуj. b. Еёi,j соавтор еще не знает, что мы пригласили Наташуj. 3.3. Основные синтаксические домены Синтаксис изучает и моделирует все виды синтаксических объектов. Важным достижением синтаксиса является ряд обобщений, накладыва ющих ограничения на их разнообразие. Здесь мы их сформулируем в самом общем виде: (1) внутренняя структура групп разных синтаксических категорий устроена единообразно и включает одну вершину и другие группы в качестве зависимых; (2) важнейшие синтаксические свойства группы, такие, как ее дистрибуция и формальные признаки, определяются ее вершиной; (3) зависимые соединяются с вершиной в определенном порядке, отражающем их семантическую роль и/или обязательность для структуры группы; (4) синтаксически активными элементами являются группы и вершины (терминальные составляющие), но не промежуточные составляющие между вершиной и группой. Несмотря на то, что структура групп разных синтаксических категорий поддается такого рода обобщениям, чрезвычайно продуктивным является 120 Е. А. Лютикова целенаправленное изучение с и н т а к с и ч е с к и х д о м е н о в — совокупностей групп, объединенных более тесными селективными связями, общими функциями в составе предложения и определенными на них формальными признаками. Наиболее важными и подробно исследованными синтаксическими доменами являются: глагольная область, в пределах которой проецируется аргументная структура глагола — его дополнения и подлежащее; область функциональной структуры клаузы, где получают выражение предикативные категории и определяются синтаксические роли подлежащего (субъекта) и сказуемого; область типирования клауз (clause typing), в которой определяется синтаксическое «предназначение» клаузы — главная или зависимая, утвердительная или вопросительная, изъяснительная, определительная или обстоятельственная, и где может получать синтаксическую репрезентацию ее логическая и коммуникативная структура (топикализация, фокализация). Г л а г о л ь н а я о б л а с т ь представляет собой зону, задаваемую тематическими (семантическими) отношениями между вершиной — предикатом и ее зависимыми — аргументами. Аргументы лексических вершин могут быть выражены группами разных синтаксических категорий, однако наиболее часто в качестве аргументов выступают именные группы, предложные группы и клаузы (в последнем случае отечественная синтаксическая традиция говорит о нефинитных оборотах или финитных придаточных изъяснительных). Важнейший принцип, регулирующий проецирование аргументной структуры, состоит в том, что все аргументы вершины должны входить в состав группы, возглавляемой этой вершиной, и получать от нее определенную семантическую роль. Таким образом, семантическая роль может рассматриваться как формальный признак, запускающий взаимодействие вершины, которой нужно заполнить свои аргументные позиции, и аргумента, которому необходимо эту роль получить, чтобы быть правильно проинтерпретированным. Помимо глагольной группы, или группы лексического глагола, VP, в состав глагольной области включаются функциональные (то есть не лексические) вершины, отвечающие за регулярные модификации аргументной структуры, связанные с добавлением новых аргументов, например, каузативная вершина, вводящая каузатора, аппликативная вершина, вводящая бенефактив и некоторые другие типы аппликативных аргументов, результативная вершина, вводящая результирующее состояние, иногда вместе с его носителем (ср. Dora shouted [herself hoarse] ‘Дора накричалась до хрипоты’, They drank [the teapot empty] ‘Они выпили чайник полностью (= до пустоты)’ ). Предполагается, что не лексическим глаголом, но отдельной функциональной вершиной — так называемым легким глаголом, Синтаксис 121 v — вводится агентивный аргумент, так что в паре английских предложений The vase broke и John broke the vase группа лексического глагола VP выглядит одинаково и содержит только пациентивный аргумент the vase. Подобная структура глагольной области носит название Ларсоновой структуры (Larsonian structure), по имени предложившего ее лингвиста Р. Ларсона (Larson 1988). В рамках исследования данного домена активно разрабатывается гипотеза об изоморфизме структуры глагольного значения, представимого в виде комбинации подсобытий, связанных причинно-следственными связями, и синтаксической структуры глагольной области. Эта гипотеза лежит в основе направления, известного как л е к с и ч е с к и й с и н т а к с и с (lexical syntax, l-syntax), и представленного в основополагающих работах К. Хейла и Дж. Кейсера (Hale, Keyser 1993, 2002), Х. Борер (Borer 2005), Дж. Рэмченд (Ramchand 2008) и др. Наиболее сильный тезис, адекватность которого исследует лексический синтаксис, состоит в том, что возможные структурно-семантические типы глагольных значений, такие как деятельность, изменение состояния, свершение, предопределены в конечном итоге ограничениями, накладываемыми на возможную синтаксическую структуру групп, образующих глагольную область. О б л а с т ь ф у н к ц и о н а л ь н о й с т р у к т у р ы к л а у з ы образована последовательностью групп функциональных вершин, доминирующих над глагольной областью и несущих формальные признаки, соответствующие предикативным категориям, то есть категориям, определяемым на клаузе или предложении — финитности, времени, модальности, отрицанию, (внешнему) виду. Важнейшая функциональная вершина этой области — предикативная вершина (обозначалась в разное время как Infl(ection), I, T(ense)), отвечающая за выражение категории времени. Поскольку во многих языках охарактеризованность клаузы по времени коррелирует с личночисловым согласованием сказуемого с подлежащим и возможностью канонического выражения подлежащего (например, именительным падежом), предполагается, что данная вершина также является носителем согласовательных признаков лица и числа и источником падежа для подлежащего; в некоторых языках, например, английском или французском, вершина T вызывает передвижение подлежащего в свою группу, за счет чего оно получает особую структурную позицию вне глагольной области (см. однако, (Nikolaeva (ed.) 2007) о различных комбинациях этих параметров, засвидетельствованных в языках мира). Нефинитные клаузы — например, инфинитивные — обладают нефинитной вершиной T и поэтому лишены возможности выражения подлежащего. 122 Е. А. Лютикова Необходимость других функциональных категорий в данном домене была впервые обоснована в работе Ж.-И. Поллока (Pollock 1989), который показал, что во французских инфинитивных оборотах имеется структурная позиция, промежуточная между глагольной областью и T. Среди синтаксистов в настоящий момент нет консенсуса относительно количества функциональных вершин, образующих функциональный каркас клаузы: представители так называемого к а р т о г р а ф и ч е с к о г о п о д х о д а, вдохновленного работами Г. Чинкве и Л. Рицци (см. программную статью Cinque, Rizzi 2008 и энциклопедическую статью У. Шлонского Shlonsky 2010), ратуют за крайне дробную и универсальную структуру, включающую все возможные в языках мира грамматически релевантные признаки, в то время как более умеренное крыло ограничивается минимально необходимым набором вершин, достаточным для деривации конкретной клаузы в конкретном языке. Упорядоченность функциональных вершин в структуре клаузы особенно ярко проявляется при рассмотрении грамматических свойств синтаксических единиц, проецирующих неполную функциональную структуру клаузы. Речь идет о н о м и н а л и з а ц и я х и других типах составляющих, в которых на основе не полностью достроенной клаузы образуется группа другой категории, например, именная или адъективная6. Наличие импликативных связей между возможностью выражения различных категорий в нефинитных клаузах, отмечавшееся во многих типологических работах (см. Givón 1984), например, «если в номинализации может быть выражено время, то в ней может быть выражен и вид», «если в номинализации подлежащее выражается так же, как и в финитной клаузе, то в номинализации может быть выражено отрицание», и т. п., получает принципиальное объяснение, если предположить, что функциональные вершины, отвечающие за выражение данных категорий, выстраиваются в определенном порядке, и невозможно включить в состав номинализации вышестоящую вершину, не включая при этом нижестоящую (Alexiadou 2001). Самый высокий домен образуют функциональные вершины, входящие в о б л а с т ь т и п и р о в а н и я к л а у з. Важнейшая вершина этой области — вершина С. Сокращение C происходит от англ. complementizer ‘комплементатор, комплементайзер’, что означает подчинительный союз типа англ. that или рус. что, превращающий клаузу в придаточное изъяснительное предложение (complement clause). Однако в данной вершине могут находиться не только подчинительные союзы. Обобщая функции комплементайзеров и учитывая их дополнительную дистрибуцию с вопросительными Структура такого рода объектов обсуждается уже в Пешковский 1928, где они называются смешанными категориями. 6 Синтаксис 123 словами, например, в косвенном вопросе (26b), или с инвертированным вспомогательным глаголом в общем независимом вопросе (26c), или с относительным местоимением в придаточном определительном (26d), и, наконец, с отсутствием какой-либо выраженной единицы в утвердительном независимом предложении (26e), можно считать, что в с е клаузы в (26) содержат вершину С, заполненную различными лексическими единицами с разными признаками (подобно тому, как в вершине N могут находиться как одушевленное существительное женского рода сестра, так и неодушевленное существительное среднего рода облако). (26) a. (I know) that the cat has caught the rat. ‘(Я знаю, ) что кошка поймала крысу’. b. (I ask) who ∅ the cat has caught who. ‘(Я спрашиваю, ) кого поймала кошка’. c. Has + ∅ the cat has caught the rat? ‘Поймала ли кошка крысу?’ d. (the rat) which ∅ the cat has caught which ‘(крыса, ) которую поймала кошка’ e. ∅ The cat has caught the rat. ‘Кошка поймала крысу’. В примерах (26b-e) лексические единицы, заполняющие C, нулевые; однако это разные единицы, поскольку их формальные признаки различны. В (26b) нулевой комплементайзер определяет клаузу, с которой соединяется, как косвенный вопрос и притягивает в свою группу вопросительное слово who. В (26с) нулевой комплементайзер помечает клаузу как главную (main clause) и вопросительную, притягивая к себе вспомогательный глагол и тем самым вызывая его инверсию. В (26d) нулевой комплементайзер делает клаузу определительной и вызывает передвижение в свою группу относительного местоимения. Наконец, в (26e) нулевой комплементайзер не производит никаких видимых эффектов, однако определяет клаузу как утвердительное независимое предложение7. Мы видим, что комплементайзеры часто вызывают передвижение составляющих, как вершин (инверсия), так и максимальных проекций (вопроМожно было бы считать, что в (26e) комплементайзер отсутствует в принципе, а тип «утвердительное независимое предложение» клауза получает по умолчанию, в отсутствие комплементайзера. Этому противоречит, однако, материал многих языков, где в деривации утвердительных независимых предложений используется комплементайзер, получающий фонологическое выражение (арабский язык) или вызывающий передвижение (V2 языки, например, немецкий язык). 7 124 Е. А. Лютикова сительные и относительные группы). Если в первом случае передвижение неизбирательно — передвигается содержимое ближайшей к комплементайзеру вершины, — то при фразовом передвижении дислокацию претерпевают составляющие определенных типов. С семантической точки зрения их можно охарактеризовать как операторы, которые в результате передвижения оказываются в такой позиции, из которой они с-командуют своей сферой действия. Например, косвенный вопрос (I ask) who the cat has caught who имеет логическую структуру WHO x. the cat has caught x («Кто тот (одушевленный) х, что кошка поймала х ?»). Передвижение операторов опирается на их формальные признаки: например, вопросительный комплементайзер притягивает только составляющие с признаком «вопросительный», не вступая во взаимодействия с другими группами. В результате передвижения группа оператора оказывается зависимым в группе комплементайзера и — благодаря этому — самой высокой составляющей в данной клаузе. Поскольку в языках с правосторонним ветвлением эта позиция является крайней левой, область типирования клауз часто называют л е в о й п е р и ф е р и е й к л а у з ы. Как и в случае с областью функциональной структуры клаузы, в области типирования клауз может выделяться более одной функциональной проекции. Так, Л. Рицци (Rizzi 1997) предположил, что передвижение топикальных и фокусных составляющих также происходит на левую периферию, однако в специально предназначенные для этого группы топика и фокуса. В развитие этого направления исследований делаются попытки объяснить коммуникативно-мотивированные передвижения как синтаксические процессы, вызванные совокупностью вершин левой периферии. Наконец, еще один важный синтаксический домен образует и м е н н а я г р у п п а. Исследования именной группы, предпринятые в работах А. Сабольчи (Szabolcsi 1983-84), С. Эбни (Abney 1987) и их последователей, показали, что структура именной группы имеет много параллелей со структурой клаузы: в обоих случаях над группой лексической категории, проецирующей аргументную структуру, доминирует совокупность групп функциональных вершин, задающих грамматически релевантные признаки составляющей. Можно даже указать на соответствия в расположении разных типов функциональных категорий: так, ближе к области аргументной структуры располагаются функциональные категории, отвечающие за квантитативные характеристики (вид у клаузы, число у именной группы), а дальше — категории, отвечающие за референциальные характеристики (время и модальность у клаузы, группы определителя (артикля) и квантора в именной группе). Во многих языках статус посессора именной группы чрезвычайно Синтаксис 125 сходен со статусом подлежащего в клаузе: он с-командует всем остальным материалом своей составляющей и контролирует согласование (см. пример (13) из татарского языка). Граница (полностью достроенной определенной) именной группы, как и граница (полностью достроенной финитной) клаузы, непреодолима для некоторых типов синтаксического взаимодействия, таких как согласование или приписывание падежа8. Завершая этот раздел, следует отметить, что на сегодняшний день синтаксис — это один из наиболее активно и динамично развивающихся разделов науки о языке, где разнообразие эмпирических данных, набор привлекаемых языков, спектр предметных областей, равно как и диапазон теоретических взглядов необыкновенно широки. Синтаксис претендует на лидерство в исследовании языковой способности человека и уже многого добился на этом пути; можно надеяться, что последующие достижения будут столь же впечатляющими. Проблематика ограничений на действие правил появляется в синтаксической повестке дня начиная с пионерской диссертации Дж. Росса (Ross 1967), и до настоящего времени образует одну из самых плодотворных и волнующих областей исследований. 8 4. Дискурс 1 А. А. Кибрик В данной главе предлагается эскиз проблематики дискурсивного анализа как лингвистической дисциплины. Эта проблематика распадается на три главных круга вопросов — вопросы таксономии, вопросы структуры дискурса и вопросы влияния дискурсивных факторов на более мелкие составляющие. Дискурсивный анализ представляет собой «уровневый» раздел лингвистики, подобный фонетике, синтаксису и т. д. Дискурсивный анализ имеет дело с составляющими максимального объема — целыми дискурсами и их частями. Актуальность дискурсивных проблем в наименьшей степени зависит от теоретической предрасположенности и научной моды, поскольку, в отличие от основных понятий других разделов лингвистики (фонема, слово, предложение), целый дискурс — это очевидный факт, не являющийся теоретическим конструктом. Как собственно лингвистическое научное направление дискурсивный анализ сформировался лишь в последние десятилетия. Учет дискурсивных явлений является необходимой предпосылкой полноты наших представлений об устройстве языка. 4.1. Введение 4.2. Краткая история и современные направления дискурсивного анализа 4.3. Таксономия дискурса 4.3.1. Модус 4.3.2. Жанр 4.4. Структура дискурса 4.4.1. Глобальная структура 4.4.2. Локальная структура 4.4.3. Теория риторической структуры как интерфейс между локальной и глобальной структурой 4.5. Дискурсивные факторы «точечных» языковых явлений (грамматика, лексика, просодия, жесты) 4.6. Когнитивное и социальное измерения дискурса Пререквизиты: Синтаксис; Морфология; Лингвистика в контексте когнитивных наук. При подготовке главы были использованы некоторые материалы работ А.А. Кибрик 2003, 2009, 2015. 1 Дискурс 127 4.1. Введение XX век в лингвистике в значительной степени прошел под знаком от рицания языкового употребления как существенного объекта научного исследования. Концепции Ф. де Соссюра и позже Н. Хомского — самые влиятельные лингвистические концепции XX века — основывались на противопоставлении языковой системы и языкового употребления. Согласно этим концепциям, центральный объект изучения лингвистов — неизменная, независимая от употребления система знаков или грамматика, хранящаяся в головах носителей языка. А реальное употребление языка в реальном времени — бесконечный набор случайностей, результат каждый раз уникального взаимодействия языковой системы с внеязыковыми факторами. В современной лингвистике представлены и прямо противоположные теоретические установки, которые постепенно сменяют жесткую оппозицию языковой системы и употребления. Подобно прочим эмпирическим наукам, лингвистика все больше осознает, что наблюдаемая языковая реальность, осуществляемая в конкретных образцах языкового взаимодействия — по крайней мере столь же заслуживающий внимания научный объект, как и невидимая языковая система. Реальное использование языка — это языковая к о м м у н и к а ц и я между двумя, несколькими или многими индивидами. В ходе динамической, разворачивающейся во времени коммуникации возникает ее след, статический объект — т е к с т. Это может быть письменный текст, т. е. последовательность графических символов, а может быть и устный текст — акустический сигнал, который может быть зафиксирован при помощи звукозаписывающего устройства. Комплексный феномен, объединяющий и динамический, и статический аспекты, в современной лингвистике именуется д и с к у р с о м. Таким образом, дискурс — это единство процесса языковой деятельности и ее результата. Термин «дискýрс» (фр. discours, англ. discourse) происходит от латинского слова discursus, имеющего большой спектр значений: ‘бегание взад-вперед; движение, круговорот; беспрерывное мелькание; суета; разветвление, барахтанье; беседа, разговор’. В настоящее время термин «дискурс» имеет много разнообразных типов употреблений и используется во многих гуманитарных науках, связанных с языком, — в лингвистике, литературоведении, семиотике, социологии, психологии, философии, этнологии и антропологии и др. В настоящей главе рассматриваются лингвистические аспекты дискурса. Чрезвычайно близко к понятию дискурса понятие д и а л о г. Однако последний термин имеет смысловую коннотацию постоянной смены говорящего — в отличие от монолога. По этой причине «дискурс», такой 128 А. А. Кибрик коннотации не имеющий, удобен как родовой термин, объединяющий все виды языковой деятельности и использования языка. Поскольку в дискурсе есть противопоставленные роли г о в о р я щ е г о и а д р е с а т а, сам процесс языкового общения может рассматриваться в этих двух перспективах. В науке о дискурсе выделяются две различные группы работ — те, которые исследуют построение дискурса (напр., выбор лексического средства при назывании некоторого референта), и те, которые исследуют понимание дискурса адресатом (напр., вопрос о том, как слушающий понимает редуцированные лексические средства типа местоимения он и соотносит их с теми или иными референтами). Кроме того, есть еще третья перспектива — с позиций самого текста, возникающего в процессе дискурса (напр., местоимения в тексте можно рассматривать безотносительно к процессам их порождения говорящим и понимания адресатом, а просто как структурные сущности, находящиеся в некоторых отношениях с другими частями текста). В данной главе за основу принята перспектива говорящего (т. е. порождения), поскольку именно говорящий является тем субъектом, который создает дискурсивную форму. Раздел лингвистики, изучающий дискурс, обычно называется д и с к у р с [ и в ] н ы й а н а л и з (также анализ дискурса, Discourse Analysis) или д и с к у р с [ и в ] н ы е и с с л е д о в а н и я (Discourse Studies). В рамках концепции, предлагаемой в данной главе, дискурсивный анализ является уровневым разделом лингвистики, занимающимся языковыми единицами максимального объема. Дискурсивный анализ исследует три основные группы вопросов, которые будут подробно рассмотрены в настоящей главе. Во-первых, это т а к с о н о м и я д и с к у р с а, т. е. деление на различные типы по тем или иным параметрам. Наиболее значимыми являются параметры модуса и жанра. Во-вторых, как и любое естественное явление или объект, дискурс имеет определенную с т р у к т у р у. Это, в первую очередь, глобальная структура — совокупность крупных блоков, непосредственных составляющих — напр., абзацы в газетной статье. Кроме того, существует локальная структура дискурса — совокупность минимальных единиц, которые имеет смысл относить к дискурсивному уровню. Во многих подходах к дискурсу минимальными единицами дискурса признаются единицы, сопоставимые по объему с предикацией (клаузой). В-третьих, в дискурсивном анализе рассматривается в л и я н и е д и с к у р с и в н ы х ф а к т о р о в на единицы, меньшие, чем минимальная единица дискурса. Например, выбор референциального средства для того или иного референта (таких, как Ельцин или первый президент России или он или Дискурс 129 нулевое выражение) — лексическое явление, но находящееся под непосредственным воздействием дискурсивных факторов, таких как расстояние до предыдущего упоминания данного референта. Каково м е с т о дискурсивного анализа в лингвистике? Один из основных способов классификации лингвистических дисциплин — с точки зрения объема изучаемого типа составляющих. По этому параметру в качестве разделов лингвистики традиционно выделяются фонетика/фонология, морфология и синтаксис. Каждая из этих дисциплин имеет дело с более объемными составляющими, чем предыдущая. Наибольшая составляющая, входящая в ведение синтаксиса, — предложение. Анализ дискурса входит именно в эту парадигму дисциплин и занимает в ней завершающую позицию, поскольку дискурс — это максимальная языковая единица. Таким образом, дискурсивный анализ является одним из уровневых разделов лингвистики и подобно более привычным ее разделам имеет собственный специализированный предмет исследования. Хотя вхождение дискурсивного анализа в число ядерных разделов лингвистики признано еще не во всех научных направлениях, рано или поздно это наверняка произойдет. Преимущество дискурса перед другими языковыми явлениями — то, что это заведомо н е к о н с т р у к т, чего нельзя с уверенностью утверждать о более мелких языковых единицах и тем более о теоретических понятиях, которые постоянно пересматриваются лингви стической теорией. Дискурс, как и другие языковые сущности (морфемы, слова, предложения), устроен по определенным п р а в и л а м, характерным для данного языка. Факт существования языковых правил и ограничений часто демонстрируется с помощью негативного материала — экспериментальных языковых структур, в которых правила или ограничения нарушаются. В качестве примера небольшого образца дискурса, в котором есть такие нарушения, рассмотрим рассказ Даниила Хармса «Встреча» из цикла «Случаи»: Вот однажды один человек пошел на службу, да по дороге встретил другого человека, который, купив польский батон, направлялся к себе восвояси. Вот, собственно, и все. В этом тексте нарушены несколько принципов построения рассказа, которые обычно не осознаются носителями языка, но которыми эти носители хорошо владеют. Во-первых, в нормальном рассказе должен быть фрагмент, который именуется кульминацией. В рассказе Хармса есть только завязка, за которой сразу следует заключительная фраза (кода). Во-вторых, адресат рассказа должен понимать, какова была коммуникативная цель рассказчика, для чего он рассказывал свой рассказ (чтобы проиллюстрировать некоторую 130 А. А. Кибрик истину; чтобы сообщить интересную информацию и т. д.). Ничего этого из рассказа Хармса не ясно. В-третьих, участники повествования обычно должны упоминаться многократно и выполнять некоторую последовательность действий; такие участники называются протагонистами рассказов. В данном случае рассказ завершается, едва только рассказчик успел ввести участников. Принципы построения рассказа, нарушенные здесь, не являются абсолютно жесткими — напротив, это мягкие ограничения. Поэтому когда они нарушаются, в результате возникает не непонятный текст, а комический эффект. При этом наличие комического эффекта показывает, что некоторые глубинные принципы существуют. Обнаружение таких принципов и составляет цель дискурсивного анализа. В разделе 4.2 настоящей главы показано, как дискурсивный анализ исторически сформировался, и каковы основные направления этой дисциплины в настоящее время. В разделах 4.3–4.5 рассматриваются три основных круга проблем, упомянутые выше и исследуемые в дискурсивном анализе. Наконец, раздел 4.6 посвящен когнитивному и социальному аспектам дискурса, помещающим это явление в более широкий научный контекст. 4.2. Краткая история и современные направления дискурсивного анализа Языковое взаимодействие и текст на протяжении веков были предметом таких дисциплин, как риторика, ораторское искусство, герменевтика, а позже — стилистики и литературоведения. Ряд мыслителей XIX века, такие как В. фон Гумбольдт и А. А. Потебня, высказывали идеи, которые могут считаться провозвестниками интереса к реальному языковому взаимодействию. Более близкие по времени в д о х н о в и т е л и дискурсивного анализа — это ряд научных школ первой половины XX века. Во-первых, это традиция этнолингвистических исследований, ориентированных на запись и анализ устных текстов разных языков; среди наиболее известных представителей этой традиции — школа американской этнолингвистики, основанная Францем Боасом (Boas 1914, 1940). Во-вторых, это швейцарская школа Ш. Балли и А. Сешеэ, которые, хотя и были публикаторами курса Ф. де Соссюра, в своих работах предлагали существенно иные идеи. Так, Шарль Балли писал: «если между речью и языком нет строгих границ, то лингвист имеет право рассматривать их как разные, но смежные феномены…» (Балли 2003: 123). В‑третьих, это русский формализм 1910–20-х гг. — такие работы, как Якубинский 1923 и в особенности Пропп 1928. В-четвертых, это пражская лингвистическая школа, созданная Вилемом Матезиусом, в том числе под влиянием представителей и идей русского формализма, возбудившая интерес к таким поня- Дискурс 131 тиям, как тема/рема и коммуникативная организация текста (см. Mathesius 1939, русский перевод Матезиус 1967). В ряду вдохновителей дискурсивного анализа можно было бы назвать и исследования из области соседних наук, особенно психологические исследования Ф. Бартлетта (Bartlett 1932). В отечественном языкознании существенные работы, предвосхищающие дискурсивный анализ, появлялись и позже, ср. в особенности Фигуровский 1948; Поспелов 1948. Эти работы намного опережали свое время, но, как это часто бывает в России, не получили отклика и развития в своей стране. Работа Проппа даже фактически вернулась на родину из-за границы, после публикации ее на английском языке (Propp 1958). Термин discourse analysis был впервые использован в 1952 г. Зеллигом Харрисом (Harris 1952); парадоксальным образом, это тот же человек, ко торый подал Н. Хомскому мысль о синтаксическом анализе при помощи структур непосредственных составляющих. Однако оформление дискурсивного анализа к а к д и с ц и п л и н ы относится скорее к 1970-м гг. В это время появились важные работы европейской школы лингвистики текста (van Dijk 1972; Dressler 1972; Petöfi 1971, см. также Николаева ред. 1978), британ ские (напр., Coulthard 1977) и американские работы по дискурсу (Labov 1972; Grimes 1975; Longacre 1976; Givón ed. 1979; Chafe ed. 1980). К 1980–90-м гг. относится уже появление о б о б щ а ю щ и х т р у д о в, справочников и учебных пособий, таких как «Дискурсивный анализ» (Brown, Yule 1983), «Структуры социального действия: исследования по анализу бытового диалога» (Atkinson, Heritage eds. 1984), четырехтомный «Справочник по дискурсивному анализу» (van Dijk ed. 1985), «Описание дискурса» (Mann, Thompson eds. 1992), «Транскрипция дискурса» (DuBois et al. 1992), «Дискурсивные исследования» (Renkema 1993), «Подходы к дискурсу» (Schiffrin 1994), «Дискурс, сознание и время» (Chafe 1994), двухтомный труд «Дискурсивные исследования: междисциплинарное введение» (van Dijk ed. 1997). В нашей стране в 1980‑е гг. появился ряд монографий по лингвистике текста (Гальперин 1981; Реферовская 1983; Тураева 1986; особенно следует отметить полезную работу Откупщикова 1982), однако по упомянутым выше причинам дискурсивные исследования в России в целом значительно отстали от западных, особенно американских, исследований. Об истории лингвистики текста и дискурсивного анализа см. также обзорные работы Гиндин 1977; Николаева 1978; Демь янков 1995. Среди относительно новых отечественных работ по теории дискурса см. Макаров 2003, Филиппов 2007. Дискурс — объект м е ж д и с ц и п л и н а р н о г о изучения. Помимо лингвистики, с исследованием дискурса связаны такие науки, как психология, компьютерная лингвистика и искусственный интеллект, философия и 132 А. А. Кибрик логика, социология, антропология и этнология, литературоведение и семиотика, историография, теология, юриспруденция, педагогика, теория и практика перевода, коммуникационные исследования, политология. Каждая из этих дисциплин подходит к изучению дискурса по-своему, однако некоторые из них оказали существенное влияние на лингвистический дискур сивный анализ. Особенно это касается психологии и социологии. Особняком от собственно лингвистического анализа дискурса стоит одноименное философское/культурологическое направление, изначально возникшее во Франции, см., напр., Серио ред. 1999; Филлипс и Йоргенсен 2004. Как отме чает Ю. С. Степанов (1995), во «французском» понимании дискурс — это не столько языковое произведение, сколько выражение некоторой мифологии, бытующей в культурно-языковой среде. Развитием этого направления является так называемый критический анализ дискурса, см. van Dijk 2015. Данное понимание дискурса вошло в широкий публицистический обиход и сильно отличается от того понимания, которого релевантно в контексте данной главы. Существуют, однако, некоторые публикации, в которых лингвистиче ское и философско-публицистическое понимания дискурса объединяются и оказывают трудноотделимы друг от друга, см., напр., Johnstone 2002. Дискурсивный анализ, будучи молодой дисциплиной, весьма неоднороден, и не существует единого подхода, разделяемого всеми специалистами по дискурсу. Однако можно выделить наиболее популярные на сегодняшний день подходы. На первом месте в этом смысле стоит направление, известное как А н а л и з б ы т о в о г о д и а л о г а (Conversation Analysis), см. Sidnell, Stivers eds. 2012. Анализ бытового диалога был основан в начале 1970-х гг. группой американских социологов на базе так называемой «этнометодологии». Этнометодология — течение, возникшее в 1960-х гг. в американской социологии под лозунгами приверженности эмпирическому материалу, отказа от излишнего теоретизирования и априорных схем. Согласно объявленной цели этнометодологии, аналитику при анализе материала следует имитировать процедуры, выполняемые рядовыми представителями культурно-этнической группы, пытаться понять процедуры социального взаимодействия с позиций «обычного человека». Анализ бытового диалога — приложение этих общих принципов этнометодологии именно к языковому взаимодействию. Одной из ключевых работ, положивших начало Анализу бытового диалога как четко очерченному направлению, стала статья «Простейшая систематика чередования реплик в разговоре» (Sacks et al. 1974). В работах по Анализу бытового диалога было уделено внимание ряду вопросов, мало исследованных лингвистами. В первую очередь это — правила чередования реплик в диалоге, или, иными словами, правила перехода Дискурс 133 «права говорить» от одного собеседника к другому. В соответствии с такими правилами, которые в основном сводятся к вопросу о том, «назначает» ли текущий говорящий следующего говорящего, выявляются несколько видов пауз в диалоге, таких как заминка, пауза при смене темы, значимое молчание (отказ говорить). Другое явление, которому было уделено большое внимание, — смежные пары (adjacency pairs), то есть типовые последовательности реплик, напр., вопрос — ответ, приветствие — приветствие, приглашение — принятие приглашение и т. д. Внутрь смежной пары может вкладываться другая смежная пара, как в следующем диалоге: Вопрос 1: «Не подскажете, где здесь почта?» — [Вопрос 2: «Видите тот киоск?» — Ответ 2: «Да».] — Ответ 1: «Там надо повернуть направо». Такого рода вложения могут быть много ступенчатыми. В смежных парах реакции (т. е. вторые части) могут быть предпочтительными и непредпочтительными. Например, предпочтительной реакцией на приглашение является принятие приглашение. Непредпочтительные реакции — такие, как отказ от приглашения, — характеризуются тем, что им обычно предшествует пауза-заминка, а сами они более длинны и включают преамбулу и мотивировку. Еще одно явление, подробно исследованное в работах по Анализу бытового диалога, — исправления, или коррекции (repairs), то есть реплики, которые корректируют сказанное ранее данным говорящим или его собеседником. Также в Анализе бытового диалога значительное внимание уделяется глобальной организации диалога, невербальным и невокальным действиям (ритму, смеху, жестам, фиксации взгляда на собеседнике). Будучи создан социологами, Анализ бытового диалога приобрел значительную популярность среди лингвистов. Ряд лингвистов, в первую очередь американский лингвист С. Томпсон и ее ученики, попытались применить методы Анализа бытового диалога в собственно лингвистических исследованиях. В этих работах исследовались в дискурсивной перспективе такие традиционные проблемы английской грамматики, как свойства прилагательного, зависимые предикации, предикатные имена, принципы употребления обстоятельственных придаточных в разговорном дискурсе и др. (см., напр., Ochs et al. eds. 1996). Другие в е д у щ и е н а п р а в л е н и я дискурсивного анализа в основном группируются вокруг исследований отдельных ученых и их непосредственных последователей. Следует упомянуть такие направления, как исследование информационного потока (information flow) У. Чейфа (Chafe ed. 1980; Chafe 1994, 2015), когнитивную теорию связи дискурса и грамматики Т. Гивона (Givón ed. 1983; Givón 2001, 2017), экспериментальные дискурсивные исследования Р. Томлина (Tomlin 1995; Myachykov, Tomlin 2015), «граммати- 134 А. А. Кибрик ку дискурса» Р. Лонгакра (Longacre 1983), «системно-функциональную грамматику» М. Халлидея (Halliday 1994; Martin 2015), Теорию риторической структуры У. Манна и С. Томпсон (см. раздел 4.3 ниже), общую модель структуры дискурса Л. Поланьи (Polanyi 1988), социолингвистические подходы У. Лабова и Дж. Гамперса (Labov 1972; Gumperz 1982), исследование стратегий понимания Т. ван Дейка и У. Кинтша (van Dijk, Kintsch 1983), психолингвистическую модель «построения структур» М. Гернсбакер (Gernsbacher 1990; Gernsbacher, Givón eds. 1995). Разумеется, этот перечень далеко не полон — дискурсивный анализ представляет собой чрезвычайно мозаичный конгломерат разрозненных (хотя и не антагонистических) направлений. См. также более новые работы, показывающие современный спектр дискурсивных исследований — Moder, Martinovic-Zic eds. 2004; Widdowson 2007; А.А. Кибрик, Подлесская ред. 2009; Gee, Handford eds. 2012; Strauss, Feiz 2013; Федорова 2014b; Tannen et al. eds. 2015; Sutherland 2016; Goddard, Carey 2017. М е т о д ы, используемые разными школами дискурсивного анализа, также весьма разнообразны. В частности, из числа вышеописанных подходов Анализ бытового диалога и работы Чейфа опираются на естественный дискурсивный материал. При этом в Анализе бытового диалога обобщения добываются путем выявления повторяющихся, доминирующих моделей, а Чейф отдает приоритет методу интроспекции. В последнее время многие дискурсивные исследования основаны на корпусах — больших и компьютеризованных массивах естественных дискурсов (см, напр., Mehler et al. eds. 2010). В психолингвистически-ориентированных подходах (Федорова 2014b) эмпирический материал состоит не из естественных, а из экспериментальных данных, а обработка материала включает стандартное для когнитивной психологии использование статистических тестов. Особый круг методологических вопросов связан с транскрибированием устного дискурса. Любая попытка объективной письменной фиксации (транскрибирования) устного языка вынуждает решать множество сложных интерпретационных и технических проблем, неведомых тем лингвистам, которые изучают исключительно письменные тексты. При фиксации устной речи важны не «только слова», а множество других явлений — паузы, просодия, смех, наложение реплик, незаконченность реплик и т. д. Без этих деталей осмысленный анализ устного дискурса попросту невозможен. При этом разработка последовательных методов транскрипции и выбор разумного уровня детализации являются чрезвычайно непростыми задачами. Поэтому в настоящее время принципы транскрибирования устного дискурса являются предметом особой научной дисциплины (см., напр., DuBois et al. 1992; А.А. Кибрик, Подлесская ред. 2009), см. также главу 23 в наст. изд. Дискурс 135 На материале р у с с к о г о я з ы к а дискурсивные явления (хотя и без употребления данной терминологии) активно исследовались в 1970–80-е гг. в рамках проекта Института русского языка Академии наук по изучению русской разговорной речи (см., напр., Земская ред. 1973; Земская и др. 1981). Был записан и затранскрибирован большой массив устных диалогов и монологов, которые затем подверглись детальному исследованию. В этом проекте разговорная речь рассматривалась на фоне более привычного для лингвистического анализа письменного языка (точнее, кодифицированного литературного языка). См. также Сиротинина 1974; Лаптева 1976. Начиная с 1980-х гг. и особенно в 1990-е гг. исследование дискурса становится важной частью к о м п ь ю т е р н о й л и н г в и с т и к и. В настоящее время любая конференция по компьютерной лингвистике включает дискурсивную секцию. Некоторые важные идеи дискурсивного анализа были сформулированы в компьютерной лингвистике едва ли не раньше, чем в теоретической. Так, еще в середине 1970-х гг. Б. Грос ввела понятие фокусирования, которое позже повлияло на когнитивные исследования в области референции (см. Grosz 1977; Walker et al. eds. 1998). Одна из относительно недавних обобщающих работ — Stede 2012. В целом можно заключить, что в настоящее время дискурсивный анализ вполне сформировался как особое (хотя и междисциплинарное) научное направление. 4.3. Таксономия дискурса Как и при изучении любого естественного феномена, при изучении дискурса встает вопрос о классификации: какие типы и разновидности дискурса существуют. В данном разделе рассматриваются две основные классификации типов дискурса — классификация по модусам (устный / письменный) и классификация по жанрам, а также более кратко упоминаются классификации по функциональному стилю и формальности. 4.3.1. Модус. Самый главный классификационный признак, различа ющий типы дискурса — это м о д у с, т. е. противопоставление между устным и письменным дискурсом. Это разграничение связано с каналом передачи информации, или носителем: при устном дискурсе производится звуковой сигнал, воспринимаемый слухом, а при письменном — графический сигнал, воспринимаемый зрением. Иногда различие между устной и письменной формами использования языка приравнивается к различию между дискурсом и текстом, однако такое смешение двух разных противопоставлений не оправдано. 136 А. А. Кибрик Несмотря на то, что в течение многих веков письменный язык пользовался бóльшим престижем, чем устный, совершенно ясно, что устный дискурс — это исходная, фундаментальная форма существования языка, а письменный дискурс является производным от устного и представляет собой более позднюю, вторичную разновидность языка — и в онтогенезе, и в филогенезе. Более того, большинство человеческих языков и по сей день являются бесписьменными, то есть существуют только в устной форме. После того как лингвисты начали признавать (в XIX в.) приоритет устного языка, еще в течение долгого времени не осознавалось то обстоятельство, что письменный язык и транскрипция устного языка — не одно и то же. Лингвисты первой половины XX в. нередко считали, что изучают устный язык (в положенном на бумагу виде), а в действительности анализировали лишь письменную форму языка. Удивительным образом и сейчас не все лингвисты осознают приоритет устного языка, иногда даже предполагается приоритет письменного; ср. Linell 1982. Хотя письменный язык изучать удобнее в силу доступности материала, элементарная логика требует признать его вторичность и производность. Почему идея о приоритете устной формы языка с таким трудом пробивала себе дорогу в лингвистике? В ходе развития европейской цивилизации (и некоторых других цивилизаций) письменная форма языка приобрела экстраординарную культурную роль. Многие культуры были фактически созданы вокруг тех или иных сакральных письменных текстов — достаточно упомянуть роль Библии в культуре евреев и позже европейских народов. Это обеспечило письменной форме языка престиж и создало не всегда эксплицируемое, но популярное убеждение, что письменный язык — истинный, «чистый», «правильный», освобожденный от всяких случайностей, собственно единственная форма языка, заслуживающая просвещенного внимания ученых, а устный язык — лишь «испорченная» версия этого правильного языка. Эта точка зрения из обыденного сознания была унаследована многими поколениями лингвистов. Она нередко просачивается и в научную литературу, даже в ту, которая фокусируется на устной речи. Так, коллектив под руководством Е. А. Земской, который имеет очень большие заслуги в области документации устного русского языка и привлечения внимания к этой форме русского языка, в своих публикациях (Земская ред. 1973; Земская и др. 1981; Земская 1983) явно исходит из предпосылки, что кодифицированный литературный язык — основная, «немаркированная» форма русского языка, а русская разговорная речь — некоторое отклонение от этого идеала. Дискурс 137 Реальное сопоставление устного и письменного дискурса как альтернативных форм существования языка началось лишь в 1970-е гг. В частности, это касается уже упомянутого выше проекта по изучению русской разговорной речи под руководством Е. А. Земской — весьма пионерского для своего времени. Для традиционной русистики характерно подавляющее преобладание интереса к письменному языку. Ср. Русскую грамматику 1980, которая основана на иллюстративном материале, почти исключительно взятом из художественной литературы. Группа Земской указала, что есть объект, который этими описаниями совершенно не охватывается. Основной вывод, к которому пришли авторы, состоит в том, что русский язык представляет собой две различные системы: кодифицированный литературный язык и разговорная речь. На русском материале Е. А. Земская и ее соавторы открыли и описали многие особенности разговорной речи — такие, как ее творче ский характер (в том числе в словообразовании) и одновременно клишированность, связь с конситуацией, активное использование просодии и жестов. Впервые были описаны многие принципиально важные явления устного русского языка — например, тенденция к помещению рематических компонентов в начало синтагмы. Есть и ряд других работ об устной русской речи — так, О. А. Лаптева (1976) указала на дискретность устной речи, ее порождение в виде последовательности сегментов, а также на неприменимость стандартного понятия предложения к устной речи. См также Сиротинина 1974; Сиротинина и др. 2003. Различие в канале передачи информации имеет принципиально важные последствия для процессов устного и письменного дискурса (эти последствия исследованы У. Чейфом — см. Chafe 1982). Первое из этих последствий связано с разным в р е м е н н ы́м р е ж и м о м речи и письма. При устном дискурсе порождение и понимание происходят синхронизированно, а при письменном — нет. При этом скорость письма более чем в 10 раз ниже скорости устной речи, а скорость чтения несколько выше скорости устной речи. В результате при устном дискурсе имеет место явление фрагментации: речь порождается толчками, квантами — так называемыми интонационными единицами, которые отделены друг от друга паузами, имеют относительно завершенный интонационный контур и типично совпадают с простыми предикациями, или клаузами. При письменном же дискурсе происходит интеграция предикаций в сложные предложения и прочие синтаксические конструкции и объединения. Например, в корпусе, исследованном У. Чейфом, в устном дискурсе частота номинализаций составила 4,8 на тысячу слов, в письменном — 55,5. Частота серий предложных групп (типа the ques- 138 А. А. Кибрик tion of the nature of referential forms in any underlying linguistic structure) для устного дискурса составила 1,8, а для письменного 16,2. Второе принципиальное различие, связанное с разницей в канале передачи информации — наличие / отсутствие к о н т а к т а между говорящим и адресатом во времени и пространстве: при письменном дискурсе такого контакта типично нет (поэтому люди и прибегают к письму). В результате при устном дискурсе имеет место вовлечение говорящего и адресата в ситуацию, что отражается в употреблении местоимений 1 и 2 лица, в указаниях на мыслительные процессы и эмоции говорящего и адресата, в использовании жестов и других невербальных средств и т. д. При письменном же дискурсе, напротив, происходит отстранение говорящего и адресата от описываемой в дискурсе информации, что, в частности, выражается в более частом употреблении пассивного залога. Например, при описании научного эксперимента автор статьи скорее напишет фразу Это явление наблюдалось только один раз, а при устном описании того же эксперимента с большей вероятностью может сказать Я наблюдал это явление только один раз. В корпусе Чейфа частоты пассивных конструкций (на тысячу слов) составили для устного и письменного дискурса 5 и 25,4 соответственно, а частоты местоимений 1-го лица, напротив, 61,5 и 4,6 соответственно. Следует отметить, что в работе Chafe 1982 автор сравнивает два корпуса дискурсов, которые различаются не только с точки зрения модуса (устный / письменный), но и еще по одному параметру, который в отечественной традиции именуется ф у н к ц и о н а л ь н ы м с т и л е м (см., напр., Солганик 2003). Функциональные стили — это разновидности дискурса, соответствующие определенной сфере человеческой деятельности: бытовой, официальной, научной и т. д. Функциональные стили принципиально независимы от модуса. Так, дискурс бытового стиля может быть не только устным, но и письменным (напр., личное письмо), а дискурс научного стиля может быть и письменным (статья), и устным (доклад). Тем не менее, лексико-грамматические эффекты, связанные с модусами и функциональными стилями, могут быть схожими (см. Сиротинина и др. 2003). В частности, и письменный модус, и научный стиль характеризуются относительно сложным синтаксисом по сравнению с устным модусом и бытовым стилем. Когда характеристики, вызывающие схожие явления, соединяются, возникает эффект резонанса. Для максимальной контрастности Чейф использовал научный письменный дискурс и бытовой устный дискурс. Поэтому различия, показанные в его работе, несколько преувеличены по сравнению с сопоставлением модусов как таковых. Если стремиться установить именно влияние модуса Дискурс 139 на характеристики дискурса, следует использовать дискурсы, различающиеся ровно по этому параметру. С этой целью был проведен анализ двух корпусов дискурса, различающих ся только одним параметром — модусом. Рассматриваемые корпуса (собранные в 1990-е гг. студенткой МГУ Е. Чувилиной) включали одни и те же рассказы, рассказанные одними и теми же рассказчиками в разные моменты времени — сначала устно, затем письменно. Пример сопоставления двух идентичных по содержанию фрагментов этих корпусов приведен в табл. 4.1. Число предикаций (финитных и деепричастных) Среднее число слов на предикацию Среднее число предикатных слов на предикацию Число дискурсивных маркеров Устный дискурс Письменный дискурс 45 27 6,9 1,2 9,4 1,7 6 0 Таблица 4.1. Сопоставительные частоты языковых явлений в устных и письменных русских рассказах Эти количественные тенденции подтверждают выводы Чейфа, в особенности те, которые связаны с его оппозицией фрагментация/интеграция. По сравнению с устным дискурсом, в письменном значительно большее количество информации упаковывается в предикации, предикации содержат больше слов и, в частности, больше предикатных слов. Устный дискурс, с другой стороны, отличается высокой частотой дискурсивных маркеров — слов, отражающих спонтанный процесс порождения дискурса (таких, как вот, ну и т. п.). Также можно отметить следующие дополнительные различия между устными и письменными рассказами. В письменных рассказах значительно чаще встречаются тяжелые ИГ, состоящие из 4-5 слов, а в устных рассказах такие ИГ отсутствуют. Для письменного изложения характерны маркеры точности, для устного — приблизительности (напр., по-моему бутылок пять). Письменные рассказы эксплуатируют элементы официального функционального стиля — различные термины, неупотребительные в разговорном языке слова типа вслед, а для устных рассказов характерны разговорная лексика и порядок слов (закусь, вместе с буквально первым покупателем…). На сайте spokencorpora.ru представлен параллельный устно-письменный корпус «Веселые истории из жизни», предоставляющий полезный материал для исследования различий по модусу. 140 А. А. Кибрик Вопрос о том, является ли письменный язык отдельной системой или представляет собой «настройку» языка на другой канал сообщения, может быть изучен на материале младописьменных языков. Действительно, языки с длительной письменной традицией имели возможность выработать частично автономную подсистему, используемую при письме. Если это так, то учащиеся писать дети должны фактически изучать новую языковую систему по сравнению с устным языком, которым они уже владеют. Исследование, специально направленное на вопрос о том, как устроен письменный дискурс на младописьменном языке, было проведено на материале языка навахо (Юго-запад США, атабаскская языковая семья). Один и тот же рассказ был записан от одной и той же рассказчицы в устной и в письменной форме. Первоначально был записан устный вариант, затем он был затранскрибирован и переведен. Через некоторое время рассказчица, обладающая полной грамотностью на родном языке (достаточно редкое среди индейцев навахо явление) записала тот же самый рассказ. После этого можно было сравнить два варианта, различающиеся только модусом. Все остальные переменные — жанр, функциональный стиль, автор и даже содержание — были зафикси рованы. Результаты сопоставления оказались следующие (подробнее см. А.А. Кибрик 2009): — письменный вариант содержит в полтора раза меньше предикаций, чем устный; — предложения письменного варианта длиннее, чем в устном варианте: 2,2 предикации в среднем против 1,9; — предикации письменного дискурса содержат существенно больше ИГ, предикации устного дискурса содержат существенно больше частиц (указательных, эпистемических, коннекторов и др.); — в письменном дискурсе существенно чаще встречаются различные типы зависимых предикаций (дополнительные, относительные). Ср. характерный пример — два отрывка из устного (1а) и письменного (1б) вариантов, передающие одно и то же пропозициональное содержание: (1) а. ˀéí shį́į́ ch’ééh kóńjiilˀįįh то вероятно понапрасну она.толкала.его ‘Она [= орлица] толкала его [= яйцо] понапрасну’ б. ˀáádóó ˀatsáh-ą́ą ˀayęęzhii t’óó siˀán-ę́ę потом орлица-эта яйцо просто оно.лежит-Отн ch’ééh yéédilch’iˀ понапрасну она.трогала.его ‘Потом эта орлица понапрасну трогала яйцо, которое лежало без движения’ Дискурс 141 Особые элементы, которые есть в устном варианте (1а), — это указательное местоимение и эпистемическая частица. Явления, имеющиеся в письменном варианте (1б), но отсутствующие в устном, — это эксплицитные именные группы, указывающие на актанты (в противоположность анафорической доступности, имеющей место в устном варианте), эксплицитный коннектор ‘потом’, а также использование относительного придаточного, характеризующего актант в главной предикации. Очевидно, мы наблюдаем, что младописьменный язык, который не мог «успеть» выработать специальные конвенции для письменного модуса, немедленно развивает те же особенности, что и языки с длительной письменной традицией. Это более сложный синтаксис, использование более тяжелых предикаций, большее количество зависимых предикаций, и с другой стороны исчезновение различных прагматических маркеров — дейктиче ских, эпистемических и т. д. Следовательно, письменный модус является в первую очередь результатом аккомодации немаркированного устного языка к специфике письменной ситуации использования. Это не значит, конечно, что язык с длительной письменной традицией не может на протяжении столетий вырабатывать какие-то конвенции, которые отличают его от устного языка. Но конвенции эти наверняка не случайны: они первоначально возникают под влиянием особенностей режима передачи сообщения, создаваемого письмом. Несколько тысячелетий назад письменная форма языка возникла как способ преодолеть расстояние между говорящим и адресатом — расстояние как пространственное, так и временное. Такое преодоление стало возможно лишь при помощи особого технологического изобретения — создания физического носителя информации: глиняной дощечки, папируса, бересты и т. д. Дальнейшее развитие технологии привело к появлению более сложного репертуара форм языка и дискурса — таких, как печатный дискурс, телефонный разговор, радиопередача, общение при помощи пейджера и автоответчика, наконец, переписка при помощи компьютеров и затем мобильных устройств. Все эти разновидности дискурса выделяются на основе типа носителя информации и имеют свои особенности. В частности, общение по электронной почте, возникшее в 1990-е гг. и получившее за это время огромное распространение, представляет собой письменный дискурс с некоторым устным «акцентом». Подобно письменному дискурсу, электронный дискурс использует графический способ фиксации информации, но подобно устному дискурсу он отличается мимолетностью и неформальностью. Еще более явным примером соединения особенностей устного и письменного дискурса является общение при помощи мессенджеров. Исследование 142 А. А. Кибрик особенностей электронной (цифровой, сетевой, компьютерно-опосредованной) коммуникации является одной из активных областей современного дискурсивного анализа (см., напр., Baron 2000; Mehler et al. eds. 2010; Herring, Androutsopoulos 2015; Bou-Franch, Garcés-Conejos Blitvich eds. 2019). Помимо двух фундаментальных разновидностей дискурса — устной и письменной — следует упомянуть еще одну: мысленную. Человек может пользоваться языком, не оставляя при этом ни акустических, ни графических следов языковой деятельности. В этом случае язык также используется коммуникативно, но одно и то же лицо является и говорящим, и адресатом. В силу отсутствия наблюдаемых следов мысленный дискурс исследован гораздо меньше, чем устный и письменный. Одно из наиболее известных исследований мысленного дискурса, или внутренней речи, принадлежит психологу Л. С. Выготскому (1934). 4.3.2. Жанр. Более частные, но также очень важные различия между разновидностями дискурса описываются с помощью понятия ж а н р. Это понятие первоначально использовалось в литературоведении для различения таких видов литературных произведений, как, напр., новелла, эссе, повесть, роман и т. д. М. М. Бахтин (1953) предложил более широкое понимание термина «жанр», распространяющееся не только на литературные, но и на другие речевые произведения. В настоящее время понятие жанра широко используется в дискурсивном анализе. Исчерпывающей классификации жанров не существует, но в качестве примеров можно назвать бытовой диалог (беседу), рассказ, инструкцию по использованию прибора, интервью, репортаж, доклад, политическое выступление, рекламное выступление, проповедь и т. д. Эти различия интуитивно очевидны, но определить их объективно оказывается очень непросто, так же как и построить удовлетворительную классификацию жанров или хотя бы определения отдельных жанров. Существует несколько подходов к определению жанров. Эти подходы можно обозначить как социологический, схематический и лексико-грамматический. Социологический подход представлен в работах Дж. Суэйлса (Swales 1990), который предложил определять жанры как атрибуты дискурсивных сообществ и как реализации типовых коммуникативных намерений, характерных для таких сообществ. Например, в сообществе людей, занимающихся бизнесом, есть типовое коммуникативное намерение «обратиться к некоторой фирме с деловым предложением». Для реализации этого намерения существует специальный жанр «деловое письмо», который является в высокой степени стандартизованным в конкретных культурно-языковых сооб- Дискурс 143 ществах бизнесменов (Kong 1998). Существует множество частных исследований жанров — напр., жанра русского анекдота (Шмелева, Шмелев 2002). Схематический подход связан с выделением стандартной дискурсивной структуры, характерной для дискурсов того или иного жанра. Такая стандартная структура именуется ж а н р о в о й с х е м о й; в работах Т. ван Дейка использовался близкий по смыслу термин «суперструктура» (ван Дейк 1989). Так, деловое письмо, согласно Kong 1998, имеет следующую стандартную схему (вариант английских бизнесменов Гонконга): — источник сведений о фирме-адресате; — суть предложения; — история своей фирмы; — обоснование предложения; — формулировка условий; — другие предложения; — сердечное завершение. Существование жанровых схем показывает, что в дискурсе присутствует элемент соссюровского языка как системы, то есть статический элемент долговременного хранения в памяти, ср. обсуждение в разделах 4.1 и 4.6. Жанровые схемы являются важным научным обобщением, но из них не следует конкретных сведений о том, каковы языковые характеристики дискурсов определенного жанра. По этой причине сформировался лексико-грамматический подход, цель которого — научиться идентифицировать конкретные дискурсы как принадлежащие к определенным жанрам на основании языковых характеристик. Некоторые из таких ожидаемых характеристик лежат на поверхности. Так, можно ожидать, что в рассказе предикаты будут часто оформлены глагольными формами в прошедшем времени совершенного вида, а между клаузами будут встречаться временные коннекторы типа потом. Американский лингвист Д. Байбер задался вопросом: можно ли приписать жанрам как культурным концептам устойчивые языковые характеристики? В масштабном исследовании (Biber 1989) он описал жанрово разнообразный корпус, содержащий 481 текст, при помощи 67 эмпирически наблюдаемых и количественно измеримых морфосинтаксических и лексических параметров — таких, как использование форм прошедшего времени, использование причастий, использование личных местоимений и т. п. Эти параметры были затем объединены в 5 групп сходно варьирующих признаков. В таком 5-мерном пространстве все тексты объединились в 8 кластеров, которые Байбер назвал «типами текстов». Оказалось, что эти типы текстов достаточно ограниченно коррелируют с жанрами как с культурно отождествимыми концеп- 144 А. А. Кибрик тами. Например, большинство текстов, отнесенных к жанру «личный телефонный разговор», попали в тот тип текста (один из восьми), который Байбер обозначил как «близкое межличностное взаимодействие». Но это большинство составляет всего лишь 62%, т. е. степень корреляции невелика. Основной вывод Байбера относительно языковых характеристик жанров носит отрицательный характер: жанры неоднородны с лексико-грамматической точки зрения. Причина отрицательного результата Байбера состоит, скорее всего, в следующем. Устойчивыми морфосинтаксическими и лексическими характеристиками обладают не типы дискурсов (т. е. жанры), а типы изложения, или т и п ы п а с с а ж е й, т. е. фрагментов дискурса. Обычно (см. напр., Longacre 1992; Graesser, Goodman 1985) выделяются следующие типы пассажей: — — — — — нарративный (повествовательный); дескриптивный (описательный); экспозиторный (объяснительный); инструктивный; персуазивный (убеждающий). О некоторых из этих типов пассажей известно, что они имеют типичные языковые характеристики. Примеры таких характеристик приводятся в табл. 4.2. Тип пассажа Характерные морфосинтаксические или лексические явления нарративный дескриптивный экспозиторный инструктивный персуазивный прошедшее время, совершенный вид стативные предикаты показатели обобщения императивы модальные предикаты типа нужно Таблица 4.2. Характерные языковые признаки типов пассажей Далее, дискурс определенного жанра не обязательно является однородным с точки зрения типа пассажа. Например, рассказ в первую очередь состоит из нарративных пассажей, но в нем также, как правило, присутствует ориентация — начальный дескриптивный тип пассажа. А если так, то нельзя ожидать, что даже один рассказ будет однородным с точки зрения языковых характеристик типа тех, что приведены в табл. 4.2. Тем более неудивительно, что в корпусе Байбера жанры оказались в целом неоднородны с лексикограмматической точки зрения. Дискурс 145 Таким образом, лексико-грамматическое определение жанров, а в пер спективе и классификация жанров, вероятно должны строиться на основе первоначального детального исследования типов пассажей. Жанровые схемы можно рассматривать как конфигурации типов пассажей. Тогда, возможно, и жанры в целом могут получить лексико-грамматическое определение. Помимо модуса и жанра, обсужденных здесь относительно подробно, есть и другие важные таксономические параметры дискурсов, в частности функциональный стиль (кратко упомянутый в разделе 4.3.1) и формальность; см. А.А. Кибрик 2009. Иногда для обозначения самых разных таксономических типов дискурса используется родовой термин «регистр», см., напр., Staples et al. 2015. Типы дискурса настолько разнообразны, что суще ствующие на сегодняшний день модели дискурса обычно хорошо применимы лишь к какому-то из этих типов. Многие актуальные проблемы дискурсивного анализа для разных типов дискурса решаются по-разному. В связи с этим дискурсивный анализ остается мозаичной дисциплиной. 4.4. Структура дискурса Другой центральный круг вопросов, исследуемых в дискурсивном анализе — вопросы с т р у к т у р ы дискурса. Это вполне естественно: вопросы об устройстве изучаемого явления возникают в любой эмпирической дисциплине. Следует различать разные уровни структуры дискурса — макроструктуру, или глобальную структуру, и микроструктуру, или локальную структуру. Глобальная структура дискурса — это членение на крупные составляющие: эпизоды в рассказе, абзацы в газетной статье, группы реплик в устном разговоре и т. д. В противоположность глобальной структуре, локальная структура дискурса — это членение дискурса на минимальные составляющие, которые имеет смысл относить к дискурсивному уровню. Иерархическое членение дискурса — от глобальной до локальной структуры — схематиче ски изображено на рис. 4.1. Понятно, что между уровнями глобальной и локальной структуры нет жесткой разделительной линии. Это два полюса среди уровней структуры дискурса. 4.4.1. Глобальная структура. Из чего состоит г л о б а л ь н а я с т р у к т у р а дискурса? Иными словами, на какие крупные части распадается дискурс? На этот вопрос нельзя ответить единым образом для всех жанров. Не существует единой теории структуры дискурса для всех жанров. Роман 146 А. А. Кибрик Рисунок 4.1. Иерархическая структура дискурса «Война и мир» — это дискурс. Двухминутный разговор по телефону — это тоже единый, целый дискурс. И тот, и другой дискурс имеют глобальную структуру. Примеры, рассматриваемые ниже, — это в основном небольшие образцы дискурса, части их глобальной структуры тоже имеют соответствующий объем. П р и м е ч а н и е. Здесь используется термин «глобальная структура», а не «макроструктура», поскольку последний термин был использован в специфическом понимании в трудах известного нидерландского исследователя дискурса Т. ван Дейка (1989). Согласно ван Дейку, макроструктура — это обобщенное описание основного содержания дискурса, которое адресат строит в процессе понимания. Макроструктура представляет собой последовательность макропропозиций, т. е. пропозиций, выводимых из пропозиций исходного дискурса по определенным правилам (так наз. макроправилам). К числу таких правил относятся правила сокращения (несущественной информации), обобщения (двух или более однотипных пропозиций) и построения (т. е. комбинации нескольких пропозиций в одну). Макроструктура строится таким образом, чтобы представлять из себя полноценный текст. Макроправила применяются рекурсивно, поэтому существует несколько уровней макроструктуры по степени обобщения. Фактически макроструктура по ван Дейку в других терминах называется рефератом или резюме. Макроструктуры соответствуют структурам долговременной памяти — они суммируют информацию, которая удерживается в течение достаточно длительного времени в памяти людей, услышавших или прочитавших некоторый дискурс. Построение макроструктур слушающими или читающими — это одна из разновидностей так называемых стратегий понимания дискурса. Дискурс 147 Между крупными фрагментами дискурса наблюдаются границы, которые помечаются относительно более длинными паузами (в устном дискурсе), графическим выделением (в письменном дискурсе), специальными лексическими средствами (такими служебными словами или словосочетаниями, как а, так, наконец, что касается и т. п.). Внутри крупных фрагментов дискурса наблюдается единство — тематическое, референциальное (т. е. един ство участников описываемых ситуаций), временнóе, пространственное, событийное. Различными исследованиями, связанными с глобальной структурой дискурса, занимались Т. ван Дейк (1989), Э. Шеглофф (Schegloff 1999), А. Н. Баранов и Г. Е. Крейдлин (1992), Е. В. Падучева (1965, 1995), Б. Грос и К. Сиднер (Grosz, Sidner 1986), Д. Кристеа (Cristea et al. 1998) и др. В письменном дискурсе есть наглядный способ маркирования глобальной структуры — графический а б з а ц. Люди, использующие письменный русский язык, очень привыкли к абзацам как графическому средству. Надо, однако, понимать, что абзацы не являются неотъемлемой характеристикой письменного дискурса и возникли в истории письма лишь с некоторого этапа. Явление абзаца как элемента глобальной структуры порождает целый ряд исследовательских вопросов, в том числе следующие. 1. На каких основаниях пишущий ставит границу абзаца и что это дает читающему? Имеет ли абзац самостоятельное семантическое содержание или границы абзацев автоматически выводимы из семантики контекста? 2. Имеет ли абзац какие-либо устойчивые соответствия в устном дискурсе? Если да, какие? Если нет, то как мы без него обходимся, когда говорим устно? Что касается первой группы вопросов, обычно предполагается, что граница абзаца — это смена топика (Brown, Yule 1983: 95ff.), или, в других терминах, снижение связности. Связность обычно понимается как совокупность общих для фрагмента дискурса характеристик. Так, Т. Гивон различает референциальную, временнýю, пространственную и событийную связность (Givón 1990: 896). Таким образом, на границе ожидается разрыв по крайней мере одного из типов связности — смена действующих лиц, смена времени или места излагаемых событий, разделенность самих этих событий. Более полувека назад Е. В. Падучева (1965) пыталась определить единство абзаца на основе употребления кореферентных ИГ, т. е. на основе только одного вида связности — референциальной. Согласно обнаруженной ею тенденции, в первом предложении абзаца вводится новый референт, а в последующих — нет. Рассмотрим в качестве примера фрагмент рассказа Бориса Житкова «Над водой», в котором были убраны границы абзацев. 148 А. А. Кибрик 1. Аппарат набирал высоты, выше и выше, шел к сежным облакам, которые до горизонта обволокли небо плотным куполом. 2. Там, выше этих облаков, — яркое-яркое солнце, а внизу ослепительно белая пустыня — те же облака сверху. 3. Два мотора вертели два винта. 4. За их треском трудно было слушать друг друга пассажирам, которые сидели в каюте аппарата. 5. Они переписывались на клочках бумаги. 6. Некоторые не отрываясь глядели в окна, другие, наоборот, старались смотреть в пол, чтобы как-нибудь не увидать, на какой они высоте, и не испугаться, но они чувствовали, что под ними, и от этого не могли больше ни о чем думать. 7. Дама достала книжку и не отрываясь в нее смотрела, но ничего не понимала. 8. «А мы все поднимаемся», — написал на бумажке веселый толстый пассажир, смотревший в окно, своему обалдевшему соседу. 9. Тот прочел, махнул раздраженно рукой, натянул еще глубже свою шляпу и ниже наклонился к полу. 10. Толстый пассажир достал из саквояжа бутерброды и принялся спокойно есть. 11. А впереди, у управления, сидели пилот, механик и ученик. 12. Все были тепло одеты, в кожаных шлемах. 13. Механик знаками показывал ученику на приборы: на альтиметр, который показывал высоту, на манометры, показывавшие давление масла и бензина. 14. Ученик следил за его жестами и писал у себя в книжечке вопросы корявыми буквами — руки были в огромных теплых перчатках. 15. Альтиметр показывал 800 метров и шел вверх. 16. Уже близко облака. (Б. Житков, «Над водой».) В тексте этого фрагмента, как он был опубликован в сборнике рассказов Житкова, есть 5 абзацев — они начинаются с предложений 1, 3, 8, 9 и 11. Абзацы перед предложениями 8 и 9 носят характер графической условно сти — они обусловлены тем обстоятельством, что предложение 8 — это прямая речь, и она может быть выделена как отдельный абзац. Поэтому эти границы не представляют для нас большого интереса и далее не обсуждаются. Граница перед предложением 11 имеет формальный маркер — частицу а. С точки зрения структуры связности, здесь происходит пространственный сдвиг — действие перемещается из одного пространства (каюта) в другое (кабина пилота). Одновременно происходит референциальный сдвиг — переход от одной группы участников событий (пассажиры) к другой (экипаж). Граница абзаца перед предложением 3 обусловлена еще более существенным пространственным сдвигом, который можно описать как смену перспективы, то есть точки отсчета, из которой автор предлагает смотреть на описываемые объекты и события. В первом абзаце мы смотрим на самолет из атмосферы, он представляет собой объект, движущийся по небу, а начиная с 3 предложения перспектива переносится внутрь самолета, и релевантный фрагмент действительности ограничивается корпусом самолета. Дискурс 149 Таким образом, две существенные границы в этом фрагменте — перед предложениями 3 и 11. Границу перед предложением 1 в рамках данного отрывка проинтерпретировать нельзя, т.к. не дан предтекст. В течение ряда лет студентам МГУ, изучающим дискурсивный анализ, предлагалось следующее задание. Они получали вышеприведенный фрагмент рассказа Бориса Житкова с убранными границами абзацев. Каждый студент должен быть самостоятельно поставить границы абзацев в тех местах, где это ему представлялось необходимым. При этом было сообщено, что предложение 1 представляет собой начало абзаца. В табл. 4.3 приведены результаты одного из таких экспериментов. Список предложений, перед 1 которыми следует поставить 3 границу абзаца 11 1 7 11 1 3 7 1 3 7 11 1 3 15 1 3 11 15 1 3 7 10 11 13 7 10 11 15 Количество студентов, пред11 ложивших данный вариант 3 1 1 1 10 1 2 Всего: 30 Таблица 4.3. Результаты эксперимента по расстановке границ абзацев Границы перед предложениями 3 и 11 оказались очень существенными. Только три человека (10 %) не поставили границу перед предложением 3, и только двое (7 %) не поставили границу перед предложением 11. Из этого следует несколько выводов. Во-первых, безусловно, границы абзацев перед предложениями 3 и 11 не являются простой графической условностью. Они маркируют границы между компонентами глобальной структуры дискурса, и носители языка с 90-процентной вероятностью сходятся в том, где эти границы находятся. Во-вторых, абзацы во многом представляют собой избыточную информацию. Когда они устранены, носитель языка по другим элементам формы текста все равно в состоянии восстановить те места, где они должны быть. С другой стороны, имеется большое количество случаев, в которых испытуемые данного квазиэксперимента разошлись в своих суждениях. В особенности это касается тех тринадцати человек (целых 43 %!), которые поставили границу перед предложением 15. Вероятно, эти испытуемые проинтерпретировали предложения 15-16 не как продолжение описания того, что происходило в кабине управления и, соответственно, было видно пилоту, механику и ученику, а как нечто с позиций внешнего наблюдателя-рассказчика, то есть усмотрели здесь существенный разрыв связности. Очевидно, это означает, что границы между абзацами не полностью выводимы из 150 А. А. Кибрик прочей формы текста. То, как их расставляет автор или редактор, несет самостоятельную семантическую информацию. Тот факт, что в оригинальном тексте нет границы абзаца перед предложением 15, сигнализирует адресату: предложения 15-16 должны интерпретироваться как часть эпизода 11-16, как то, что происходит в кабине управления и находится в поле зрения экипажа. В принципе, тот факт, что расстановка абзацев не абсолютно безразлична и не абсолютно предсказуема, не слишком отличает абзацы от других элементов текстовой формы. Например, в преподавании иностранного языка иногда используется такой прием, как изъятие из текста всех предлогов и дальнейшее задание их восстановить. Это, казалось бы неестественное, упражнение во многих случаях оказывается осуществимым. Нельзя сказать, что предлоги ничего не значат, но их значение восстановимо из контекста. Еще больше по своим свойствам абзацы напоминают знаки препинания. Они тоже во многом избыточны, но иногда оказываются смыслоразличительными. Абзацы похожи на знаки препинания и в другом отношении — и те, и другие представляют собой бледные аналоги тех языковых средств, которые используются в устном дискурсе. Знаки препинания заменяют в редуцированном и дискретном виде большой репертуар просодических средств устного дискурса. Абзацы, тоже редуцированно и дискретно, заменяют такие маркеры глобальной структуры, как относительно длинные паузы и специальные дискурсивные маркеры. Cуществует ряд типологически-ориентированных работ (напр., Grimes 1975; Hinds ed. 1978; Longacre 1983) о разных языках, в которых термин «абзац» используется нейтрально относительно модуса, т. е. применительно и к устному дискурсу. Согласно этим работам, абзац помечается неким специальным маркером, типа рус ского а — ср. использование этого маркера на границе абзаца в примере, разобранном выше. Существует несколько традиций описания глобальной структуры диалогического дискурса. Во всех случаях в качестве глобальных блоков диалога рассматриваются г р у п п ы р е п л и к. Так, в исследовании Баранов, Крейдлин 1992 была сформулирована модель, основанная на теории речевых актов. Одно из основных понятий этой теории — понятие иллокуции, т. е. намерения, которое говорящий реализует в речевом акте. Авторы предложили понятие иллокутивного вынуждения — отношения между такими парами реплик диалога, в которых первая реплика вызывает или предопределяет вторую. Простейший пример иллокутивно вынуждающего речевого акта — вопрос, вынуждающий ответ. Группы реплик, связанные отношени- Дискурс 151 ями иллокутивного вынуждения, авторы назвали минимальными диалогами или минимальными диалогическими единицами (МДЕ). Другая традиция связана с описанием устного общения и возникла в рамках Анализа бытового диалога. Как уже было упомянуто в разделе 4.2, в этом исследовательском направлении используется понятие смежных пар (adjacency pairs) — групп реплик, весьма похожих на МДЕ (Schegloff, Sacks 1973). 4.4.2. Локальная структура. В противоположность глобальной структуре, л о к а л ь н а я с т р у к т у р а дискурса — это членение дискурса на минимальные составляющие, которые имеет смысл относить к дискурсивному уровню. Во многих исследованиях начиная с 1980-х гг. такими минимальными единицами считаются п р е д и к а ц и и, или к л а у з ы. В работах, ориентированных непосредственно на устный дискурс, используется ряд понятий, основанных на наблюдении, что устный дискурс разворачивается не в виде плавного непрерывного потока, а в виде квантов — или, другими словами, сегментов, шагов, порций, импульсов или толчков. Устный дискурс представляет собой последовательность таких квантов. Сегментация на кванты — это одновременно и теоретическая, и практическая проблема. С теоретической точки зрения важно понять объем квантов и почему он именно такой, каковы признаки границы между ними. С практической точки зрения необходимы критерии, позволяющие с достаточной объективно стью передать локальную структуру устного дискурса, графически отразив его сегментацию в транскрипции. В литературе по сегментации устной речи используются разнообразные термины — синтагмы, интонационные группы, ритмические группы, интонационные единицы, просодические единицы/фразы и т. д. (Щерба 1955; Cruttenden 1986; Светозарова и др. 1988; Chafe 1994: 57; Chafe 2001; Хитина 2004; Кривнова 2007; Stelma, Cameron 2007). В настоящей главе используется термин э л е м е н т а р н ы е д и с к у р с и в н ы е е д и н и ц ы (ЭДЕ), введенный и обоснованный в работах A.A. Kibrik 2000; Литвиненко 2000; А.А. Киб рик, Подлесская ред. 2009; ср. также Carlson et al. 2003, Stede 2012. Этот термин представляется предпочтительным, поскольку он отражает функциональную природу данных единиц, а также позволяет с единых позиций описывать устный и письменный дискурс. ЭДЕ можно выделить на просодическом основании, при этом они обладают следующими чертами (Брызгунова 1977; Николаева 1977; Светозарова и др. 1988: 146–147; Кривнова 1989; Levelt 1989: 308; Chafe 1994: 58–59; А.А. Кибрик, Подлесская ред. 2009): 152 А. А. Кибрик — единый контур частоты основного тона, типично начинающийся с базовой для данного говорящего частотного уровня с дальнейшим подъемом и, часто, падением; — наличие основного акцентного центра, как правило рематического; — характерный громкостный паттерн: затихание к концу; — характерный темповый паттерн: ускорение в начале, замедление к концу; — типичный паттерн паузации: дыхание / планирование пауз на границах, отсутствие пауз в пределах ЭДЕ. Просодически выделенные ЭДЕ имеют тенденцию коррелировать с клаузами. Это явление было обнаружено в целом ряде языков, включая английский (Chafe 1994: 65–66; Croft 1995: 845), японский (Iwasaki 1993), китайский (Tao 1996), тайский (Iwasaki 1996), сасак (Индонезия; Wouk 2008). В корпусе «Рассказы о сновидениях» (А.А. Кибрик, Подлесская ред. 2009) клаузальные ЭДЕ составляют более двух третей из всех ЭДЕ. Среди клаузальных ЭДЕ в «Рассказах о сновидениях» наиболее многочисленную группу представляют канонические ЭДЕ — те, которые содержат лексически полный глагольный предикат. Они составляют 48 % от всех ЭДЕ корпуса. Клаузальные, но неканонические ЭДЕ включают в себя клаузы с неглагольным предикатом и нефинитные клаузы. Неклаузальные ЭДЕ можно разделить на два больших класса: малые и большие. Малые ЭДЕ достаточно хорошо представлены (26 %) в корпусе и включают в себя следующие подклассы: субклаузальные (13,5 %); регуляторные (6,4 %); усеченные ЭДЕ (5,1 %); специальные иллокуции, такие как различные формы обращений, звукоподражания и т. д. (1,0 %). Противоположное отклонение от канонических дискурсивных единиц можно обнаружить в больших ЭДЕ — тех, что передают больше пропозиционального содержания, чем типичная клауза. Большие ЭДЕ составляют 6,3 % всех ЭДЕ корпуса. Причины, приводящие к формированию больших ЭДЕ, разнообразны и включают глагольную сериализацию, редупликацию, инфинитивные и эпистемические конструкции, конструкции с цитацией и т. д. (А.А. Кибрик, Подлесская ред. 2009: глава 7). О типах ЭДЕ см. также Подлесская 2011. С учетом имеющихся отклонений, в целом можно обоснованно сделать следующее обобщение:  С точки зрения локальной структуры, дискурс представляет собой цепочку предикаций. Феномен предикации занимает центральное место в архитектуре языка. Предикация одновременно является единицей хранения в долговременной памяти и единицей речепорождения. Что касается единицы более высокого Дискурс 153 уровня — предложения, — то его роль и в дискурсивной структуре, и в системе хранения информации гораздо скромнее. В исследованиях по воспроизведению ранее полученной вербальной информации обычно выясняется, что распределение информации по предикациям относительно неизменно, а объединение предикаций в сложные предложения значительно более изменчиво. 4.4.3. Теория риторической структуры как интерфейс между локальной и глобальной структурой. В Теории риторической структуры, созданной в 1980-е гг. У. Манном и С. Томпсон (Mann, Thompson 1988), предложен единый подход к описанию глобальной и локальной структуры дискурса. Теория риторической структуры (ТРС) основана на предпосылке о том, что любая единица дискурса связана хотя бы с одной другой единицей данного дискурса посредством некоторой осмысленной связи. Такие связи называются р и т о р и ч е с к и м и о т н о ш е н и я м и. Термин «риторические» указывает на то, что каждая единица дискурса существует не сама по себе, а добавляется говорящим к некоторой другой для достижения определенной коммуникативной цели. Дискурсивные единицы (ДЕ), вступающие в риторические отношения, могут быть самого различного объема — от максимальных (непосредственные составляющие целого дискурса) до минимальных (отдельные предикации). Дискурс устроен иерархически, и д л я в с е х у р о в н е й и е р а р х и и используются одни и те же риторические отношения. В этом смысле ТРС является уникальным инструментом, позволяющим е д и н ы м о б р а з о м представить глобальную и локальную структуру дискурса. В число риторических отношений (всего их более двух десятков) входят такие, как Sequence (последовательность), Volitional result (волитивный результат), Non-volitional result (неволитивный результат), Condition (условие), Concession (уступка), Joint (конъюнкция), Elaboration (детализация), Background (фон), Purpose (цель), Otherwise (альтернатива) и др. ДЕ, вступающая в риторическое отношение, может играть в нем роль я д р а либо с а т е л л и т а. Бóльшая часть отношений асимметрична и бинарна и содержит ядро и сателлит. Например, в паре предикаций Иван вышел рано, чтобы не опоздать на встречу имеет место риторическое отношение цели; при этом первая часть является главной и представляет собой ядро, а вторая является зависимой, сателлитом. Другие отношения, симметричные и не обязательно бинарные, соединяют ядра. Таково, например, отношение конъюнкции: Морж — морское млекопитающее. Он живет на севере. Два типа риторических отношений напоминают противопоставление между подчинением и сочи- 154 А. А. Кибрик нением, а список риторических отношений типа «ядро–сателлит» весьма похож на традиционный список типов обстоятельственных придаточных. Это неудивительно — фактически ТРС распространяет типологию семантико-синтаксических отношений между предикациями на отношения в дискурсе. Для ТРС несущественно, выражено ли данное отношение союзом соответствующей семантики, или запятой, или же оно соединяет независимые предложения или группы предложений. В ТРС разработан формализм, позволяющий представлять дискурс в виде сетей дискурсивных единиц и риторических отношений. Риторическая трактовка в принципе не зависит от того, как внешне оформлена та или иная предикация. Ср. пример (2), в котором всем трем способам выражения соответствует один и тот же риторический граф (рис. 4.2). (2) 1. Иван боялся разбудить ребенка 2а. . Он вошел в комнату на цыпочках. 2б. , поэтому он вошел в комнату на цыпочках. 2в. и вошел в комнату на цыпочках. Рисунок 4.2. Риторический граф, соответствующий примеру (2) Согласно принятому в ТРС формализму, стрелка в асимметричном отношении направлена от зависимого (сателлита) к главному (ядру). (В принципе, стрелки логически избыточны, т. к. вертикальный штрих — см. рис. 4.2 — указывает ДЕ, являющуюся ядром. Поэтому можно пользоваться просто дугами.) Главный критерий выделения ядра состоит в следующем: ядро может выступать как представитель всей группы. В качестве примера можно рассмотреть фрагмент (3) из рассказа Б. Житкова «Над водой». Риторический г р а ф, соответствующий этому примеру, приведен на рис. 4.3. Этот граф содержит случаи как асимметричных, так и симметричных отношений; входящие в симметричное отношение единицы соединяются с объединяющей их единицей косыми штрихами. Читателю предлагается проанализировать этот граф, пользуясь определениями риторических отношений по ссылке: http://www.philol.msu.ru/~otipl/new/main/ courses/discourse/rhetrel.rtf. (3) 1. Два мотора вертели два винта. 2. За их треском трудно было слушать друг друга пассажирам, которые сидели в каюте аппарата. 3. Они переписывались на клочках бумаги. 4. Некоторые не отрываясь глядели в окна, 5. другие, наоборот, старались смотреть в пол, Дискурс 6. 7. 8. 9. 155 чтобы как-нибудь не увидать, на какой они высоте, и не испугаться, но они чувствовали, что под ними, и от этого не могли больше ни о чем думать. Рисунок 4.3. Риторический граф, соответствующий примеру (3) Авторы ТРС специально подчеркивают возможность а л ь т е р н а т и в н ы х т р а к т о в о к одного и того же текста. Иначе говоря, для одного и того же текста может быть построен более чем один граф риторической структуры, и это не рассматривается как дефект данного подхода. Действительно, попытки применения ТРС к анализу реальных текстов сразу демонстрируют множественность решений. Тем не менее, эта множественность очень ограничена. К тому же, принципиальная возможность различных трактовок не противоречит реальным процессам использования языка, а, напротив, вполне им соответствует. Существует ряд весомых подтверждений того, что ТРС в значительной степени моделирует реальность и представляет собой важный шаг в понимании того, как дискурс устроен «на самом деле». Во-первых, сами авторы ТРС приводят процедуру построения резюме (реферата, краткого варианта) текста на основе графа риторической структуры. По определенным правилам многие сателлиты в риторических парах могут быть опущены, а результирующий текст останется связным и вполне репрезентативным по отношению к исходному тексту. Во-вторых, в 156 А. А. Кибрик важной работе Б. Фокс об анафоре в английском дискурсе (Fox 1987) было показано, что выбор референциального средства (местоимение / полная ИГ) зависит от риторической структуры; см. также A.A. Kibrik 2011. ТРС изначально была в основном предназначена для описания письменного дискурса. Однако при определенной модификации ТРС может быть приспособлена и для устного дискурса; такой опыт был предпринят в работе А.А. Кибрик, Подлесская ред. 2009. ТРС позволяет по-новому подойти к некоторым традиционным лингвистическим проблемам, таким как реферирование текста, референциальный выбор, определение дискурсивных жанров. О некоторых расширениях ТРС см. Carlson et al. 2003; Taboada, Mann 2006. Помимо теории У. Манна и С. Томпсон существует еще много моделей дискурсивных семантических отношений, см. Grimes 1975; Reichman 1985; McKeown 1985; Hobbs 1985; Шувалова 1990; Wolf, Gibson 2005. 4.5. Дискурсивные факторы «точечных» языковых явлений (грамматика, лексика, просодия, жесты) Третий основной круг проблем, исследуемых в дискурсивном анализе — в л и я н и е д и с к у р с и в н ы х ф а к т о р о в на более мелкие языковые составляющие — грамматические, лексические, фонетические, невербальные. Например, порядок слов в предикации такого языка, как русский, хотя и является г р а м м а т и ч е с к и м явлением, не может быть объяснен без апелляции к дискурсивным факторам. Порядок слов чувствителен к характеристикам коммуникативной организации высказывания, которые обычно описываются с помощью понятий темы (исходный пункт высказывания) и ремы (основной информационный элемент высказывания). Согласно идее, изначально высказанной чешскими лингвистами (Mathesius 1939; Firbas 1992), более тематические элементы располагаются в предложении раньше, чем более рематические. Предполагаемая универсальность этой тенденции была поставлена под сомнение после ряда исследований, в особенности статьи Р. Томлина и Р. Роудса (Tomlin, Rhodes 1979) об алгонкинском языке оджибва (Сев. Америка), где была замечена прямо противоположная тенденция: тематическая информация располагается позже, чем нетематическая. К настоящему времени накопилось большое количество свидетельств того, что принцип «рематическая информация вначале» (с вариациями: новое вначале, неопределенное вначале, важное вначале, срочное вначале) весьма распространен в языках мира. М. Митун (Mithun 1995) отметила, что принцип «рема вначале» поддерживается просодическими факторами, так как и рема, и начало предикации склонны к просодической выделенности (более высокая амплитуда и более высокая частота). Ряд авторов пытается дать ко Дискурс 157 гнитивные объяснения обоим принципам порядка, однако пока окончательно не выяснено, почему в одних случаях преобладает один принцип, а в других — другой. Русский порядок слов изучался в рамках разных теоретических подходов; одно из наиболее подробных исследований принадлежит американскому русисту О. Йокояме. В книге «Дискурс и порядок слов» (Yokoyama 1986, русский перевод Йокояма 2005) Йокояма предложила когнитивную модель, основанную на состояниях базы знаний говорящего и адресата и призванную полностью объяснить порядок слов в русских высказываниях. Одно из наиболее полных исследований проблематики темо-рематического членения в русском языке принадлежит Т. Е. Янко (2001). Следующее грамматическое явление, объясняемое дискурсивными факторами — выбор между главной и зависимой формой предикации в дискурсе. Согласно гипотезе ряда авторов (см., напр., Labov 1972a; различные статьи в сборнике Haiman, Thompson eds. 1988), этот выбор является иконическим отражением дискурсивной значимости событий: более значимые события, входящие в основную линию дискурса (mainline), или вынесенные на первый план (foregrounded), типично кодируются главными предикациями, а второстепенные события (backgrounded) — зависимыми предикациями. Данное явление наиболее изучено на материале нарративного дискурса. Типовое исключение из общего правила состоит в том, что временные обстоятельственные придаточные могут входить в основную линию, поскольку нарратив строится в первую очередь на основе семантического отношения «последовательность». Есть и множество других грамматических явлений, управляемых дискурсивными факторами — структуры с вынесенным топиком, расщепленные структуры (cleft), конструкции с маркированием переключения референции (switch-reference), конструкции с определительными придаточными, сложносочиненные предложения, различные явления пропозициональной деривации, инверсив, глагольный вид и т. д. См. также Thompson, CouperKuhlen 2005; Mithun 2015. Пример л е к с и ч е с к о г о явления, объясняемого дискурсивными факторами, — референциальный выбор, т. е. выбор наименования лица или объекта в дискурсе. Такое именование может быть выполнено посредством полной именной группы (имени собственного — напр., Сергей, или дескрипции — мой сосед снизу, этот алкоголик), посредством местоимения (напр., он) или даже посредством нулевой формы (как в предложении Пушкин считал, что Ø должен вызвать Дантеса). Такого рода выбор может быть объяснен только посредством сочетания дискурсивных факторов — таких, как рассто- 158 А. А. Кибрик яние до предшествующего упоминания данного участника, роль этого предшествующего упоминания в своей предикации, значимость данного участника для дискурса в целом и т. д. Разные авторы придают особое значение разным факторам (см., напр., различные статьи в сборнике Fox ed. 1996). При этом часто остается неясным, какую роль играют факторы, не являющиеся центральными в конкретном случае — можно ли их влияние счесть пренебрежимо малым или они все же оказывают воздействие на референциальный выбор. Многофакторный когнитивный подход к референциальному выбору был предложен в работах автора этой главы; см. A.A. Kibrik 2011. О проблемах референции см. также Арутюнова 1982; Падучева 1985; Шмелев 1995. Другое лексическое явление, активно исследуемое в связи с влиянием дискурсивных факторов — так называемые дискурсивные маркеры (дискурсивные слова). В самом общем виде дискурсивные маркеры можно определить как лексические средства, помогающие встроить данный фрагмент дискурса в более широкий контекст. К дискурсивным маркерам относятся коннекторы, помечающие структуру дискурса как такового (напр., союзы когда, потому что, но, и и т. д.), а также несколько других категорий единиц: маркеры ментальных процессов говорящего (слова типа вот, ну, так сказать), маркеры контроля над ментальными процессами адресата (слова типа понимаешь, видите ли) и пр. Исследование дискурсивных маркеров является одной из наиболее популярных областей на стыке дискурсивного анализа и лексикологии, см. напр., Schiffrin 1987; Fraser 1999; Maschler, Schiffrin 2015. О русских дискурсивных словах и сходных с ними лексических элементах см. Николаева 1985; Баранов и др. 1993; Киселева, Пайар ред. 1998, 2003. Особая и важная подгруппа дискурсивных маркеров — так называемые маркеры обратной связи (backchannels), которые служат подтверждению того, что собеседник слушает и понимает второго собеседника в диалоге. Это слова типа угу, понятно и т. п. (см., напр., Schegloff 1982). Далее, без учета дискурсивных факторов не могут быть объяснены многие фонетические явления в устном дискурсе — это касается сильного/слабого акцентуирования слов в устной речи, использования интонационных контуров, паузации и других видов д и с к у р с и в н о й п р о с о д и и. Дискурсивная просодия русского языка исследовалась в известных работах Брызгунова 1977; Николаева 1982; Янко 2001. Этап в изучении этого явления связан с именем Сандро Васильевича Кодзасова, см. одну из его первых работ на эту тему Кодзасов 1996 и итоговую книгу Кодзасов 2009. В работах С. В. Кодзасова были рассмотрены такие компоненты просодии, как размещение акцента, направление тона в акценте, интервал тона в акценте, артикуляционная поза, интегральная выделенность, долгота/краткость в акцен- Дискурс 159 те, маркированная фонация и многие другие. С. В. Кодзасов называет свою модель комбинаторной, подчеркивая таким образом автономность различных просодических средств и различных типов значений, которые могут встречаться в разнообразных сочетаниях. Каждый слой просодии, по С. В. Кодзасову, передает некоторый тип дискурсивной семантики. Так, размещение акцента зависит от категории данного/нового. Восходящий тон в главном акценте иконически кодирует ожидание продолжения, незавершенность, а нисходящий, напротив, завершенность. Долгота кодирует большое расстояние (физическое, временное или ментальное), и т. д. Комбинаторная модель просодии противопоставлена подходу, выделяющему несколько интонационных контуров со сложной формальной структурой и комплексной семантикой. Многие идеи С. В. Кодзасова были взяты за основу подхода к локальной дискурсивной структуре, реализованного в монографии А.А. Кибрик, Подлесская ред. 2009; см. также Коротаев 2015. Просодия английского языка описана в таких работах, как Cruttenden 1986; Pierrehumbert, Hirschberg 1990; Barth-Weingarten et al. eds. 2009. Просодия представляет собой невербальный, но вокальный информационный канал, всегда используемый в устной речи. Помимо этого, речь сопровождается невокальным поведением, которое в целом можно обозначить как кинетическое. К кинетическому поведению относятся ж е с т ы рук, головы, других частей тела. Жесты согласованы с вербальным дискурсивным поведением и, таким образом, также представляют собой формальные единицы, находящиеся под воздействием дискурсивных факторов. Исследование жестикуляции является одним из устоявшихся направлений научной работы на кафедре теоретической и прикладной лингвистики филологического факультета МГУ, см. Николаева 2002, 2004, 2013. Проблематика сопровождающей речь жестикуляции и, шире, мультиканальной коммуникации рассматривается в главе 12 в наст. изд. 4.6. Когнитивное и социальное измерения дискурса Лингвистика имеет длительную традицию автономизации. Автономная лингвистика основывается на идее, что языковая система может быть описана и объяснена в пределах себя самой, без апелляции к другим феноменам (таким, как психика, мышление, мозг, анатомия и физиология человека, общество, культура и т. д.). Сторонники автономного подхода обычно характеризуют любое объяснение языковых фактов, опирающееся на внешние по отношению к языку феномены, как «не лингвистику». Самая могущественная школа в современной лингвистике, придерживающаяся позиций автономизации, — это генеративная грамматика. В 1970-80-е гг. как реакция на 160 А. А. Кибрик автономную лингвистику возник целый ряд направлений, основанных на прямо противоположном тезисе — тезисе о том, что язык тесно связан с к о г н и т и в н ы м и функциями человека. Если язык является частью объемлющей когнитивной системы, то естественно ожидать, что многие языковые явления могут найти свое объяснение в когнитивных функциях. К числу первых работ современной эпохи, выдвинувших на первый план эту идею, относятся Chafe 1974; Звегинцев 1996 (издание ранее написанных работ); Lakoff, Johnson 1980; А.Е. Кибрик 1983. К о г н и т и в н а я л и н г в и с т и к а в нынешнем контексте — ветвь лингвистического функционализма (см. Демьянков 1995; А.А. Кибрик, Плун гян 1997), считающего, что языковая форма производна от функций языка. Однако разные направления функционализма сосредотачиваются на разных типах функций — напр., семантических ролях, связности текста, коммуникативных установках и т. д. Когнитивное направление функционализма особо выделяет роль когнитивных функций и предполагает, что остальные функции выводимы из них или сводимы к ним. Как писал А. Е. Кибрик, «в основе современного когнитивного подхода к языку лежит идея целена правленной реконструкции когнитивных структур по данным внешней языковой формы. Реконструкция опирается на п о с т у л а т о б и с х о д ной когнитивной мотивированности языковой формы: в той мере, в какой языковая форма мотивирована, она “отражает” стоящую за ней когнитивную структуру» (А.Е. Кибрик 2008: 205). Между различными когнитивными феноменами пролегает фундаментальное различие с точки зрения того, какова их роль по отношению к языку. Одни из них ответственны за использование языка в реальном времени, в режиме on-line. К когнитивным феноменам типа on-line относятся, в частности, рабочая память, внимание, активация, сознание. Эти феномены связаны с коммуникативной функцией языка — функцией передачи информации от одного человека к другому. Феномены другого типа не имеют прямого отношения к функционированию языка в реальном времени, а связаны с языком как средством хранения и упорядочения информации — это феномены типа off-line. К феноменам второго типа относятся долговременная память, система категорий и категоризация, структуры представления знаний, лексикон и т. д. Эти феномены связаны с функцией языка как системы долговременного хранения информации в голове носителя языка. Направление, ныне официально известное как «когнитивная лингвистика», оформилось в Северной Америке и Западной Европе в 1980-е гг. Это направление фактически ýже, чем вся совокупность исследований, посвя- Дискурс 161 щенных связи языка с когнитивной системой. В современной лингвистике сложилась такая ситуация, что понятия «когнитивная лингвистика», «когнитивный подход» ассоциируются в основном с работой в области исследования категорий, лексической семантики, метафоры и т. д., то есть явлений типа off-line. Большинство исследований, появляющихся под рубрикой «когнитивная лингвистика», объединены не только представлением о ко гнитивной мотивированности языковых явлений, но и следованием одной из двух наиболее известных школ, связанных с именами Дж. Лакоффа (напр., Lakoff 1987) и Р. Лангакера (Langacker 1987/1991). Проблематика когнитивнолингвистических работ обсуждается в обзорах Демьянков 1994; Кубрякова 1994; Рахилина 1997; Ченки 1997, а также в главе 7 в наст. изд. В последнее время ситуация начала меняться, и «когнитивная лингви стика» все чаще включает и дискурсивные исследования, т. е. явления типа on-line, процессы построения и понимания дискурса. Несомненно, когнитивный подход применим и продуктивен в области явлений типа on-line не в меньшей степени, чем в области семантики; см. van Hoek et al. eds. 1999; А.А. Кибрик и др. ред. 2015. Противопоставление и переплетение структуры и функционирования характерны не только для языка, но и для всего живого. Существуют два возможных взгляда на любой живой объект — с точки зрения его структуры и с точки зрения его функционирования. В биологических науках выделяются два раздела — анатомия и физиология. Анатомия — наука о структуре организма, о его составляющих — крови, скелете, мышцах и т. д. Но не менее важно понять, как это тело функционирует, и этим занимается физиология. Анатомия связана со статической структурой, физиология — с динамиче ским ее использованием, употреблением. Можно было бы прокламировать идею, что физиология не имеет значения, мы изучаем только то, что можно пощупать. Но вряд ли есть приверженцы такой идеи в биологии, т. к. человеческое сознание всегда задается вопросом: а для чего это нужно? Для чего нужно сердце? Для чего нужны мышцы? Как организм выживает при помощи этих органов? Любой вопрос такого типа приводит нас в область физиологии, performance, on-line. Аспекты off-line и on-line постоянно переплетаются. Хотя это противопоставление фундаментально, оно не дискретно. Почему? Потому что, вопервых, употребление формирует структуру: любой анатомический элемент существует, потому что он выполняет какие-то функции или выполнял их когда-то. Детерминация формы со стороны функции не является абсолютной. Если бы она была абсолютной, то все живые организмы были бы одинаковыми, а в области языка — были бы одинаковыми все языки. Поэтому 162 А. А. Кибрик есть и обратная зависимость — структура, сформировавшаяся к данному моменту, накладывает ограничения на функционирование. Поэтому при описании любого языкового явления важно стараться понять, в какой мере его форма определяется его функцией, а в какой мере имеющаяся форма, каким-то образом кристаллизованная в языке, ограничивает возможности употребления. В целом, чем больше языковая составляющая, тем в целом неестественнее отрешаться от аспекта on-line. Отчасти это связано с количеством единиц: фонем — несколько десятков, слов — несколько десятков тысяч, дискурсов — бесконечное открытое множество, они никогда не повторяются. Хотя в них можно усмотреть повторяющиеся модели (см. раздел 4.3.2), но процессы их продуцирования, их развертки во времени являются более важными. Основой когнитивного взгляда на дискурс и язык вообще является учет того факта, что, пользуясь языком, мы оперируем з н а н и я м и. Использу емые знания лишь отчасти эксплицируются в дискурсе, большая роль принадлежит имплицитным знаниям. Дисциплина, изучающая вопросы им плицитных знаний, традиционно именуется прагматикой. Операции над знаниями выполняются при помощи таких когнитивных систем, как сознание, мышление, внимание, память, категоризация. Таким образом, когнитивный взгляд на дискурс связан с изучением внутренних процессов, происходящих в мозгу и уме говорящего индивида. Очевидно в то же время, что дискурс предполагает, как правило, более од ного участника. Между двумя, несколькими или многими индивидами разворачивается коммуникация как некоторый обмен знаниями, оценками, эмоциями. Отсюда следует с о ц и а л ь н ы й аспект дискурса. Даже элементарный коммуникативный акт между двумя людьми предполагает роли говорящего и адресата. Это простейшие социальные роли, представленные в коммуникативном акте. Конечно, для коммуникации важны и многие более устойчивые социальные роли (гендерные, этнические, возрастные, статусные, профессиональные). Несомненно, различные виды социального взаимодействия относятся к числу наиболее базовых функций языка. Так, в исследованиях М. Б. Бергельсон (2007: 26) выделяются следующие коммуникативные функции языка: — — — — информирующая функция (включая запрос информации); функция взаимодействия и воздействия на адресата; аффективная функция (оценка, эмоции); изобразительная функция (в т.ч. языковая игра). Дискурс 163 В книге М. Томаселло (2011), исследующей самые первичные социальные взаимодействия в фило- и онтогенезе, указываются следующие основные коммуникативные мотивы: • просьба; • информирование (с целью помочь); • приобщение (sharing). Между когнитивным и социальным аспектами дискурса нет противоречия. Напротив, эти аспекты с о г л а с о в а н ы между собой. Исходным пунктом для любого акта коммуникации является коммуникативное намерение в когнитивной системе говорящего. Это коммуникативное намерение затем разворачивается в семантическую сеть и во внешнюю дискурсивную форму. Коммуникативные намерения в индивидуальном уме говорящего формируются в соответствии с фактором адресата (Арутюнова 1981) или с моделью психического (theory of mind; Premack, Woodruff 1978). Говорящий должен постоянно отслеживать знания, установки, намерения собеседника, без этого коммуникация не будет успешной. В целом можно заключить, что внутренние когнитивные процессы индивида нужны для того, чтобы обеспечить коммуникацию, а протекающие коммуникативные процессы, в свою очередь, постоянно индуцируют когнитивные процессы в умах коммуникантов. 5. Семантика 1 И. М. Кобозева, С. Г. Татевосов С е м а н т и к а (Semantics) — раздел лингвистики, который изучает, как при помощи естественного языка (ЕЯ) осуществляется передача информации2. Язык — относительно устойчивая система знаков, структурирующих и кодирующих опыт, полученный в результате взаимодействия людей с окружающим миром и себе подобными. Этот код служит средством сообщения знаний, мнений, выражения переживаемых состояний не только между теми, кто находится в непосредственном общении, но и теми, кто разделен во времени. Знаки языка (морфемы, слова, синтаксические и итонационные конструкции) наделены относительно стабильным з н а ч е н и е м. При этом на их сочетаемость друг с другом и условия их уместного употребления налагаются определенные ограничения. Выявление и описание значений, а также с о ч е т а е м о с т н ы х о г р а н и ч е н и й языковых знаков на уровне морфем входит в задачи м о р ф е м н о й, на уровне слов — л е к с и ч е с к о й, на уровне предложений — с и н т а к с и ч е с к о й с е м а н т и к и. Когда знаки ЕЯ употребляются в речи, передаваемая ими информация вступает во взаимодействие с экстралингвистической информацией, как ситуативной, т. е. поставляемой конкретной ситуацией общения, так и энциклопедической, хранящейся в памяти коммуникантов. В результате такого взаимодействия закодированная знаками ЕЯ информация меняется, а к т у а л и з и р у е т с я, превращаясь из абстрактного языкового значения в конкретный с м ы с л, существенными аспектами которого являются соотнесенность с объектами и ситуациями действительного или возможного мира (р е ф е р е н ц и я) и коммуникативное намерение говорящего (и л л о к у т и в н а я ф у н к ц и я). Соотнесенность высказывания и употребленных в его составе именных выражений с действительностью изучается в т е о р и и р е ф е р е н ц и и. Механизмы выражения говорящим коммуникативного намерения своего высказывания и понимания этого намерения слушающим изучает л и н г в и с т и ч е с к а я п р а г м а т и к а, рассматриваемая как интегральная часть лингвистической семантики. Раздел 5.5 написан С. Г. Татевосовым, остальные разделы написаны И. М. Кобозевой. 2 Раздел «семантика» выделяется также в логике. 1 Семантика 165 Пререквизиты: Морфология, Синтаксис. 5.1. Введение 5.1.1. Значение как неотъемлемая принадлежность языкового знака 5.1.2. Типы информации, заключенной в значении знаков ЕЯ 5.2. Лексическая семантика 5.2.1. Лексическое значение vs. грамматическое значение 5.2.2. Лексическое значение vs. понятие 5.2.3. Системные отношения между значениями слов 5.2.4. Методы выявления и представления лексического значения 5.2.5. Лексико-синтаксическая информация Семантические валентности слова Сочетаемость слова 5.2.6. Лексическая многозначность Виды неоднозначности Когнитивные механизмы появления у слова нового значения 5.3. Семантика словосочетания: свободные словосочетания vs. фразеологизмы 5.4. Семантика предложения-высказывания 5.4.1. Пропозициональное содержание предложения 5.4.2. Коммуникативный компонент значения предложения 5.4.3. Прагматический компонент смысла предложения-высказывания 5.5. Формальная семантика 5.5.1. Семантика на маленьком примере 5.5.2. Означаемое, домены, логические типы, функции 5.5.3. Интерпретация и композициональность 5.5.4. Дальнейшие действия Литература для дальнейшего чтения: Апресян 1974; Падучева 1985, 2004; Анна А. Зализняк 2006; Иорданская, Мельчук 2007; Янко 2001; Вежбицкая 1999; Лакофф, Джонсон 2008; Кобозева 2012; Heim, Kratzer 1998; Portner 2005. 5.1. Введение Первоначально круг вопросов, которые впоследствии вошли в компетенцию лингвистической семантики, разрабатывался в рамках ф и л о с о ф и и 3. Философия языка (philosophy of language) стала одним из разделов философии, посвященным изучению самых общих вопросов, связанных с отношением между языком, теми, кто его использует, и миром. Раздел «Философия зыка» по традиции выделяется также в рамках учебного курса «Общего языкознания». В нем трактуются, в числе прочих, и некоторые общие вопросы семантики, см., напр., раздел «Лингвосемиотика. Язык как система знаков», относимый к ведению философии языка («лингвофилософии») в Даниленко 2009: 8–9. 3 166 И. М. Кобозева, С. Г. Татевосов Так, современные представления о соотношении иконичности (изобразительности, мотивированности формы языкового знака его значением) и условности (конвенциональности) знаков ЕЯ уходят своими корнями в философский спор о том, как связаны вещь и ее имя — по природе вещи или по установлению людей, представленный в диалоге Платона «Кратил». Ряд понятий, которыми оперирует современная семантика (напр., денотат, сигнификат), восходит к средневековой схоластической философии. Используемые современными лингвистами метаязыки для представления значения единиц языка и смысла высказываний в идейном отношении близки к универсальным языкам мысли, которые пытались создавать в эпоху Просвещения многие философы, в частности Г. Лейбниц и И. Ньютон. Существенную роль в развитии лингвистической семантики сыграла л о г и к а. В рамках логики был заложен фундамент т е о р и и р е ф е р е н ц и и. Многие важные понятия лингвистической семантики были впервые введены логиками, напр., понятие пресуппозиции (в оригинале нем. Voraus zetzung), введенное Г. Фреге, или импликатуры (implicature), введенное П. Грайсом. Языки логических исчислений приспосабливаются лингвистами для целей формального представления смысла предложений. Полноправным предметом лингвистического исследования содержатель ная сторона знаков ЕЯ становится лишь в ХIХ в., когда господствующим стал сравнительно-исторический метод исследования языков. В этот период началось не умозрительное, а эмпирическое изучение значения языковых знаков, конкретнее, тех изменений, которым подвергаются значения слов с течением времени. Данный раздел лингвистики первоначально было предложено назвать с е м а с и о л о г и е й, нем. Semasiologie (Reisig 1839). Однако в качестве общего названия для области лингвистики, которая исследует то, как устанавливается соответствие между формой языкового выражения и его значением / смыслом, был принят термин с е м а н т и к а (в оригинале фр. Sémantique), предложенный в Bréal 1897. Настоящий расцвет семантики начинается в 1960-е гг. Если ранее семантическая проблематика разрабатывалась преимущественно на материале лексики, то с появлением в 1960-е гг. структуралистских теорий интегрального описания языка, задающего соответствие между значением предложения и его звуковой формой — Теории порождающих грамматик (Chomsky 1965), Теории моделей «Смысл» ⇔ «Текст» (Мельчук 1974) и им подобных — возникла необходимость в описании значений единиц всех уровней анализа языка, начиная с морфологического и кончая уровнем предложения, а также построения правил объединения значений единиц нижестоящего уровня, следуя которым мы получим адекватное описание значения по Семантика 167 строенной из них единицы вышележащего уровня. А поскольку свой вклад в значение предложения вносят не только значения слов как единиц словаря, но и значения грамматических морфем, синтаксических конструкций, просодических маркеров, то область семантических исследований существенно расширилась, включив в себя помимо лексической семантики также семантику морфологическую и синтаксическую, к которой может быть отнесена и семантика линейно-акцентных структур (Янко 2001; Падучева 2016). Следует отметить, что вопросы семантики, относящиеся к уровню морфем, по сложившейся традиции относятся к компетенции морфологии и словообразования. В 1970-е гг. получает развитие л и н г в и с т и ч е с к а я п р а г м а т и к а, возникшая на базе т е о р и и р е ч е в ы х а к т о в, разработанной в рамках философского направления, именуемого «лингвистической философией», или «философией обыденного языка» (Austin 1962; Searle 1969)4. Лингвистическая прагматика перешла от анализа предложения как единицы языка, к анализу высказывания — того же предложения, но рассматриваемого как единица речи, или дискурса, то есть с учетом коммуникативной цели говорящего и конкретного языкового и экстралингвистического контекста, в котором оно было или может быть употреблено. Поскольку объектом исследования в лингвистической прагматике остается соответствие между формой высказывания и его содержанием — с м ы с л о м 5, вполне правомерным было включение ее в семантику (см, напр., Lyons 1981; Лайонз 2003; Кобозева 2012)6. Примерно в то же время заявляет о себе к о г н и т и в н а я л и н г в и с т и к а (см. раздел 5.3, а также главу 7 в наст. изд.), ядром которой является к о г н и т и в н а я с е м а н т и к а, связывающая значение языковых знаков с познавательными процессами и стремящаяся привести лингвистическое описание семантических явлений в соответствие с данными, получаемыми в к о г н и т и в н о й п с и х о л о г и и (см. главу 6 в наст. изд). Параллельно Анализ этой теории и сопоставление ее с отечественными подходами к построению теории речевой деятельности можно найти в Кобозева 1986. 5 То, что термин смысл неправомерно применять по отношению к предложению, изолированному от контекста его употребления в речи, обосновано в Звегинцев 1976 и подтверждено анализом понятий, выражаемых словами смысл и значение в обыденном языке в Кобозева 2000. 6 Ср. «Постулат О ГРАНИЦАХ СЕМАНТИКИ: к области семантики (в широком смысле) относится вся информация, которую имеет в виду говорящий при развертывании высказывания и которую необходимо восстановить слушающему для правильной интерпретации этого высказывания» (А.Е. Кибрик 1992: 22). 4 168 И. М. Кобозева, С. Г. Татевосов развивается тесно связанное с ф о р м а л ь н о й л о г и к о й направление ф о р м а л ь н о й с е м а н т и к и (см. раздел 5.5). Современная семантика — динамично развивающаяся наука. Ответы на вопросы, которые она ставит, у представителей разных ее направлений — структурной, когнитивной, формальной семантики — могут различаться. Мы в данном разделе будем излагать более или менее общепринятые представления об устройстве семантики, отмечая там, где это необходимо, различия в трактовках тех или иных понятий. 5.1.1. Значение как неотъемлемая принадлежность языкового знака. Естественный язык (ЕЯ) — это сложная, многоуровневая система знаков7. Но знаки ЕЯ — это хотя и важнейший, но все-таки частный случай знаков. Отличительное свойство знаков — их двойственная природа, соединение в них внешней стороны, имеющей физическую природу, и внутренней, идеальной стороны — той информации, которую они в себе заключают. В принципе любой физический объект или явление может стать знаком. Так, например, сами по себе бокалы или бутылка шампанского являются обычными физическими объектами (точнее, артефактами) с определенными функциями, но те же предметы станут знаком, если будут обнаружены на столе в квартире в ходе следствия по делу об исчезновении ее хозяина: они станут носителями информации о том, что с высокой вероятностью до своего исчезновения хозяин ожидал прихода гостей. Погоны с определенным количеством звездочек, информирующие о военном звании того, кто их носит; столбик ртути в градуснике, сообщающий о температуре тела человека, и тем самым о состоянии его здоровья; государственный флаг, обознача ющий соответствующее государство, а, например, в руках болельщиков на трибуне стадиона во время международного матча свидетельствующий о том, за какую команду они болеют, — все это примеры знаков. Та информация, носителем которой является знак, называется его значением. Таким образом, наличие значения, или означаемого — это необходимое условие, конституирующее статус материального объекта или явления как знака. Что касается носителя значения — означающего8, то эта сторона знака может быть «нулевой», то есть состоять в отсутствии материального репрезентанта. Так, отсутствие лычек или звездочек на погонах военного означает, что их К естественным языкам относятся не только языки, рассчитанные на слуховое восприятие, но и жестовые языки глухонемых. 8 Термины означающее (фр. signifiant) и означаемое (фр. signifié) для двух сторон знака ввел основоположник структурного направления в лингвистике — Ф. де Соссюр (Saussure 1916). 7 Семантика 169 обладатель — рядовой, нулевое окончание у существительных во многих языках имеет значение ‘единственное число’ в противопоставлении материально выраженному окончанию тех же существительных, обозначающему ‘множественное число’. Общие свойства знаков и знаковых систем изучает с е м и о т и к а. В семиотике знаки подразделяются на п р и р о д н ы е (natural) и у с л о в н ы е (conventional). В природных знаках их форма хотя бы отчасти мотивированна, т. е. объяснима, исходя из их значения. В и к о н и ч е с к и х природных знаках означающее подобно означаемому либо по форме, цвету, характеру движения, звучания или др. их абсолютным качествам (знаки-образы), либо по количественным, порядковым и т. п. относительным свойствам (знакидиаграммы). В и н д е к с а л ь н ы х природных знаках означаемое и означающее связаны отношениями смежности в пространственно-временном континууме, разновидностью которых являются отношения обусловленно сти. В у с л о в н ы х, или к о н в е н ц и о н а л ь н ы х, знаках связь означа ющего и означаемого не мотивирована, по крайней мере, на текущем этапе функционирования знака, да и не нуждается в мотивировке: они связаны произвольно, по договоренности. В наших примерах количество и размер звездочек или лычек на погонах — знак-диаграмма (чем выше воинское звание, тем их количество и размер больше); шампанское с бокалами на столе, государственный флаг в руках болельщиков — знаки-индексы, столбик ртути в градуснике — это одновременно и диаграмма (чем столбик выше, тем более высокую температуру он обозначает), и индекс (состояния здоровья). Государственный флаг сам по себе — как правило, конвенциональный знак, хотя некоторые флаги содержат и элементы образности, как флаг Камбоджи, в центре которого помещено схематическое изображение находящегося на ее территории гигантского храмового комплекса Ангкор-Ват. Знаки ЕЯ в подавляющем большинстве своем конвенциональны9, хотя есть среди них и знаки-образы (напр., звукоподражательная лексика), и знаки-индексы (напр., личные местоимения первого и второго лица, связанные с обозначаемыми ими участники коммуникативного акта отношением пространственно-временной смежности). Знаки ЕЯ имеют сложную структуру, называемую вслед за А. Мартине (Martinet 1960) д в о й н ы м ч л е н е н и е м. Первое членение — это разлоСказанное не относится к жестовым языкам, знаки которых по преимуществу иконичны. Производные знаки ЕЯ, построенные на основе конвенциональных (ср. стол-ик < стол) также конвенциональны. Их форма мотивирована не непо средственно их означаемым, а опосредованно — формой производящего знака. 9 170 И. М. Кобозева, С. Г. Татевосов жимость знаков более высокого уровня на знаки нижележащего уровня: предложений на слова (словоформы), слов на морфемы (морфы)10: (1) Пришла весна. 1) пришла / весна 2) при-ш-л-a / весн-а На обоих уровнях вычленяемые элементы суть знаки со своим означающим и означаемым, напр., слово весна имеет означающее [в’иeснá] и, если отвлечься от грамматической части значения этого знака в предложении (1), означает определенное время года, а морф весн- с означающим [в’иeсн] имеет своим означаемым нечто, так или иначе связанное с этим временем года (в том числе и само это время), ср. весн-ушк-и ‘рыжеватые пятна на коже, появляющиеся у некоторых людей весной’11 (Ожегов 1990). Второе членение — это разложимость знаков на единицы, которые, сами знаками не являются. Так, слова и морфемы разложимы на фонемы, которые собственным означаемым не обладают, ср. фонему [в’] в слове весна, которая собственного означаемого не имеет, но позволяет отличить это слово от краткого прилагательного тесна, т. е. выполняет так называемую с м ы с л о р а з л и ч и т е л ь н у ю ф у н к ц и ю. Фонемы не знаки, так как лишены значения (= означаемого). Можно говорить о втором членении знаков ЕЯ, при котором выделяются единицы означаемого, не имеющие соб ственного означающего. Так, значения слов кепка и берет разложимы на семантические компоненты, один из которых — ‘головной убор’ — входит в означаемое обоих слов, но не имеет соответствующей именно ему формальной единицы, которая представляла бы этот компонент значения в составе означающего этих слов. (О разложении означаемого слов на более элементарные компоненты см. ниже в разделе 5.2.4). Итак, знаки ЕЯ с необходимостью обладают значением (означаемым), которое может быть связано с их формой либо произвольным образом (конвенционально), либо на основе отношений подобия (иконически) или смежности (индексально). Значение знаков ЕЯ обладает относительной устойчивостью во времени, т. е. эти значения изменяются очень медленно и незаметно для носителей языка, что обусловлено основной функцией ЕЯ — коммуникативной. Ведь резкое изменение значения знака по воле говоряЕсли в языке отсутствуют основания для выделения уровня слов, то предложение раскладывается на морфемы. 11 Заключение языкового выражения в так называемые «марровские кавычки» (‘ ’) означает, что оно служит способом записи значения некоторого другого языкового выражения. 10 Семантика 171 щего с большой вероятностью привело бы к непониманию того, что он хотел сказать. 5.1.2. Типы информации, заключенной в значении знаков ЕЯ. Знаки ЕЯ (как и знаки других знаковых систем) передают информацию четырех типов: 1) информацию о том или ином фрагменте мира (денотативную); 2) информацию о способе представления этого фрагмента мира в сознании (сигнификативную); 3) информацию о говорящем и других элементах коммуникативной ситуации (прагматическую); 4) информацию о других знаках, которые могут появиться в окружении данного знака (синтаксическую). Соответственно мы можем говорить о денотативном, сигнификативном, прагматическом и синтаксическом значении знаков ЕЯ. Проиллюстрируем введенные понятия на конкретном примере предложения (2): (2) Мама сейчас спит. Д е н о т а т и в н ы м з н а ч е н и е м слова мама в контексте предложения (2), употребленного в речи, иначе говоря, его р е ф е р е н т о м, будет конкретная женщина, которую имеет в виду говорящий, а денотативным значением того же слова в лексической системе языка, иначе говоря, его д е н о т а т о м, будет не какая-то конкретная женщина, а множество всех объектов в мире, к которым согласно языковым конвенциям применимо слово мама12. Денотативным значением предложения (2) в конкретном его употреблении, т. е. референтом высказывания (2), будет имеющая место в момент речи ситуация, состоящая в том, что конкретное лицо, обозначенное как мама, находится в состоянии сна, а денотативным значением того же предложения (2), изолированного от контекста, будет множество всех ситуаций данного типа, имеющих место в момент речи. С и г н и ф и к а т и в н о е з н а ч е н и е (с и г н и ф и к а т ) высказывания (2) — это способ, каким фрагмент мира представлен в сознании говорящего. Так, та же конкретная ситуация, которая в (2) представлена как нахождение конкретного референта в состоянии сна (с умолчанием о его местоположении), в (3) представлена как местоположение того же референта в том же состоянии на диване: (3) На диване лежит спящая женщина. Соответственно, высказывания (2) и (3) могут иметь один денотат, но различаются своими сигнификатами. В таких случаях также говорят, что (2) и (3), 12 Денотат знака ЕЯ, рассматриваемого как элемент знаковой системы, называется также его э к с т е н с и о н а л о м. 172 И. М. Кобозева, С. Г. Татевосов отсылая к одному и тому же положению дел, имеют разный смысл13. Сигнификат слова, рассматриваемого как элемент лексической системы — это не класс обозначаемых им объектов или событий, а совокупность тех признаков, на основании которых они объединены в данный класс (= категорию) и противопоставлены членам других классов14. Так, сигнификат имени мама включает в свой состав признаки ‘человеческое существо’, ‘женского пола’, ‘родитель некоторого Х-а’. Сигнификат глагола спать включает в свой состав такие признаки, как ‘физическое состояние живого существа’, ‘вид отдыха’, ‘с максимально возможном без ущерба для организма отключении систем последнего’ (ТКС: 785). Различие между денотатом и сигнификатом слова ясно проявляется не в системе языка, а в языковом употреблении, иначе говоря, при актуализации значения слова: один тот же актуальный денотат (= референт) может быть обозначен языковыми выражениями с различными сигнификатами. Так, та же женщина, которая в высказывании (2) названа мамой, в других случаях может быть поименована как Ирина Сергеевна; парикмахерша; соседка по этажу; женщина с синей сумкой и т. д. Разумеется, при тождестве референта, эти языковые выражения различаются по своему сигнификативному значению, поскольку несут информацию о разных его свойствах (собственное имя не сообщает ни о каких свойствах, кроме пола и вероятной национальности). П р а г м а т и ч е с к о е з н а ч е н и е знака ЕЯ — это содержащаяся в нем информация о коммуникативной ситуации (КС), в которой он используется, и в первую очередь, о говорящем — главном элементе КС: об отношении говорящего к денотату знака (в терминах разнообразных оценочных характеристик типа ‘хорошо / плохо’, ‘много / мало’, ‘свое / чужое’ и т. д.), об отношениях между говорящим и адресатом, об обстановке общения (например, официальная / неофициальная), о цели, которой говорящий хочет достичь с помощью своего высказывания и о многих других параметрах КС. Так слово мама, в противопоставлении с имеющим тот же сигнификат словом мать, несет информацию о том, что либо его денотат относится к л и ч н о й с ф е р е (Апресян 1986) говорящего (Г) или слушающего (С), т. е. является матерью одного из них, либо, обозначая мать некоторого лица Х, не входящего в личную сферу Г, оно дополнительно выражает дружеское расположение Г Возможность представить одну и ту же конкретную ситуацию действительности при помощи высказываний, имеющих разный смысл, — пример так называемой в а р и а т и в н о й и н т е р п р е т а ц и и д е й с т в и т е л ь н о с т и (Баранов, Паршин 1986), осуществляемой при помощи языка. 14 Вместо термина сигнификат также используется заимствованный из логики термин интенсионал. 13 Семантика 173 к этому лицу. Поскольку в официальной обстановке выражение эмоциональных отношений не приветствуется, то в контексте такой коммуникативной ситуации для обозначения того же денотата используется слово мать. Так, даже свою собственную мать не принято обозначать словом мама в тексте официальной автобиографии, составляемой при поступлении на службу. Таким образом, в прагматическом значении слова мама содержится определенная информация об отношении Г либо к денотату данного имени, либо к лицу Х, которому денотат имени доводится матерью. Эту информацию мы извлекаем из слова мама, даже встретив его в изолированном от контекста предложении, а значит оно присуще данному слову как элементу лексической системы языка. К прагматическому значению предложений относится закодированная в них информация о коммуникативной цели высказываний, которые могут быть произведены с их помощью. Так, (2) может быть употреблено говорящим только с целью представить его денотат как принадлежащий действительному миру, а (4), произносимое с определенной интонацией — с целью выразить, что описанная ситуация желательна для Г и тем самым побудить С не препятствовать ее продолжению: (4) Пусть мама сейчас спит. В предложение (5) закодирована цель побудить адресата к осуществению денотируемой ситуации, а в (6) — цель получить от адресата недостающую информацию о ней: (5) Займи мне место в первом ряду партера. (6) В котором часу Иванов вышел из дома? Таким образом, в означаемом каждого предложения есть прагматический компонент, содержащий информацию о том, для достижения каких коммуникативных целей оно предназначено, как правило, выражаемый его морфо-синтаксической и линейно-акцентной структурой. С и н т а к с и ч е с к о е з н а ч е н и е языкового знака содержит информацию о разного рода требованиях, предъявляемых языковым знаком к другими знакам в его окружении. Данный тип значения хорошо изучен применительно к слову и называется его с о ч е т а е м о с т ь ю (подробнее см. ниже в разделе 5.2.5). Сочетаемость для знаков уровня предложения-высказывания рассматривается в основном на материале диалогов, см., напр., Баранов, Крейдлин 1992. Реплика в диалоге не только денотирует некоторую ситуацию, осмысление, или интерпретация которой задается сигнификатом (смыслом) реплики, не только содержит в своем означаемом коммуникативную цель (прагматическое значение реплики), но и предъявляют опреде- 174 И. М. Кобозева, С. Г. Татевосов ленные требования к означаемому реплики, которая должна последовать со стороны собеседника. Так, после реплики (6) при нормальных условиях (т. е. при соблюдении условий успешности этого речевого акта, о которых речь пойдет в разделе 5.4.3) следующая реплика должна представлять собой предложение с вполне определенным денотативным, сигнификативным и прагматическим значением: это должна быть реплика, денотативно и сигнификативно совпадающая с вопросом во всем, кроме того, что неопределен ный, неизвестный говорящему элемент денотата вопроса в ответе должен быть замещен конкретной денотативно-сигнификативной информацией, и эта реплика должна иметь коммуникативную цель сообщения. 5.2. Лексическая семантика Лексическая семантика — раздел семантики, изучающий значение слов как единиц языка (его лексической системы, словаря), т. е. лексем, и как единиц речи, т. е. словоупотреблений. 5.2.1. Лексическое vs. грамматическое значение. Слова ЕЯ делятся на два типа15. Так называемые п о л н о з н а ч н ы е (з н а м е н а т е л ь н ы е, с а м о с т о я т е л ь н ы е) с л о в а, называющие предметы в широком смысле этого слова (копейка, идея, совесть), явления (кипеть, голосовать, рад, боль) и их признаки (кислый, добрый, поздно, легкомысленно), несут основную информационную нагрузку. Именно такие слова и их сочетания служат так называемыми «ключевыми словами» при информационном поиске. Знаменательные слова образуют открытые классы, которые легко пополняются при необходимости обозначить новый тип предметов, явлений или свойств. С л у ж е б н ы е (н е п о л н о з н а ч н ы е, с т р у к т у р н ы е, с т р о е в ы е, ф у н к ц и о н а л ь н ы е) с л о в а — предлоги (до, без), частицы (ли, небось), союзы (однако, потому что) играют вспомогательную роль. Они кодируют информацию о разного рода отношениях (ролевых, пространственных, временных, причинно-следственных и т. п. отношениях высокой степени абстракции) между предметами, явлениями и признаками, обозначаемыми при помощи полнозначных слов. Так как количество таких отношений ограниченно, то служебные слова образуют закрытые классы, которые практически не пополняются16. Если в языке уровень слова не выделяется, то в нем на данные два типа делятся морфемы. 16 Если пополнение таких классов и происходит, то не по причине возникновения новых абстрактных отношений, которые нуждаются в средстве их выражения, 15 Семантика 175 Полнозначные слова наделены л е к с и ч е с к и м з н а ч е н и е м — содержащейся в слове информацией об объектах, явлениях и их признаках. Служебные слова обычно считают имеющими г р а м м а т и ч е с к о е з н а ч е н и е. Перифразируя Л. Талми, можно сказать, что лексические значения отображают «субстанцию» мира, а грамматические — его «структуру» (Талми 1999: 91–92). В языках с развитой морфологией означаемое полнозначного слова (и в системе и в речи) содержит в себе как лексическое, так и грамматическое значение. Так, если мы рассматриваем слово домик как элемент лексической системы русского языка, то его лексическое значение — это информация об объекте, относящемся к классу построек и обладающему признаками малого размера и предназначенности для проживания в нем. Грамматическое же значение этого слова — это информация о принадлежности его к лексикограмматической категории неодушевленных существительных мужского рода, которую содержат все его словоформы. Если же мы рассматриваем слово домик в речи, то оно будет представлено конкретной словоформой, напр., домиком, и в ее грамматическое значение войдут также признаки един ственного числа и творительного падежа. Иными словами, к грамматиче скому значению будут отнесены все те элементы означаемого, которые являются граммемами той или иной грамматической категории. Если у грамматической категории в языке есть морфологические показатели (аффиксы, флексии и т. п.), то они также образуют закрытый класс, как и служебные слова. Лексическую семантику при изучении полнозначных слов интересует только лексическое значение, а их грамматическое значение находится в ведении грамматической семантики. Сложнее обстоит дело со служебными словами. Рассмотрим два предложения: (7) а. Аул Х расположен выше аула Y. б. Аул Х расположен над аулом Y. Выше и над отражают приблизительно один и тот же признак аула X или одно и то же пространственное отношение между двумя аулами. Но у полнозначного выше (формы сравнительной степени наречия высоко) — этот признак или отношение будет рассматриваться как лексическое значение, а за счет образования вариантов обозначения тех же отношений в результате перехода полнозначных слов в служебные в процессе грамматикализации, ср. сделать что-л. для (= в интересах) развития региона. Варианты могут различаться по стили стическим характеристикам или сочетаемостным свойствам, но выражаемое отношение остается тем же. 176 И. М. Кобозева, С. Г. Татевосов а у служебного над — как грамматическое, что не может не вызывать вопросов17. Это побуждает к тому, чтобы относить к ведению лексической семантики не только лексическое значение полнозначных слов (в противовес грамматическому), но и значение слов служебных независимо от противопоставления «лексическое» vs. грамматическое». 5.2.2. Лексическое значение vs. понятие. Лексическое значение полнозначного слова, всегда обозначающего некоторый класс, категорию, тип объектов или ситуаций внешнего или внутреннего мира, — это идеальная, ментальная сущность, близкая, хотя и не тождественная той, что в философии и других когнитивных науках называется п о н я т и е м об этом классе, или к о н ц е п т о м (concept). C одной стороны, первое включает в себя некоторые виды информации, не входящей во второе, а именно прагматиче скую информацию, напр., об эмоционально-оценочном отношении говорящего к обозначаемому объекту или ситуации (ср. лексическое значение слов сметанка, чтиво, сдрейфить, придираться) или о том, что говорящий включен в ситуацию в качестве ее наблюдателя (так, одно из лексических значений глаголов цвета типа чернеть, присущее им в типовом контексте В месте Х чернеет Y, информирует о том, что некий Y воспринимается говорящим в момент речи как черный; при этом объективно Y может иметь иной цвет, как в Прозрачный лес один чернеет у А. С. Пушкина, который вряд ли имел в виду лес, состоящий из обуглившихся при пожаре деревьев). С другой стороны, лексическое значение слова, а точнее, его сигнификативная часть, включает в себя далеко не все признаки той категории объектов или ситуаций, которые входят в понятие об этой категории, а лишь наиболее заметные различительные признаки, на основании которых данная категория была в свое время выделена в процессе познания мира и получила соответ ствующее наименование. Так, в лексическое значение слова река входят такие различительные признаки обозначаемой категории объектов, как, ‘водоем’, ‘незамкнутый’, ‘естественного происхождения’, ‘достаточно большого размера’, на основании которых объект, именуемый рекой, отличается от любых объектов, не являющихся водоемами, а также от водоемов, именуемых озером, каналом, ручьем. Понятие же о реке включает помимо данных и другие признаки, например, ‘быть основным источником пресной воды для нужд человека’, ‘обеспечивать возможность для перемещения на плавательных средствах’, ‘быть частью водного бассейна’, ‘питаться за счет поверхностного и подземного стока со своего водного бассейна’ и т. д. Аргументация в пользу разграничения лексического и грамматического значений в означаемом пространственных предлогов приводится в Селиверстова 2000. 17 Семантика 177 Нередко лексическое значение называют «наивным понятием», противопоставляя его «научному понятию», которое воплощает полное и точное на данной стадии научного познания мира представление о той или иной категории объектов или явлений. Научные понятия выражаются с помощью терминов — особой категории слов, у которых лексическое значение совпадает с понятием. То же справедливо и в отношении терминов других областей, например, области права. Границы категорий, задаваемых признаками, входящими в лексическое значение обычных слов, размыты. И это соответствует устройству мира, в котором одни объекты или явления являются типичными представителями некоторой категории, а другие — нетипичными. Первые называют п р о т о т и п а м и категории. Именно их признаки входят в состав лексического значения слова. Нетипичные, п е р и ф е р и й н ы е члены обозначаемой словом категории имеют не весь набор признаков, входящих в лексическое значение, но, тем не менее, и они могут обозначаться данным словом. Так, лексическое значение слова украсть включает в себя признаки ‘взять’, ‘объект, который взят, является чужим’, ‘объект взят с целью сделать его своим’, ‘действие совершено без ведома владельца’, ‘взявший не намерен компенсировать бывшему владельцу утрату данного объекта’. Несомненно, что к данной категории относятся кражи, совершаемые проникшими в дом ворами. Но если подросток, живущий с родителями и находящийся на их содержании, в их отсутствие без спроса присвоил себе найденные в доме деньги, потратил их и не собирается их возмещать, то одни могут сказать, что он украл эти деньги, а другие сомневаться в этом, считая, что эти деньги не чужие. Несмотря на различия между лексическим значением и понятием, они суть объекты одной природы — ментальные сущности, отражающие представления о мире. В процессе коммуникации слово, передавая информацию, заключенную в его лексическом значении, одновременно активирует и ту часть понятийной и/или образной информации о денотате слова, которая имеет отношение к коммуникативной ситуации, благодаря чему лексиче ское значение слова в речи обретает с м ы с л. Так, уместность второй реплики диалога (8): (8) Эх, искупаться бы сейчас! — Тут неподалеку есть река. объясняется тем, что в смысл слова река в данном контексте помимо признаков реки, входящих в лексическое значение, включается и входящий в понятие о реках признак ‘быть местом купания’. В связи с этим при моделировании процессов порождения и понимания текста информация, входящая в лексическое значение слова, и понятийная информация должны иметь одинаковую форму представления (= репрезентации). Одной из таких форм яв- 178 И. М. Кобозева, С. Г. Татевосов ляются семантические метаязыки, разрабатываемые для целей формального описания лексических значений, но пригодные и для представления любой понятийной (= концептуальной) информации (см. ниже). Активация словом связанной с ним понятийной и образной информации наблюдается в ассоциативных экспериментах, когда носителям языка дают слово-стимул и просят записать первые n слов, которые придут им в голову в связи со словом-стимулом. Среди словесных реакций есть как те, которые непосредственно соотносятся со словом-стимулом по их лексиче скому значению (река — вода, водный поток), так и те, значение которых указывает на знания о мире, ассоциированные с денотатом слова-стимула (река — рыба, купаться, водные лыжи) или на хранящиеся в памяти образы конкретных ситуаций, связанных с рекой (река — тишина, бабочки) (Караулов и др.. 1994). Ниже, в разделе 5.2.6, мы покажем, что сходство значений многозначного слова может основываться не только на сходстве их сигнификатов, но и на сходстве сигнификата одного из значений с ассоциативной понятийной или образной информацией, связанной с другим значением). 5.2.3. Системные семантические отношения между словами. Лексика ЕЯ может рассматриваться как множество подмножеств слов, в котором каждое из подмножеств содержит слова, соотносящиеся с той или иной областью действительности. Области могут выделяться по-разному. Это могут быть те или иные виды объектов или веществ, например, виды живых существ (человек, волк, комар и т. п.), виды искусственных веществ (бензин, квас), виды элементов земного рельефа (гора, озеро и т. п.), виды небесных тел (звезда, луна и т. п.), виды частей тела зверей (лапа, коготь и т. п.), виды перемещения (идти, ехать, плавание и т. п.), виды ментальных состояний (помнить, предполагать, озарение и т. п.), виды стихийных бедствий (землетрясение, засуха и т. п.), определенные сферы деятельности, напр., сфера образования (школа, преподавать, дневник, экзамен и т. п.) и так далее. Множе ство слов, соотносящихся с той или иной областью действительности (предметной, или тематической областью) называется с е м а н т и ч е с к и м п о л е м. Семантические поля (СП) могут вкладываться одно в другое (напр., СП осадков входит в СП явлений природы), пересекаться (напр., СП дорожного движения пересекается с СП транспортных средств, т. к. в него входят названия колесных видов транспорта, с СП осветительных приборов, т. к. слово светофор входит в оба этих СП и мн. др.). Внутри СП могут быть выделены группы слов, относящиеся к одной и той же части речи, называемые л е к с и к о - с е м а н т и ч е с к и м и г р у п п а м и (ЛСГ), напр., ЛСГ глаголов речевой деятельности в СП речевой деятельности. Семантика 179 Слова внутри СП находятся в отношениях, основанных на сходствах и различиях в их лексических значениях (далее для краткости мы будем называть лексические значения просто значениями). Такие отношения называются с е м а н т и ч е с к и м и к о р р е л я ц и я м и. Основные семантиче ские корреляции системны в том смысле, что их количество ограниченно, но при этом они связывают слова внутри многочисленных СП. Корреляция с и н о н и м и и связывает слова с максимально схожими значениями (везде — всюду, убегать — драпать — улепетывать, свитер — пуловер), корреляция г и п о н и м и и связывает слово, обозначающее род объектов или явлений (г и п е р о н и м) со словами, обозначающими виды этого рода (г и п о н и м а м и) (сосуд — стакан, чашка, кувшин и т. д.), а корреляция к о г и п о н и м и и связывает гипонимы одного гиперонима. Корреляция а н т о н и м и и связывает слова, значения которых противоположны (сытый — голодный, войти — выйти, хороший — плохой), корреляция к о н в е р с и в н о с т и — слова, обозначающие одну и ту же ситуацию с несколькими участниками, но по-разному распределяющие приоритеты между ними (купить — продать, опередить — отстать). Системными являются и корреляции, связывающие название ситуации с названиями типовых участников и обстоятельств этой ситуации (лекция — лектор, лекция — слушатель, лекция — кафедра; спектакль — актер; спектакль — зритель, спектакль — сцена). Некоторые корреляции специфичны для определенных областей, напр., корреляция по признаку пола (мужик — баба, петух — курица) релевантна только для области живого. 5.2.4. Методы выявления и представления значения слова. Для выявления значения полнозначного слова в лексической системе ЕЯ его необходимо сопоставить с другими словами тех СП, в которое оно входит, и прежде всего с его синонимами и когипонимами. Это нужно потому, что область, обслуживаемая словами данного СП, разделена между их значениями, и надо установить, какая часть этой области приходится на долю значения данного слова. Основным методом выявления структуры значения полнозначного слова является к о м п о н е н т н ы й а н а л и з — последовательность процедур, применяя которые мы в результате получаем разложение значения слова (semantic decomposition) на составляющие его с е м а н т и ч е с к и е к о м п о н е н т ы (семантические признаки, семы), см. Найда 1983. Выше мы привели результат компонентного анализа значения слова река. Для его получения нужно было определить гипероним этого слова — водоем, затем найти все остальные его гипонимы (море, ручей, канал и т. д.), а далее, срав- 180 И. М. Кобозева, С. Г. Татевосов нивая их значение со значением слова река, как сравниваются фонемы в ходе фонологического анализа, выделить их дифференциальные семантические признаки. Если слово обозначает не тип сущностей, а тип ситуаций, то семантические компоненты, по которым значение такого слова отличается от его когипонимов, могут характеризовать не сам тип ситуации как таковой, а того или иного из ее участников, а это значит, что при анализе надо сравнивать не значения отдельных слов, а значения сочетаний с этими словам. Так, выявляя структуру значения глагола расколоть, мы должны сравнивать не только сами глаголы, входящие с ним в ЛСГ «разделение объекта на части», но и их сочетания с дополнениями, чтобы понять, что данный глагол обозначает разделение на части только таких объектов, которые обладают свойством хрупкости (быстрого распадения на части при ударном воздействии на объект), как полено, чашка или орех и т. п., но не бумага, хлеб и т. п. В общем случае слова должны подвергаться семантическому анализу в составе выражений, минимально достаточных для раскрытия всех отличительных признаков. Для глагола таким выражением будет обобщенная формула клаузы, содержащей все его синтаксические актанты в виде переменных, напр., Х расколол Y на Z частей. Компонентный анализ служебных слов отличается от вышеописанного. Это связано с тем, что служебные слова характеризуют не «субстанцию» мира (т. е. его области), а структуру мира и/или прагматические аспекты коммуникативной ситуации. В связи с этим они не образуют семантических полей, внутри которых их можно было бы сопоставлять друг с другом по значению18. Чтобы выявить значение служебного слова (если это слово не является чисто формальным, семантически пустым, как у сильноуправляемых предлогов) надо использовать процедуру э к с п л и ц и р у ю щ е г о с и н о н и м и ч е с к о г о п е р и ф р а з и р о в а н и я. Она состоит в том, чтобы в типовом предложении с этим словом заменить его синонимичным выражением, состоящим из слов, значение которых нам уже известно или принадлежит к числу простейших неопределяемых понятий. Например, значение союза но в предложениях типа А, но B (Шла война, но театры работали) раскрывает перифраза типа А, B, обычно если A, то не В (Шла война, театры работали, обычно если идет война, то театры не работают). Такая перифраза позволяет разложить значение союза но на значение конъюнкции, выражаемое в перифразе бессоюзным соединением А и B, значением Они вместе с морфологическими показателями грамматических категорий входят в разного рода грамматико-семантические поля: аспектуальности, модальности, сопоставительного выделения и т. п. Ср. понятие функционально-семантического поля в теории функциональной грамматики (Бондарко 1999). 18 Семантика 181 вероятностной импликации, однозначно выражаемой в перифразе соче танием квантора обычно с союзом если, … то, и значение отрицания, однозначно выражаемое в перифразе частицей не. При этом важно, что отрицание находится в консеквенте импликативного суждения, а не в его антецеденте. Действительно, перифраза, в которой отрицание относилось бы к антецеденту …обычно если нет войны, то театры работают была бы не синонимичной исходному предложению. Результаты компонентного анализа значений должны быть представлены в таком виде, чтобы обеспечивалась их сопоставимость, то есть, чтобы по форме представления значения слова Х можно было судить о наличии и степени его сходства со значениями других слов. Для этого разрабатываются с е м а н т и ч е с к и е м е т а я з ы к и (СМ) — специальные языки, в терминах которых описывается значение слова. «Словарь» таких языков, т. е. набор семантических единиц, которые выявляются в ходе компонентного анализа, содержит в сотни раз меньше элементов, чем словарь описываемого языка — языка-объекта, потому что значения многих слов ЕЯ представимы в виде различных конфигураций относительно небольшого количества элементарных сем (‘вещь’, ‘начинать’, ‘иметь’, ‘делать’, ‘часть’, ‘не’ и т. п.’). Обычно «слова» словаря СМ записываются при помощи слов языка-объекта, которые в этом случае должны пониматься как символы семантических единиц, соответствующих основным значениям этих слов в языке-объекте. При использовании слова ЕЯ в качестве элемента СМ его основное значение нередко приходится уточнять. Так, в СМ, созданном А. Вежбицкой на основе английского языка, есть элемент ‘say’ (‘говорить’), который не полностью тождествен значению английского слова say, поскольку первый соответ ствует идее речевого действия в отвлечении от его формы (устной, письменной и т. п.), а значение второго включает в себя компонент ‘устности’. По скольку значения слов ЕЯ, совпадающие по компонентному составу, могут различаться только синтаксически, то есть способом соединения компонентов в структуре значения, как проанализированные в Fillmore 1971 глаголы blame «обвинять» и criticize «осуждать», то СМ должен иметь не только свой словарь, но и свой синтаксис, который может быть как упрощенным и стандартизованным вариантом синтаксиса языка-объекта, так и синтаксисом какого-либо искусственного языка. напр., языка какого-либо логического исчисления (пример см. в разделе 5.5 «Формальная семантика»). Семантиче ские метаязыки для представления лексических значений вполне пригодны и для описания соответствующих понятий и знаний вообще (энциклопедиче ской информации), см. напр., СМ «Онтологической семантики» (Nierenburg, Raskin 2004), который изначально разрабатывался как единый СМ фор 182 И. М. Кобозева, С. Г. Татевосов мальной репрезентации как для у н и в е р с а л ь н о й о н т о л о г и и — иерархической системы понятий о мире, так и для лексических значений в словарном компоненте модели синтеза и понимания текста на ЕЯ. Семантические представления, или т о л к о в а н и я значений на СМ показывают, чем обусловлены корреляции, в которые данное слово вступает с другими членами своего СП. При синонимии слов наблюдается почти полное совпадение составляющих их значение компонентов при совпадении синтаксических связей между ними; гипероним включает в себя только вершинный компонент семантического представления гипонима; у когипонимов совпадают их вершинные компоненты; у антонимов компонентные представления отличаются либо только наличием семы ‘не’ в одном из них, либо наличием компонента ‘меньше нормы’ в том месте конфигурации сем, где у антонима находится компонент ‘больше нормы’ и т. д. Адекватность описаний значений слов, получаемых исследователем в ходе компонентного анализа может быть проверена при помощи экспериментов с информантами. Примеры таких экспериментов см. в Лич 1983. 5.2.5. Лексико-синтаксическая информация. Лексическая семантика занимается только теми синтаксическими характеристиками слова, которые обусловлены его лексическим значением, а не принадлежностью слова к определенной грамматической категории. К таким характеристикам относятся семантические валентности слова и его сочетаемость. Семантические валентности слова. Когда слово обозначает ситуацию, то оно не только информирует о некоем типе действия, состояния, местоположения, свойства или отношения, но и тем самым определяет количественный состав участников ситуации и их роли в ней. Так, слово кража определяет наличие трех участников обозначаемой ситуации — укравшего, украденного и обокраденного. Обязательные участники ситуации, обозначаемой словом А, называются его с е м а н т и ч е с к и м и в а л е н т н о с т я м и. Естественно, слово А обычно не индивидуализирует свои семантиче ские валентности, поэтому они представляются при записи значения данного слове в виде переменных Х, Y и т. д., напр., ‘Х украл Y у Z-а’. Семантические валентности как бы открывают при значении слова А позиции, которые должны быть заполнены значениями слов или словосочетаний, сочетающихся со словом А при его употреблении в речи. Значения слов или выражений, которые заполняют позиции семантических валентностей слова А при его употреблении называются с е м а н т и ч е с к и м и а к т а н т а м и слова А. Так в примере (9): Семантика 183 (9) Карл у Клары украл кораллы. фигурируют следующие семантические актанты предиката украсть: ‘референт по имени Карл’, ‘референт по имени Клара’, ‘кораллы’. Семантической валентности слова в большинстве случаев соответствует синтаксическая валентность — способность присоединять к себе другие слова при помощи тех или иных синтаксических отношений, прежде всего отношения управления. Тем самым семантическому актанту слова А соответствует синтаксический актант — синтаксически связанное с А слово или синтаксическая группа и наоборот. В случае, если А — глагол, то его синтаксическими актантами являются подлежащее и дополнения19. Именно поэтому таблица, задающая соответствие между семантическими и синтаксическими актантами в модели «Смысл ⇔ Текст» называется м о д е л ь ю у п р а в л е н и я. Морфологическое оформление синтаксического актанта B служит означающим той роли, которую соответствующий ему семантический актант ‘B’ выполняет в ситуации, обозначаемой словом А. Благодаря этому мы понимаем, что в (9) Карл — укравший, Клара — та, кого обокрали, а кораллы — украденное. Однако столь конкретное описание ролей семантических актантов применимо только к предикату украсть и его синонимам. При замене украл на купил: (10) Карл у Клары купил кораллы. придется приписывать семантическим актантам предиката купить другие роли (покупателя, продавца, купленного), хотя оформление этих ролей будет таким же, как у украсть, отнять, одолжить и др.. Очевидно, что наблюдаемое сходство не случайно. Оно как-то связано со сходством значений таких глаголов. Ведь все они обозначают ситуации, в которых участник Х делает так, чтобы некоторый объект, до этого момента принадлежавший участнику Y, хотя бы на время перешел в распоряжение Х-а. Если мы хотим сформулировать обобщение о том, на какие роли семантических актантов предикатов указывает проиллюстрированное в (9) и (10) морфологическое оформление их синтаксических актантов, нам надо перейти к обобщенному описанию содержания ролей семантических актантов. Указанные канонические соотношения между семантическими и синтаксическими валентностями слова могут нарушаться, см. напр., Апресян 1974: 133–156. О том, что семантические актанты глагола могут выражаться не только его подлежащим и управляемыми группами см. Богуславский 1996: 24–32. 19 184 И. М. Кобозева, С. Г. Татевосов Проблема выработки оптимального уровня обобщения при описании ролей семантических актантов предикатных слов входит в область общих интересов семантики и синтаксиса, в котором она выступает как проблема с е м а н т и ч е с к и х, или т е м а т и ч е с к и х р о л е й. В разных семантических и синтаксических теориях предлагаются различные списки таких ролей. Часто в таких списках присутствуют роли Агенса (Agent — производитель действия с некоторой целью), Экспериенцера (Experiencer — испытывающий состояние), Бенефактива (Benefactive — тот, чьи интересы затронуты действием Агенса в положительную или отрицательную сторону), Пациенса (Patient — участник, который изменяется в результате действия Агенса) и др., см., напр., Филлмор 1981. Используя подобные абстрагированные от конкретики обозначаемой ситуации роли, мы могли бы сформулировать обобщение, что у глаголов ЛСГ «присвоения физического объекта, исходно принадлежащего другому» есть три семантическими актанта с ролями Агенса, Объекта Присвоения и Исходного Обладателя, которые кодируются соответственно подлежащим, прямым дополнением в вин. пад и косвенным дополнением у ИГвин. Можно пройти и дальше по линии обобщения, если заметить, что предикаты ЛСГ «присвоения информационного объекта, исходно принадлежащего другому» — узнать, выведать, списать (контрольную), и под. — имеют семантические актанты с похожими ролями и тем же способом их оформления. Различие только в том, что Объект Присвоения в первом случае относится к СП физических объектов, а во втором — информационных, и к тому же он сохраняется у Исходного обладателя при его присвоении Агенсом. Таким образом, мы сможем сказать, что одно из значений конструкции у NPрод — это семантическая роль Исходного Обладателя (частный случай еще более обобщенной роли Источника (Source)). Откуда берутся содержательно различные семантические роли актантов предикатов? Ответ на этот вопрос дает разложение значения предикатного слова А на семантические компоненты (семы). Возьмем для примера глагол отнять в типовом контексте Х отнял у Y-а Z и посмотрим на его упрощенную декомпозицию: (11) Х отнял у Y-а Z = ‘до момента референции t Y имел Z, а Х не имел Z и хотел иметь его, или не хотел, чтобы Y имел Z; в t Х делает нечто с Y и с Z; в результате этого Х начинает иметь Z, а Y перестает иметь Z; Y не хотел, чтобы это случилось с ним’. Легко видеть, что роль Агенса глагол отнять приписывает тому синтаксическому актанту, который соответствует первому актанту семантического предиката ‘делать нечто’, роль Объекта Присвоения — второму актанту предиката ‘иметь’, а роль Исходного Обладателя — первому актанту предиката Семантика 185 ‘иметь’ до момента референции. Получается, что содержание семантических ролей синтаксических актантов слова, которое выражается при помощи их морфосинтаксического оформления, обусловлено наличием в его лексическом значении определенных элементарных сем. Таким образом возникает возможность объяснить наблюдаемые модели управления слов исходя из их лексических значений, т. е. объяснить важный фрагмент синтаксиса языка через семантику. Поиски такого объяснения — одно из актуальных направлений исследования в лексической семантике. Сочетаемость слова. Если семантические валентности слова А определяют его синтаксические связи с другими словами, то сочетаемость слова, или с о ч е т а е м о с т н ы е о г р а н и ч е н и я — это требования, которые предъявляет слово A к слову B, синтаксически связанному со словом A. Выделяется три типа сочетаемости (Апресян 1974). М о р ф о с и н т а к с и ч е с к а я с о ч е т а е м о с т ь слова A — это ограничения, которые оно налагает на морфологическую категорию и грамматиче скую форму слова B, синтаксически связанное со словом A. Так, лексическое значение синонимов сообщить, известить и оповестить предопределяет наличие при них трех синтаксических актантов с ролями Агенса, Адресата и Содержания, но при сообщить Адресат оформляется дательным падежом, а при известить и оповестить — винительным. Этот пример показывает, что морфологическое оформление актантов не полностью определяется их семантической ролью даже у почти тождественных по значению слов. Одно из направлений исследования — это поиск дополнительных семантических факторов, влияющих на морфосинтаксическое оформление актантов. Такие факторы выявляются, в частности в ходе изучения явления вариативного управления (вытереть грибы от земли — вытереть землю с грибов, лечить от болезни — лечить болезнь и т. п.). С е м а н т и ч е с к а я с о ч е т а е м о с т ь слова A — требования к значению слова B, синтаксически связанного со словом A. Обычно это требование наличия в значении слова B определенного семантического компонента (признака). О семантических ограничениях на сочетаемость можно говорить только в тех случаях, когда любое слово B, имеющее требуемый семантиче ский признак, способно сочетаться с A. Так, если А — спать, то в значении его единственного синтаксического актанта B должен присутствовать семантический признак одушевленности, если А — боронить, то его прямое дополнение B должно содержать семантический компонент ‘участок земли’, если А — перелетный, то определяемое B должно иметь в своем значении компонент ‘птица’. 186 И. М. Кобозева, С. Г. Татевосов Требования семантической сочетаемости, т. е. фактически, отграничения на возможность двух значений быть непосредственно связанными определенным семантическим отношением, обусловлены нашими знаниями о мире: обозначаемое словом спать состояние возможно только для живых существ, обозначаемое глаголом боронить действие производится только по отношению к участкам земной поверхности, покрытым слоем почвы, а свойством, обозначаемым словом перелетный, обладают только птицы. Именно поэтому при изучении иностранного языка нам не надо специально запоминать семантическую сочетаемость переводных эквивалентов русских слов. Вместе с тем семантические сочетаемостные ограничения играют важнейшую роль в процессе интерпретации высказываний, позволяя выбрать одно из ряда значений многозначного слова. Так, в сочетании прикусил язык мы однозначно выберем для слова язык значение ‘орган во рту человека’, а в сочетании выучил язык — значение ‘система знаков’. Л е к с и ч е с к а я с о ч е т а е м о с т ь слова A — это не ограничения, налагаемые словом А на означающее или означаемое синтаксически связанного с ним слова B. Это ограничения на то, каким из множества слов {B1, B2, …, Bn}, в принципе способных выражать значение ‘В’, можно выразить это значение при слове А. Так, значение ‘в высокой степени’ могут выражать многие слова: сильный (напр., насморк), большой (напр., успех), резкий (напр, скачок цен), бурный (напр., аплодисменты) и целый ряд др., но не каждое из них может выражать это значение в связи со словом дождь, а только сильный или проливной. Ограничения лексической сочетаемости, в отличие от семантической, не объяснимы экстралингвистическими соображениями, это чисто языковые конвенции. Именно поэтому их освоение представляет собой одну из главных трудностей при овладении иностранным языком. Если описание семантической сочетаемость слов — одна из основных задач при моделировании понимания текста человеком, то описание морфосинтаксической и лексической сочетаемости необходимо при моделированиии синтеза текста, выражающего заданный смысл. В качестве инструмента описания лексической сочетаемости в Московской семантической школе был разработан аппарат л е к с и ч е с к и х п а р а м е т р о в, см. Мельчук 1974; Апресян 1974; Мельчук, Жолковский 1984. 5.2.6. Лексическая многозначность. Одним из свойств знаков ЕЯ является их неоднозначность, отличающая их от знаков искусственных языков. На лексическом уровне это явление представлено очень широко. Иногда это случайное совпадение форм разных слов, очень далеких друг от друга по значению (напр., лук как название вида растения и лук как название вида Семантика 187 оружия). Такая неоднозначность называется о м о н и м и е й. Но гораздо чаще речь идет о том, что у одного слова имеется несколько значений (напр., ‘а’, ‘b’, ‘c’, ‘d’), которые связаны между собой по принципу «семейного сход ства»: у ‘а’ и ‘b’ одинаковые «цвет глаз» и «цвет волос», но разные «форма носа» и «размер глаз», у ‘а’ и ‘c’ — «форма носа» и «цвет волос» совпадают, но «цвет глаз» и их «размер» различаются и т. д., только вместо внешних признаков членов семьи надо подставить те или иные семантические компоненты, входящие в структуру этих значений. Впрочем, достаточно часто имеет место совпадение компонента одного из значений неоднозначного слова с компонентом понятийной или образной ассоциации, связанной с другим значением. Так, по словарю Ожегов 1990 первое и второе значение слова язык (как в выснуть язык1 и заливной язык2) имеют общий компонент значения ‘мышечный орган’, а четвертое — ‘о чем-то, имеющем удлиненную, вытянутую форму’ (как в языки4 пламени, язык4 ледника) не имеет никаких общих компонентов со значениями 1 и 2, но воплощает схематизированное представление о прототипической форме языка (образную ассоциацию, активируемую словом язык в его первом значении). В теоретической лексиче ской семантике предлагается систематическим образом учитывать ту ассоциативную информацию, активируемую словом, которая, не входя в его лексическое значение, служит связующим звеном между данным и какимито другими его значениями, помещая ее в особую зону словарного описания, отличную от толкования (см. зоны наивно-энциклопедической информации и коннотаций в Активном словаре русского языка (Апресян ред. 2010: 101–103). Неоднозначность слов можно объяснить, с одной стороны, действием в языке общего принципа экономии, т.к., при условии взаимно-однозначного соответствия между означающими слов и их означаемыми пришлось бы запоминать на порядки больше разных по форме лексем. С другой стороны, неоднозначность слова вызывается постепенными сдвигами, изменениями в его означаемом, которые неизбежно возникают при употреблении слова применительно к денотатам, которые, хотя и отличаются от прототипа, но имеют с ним много общих черт. С. О. Карцевский писал, что «природа лингвистического знака должна быть неизменной и подвижной одновременно. Призванный приспособиться к конкретной ситуации, знак может измениться только частично; и нужно, чтобы благодаря неподвижности другой своей части знак оставался тождественным самому себе» (там же: 85). Виды неоднозначности. Можно выделить два типа лексической неоднозначности — н е д о о п р е д е л е н н о с т ь (vagueness), называемую также 188 И. М. Кобозева, С. Г. Татевосов р е ч е в о й м н о г о з н а ч н о с т ь ю, и (я з ы к о в у ю) м н о г о з н а ч н о с т ь, или п о л и с е м и ю (polysemy, ambiguity). О н е д о о п р е д е л е н н о с т и, или р е ч е в о й м н о г о з н а ч н о с т и мы говорим тогда, когда некоторые характеристики денотата слова, которые в его лексическом значении не зафиксированы, в разных ситуативных контекстах могут «определиться» по-разному. Так, изолированное от контекста предложение Иван кашлянул оставляет нас в неведении относительно того, действовал ли Иван намеренно, или с ним это произошло помимо его воли. В конкретной ситуации употребления оно может обозначать либо намеренное действие человека, желающего привлечь к себе внимание или прочищающего горло перед тем, как запеть и т. п., либо рефлекторную реакцию его организма на какие-либо раздражители. Но главное, что вполне возможно и такое употребление, в котором говорящий имеет в виду только информацию о характере произведенного кем-то звука, не зная либо не считая важным аспект намеренности / ненамеренности этого действия. Неоднозначность такого типа и называется речевой (Апресян 1974: 176–178; Анна А. Зализняк 2006: 21–22). О п о л и с е м и и, или я з ы к о в о й м н о г о з н а ч н о с т и мы говорим тогда, когда при употреблении неоднозначного слова в контексте ситуации говорящий обязательно имеет в виду только одно из его значений. Так, глагол уточнить имеет два значения: 1) ‘сообщить более точную информацию о чем-л.’, как в (12); 2) ‘сделать так, чтобы получить более точную информацию о чем-либо’, как в (13) и (14). Изолированное от контекста предложение (15) можно понять в любом из этих значений: (12) Он уточнил, что приедет не раньше восьми вечера. (13) Медсестра уточнила у Петра его отчество. (14) Ученик уточнил написание слова по словарю. (15) Таксист уточнил, с кем сегодня играет «Ак Барс». (16) Если вы еще не применяли это средство, то обязательно уточните противопоказания. Но говорящий, употребляя (15) в речи, должен иметь в виду только одно из них. Неопределенность в подобных случаях исключается. При этом во втором значении остается недоопределенным способ добывания информации. В одних конкретных случаях, как в (13), это может речевое действие вопроса, в других, как в (14) — чтение, в третьих, проведение разведки на местности и т. д. Этот аспект действия говорящий вполне может не закладывать в смысл своего сообщения, как в (16). Это значит, что второе значение слова уточнить нет оснований дробить на более конкретные, указыва ющие на способ получения информации. Семантика 189 При этом легко заметить, что в (13) недоопределенный в лексическом значении глагола способ добывания информации однозначно понимается как спрашивание благодаря синтаксической связи с группой у NPодуш. Подобный эффект называется р а з р е ш е н и е м н е о д н о з н а ч н о с т и с л о в а в к о н т е к с т е. В данном случае лексическое значение глагола вступает во взаимодействие с единственным из семантически совместимых с ним ролевых значений конструкции у NPодуш — ролью Исходного Обладателя и конкретизируется как ‘Х сделал так, чтобы получить информацию, которой исходно обладало лицо Y’. По умолчанию (т. е. если не сказано иное) способом получения информации от лица, которое ею располагает, является речевой акт вопроса. Так следует ли выделять в качестве отдельного значения глагола то, которое оно закономерно получает в определенном типе конструкций? Критерии установления количества лексических значений многозначного слова, основания для проведения границ между отдельными значениями — одна из дискуссионных проблем теоретической семантики. В структуралистской семантике неоднозначные слова обычно представлены большим количеством значений и подзначений, в зависимости от характера и степени их сходства, т.к. в качестве отдельных выделяются все значения, различия между которыми проявляются в тех или иных синтаксических конструкциях. Такое решение может быть удобным для каких-то целей, но вряд ли адекватно отражает устройство языковой способности человека. В когнитивной семантике напротив стремятся свести количество выделяемых значений к минимуму, в идеале к одному значению, которое модифицируется под влиянием либо синтаксического, либо ситуативного контек ста. Часто такое значение, особенно у служебных слов, задается в виде единой абстрактной схемы, а его различные конкретные употребления понимаются как модификации, или грани этой схемы, проявляющиеся в определенных типах контекстов, см. напр. Киселева, Пайар ред. 1998. Когнитивные механизмы появления у слова нового значения. Разные значения полисемичной лексемы фиксируют синхронное состояние, которое является результатом диахронического развития ее первичного значения, которое называют п р я м ы м н о м и н а т и в н ы м з н а ч е н и е м слова. Значения, развившиеся на основе уже имеющегося, называются п р о и з в о д н ы м и или п е р е н о с н ы м и. Сам процесс образования у слова таких значений называется с е м а н т и ч е с к о й д е р и в а ц и е й. Все конкретные изменения, которым подвергаются значения слов в речи и которые затем могут «откладываются» в языке в виде отдельных частных 190 И. М. Кобозева, С. Г. Татевосов значений многозначного слова, сводятся к двум основным типам — метафоре и метонимии. М е т а ф о р а обычно понимается как перенос слова А, исходно обозначавшего объект или ситуацию A, на объект или ситуацию Б, которая обнаруживает то или иное с х о д с т в о с А (см. выше язык1 → язык4), а м е т о н и м и я — как перенос слова А на объект или ситуацию Б, которая находится с А в отношении смежности (напр., запрашивание информации в норме «смежно» с ее сообщением в ответ на запрос, что лежит в основе метонимического переноса уточнять1 ‘спрашивать’ → уточнять2 ‘сообщать’). В когнитивной семантике семантическая деривация изучается как поверхностное проявление действия когнитивных механизмов. В частности в теории концептуальной метафоры (Лакофф, Джонсон 2008) метафора представлена как инструмент осмысления, концептуализации новой сферы опыта («области — мишени») при помощи наложения на нее тех понятий и отношений, которые сформировались в другой сфере опыта («области — источнике») и нашли отражение в прямых значениях слов, относящихся к этой сфере. Так, на область времени были перенесены категории и отношения, выделенные в ходе освоения и осмысления пространства, что наглядно показывают те исходно «пространственные» слова, при помощи которых мы мыслим и говорим о времени (ср. перед, в, конец, следовать за и т. д. и т. п.); на область речевой коммуникации были перенесены понятия, связанные с манипуляцией физическими объектами (передавать, получать), на область межгосударственных отношений — понятия, связанные с межличностными отношениями (дружба, взимопомощь, бойкот и др..). Как было сказано выше, слово активирует в сознании не только компоненты своего лексического значения, но и многочисленные понятия, знания и представления, имеющие отношение к обозначаемой сущности. В когнитивных науках структуру взаимосвязанных понятий, соотносящихся с тем или иным объектом или явлением, чаще всего называют ф р е й м о м (frame), см. Минский 1978; Баранов 1987, а ее структурные элементы — с л о т а м и. Так, во фреймы сложно устроенных физических объектов в качестве слотов входят их составные части, во фреймы животных — среда их обитания, то, чем они питаются, то, как человек их использует и т. п., во фреймах объектов искусственного происхождения (артефактов) будут слоты материала, из которого этот объект изготовлен, способа изготовления, назначения и т. д. Во фрейм ситуации входят типы и роли ее участников, условия ее возникновения, ее последствия и т. п. Явление м е т о н и м и и при когнитивном подходе к ней можно трактовать как применение одного и того же слова, активирующего данный фрейм, к разным его слотам. Так, имя целого в ходе семантической деривации регулярно переносится на часть и наобо- Семантика 191 рот, ср., город1 ‘крупный населенный пункт’ → город2 ‘население города’, слива1‘плодовое растение …’ → слива2 ‘плод этого растения’; имя свойства части переходит на свойство целого круглый1 (напр., о корже для торта) → круглый2 (о торте из таких коржей); имя материала переносится на изделия из него фарфор1 (материал) → фарфор2 (изделия из этого материала); одно и то же слово может обозначать состояние, переход в состояние и действие, приводящее в это состояние, ср. англ. opеn1 ‘открытый’(The door was open) — opеn2 ‘открываться’ (The door opened)20 — opеn3 ‘открывать’ (I opened the door). В отличие от метафоры, при метонимии слово не покидает границ одной сферы опыта, или, используя традиционный семантический термин, — границ своего семантического поля. 5.3. Семантика словосочетания: свободные словосочетания vs. фразеологизмы Значения сочетаний слов, построенных по правилам синтаксиса ЕЯ, в общем случае представляют собой результат соединения лексических и грамматических значений составляющих их слов со значением морфо-синтаксической конструкции, в которую они входят. Правила такого соединения называются п р а в и л а м и в з а и м о д е й с т в и я, или к о м п о з и ц и и значений (Апресян 1974: 79–94; Падучева 1999). Примером таких правил может служить правило заполнения семантических валентностей предикатного слова значениями его синтаксических актантов. В формальных репрезентациях значений слов на семантическом метаязыке это правило соответствует заполнению переменных в толковании предикатного слова. Еще один пример таких правил — правило зачеркивания повторяющихся семантических компонентов сочетания (в том случае, когда повтор не несет дополнительной смысловой нагрузки, напр., не используется в целях усиления, подчеркивания) ср. лингвистическая наука, где компонент ‘наука’ выражен дважды. Разработка полной, непротиворечивой и неизбыточной системы правил взаимодействия значений представляет собой одну из важных и сложных задач семантического описания языка. Словосочетания, в которых соединение значений подчиняется общим правилам семантической композиции, называются с в о б о д н ы м и, как, напр., собирать грибы, вытирать насухо, очень болен, новая лодка и т. д. и т. п. Но в ЕЯ много таких словосочетаний, значение которых по тем или иным причинам не может быть описано как результат применения общих правил То, что оpеn2 отличается от opеn1 грамматическим значением, при рассмотрении семантической деривации не столь существенно. 20 192 И. М. Кобозева, С. Г. Татевосов взаимодействия значений. Такие сочетания слов называются ф р а з е о л о г и з м а м и, или ф р а з е м а м и, а область лингвистики, занимающаяся их изучением — ф р а з е о л о г и е й. В области фразеологии построены классификации фразем, основанные на разных их свойствах, или параметрах (см., напр., Виноградов 1977; Иорданская, Мельчук 2007: 213–246; Баранов, Добровольский 2008). Например, фразема точить лясы ‘разговаривать о чем-то не важном (с точки зрения говорящего)’ обладает свойствами непрозрачности, переинтерпретации компонентов, устойчивости (Баранов, Добровольский 2008). Она непрозрачна уже потому, что слово лясы вместе с его значением уже выбыло из языка. Она требует переинтерпретации слова точить, т. е. приписывания ему такого значения, которое отсутствует у него в данном языке. Она устойчива, в частности синтаксически не трансформируема, ср., долго вели разговор → вели долгий разговор, но долго точить лясы → *точить долгие лясы. Фразема подлить масла в огонь ‘вызвать усиление интенсивности конфликтной ситуации’ прозрачна потому что ее значение связано со значением соответствующего свободного сочетания (буквальным значением фраземы) концептуальной метафорой КОНФЛИКТ — ЭТО ОГОНЬ (ср. ее отражение в сочетаниях разгорелась ссора, погасить конфликт, притушить искры конфликта и т. п.); она требует переинтерпретации обоих компонентов в соответствии с указанной метафорой (огня как конфликта, масла как фактора его интенсификации), и она устойчива (огонь не заменим на его синоним пламя или имя другого горючего вещества, к маслу и огню нельзя добавить определений, разве что в целях языковой игры, ср. Что он ни делал, чтобы их примирить, это только подливало бензина / подсолнечого масла в полыхающий огонь). С учетом различий в их свойствах фраземы делят на классы. И д и о м ы характеризуются либо непрозрачностью, либо необходимостью переинтерпретации всех компонентов. Оба приведенных примера фразем относятся, таким образом, к идиомам. Другой важный тип фразем — к о л л о к а ц и и отличается тем, что основное, «ключевое» слово, определяющее значение всего сочетания, выступает в своем обычном, буквальном значении, а другое слово выбирается для выражения нужного компонента смысла в зависимости от «ключевого» слова. Так, в коллокациях сокрушительное поражение и головокружительный успех с ключевыми словами поражение и успех прилагательные нельзя поменять местами, хотя их значение в данных сочетаниях одинаково — ‘в высокой степени’. Выше мы рассматривали подобные сочетания как проявление ограничений лексической сочетаемости, улавливаемые при помощи аппарата лексических параметров. Таким образом, сфера фразеологии пересекается со сферой изучения сочетаемости слова. Семантика 193 5.4. Семантика предложения-высказывания Языковое значение предложения и смысл, которое оно приобретает, становясь высказыванием в конкретной ситуации его употребления, заключают в себе те же типы информации, которые можно обнаружить в слове — денотативный, сигнификативный, прагматический и синтаксический (см. выше раздел 5.1.2). Естественно, языковые единицы уровня предложения имеют семантические свойства и семантическую структуру, которые специфичны именно для них. Только предложение обладает свойством выражать суждение о чем-либо, которое, будучи соотнесено с действительно стью, может быть оценено как истинное или ложное. Только предложениевысказывание расценивается как коммуникативный акт, направленный на достижение той или иной цели говорящего. Слово же выступает как строительный материал для предложения. Само по себе, вне предложения, слово не выражает суждения, не может быть оценено как истинное или ложное, не указывает на цель говорящего. В семантической структуре предложения выделяется как минимум три компонента, выполняющие разные функции: пропозициональный, коммуникативный и прагматический. 5.4.1. Пропозициональное содержание предложения. Пропозициональное содержание предложения, или п р о п о з и ц и я — это сигнификативная, концептуальная часть его значения, которая отображает некоторое возможное положение дел в его определенной интерпретации, но без оценки его как имеющего или не имеющего места в мире. Так, предложения (17)–(19), а также придаточное предложение в (20) при всем различии в их значениях, имеют одно и то же пропозициональное содержание: (17) Петя уезжает. (18) Петя уезжает? (19) Уезжай, Петя! (20) Отец не хочет, чтобы Петя уезжал Все они обозначают ситуацию отъезда с ее участником-Агенсом по имени Петя, не специфицируя участников с ролями Начальной и Конечной точки. В (17) помимо пропозиционального содержания выражена также оценка говорящим данной пропозиции как истинной, в (18) выражена неизвестность говорящему ее истинностной оценки, в (19) и (20) выражена оценка пропозиции как ложной (т.к. обозначаемая ею ситуация, по мнению говорящего, не имеет места в реальном мире). Пропозиция задает условия истинности высказывания, в котором она утверждается. 194 И. М. Кобозева, С. Г. Татевосов При употреблении предложения содержащиеся в нем имена участников обозначаемой предикатом ситуации вступают в отношения р е ф е р е н ц и и с объектами мира дискурса. Как было сказано выше, слова как единицы словаря языка, денотируют множество всех сущностей, которые могут быть обозначены данным словом — экстенсионал слова. В дискурсе те же слова, точнее, содержащие их ИГ соотносятся лишь с той частью этого множества, которую имеет в виду говорящий, называемой р е ф е р е н т о м И Г. Тот способ, каким ИГ указывает на свой референт, называется р е ф е р е н ц и а л ь н ы м с т а т у с о м (РС) ИГ. С точки зрения теории референции ИГ может быть разделена на две части — о б щ е е и м я, задающее тот класс, к которому принадлежит референт, и а к т у а л и з а т о р Р С — выражение, которое указывает, каким способом надо выбирать референт из эктенсионала общего имени. Так, в предложении (17) при его типовом употреблении ИГ Петя отсылает к существующему в мире дискурса лицу по имени Петя, которое, по мнению говорящего (Г), известно адресату (А) и будет активировано в его сознании в данной коммуникативной ситуации (при том, что в принципе А может знать много лиц с таким именем, существующих в мире дискурса). Такой РС называется референтным определенным. Основным показателем данного РС в языках с артиклями типа английского или венгерского является определенный артикль, а в языках типа русского — указательные местоимения, употребление которых, в отличие от артиклей, не обязательно при данном РС ИГ. Сравним предложения (21) — (23): (21) Один ученый сравнил семантику с владетельной принцессой. (22) Какой-то ученый сравнил семантику с владетельной принцессой. (23)Мог ли какой-нибудь ученый сравнить семантику с владетельной принцессой? В (21) актуализатор один придает ИГ один ученый РС «референтный слабоопределенный» (т. е. Г имеет в виду конкретного известного ему ученого, и не предполагает, что референт известен А); в (22) актуализатор какой-то служит показателем РС «референтный неопределенный» (т. е. Г имеет в виду существующего в действительном мире ученого, о котором он знает только то, что тот употребил такое сравнение, и не предполагает, что референт известен А); актуализатор какой-нибудь в (23) указывает на статус «нереферентный экзистенциальный» (т. е. Г предполагает существование референта в возможном мире, отличном от действительного). Полное описание РС ИГ на семантическом метаязыке Московской семантической школы дано в (Падучева 1985). С описанием различных способов соотнесения языковых выражений с их референтами в других теоретических рамках знакомит сборник НЗЛ 1982. Семантика 195 5.4.2. Коммуникативный компонент значения предложения. Рассмотрим следующие предложения, отмечая при помощи знака «/» — восходящий фразовый акцент (далее для краткости просто акцент) на слове, при помощи «\» — нисходящий акцент, а двойным слэшем будем отмечать усиленный, так наз. «контрастивный» акцент: (24) В коридоре/ мы повесим эту картину\. (25) Мы повесим эту картину/ в коридоре\. (26) Эту// картину мы повесим в коридоре\\. Предложения (24)—(26) при условии, что референты всех ИГ в них тождественны, имеют одно и то же пропозициональное содержание. Это легко проверить, установив, что если утверждение любого из этих предложений будет истинно в мире дискурса, то истинными в нем будут и два других. Значит ли это, что означаемые этих предложений полностью тождественны, что различия в порядке слов и интонации, или л и н е й н о - а к ц е н т н о й с т р у к т у р е (ЛАС) этих предложений (Падучева 2016) семантически не существенны? Если бы это было так, то данные предложения могли бы заменять друг друга в любом контексте. Но это не так. Для ответа на вопрос Что мы повесим в коридоре? подойдет только (24), на вопрос Где мы повесим эту картину? — только (25), а на вопрос А эту\\ картину мы куда\\ повесим? — только (26). Что же вносит ЛАС в значение предложения? Она служит средством выражения того его компонента, который в разных лингвистических теориях называется по-разному: актуальное членение, функциональная перспектива, упаковка, коммуникативная организация смысла (КОС), информационная структура. Мы будем использовать термин Московской семантической школы — КОС, ясно указывающий на то, что речь идет о компоненте содержания предложения, а не о предложении как двусторонней единице языка. Все термины, включая КОС, показывают, что ЛАС не вносит ничего нового в пропозициональное содержание предложения, а только определенным образом структурирует, организует, «упаковывает» его. Это добавля емая информация о том, как пропозициональное содержание встраивается в контекст коммуникации, своего рода инструкции адресату о том, как он должен соотнести поступающую информацию с уже имеющейся. Основными категориями КОС, в терминах которых как бы размечается пропозиция предложения являются т е м а / р е м а, д а н н о е / н о в о е, ф о к у с к о н т р а с т а . Тема — это то, «о чем» данная пропозиция, тема служит исходной точкой сообщения. Тема обычно стоит в начале предложения и произносится с второстепенным (восходящим) акцентом. Рема — то, что сообщается о теме. Рема обычно стоит в конце предложения и несет главный (нисходя- 196 И. М. Кобозева, С. Г. Татевосов щий) акцент. В (24) тема — ‘коридор’, рема —‘мы (там) повесим картину’); в (25) тема — ‘место, где мы повесим картину’, рема — ‘коридор’, в (26) тема — ‘эта картина’, рема —‘мы повесим (ее) в коридоре’. Противопоставление д а н н о е / н о в о е отражает активированность / неактивированность информации в сознании коммуникантов в момент высказывания. Обычно тема содержит уже активированную в сознании адресата информацию, т. е. является одновременно и данным, как во всех примерах (24) — (26), но темой может быть и новое, как в начале рассказа А. П. Чехова «Белолобый» (27), а ремой — данное, как в (28): (27) Голодная волчиха / встала, чтобы идти на охоту\. (28) Состоялся матч чехов с канадцами. Выиграли чехи \. (Оба примера взяты из Падучева 2016: 56) Фокус контраста — это такой коммуникативный статус компонента ‘Аi’ в составе пропозиции, который добавляет информацию о включенности ‘Аi’ в контекстно-обусловленное множество {‘А1’,‘А2’, …‘Аn’ } и о том, что ‘Аi’ противопоставлен всем другим членам этого множества в отношении того свойства, о котором идет речь в предложении. Показателем фокуса контра ста служит контрастивный акцент. Фокус контраста представлен в (26), где к пропозициональному содержанию добавляет информацию о том, что помимо «этой» имеются и другие картины, но они, скорее всего, будут повешены не в коридоре. К коммуникативному компоненту значения предложения имеет отношение и целый ряд других категорий, предлагавшихся в семантических работах, причем не обязательно посвященных проблематике КОС. Это фон / фигура в Talmy 1983, коммуникативные ранги в Падучева 2004, психологическая важность (Мельчук 1974: 65–66), эмфаза (Мельчук 1974: 66; Янко 2001: 64–67), эмпатия (Чейф 1982). Пока эти категории, их содержание, соотношение с общепринятыми категориями КОС еще недостаточно изучены, и ясно, что для построения всеобъемлющей теории коммуникативной организации концептуального содержания предложения потребуется еще много усилий. 5.4.3. Прагматический компонент смысла предложения-высказывания. Смысл высказывания, помимо отображаемой пропозициональным компонентом ситуации, которую коммуникативный компонент подает в определенном ракурсе, содержит и прагматическую информацию, т. е. информацию о говорящем, его отношении к собственному высказыванию, к тому, о чем он говорит, к собеседнику и другим аспектам коммуникативной ситуации. Эта информация и составляет прагматический компонент смысла высказывания. Семантика 197 Иногда этот компонент называют и л л о к у т и в н ы м, имея в виду понятие и л л о к у т и в н о й с и л ы, или и л л о к у т и в н о й ф у н к ц и и (ИФ) высказывания (Остин 1986). ИФ характеризует высказывание как действие, совершаемое в определенных условиях с определенной целью, предназначенной для распознавания ее адресатом. Высказывание в его отношении к манифестируемой в нем цели и условиям осуществления называется и л л о к у т и в н ы м а к т о м (ИА) в противовес л о к у т и в н о м у а к т у, совершаемому одновременно с ним и состоящему в чисто языковых операциях: производстве знаков ЕЯ и соединении их по правилам языка для выражения некоторого пропозиционального содержания. Иллокутивный акт — это действие, осуществляемое при говорении (лат. in locutio). Вот как это понятие вводится у Остина. «Чтобы определить, что представляет собой осуществленный иллокутивный акт, следует установить, каким образом мы используем локуцию (пропозициональное содержание — И.К.): спрашивая или отвечая на вопрос; информируя, уверяя или предупреждая; объявляя решение или намерение; объявляя приговор, назначая, взывая или критикуя; отождествляя или описывая и т. п.» (Остин 1986: 86). И л л о к у т и в н а я ф у н к ц и я (далее ИФ) — это тот компонент смысла, который надо добавить к пропозиции, чтобы стало понятно, с какой целью она вводится в дискурс. Об ИФ можно говорить только применительно к высказыванию, а применительно к изолированному от контекста предложению можно говорить только об и л л о к у т и в н о м п р е д н а з н а ч е н и и или и л л о к у т и в н о м п о т е н ц и а л е. Так, в нулевом контексте (и без учета интонации) предложение Попробуй только! неоднозначно как в отношении пропозиционального содержания, так и в отношении ИФ. Две возможных интерпретации, и соответственно две ИФ этого предложения представлены в (29): (29) 1) ‘усиленная просьба’ + ‘ты пробуешь (некоторое блюдо)’ 2) ‘ответная угроза’ + ‘если ты попытаешься сделаешь это, у тебя будут большие неприятности’ Итак, в семантической структуре высказывания выделяется дополнитель ный к пропозициональному содержанию компонент — прагматический, характеризующий условия употребления этого предложения, и, в первую очередь, — цель, с которой оно используется. Этот компонент отражается в языковой структуре используемого предложения с разной степенью эксплицитности. То, что в отечественных грамматиках называется т и п о м п р е д л о ж е н и я п о ц е л и в ы с к а з ы в а н и я, а в западной традиции — с и н т а к с и ч е с к и м т и п о м (повествовательные, вопросительные и побудительные предложения) отражает всего два типа и один вид ИФ: репрезентативный 198 И. М. Кобозева, С. Г. Татевосов тип ИФ (цель — представить ситуацию как имеющую место в мире), побудительный тип ИФ (цель — побудить адресата осуществить ситуацию), и ИФ вопроса соответственно. Однако, если принять во внимание не только морфосинтаксическую структуру предложения, но и его лексический состав, т. е. если рассматривать лексико-синтаксическую структуру в целом, то можно увидеть, что форма предложения гораздо точнее указывает на типовые условия его употребления, в том числе на типовую коммуникативную цель. Прежде всего существует особый класс предложений, прямо эксплицирующий ИФ высказывания, которое производится с их помощью. Это так называемые п е р ф о р м а т и в н ы е п р е д л о ж е н и я. Основу лексико-семантической структуры этих предложений составляет так называемый и л л о к у т и в н ы й г л а г о л, т. е. глагол, относящийся к подклассу глаголов говорения и содержащий в своем лексическом значении компонент, указывающий на цель говорения и факультативно указывающий на другие условия осуществления речевого действия, например, просить, поздравлять, уверять, обещать и т. п. Однако наличие иллокутивного глагола не является достаточным условием для того, чтобы предложение было перформативным. Иллокутивный глагол должен быть употреблен не для того, чтобы описать некоторое речевое действие, а для того, чтобы пояснить, какой речевой акт совершает говорящий, употребляя данное предложение. Канониче ская форма перформативного предложения: подлежащее, выраженное личным местоимением 1 л., ед. ч. и сказуемое в форме индикатива настоящего времени активного залога. Например, Поздравляю с днем рождения!; (Я) обещаю вам исправиться. Первоначально понятие ИФ фактически отождествлялось со значением иллокутивного глагола, и ИФ трактовалась как семантически неразложимая сущность. Однако, так же, как значение иллокутивного глагола разложимо на семантические компоненты (Вежбицка 1985), так и понятие ИФ следует рассматривать не как неделимое, а как кластер признаков, каждый из которых соответствует одному из условий успешного осуществления иллокутивного акта. К числу этих признаков в Серль 1986b относятся: — цель речевого акта; — психологическое состояние говорящего (ментальное, волевое, эмоциональное); — соотношение социальных статусов говорящего и слушающего; — связь высказывания с интересами говорящего; — связь высказывания с остальной частью дискурса; — связь высказывания с деятельностью в рамках определенных социальных институтов (таких, например, как парламент, суд, церковь); — стиль осуществления речевого акта. Семантика 199 Данные типы прагматической информации имеют в лексико-синтаксической структуре предложения свои показатели — и н д и к а т о р ы И Ф. Наличие в предложении таких индикаторов определяет его иллокутивный потенциал. Наиболее точным индикатором ИФ является перформативный глагол в перформативном употреблении. Определенную ИФ имеют и так называемые речевые клише, например До свидания! (ИФ прощания), Вон отсюда! (ИФ требования (покинуть помещение), Г находится в активно-отрицательном эмоциональном состоянии, вызванном действием С). Тип предложения по цели высказывания (повествовательный, вопросительный, побудительный) указывает только на такой компонент ИФ, как цель говорящего, да и то не точно. Так, побудительное предложение может иметь ИФ разрешения, цель которого — не побуждать адресата к действию, а снять препятствия к его осуществлению. Косвенными индикаторами ИФ служат вводные слова и частицы. Значения многих из них заключают в себе информацию прагматического характера, которая предъявляет свои сочетаемостные требования к ИФ высказывания (Кобозева 1989). Одним из наиболее распространенных способов репрезентации прагматического (иллокутивного) компонента предложения-высказывания является характеристика условий его уместного употребления в речи, называ емых у с л о в и я м и у с п е ш н о с т и. Условия успешности делятся на четыре типа: 1) у с л о в и я п р о п о з и ц и о н а л ь н о г о с о д е р ж а н и я, 2) п о д г о т о в и т е л ь н ы е, или п р е д в а р и т е л ь н ы е у с л о в и я, 3) у с л о в и я и с к р е н н о с т и, 4) с у щ е с т в е н н о е у с л о в и е, или у с л о в и е н а з н а ч е н и я. Условия первого типа эксплицируют не саму ИФ, а сочетаемостные требования, которые она накладывает на содержание пропозиционального компонента смысла высказывания. Существенное условие эксплицирует главный компонент ИФ — иллокутивную цель (цель Г, которую он стремится довести до сознания С при помощи своего высказывания). Подготовительные условия отражают объективные и субъективные предпосылки, совместимые с выдвижением данной иллокутивной цели, то есть обстоятельства речевого акта, при отсутствии которых он потерпит коммуникативную неудачу. Условия искренности отражают психическое состояние, в котором должен находиться Г, если его высказывание искренно и серьезно (в отличие от подготовительных условий, нарушение говорящим условий искренности обычно проходит незамеченным и непосредственно не влечет за собой коммуникативного провала, хотя и может быть разоблачено в дальнейшем). Так, ИФ обещания согласно Searle 1969; Серль 1986а, Падучева 1985: 24–25 может быть эксплицирована в виде следующих усло- 200 И. М. Кобозева, С. Г. Татевосов вий успешности речевого акта обещания, осуществляемого с помощью высказывания Т: Условие пропозиционального содержания: Произнося Т, Г выражает мысль, о том, что Г совершит действие Д в будущем. Подготовительные условия: 1. Г в состоянии совершить Д; 2. С предпочел бы совершение Г-им действия Д его несовершению и Г убежден в том, что это так; 3. Ни Г, ни С не считают, что совершение Г-им действия Д есть нечто само собой разумеющееся. Условие искренности: Г намерен совершить Д. Существенное условие: Г намерен с помощью высказывания Т связать себя обязательством совершить Д. Существуют и другие способы репрезентации прагматической информации, передаваемой предложением-высказыванием, напр., модальные рамки А. Вежбицкой. 5.5. Формальная семантика Формальная семантика — разновидность семантики, для которой характерно использование методов, понятийного аппарата и приемов теоретизирования, разработанных в различных математических дисциплинах (в первую очередь в математической логике) и аналитической философии. Как и «обычная» семантика, формальная семантика нацелена на объяснение семантической компетенции носителей языка, в частности, их способности соотносить языковые выражения с объектами внеязыковой действительности, их суждений о смысловых отношениях между такими выражениями и возможности выстраивать более сложные смыслы из более простых. 5.5.1. Семантика на маленьком примере. Чтобы увидеть небольшую часть формальной семантики в действии, разберем простой пример. (По соображениям места мы не имеем возможности обсуждать многие важные проблемы, альтернативные теоретические решения и подкрепляющие их эмпирические аргументы. Для обстоятельного ознакомления с предметом мы рекомендуем читателю обратиться к более подробным введениям в фор- Семантика 201 мальную семантику, напр., Heim, Kratzer 1998; von Fintel, Heim 2017 или Portner 2005). Предположим, что русский язык состоит исключительно из простых предложений типа (30), в котором подлежащее — именная группа, состоящая из имени собственного, а сказуемое — непереходный глагол. Предположим также, что этот упрощенный, игрушечный русский язык (ИРЯ) лишен каких-либо семантически наполненных грамматических категорий и глагол соответственно имеет единственную форму — такую, как поет в (30): (30) Пол Маккартни поет. Вот первые два вопроса, на которые должен ответить формальный семантист: — Каково значение предложения (30) и его элементов — именной группы Пол Маккартни и глагола поет? — Как значения элементов соединяются в целое и в результате дают значение предложения? Носители естественных языков имеют отчетливую интуицию по поводу смыслового содержания предложений, в частности (30): предложения можно соотнести с внеязыковой действительностью и попытаться выяснить, правильно ли они описывают то, что в ней происходит. Попытка может быть успешной или безуспешной. Носитель языка, находящийся на концерте Пола Маккартни, вероятнее всего, признает предложение (30) правильно описывающим действительность, или и с т и н н ы м. Носитель, увидевший Пола Маккартни спящим на концерте Мадонны, по-видимому, признает его л о ж н ы м. Носитель, который не представляет себе, чем занят Пол Маккартни (или вовсе не знает, кто это такой) вряд ли сможет сказать, истинно предложение или ложно. Однако всех трех носителей объединяет важное знание: как должен быть устроен мир, чтобы (30) было истинным. В мире должен существовать субъект, который носит имя Пол Маккартни, и он должен быть занят тем, что описывается глаголом петь. Это дает, вероятно, самое распространенное в формальной семантике (хотя и далеко не един ственное) понимание того, что представляет собой значение предложения: (31) Мы знаем значение предложения S, если мы знаем его у с л о в и я и с т и н н о с т и, а именно: как должен быть устроен мир, чтобы S было истинным. Семантическая теория должна объяснять суждения носителей языка об условиях истинности предложений типа (30). Как этого добиться? Ниже мы изложим, как может быть устроена теория, которая решает эту задачу при- 202 И. М. Кобозева, С. Г. Татевосов менительно к ИРЯ, состоящему только из предложений типа (30). Для языка, более похожего на обычный русский (ОРЯ), теорию потребуется дополнять и расширять, но самые общие идеи, тем не менее, останутся неизменными. 5.5.2. Означаемое, домены, логические типы, функции. Прежде всего следует принять решение об о з н а ч а е м о м каждого языкового выражения, которое возможно в нашем языке. (Часто означаемые называются более техническим термином д е н о т а т (denotation), однако в современной семантической литературе на русском языке этот термин не полностью однозначен (см. раздел 5.1.2), так что ниже мы будем говорить об означаемых, а не о денотатах.) Для этого необходимо эксплицитно сформулировать, какие типы означаемых мы полагаем возможными. Лексические единицы языка характеризуются их морфосинтаксической категорией — существительное, глагол, прилагательное и так далее. Из них в процессе построения грамматической структуры создаются именные группы, глагольные группы, группы прилагательного. Все такие выражения характеризуются также семантической категорией, соответствующей т и п у их о з н а ч а е м о г о. Тип означаемого называется также л о г и ч е с к и м т и п о м. Для ИРЯ нам понадобится всего три таких типа. Первый логический тип — с у щ н о с т и (вещи, и н д и в и д ы), из которых составлено мироздание. Это базовый тип — в том смысле, что он не представим через какой-то другой род сущего. Существует традиция обозначать этот базовый тип буквой латинского алфавита е (от англ. entity ‘сущность’). Соответственно, множество всех сущностей / индивидов можно обозначить как E. Поскольку реальный мир обширен и слишком сложен, договоримся, что игрушечный язык описывает не менее игрушечную действительность, в которой есть всего три индивида на рис. 5.1. В обычной действительности они известны под именами Пол Маккартни, Мадонна и Брюс Уиллис. E Рисунок 5.1. Множество индивидов В языках имеется целый ряд выражений, означаемым которых выступают индивиды. В ОРЯ это, в частности, имена собственные, определенные именные группы и местоимения. В ИРЯ из них есть только имена собственные. Множество сущностей образует с е м а н т и ч е с к и й д о м е н, из которого такие выражения получают свое означаемое. Обычно этот домен Семантика 203 обозначается как De (где D соотносится со словом domain ‘область, домен’). Соответственно, мы будем говорить, что имена собственные имеют означаемое типа е или, что то же самое, что их означаемым выступают элементы De. Второй базовый логический тип — тип и с т и н н о с т н ы х з н а ч е н и й, который часто обозначается буквой t (от truth ‘правда, истина’). В нашей теории истинностных значения будет два — 1 («истинно») и 0 («ложно»). Множество истинностных значений {0, 1} образует другой домен, обозначаемый как Dt. Истинностные значения, как показывает предшествующие обсуждение, возникают в теории в тот момент, когда мы начинаем думать о значении предложения в терминах его истинности. Предложения получают свое означаемое из домена Dt. Кроме базовых логический типов, понадобятся производные. Мы не будем перечислять их, а зададим с помощью правила: (32) Если σ и τ — это логические типы, то функция из Dσ в Dτ — тоже логический тип, где Dσ и Dτ — это множества объектов, имеющих соответственно тип σ и τ. Для удобства длинное выражение «означаемое, имеющее логический тип функции из Dσ в Dτ» будем записывать более кратко c использованием угловых скобок: «означаемое типа <σ, τ>». Понятие функции вводится в школьной программе математики, однако для лучшего знакомства с предметом можно воспользоваться любым введением в математику для представителей других наук, например, введением в математику для лингвистов Partee et al. 1990. Работу правила (32) можно увидеть на следующем примере. Мы уже определили e и t (сущности и истинностные значения) как (базовые) логиче ские типы. Согласно (32), функции из De в Dt — это тоже логический тип, а именно: тип <e,t>. Пример такой функции показан на рис. 5.2. De (= E) 1 Dt 0 Рисунок 5.2. Функция из De в Dt Как показывает рис. 5.2, функция ставит элементам De в соответствие элементы Dt. Например, Полу Маккартни ставится в соответствие 0, а Ма- 204 И. М. Кобозева, С. Г. Татевосов донне — 1. (Вместо «функция ставит объект у в соответствие объекту х» часто говорят, что функция о т о б р а ж а е т х в у.) Правило (29) можно использовать дальше, создавая все более и более сложные типы. Несколько примеров показано в (33). Все такие типы релевантны для ОРЯ, однако для анализа ИРЯ они не понадобятся. (33) <e, <e,t>> <<e,t>, e> <<e,t>, t> <<e,t>, <e,t>> Таким образом, мы получаем систему с двумя базовыми логическими типами и бесконечным множеством производных. Последние представляют собой функции. Следующие два шага тесно связаны. Во-первых, надо соотнести логиче ские типы и лексико-синтаксические категории языка, то есть, в частности, определить тип собственных имен и непереходных глаголов. Во-вторых, надо сопоставить означаемое конкретным языковым выражениям. Означаемое имеет внеязыковой характер: как индивиды, элементы De, так и истинностные значения, элементы Dt, и тем более означаемые функциональных типов — это не часть языка. Приписывание языковым выражением внеязыкового означаемого называется с е м а н т и ч е с к о й и н т е р п р е т а ц и е й. Семантическая интерпретация обычно обозначается с использованием двойных квадратных скобок ⟦ ⟧ . (В техническом смысле ⟦ ⟧ — это функция, которая называется и н т е р п р е т и р у ю щ е й.) Запись ⟦ Брюс Уиллис ⟧ читается как «семантическая интерпретация имени собственного Брюс Уиллис» или «означаемое имени собственного Брюс Уиллис»21. Здесь и далее описывается так называемая п р я м а я и н т е р п р е т а ц и я, когда выражениям естественного языка непосредственно сопоставляются некоторые внеязыковые сущности в качестве означаемого. В формально-семантических работах не менее распространена и другая стратегия — стратегия о п о с р е д о в а н н о й и н т е р п р е т а ц и и. В последнем случае выражения естественного языка с помощью отдельного блока правил переводятся на язык-посредник, которым обычно выступает один из языков формальной логики. Интерпретации подвергаются выражения языка-посредника. Эти две стратегии дают эквивалентный результат. Недостаток последней — несколько большая громоздкость, достоинство — то, что все свойства языка-посредника известны заранее, и на это можно опираться в рассуждениях про естественный язык, выступающий объектом анализа. 21 Семантика 205 Как мы уже сказали, стандартный взгляд на и м е н а с о б с т в е н н ы е состоит в том, что они обозначают конкретный индивид. При семантиче ской интерпретации они получают означаемое из домена De. Вот несколько примеров: (34) a. ⟦ Пол Маккартни ⟧ = b. ⟦ Мадонна ⟧ = c. ⟦ Брюс Уиллис ⟧ = Что выступает означаемым одноместных глаголов, например, поет? Предположим, что в игрушечном мире, как и в обычном, Пол Маккартни и Мадонна поют, а Брюс Уиллис нет, как показано на рис. 5.3. Поющие индивиды обведены пунктирной линией. Ϟϝϭϡ De (=E) Рисунок 5.3. Поющие индивиды из De Рисунок 5.3 подсказывает простое решение по поводу того, как анализировать непереходные глаголы типа петь: можно объявить их означаемым множество тех, кто поет, как в (35): (35) ⟦ поет ⟧ = { , } Проблема в том, что среди возможных типов означаемого, заданных выше, есть только два множества — De и Dt; все остальное — функции. Однако ни De ни Dt не соответствует тому, что представлено в (35); в (35) речь идет о с о б с т в е н н о м п о д м н о ж е с т в е De. К счастью, есть способ задать (35) с помощью функции. Для этого нужна функция из De в Dt, изображенная на рис. 5.4, которая всех поющих индивидов отображает в 1, а всех остальных — в 0. (Такая функция как бы исследует индивидов на предмет пения, и тем, кто поет, выставляет 1, а остальным 0.) Таким образом функция выделяет, или, говоря более техническим языком, х а р а к т е р и з у е т множест- 206 И. М. Кобозева, С. Г. Татевосов во поющих: множество состоит ровно из тех элементов De, которые отображаются в 1. De (=E) 1 Dt 0 Рисунок 5.4. Характеристическая функция множества поющих индивидов Означаемое поет теперь можно представить в виде (36): (36) ⟦ поет ⟧ — это (наименьшая) функция из множества De в множество Dt (т. е. выражение типа <e,t>), которая отображает индивида х в 1 тогда и только тогда, когда х поет Более коротко и технически то же самое, что в (36), можно выразить так, как показано в (37): (37) ⟦ поет ⟧ = λx: x ∈ De. х поет (37) содержит символ «λ» (лямбда). В (37) «λ» указывает, что перед нами функция. Выражение «х» после «λ» — а р г у м е н т функции. Выражение «x ∈ De» указывает, что аргумент относится к домену De, множеству индивидов. Выражение типа «x поет» представляет собой о п и с а н и е з н а ч е н и я ф у н к ц и и. В нашем случае значение функции описывается следу ющим образом: функция отображает индивида х в 1, если индивид х поет (и в 0 в противном случае). Таким образом, (37) содержательно полностью эквивалентно (36) и отличается от него лишь нотацией. (λ-нотация как способ описания функций имеет настолько широкое распространение, что именно символ λ для многих лингвистов олицетворяет формальную семантику, «науку о лямбдах».) Другие одноместные глаголы будут обозначать функции такого же типа, но характеризующие другие множества. Например, функция в (38) представляет собой характеристическую функцию множеств веселящихся индивидов: (38) ⟦ веселится ⟧ = λx: x ∈ De. х веселится Если игрушечный мир устроен так, как показано на рис. 5.5, эта функция отобразит в 1 Мадонну и Брюса Уиллиса, а Пола Маккартни отобразит в 0. Семантика 207 Ϟϝϭϡ De (=E) ϑϔϠϔϚϮϡϠϮ Рисунок 5.5. Поющие и веселящиеся индивиды из De Все эти соображения отвечают на вопрос о том, что выступает означа емым л е к с и ч е с к и х е д и н и ц, составляющих предложения. Обычная среди семантистов практика — рассматривать всю совокупность информации об означающих лексических единиц языка в виде единого словарного блока, для обозначения которого используются различные символы, например, F. В техническом смысле F — это функция, которая получает на вход лексическую единицу, а на выходе дает ее означаемое: (39) a. F(Брюс Уиллис) = b. F(веселится) = λx: x ∈ De. х веселится В теории в таком случае появляется дополнительное правило: (40) Если a — единица словаря, то ⟦ a ⟧ = F(a) «Чтобы узнать интерпретацию лексической единицы а, надо обратиться к словарю» Словарная информация вкупе с информацией об устройстве действительности критически необходима для интерпретации произвольных языковых выражений. Чтобы понимать язык, надо знать означаемое отдельных слов. С другой стороны, как мы уже видели, семантика слов и предложений устанавливается п р и м е н и т е л ь н о к имеющейся действительности. (Например, условия истинности предложения (30) таковы, что оно истинно, если в д е й с т в и т е л ь н о с т и индивид с именем Пол Маккартни находится в множестве поющих индивидов.) Большинство семантистов в своих теоретических построениях делают этот аспект интерпретации эксплицитным и говорят не об интерпретации вообще, а об интерпретации о т н о с и т е л ь н о м о д е л и. Моделью, следуя традиции, унаследованной от логики и философии языка, называется пара вида <O, F>, где О — это о н т о л о г и я, то есть информация о том, какого рода сущности образуют структуру действительности, и уже знакомая нам функция F, приписывающая означаемое лексическим единицам языка. В рассматриваемом здесь случае онтология исчерпывается множеством ин- 208 И. М. Кобозева, С. Г. Татевосов дивидов Е, однако в анализе более полных фрагментов естественного языка фигурируют значительно более сложные онтологии. Эксплицитное указание на то, что интерпретация осуществляется по отношению к модели М, обычно делается в виде верхнего индекса, подписанного к интерпретиру ющей функции ⟦ ⟧, т. е. ⟦ ⟧М. Соответственно, запись вида ⟦ a ⟧ М читается как «интерпретация выражения а относительно модели М». В оставшейся части этого раздела мы будем пользоваться именно такой записью, где М = <E, F> (E — это множество индивидов на рис. 5.1, а F представляет словарную информацию, описанную в (34a-c) и (36)–(38). 5.5.3. Интерпретация и композициональность. Следующий вопрос: когда составляющие соединяются в синтаксическое целое, как взаимодействуют их означаемые? При ответе на этот вопрос подавляющее большин ство семантистов руководствуется п р и н ц и п о м к о м п о з и ц и о н а л ь н о с т и, который связывают с именем немецкого логика и философа Готлоба Фреге. Принцип известен во многих (близких) формулировках, одна из которых приводится в (41): (41) Значение целого выражения полностью выводится из значения частей и информации о его синтаксической структуре. В соответствии с этим принципом, в значении предложения (30) представлена вся информация, заключенная в его составляющих Пол Маккартни и поет, и только она. При построении более сложных языковых конфигураций из более простых никакая информация не возникает из ниоткуда и не исчезает в никуда. Принцип композициональности, конечно, не абсолютен. Его нарушают, например, идиомы типа убить время, где значение целого не выводится т о л ь к о из значений глагола убить и существительного время. Однако большинство современных семантистов согласно, что именно композициональность — возможность вывести смысл целого из смысла частей — это норма, а отклонения от нее — исключения. В (41) имеется важная часть: «и их синтаксической структуры». Этот элемент определения возникает потому, что для построения значения целого словосочетания и предложения в общем случае недостаточно знать только значения слов, из которых оно состоит. Например, в зависимости от синтаксической структуры одна и та же цепочка Мать любит дочь может иметь два совершенно разных прочтения: в одном случае мать выступает подлежащим, а дочь — прямым дополнением, в другом наоборот. В ИРЯ все предложения имеют очень простую структуру в (42), и для него это уточнение не имеет принципиального значения. Семантика (42) 209 Предложение Подлежащее Сказуемое Однако чем больше то, что мы анализируем, похоже на настоящий язык, ОРЯ, тем все более критическую роль в интерпретации начинают играть не только значения отдельных слов, но и то, как они организованы в синтаксическую структуру. Семантика интерпретирует не наборы слов, а именно синтаксические структуры. Вернемся к вопросу о том, что происходит с означаемыми, когда соответ ствующие составляющие объединяются в целое. Как получить означаемое для предложения, имея означаемые для подлежащего и сказуемого? Принцип композициональности подсказывает ответ: должны существовать правила соединения означаемых в целое, причем (неосознанное) владение ими — неотъемлемая часть семантической компетенции носителей языка. Такие правила называют п р а в и л а м и с е м а н т и ч е с к о й к о м п о з и ц и и. Для нашего случая понадобится ровно одно правило, известное как п р и м е н е н и е ф у н к ц и и к а р г у м е н т у: (43) Применение функции к аргументу: Если синтаксический объект α состоит из компонентов β и γ, причем ⟦ β ⟧ М — это функция, которая осмысленно применима к ⟦ γ ⟧ М, то ⟦ α ⟧ М = ⟦ β ⟧ М ( ⟦ γ ⟧ М). Согласно (41), означаемое сложного выражения α получается применением функции, обозначаемой компонентом β, к аргументу, обозначаемому компонентом γ. При этом должно выполняться очевидное условие: ⟦ β ⟧ М должно быть функцией, и эта функция должна быть применима к ⟦ γ ⟧ М. Теперь есть все необходимое для завершающего шага. Означаемое подлежащего Пол Маккартни показано в (34а), означаемое глагола-сказуемого поет — в (36) (и в эквивалентной формулировке (35)). Нетрудно убедиться, что второе — это функция, а первое — подходящий для нее аргумент. Чтобы построить интерпретацию предложения (30), остается воспользоваться правилом из (43) и означаемыми лексических единиц. Все шаги интерпретации показаны в (44); справа обозначена используемая на каждом шаге инфор мация: 210 И. М. Кобозева, С. Г. Татевосов (44) ⟦ Пол Маккартни поет ⟧ М = (43) ⟦ поет ⟧ М (⟦ Пол Маккартни⟧ М) = (34а) ⟦ поет ⟧ М (36) ( ) = [ λx: x ∈ De. х поет ]. ( ) В последней строчке имеется функция, применяющаяся к индивиду, который носит имя Пол Маккартни. Согласно (35)–(36), функция дает значение 1 («истинно») ровно в том случае, если он поет. В противном случае она дает 0 («ложно»). Таким образом, теория предсказывает, что предложение (30) истинно тогда и только тогда, когда в рассматриваемой модели, то есть в действительности, изображенной на рис. 5.1, Пол Маккартни поет. Поскольку, как показывает рис. 5.3, это действительно так, предложение (27) оказывается истинным. Истинностное значение 1 — это означаемое предложения (30) применительно к действительности, изображенной на рис. 5.1–5.3. Таким образом, поставленная выше задача успешно решена для ИРЯ: мы получили эксплицитную теорию, которая объясняет суждения носителей языка об условиях истинности предложений типа (30). 5.5.4. Дальнейшие действия. Может показаться, что понадобилось слишком много усилий, чтобы прийти к довольно очевидному выводу. Если бы естественные языки были устроены, как ИРЯ, это было бы совершенно справедливое недоумение, а формальная семантика, по крайней мере, в том виде, в котором мы ее знаем, скорее всего никогда бы не возникла. Однако языки устроены намного сложнее, и чем более сложные семантические явления мы пытаемся понять, тем больше проявляется главное достоинство формально-семантического взгляда на предмет. Неверно думать, что «формальность» наделяет исследователя каким-либо сверхъестественными возможностями, недоступными другим. Но она дает ему в руки инструменты, позволяющие сделать семантические построения полностью эксплицитными и отрефлектировать в них каждый шаг, что в конечном итоге позволяет построить достаточно полную теорию значения, делающую ясные эмпирические предсказания. Другое важное преимущество описанного выше анализа ИРЯ состоит в том, что он позволяет рассматривать ИРЯ как ф р а г м е н т ОРЯ. Это означает, что все сказанное о предложениях типа (30) остается верным, если понимать их не как выражения ИРЯ, а как выражения ОРЯ. В частности, останется Семантика 211 неизменным представления о непереходных глаголах и именах собственных, правило применения функции к аргументу и целый ряд других аспектов анализа. Анализ необходимо лишь расширять и дополнять. Завершая этот раздел, перечислим в самом общем виде направления движения от семантической теории для языков типа ИРЯ к теории для языков типа ОРЯ. Прежде всего необходимо распространить анализ на более полный список синтаксических структур и семантических явлений обычного языка. Именные группы, например, могут содержать нарицательное существительное и его разнообразные модификаторы. Мы должны снабдить означаемым выражения типа этот артист, каждый певец, не менее трех красивых поп-звезд и так далее. Попутно скорее всего выяснится, что далеко не все именные группы возможно анализировать как имеющие означаемое типа е, то есть как р е ф е р е н т н ы е. Надо будет учесть в анализе не только непереходные глаголы, но глаголы с любой аргументной структурой, причем не только сами глаголы, но и создаваемые ими глагольные группы, такие, например, как в предложении Пол Маккартни послал Мадонну к Брюсу Уиллису. Предстоит разработать анализ прилагательных, отражающий достаточно нетривиальные суждения носителей об их значении. (Например, истинность предложения Пол Маккартни выше Мадонны с прилагательным в сравнительной степени не влечет за собой истинность предложения Пол Маккартни высокий с тем же самым прилагательным в положительной степени.) Многие проблемы, которые встретяся при анализе прилагательных, скорее всего распространяются и на анализ наречий. Выстаивая семантическое описание ИРЯ, мы с самого начала приняли упрощение, согласно которому в нашей действительности отсутствует время и временные формы глагола ничего не значат. На самом деле информация о времени играет исключительно важную роль в интерпретации многих выражений естественного языка. Например, предложение Президент России — Дмитрий Медведев в 2008 году было истинно, в 2015-м ложно, а в 1962-м, по-видимому, вовсе не имело истинностного значения ввиду отсутствия в России должности президента. В анализе ИРЯ не содержится даже намека то, в чем состоит вклад в интерпретацию грамматического вида и чем например, предложение Пол Маккартни исполнил песню «Миссис Вандербильт» отличается от Пол Маккартни исполнял песню «Миссис Вандербильт». (В школе учат, что первое отвечает на вопрос «Что сделал?», а второе на вопрос «Что делал?», но это не решение задачи, это уход от решения.) 212 И. М. Кобозева, С. Г. Татевосов ИРЯ не дает никаких указаний и на то, как следует анализировать единичность и множественность, которые в ОРЯ встречаются на каждом шагу. Категории числа в ИРЯ нет, а значит пока нет и средств, позволяющих понять, почему в предложении На концерте выступали певцы именная группа во множественном числе певцы понимается как ‘два певца или более’, а предложении На концерте не выступали певцы — как ‘один певец или более’. При анализе языка семантике приходится сталкиваться и с огромным множеством других явлений — относительные предложения, деепричастные обороты, депиктивные конструкции, временные адъюнкты и многое и многое другое. Тем не менее по большому счету для анализа почти всех только что перечисленных явлений семантическая теория требует не радикальных изменений архитектуры, а лишь некоторого расширения выразительных возможностей. В онтологии могут появиться элементы новых базовых типов (напр., моменты времени, необходимые для анализа темпоральной семантики). Возможно, компоненты онтологии придется понимать не как неупорядоченные множества элементов наподобие E, а как более сложные структуры, упорядоченные различными отношениями. Например, отношение предшествования скорее всего понадобится для упорядочивания моментов времени, а отношение части и целого — для анализа множественности. Могут также возникнуть новые правила композиции. Семантическая система должна быть обеспечена надлежащим с е м а н т и к о - с и н т а к с и ч е с к и м и н т е р ф е й с о м, позволяющим ей без излишнего напряжения взаимодействовать с синтаксической теорией. Есть, однако, фундаментальный аспект семантики языковых выражений, для которого описанная выше система принципиально неадекватна. Она связана с упомянутыми в разделе 5.1.2 двумя аспектами значения, которые в российской семантической традиции часто называют д е н о т а т и в н ы м и с и г н и ф и к а т и в н ы м. Семантический анализ ИРЯ отражает только один из них. Означаемое языкового выражения при таком анализе представляет собой его э к с т е н с и о н а л (≈ денотативный аспект) — объект действительности (для имен собственных) или множество таких объектов (для одноместных глаголов), пусть и заданное опосредованно, через характеристическую функцию. (При расширении анализа, как уже было сказано, в качестве экстенсионала станут возможны и более сложные функции, но это не меняет общую картину.) Анализ делает одно важное предсказание. Если два выражения а и b имеют одно и то же означаемое, замена одного на другое не должна влиять Семантика 213 на истинность предложения. И действительно: если верны (45a) и (45b), с неизбежность верно и (45с). (45) a. Пол Маккартни встретился с нынешним президентом Уганды. b. Президент Уганды — Йовери Мусевени. c. Таким образом, Пол Маккартни встретился с Йовери Мусевени. Ключевую роль в этом рассуждении играет (45b), которое эксплицитно утверждает (46): (46) ⟦ Йовери Мусевени ⟧ М′ = ⟦ президент Уганды ⟧ М′ = При наличии (46) невозможно, чтобы (45a) было истинно, а (45c) ложно или наоборот. Ситуация меняется в (47): (47) a. Пол Маккартни хочет встретиться с нынешним президентом Уганды. b. Президент Уганды — Йовери Мусевени. c. Таким образом, Пол Маккартни хочет встретиться с Йовери Му севени. (47a-c) критически отличается от (45a-c) тем, что (47c) не следует из (47a) и (47b). Предложение (47a) может быть истинно, а предложение (47с) тем не менее ложно. Так случится например, например, если Пол Маккартни хочет вручить чек на строительство детского госпиталя в Кампале лично президенту Уганды, но понятия не имеет, кто сейчас работает в этой стране президентом. В отличие от (47c), (45c) будет истинным даже в том случае, если Пол Маккартни за все время встречи так и не узнал, как зовут его собеседника. Эти примеры показывают, что в языке существуют контексты, в которых задействуется второй, не экстенсиональный аспект значения языковых выражений. В (47а) о президенте Уганды может идти речь не как об индивиде, а как о своего рода идее, функции, совокупности свойств и полномочий. Примерно в этом смысле выше в разделе 5.1.2 говорилось о сигнификативном аспекте значения. Этот аспект в формальной семантике принято называть и н т е н с и о н а л ь н ы м. Соответственно, теория должна предсказывать двойственный характер означаемого языковых выражений, наделяя каждое из них не только экстенсионалом, но и и н т е н с и о н а л о м. Семантика ИРЯ, описанная выше, не имеет ресурсов для работы с интенсионалами и ничего не может о них сказать. Она э к с т е н с и о н а л ь н а и поэтому не в состоянии объяснить примеры типа (47а-с). Обеспечить семантику такими возможностями критически важно для построения эмпириче 214 И. М. Кобозева, С. Г. Татевосов ски адекватной семантической теории, охватывающей все существенные измерения естественно-языкового значения. В очень многих формально-семантических системах решение этой задачи опирается на понятие в о з м о ж н ы х м и р о в (положений вещей, ситуаций), и интенсионалы задаются через отношение между мирами и экстенсионалами (см. подробное введение в интенсиональную семантику von Finel, Heim 2017). Возможные миры, кроме того, приносят существенный эмпирический выигрыш при анализе очень многих семантических явлений — модальности, эвиденциальности, некоторых аспектуальных категорий, конструкций с так называемыми глаголами пропозициональной установки (хотеть, полагать, верить, считать и т. д.), условных конструкций, общих и частных вопросов и много другого. Имеются обнадеживающие результаты и в области формального описания семантики языковых единиц, больших, чем предложения, т. е. в области моделирования дискурса. Современная формальная семантика, оперирующая фрагментами языков, похожих на ОРЯ, имеет большие наработки и во многих других областях. Исследования п р е с у п п о з и ц и о н а л ь н о г о с о д е р ж а н и я языковых выражений превратились в самостоятельную индустрию. Имеются внушительные достижения в изучении н е д е к л а р а т и в н ы х р е ч е в ы х а к т о в, таких, как вопрос и императив. Давно выделились в отдель ную дисциплину ф о р м а л ь н а я п р а г м а т и к а, которая изучает, какую информацию носитель может извлечь из семантического содержания языкового выражения, опираясь на определенные гипотезы о коммуникативном поведении партнеров по обмену информацией. Перечислить все в этом введении попросту невозможно, а тем, кто чувствует заинтересованность в семантике формального направления, мы рекомендуем обратиться к специальной литературе. В формальной семантике остается еще очень много нерешенных проблем, заниматься которыми, возможно, предстоит читателям этой книги. Мы рассмотрели лишь самые основные понятия и положения семантики. Надеемся, что их будет достаточно для первичной ориентации в этой области и дальнейшего более глубокого погружения в ее проблематику. I I . Яз ык и п о зна ни е 6. Лингвистика в контексте когнитивных наук М. В. Фаликман, О. В. Федорова Когнитивная наука — область междисциплинарных исследований по знания, понимаемого как совокупность процессов приобретения, хранения, преобразования и использования знаний живыми и искусственными системами. В число областей, составляющих когнитивную науку, входят философия сознания, экспериментальная психология познания, нейронауки, когнитивная лингвистика, компьютерные науки, культурная антропология и еще целый ряд дисциплин. Пререквизиты: Эксперимент 6.1. «Когнитивная революция» 6.2. Основные подходы в когнитивной науке 6.2.1. Символьный подход 6.2.2. Модульный подход 6.2.3. Коннекционизм 6.3. Методология и методы когнитивной науки 6.4. Место лингвистики среди когнитивных дисциплин 6.5. Междисциплинарное взаимодействие в когнитивных исследованиях: случай рабочей памяти Литература для дальнейшего чтения: Фаликман, Спиридонов ред. 2011; Спиридонов, Фаликман ред. 2012; Федорова 2014a. 6.1. «Когнитивная революция» Появление когнитивной науки относится к середине XX в. Именно в это время бурно шло развитие компьютерной техники, и возникали вопросы о том, сможет ли машина мыслить и общаться с человеком, однако не хватало знаний о том, как именно мыслит и осуществляет коммуникацию человек. Однако в США с начала ХХ в. господствовало такое направление, как психология поведения, или б и х е в и о р и з м, согласно постулатам которого изучать следовало только внешне наблюдаемые реакции, поскольку психиче ские процессы не могут быть объективно зафиксированы и измерены. 218 М. В. Фаликман, О. В. Федорова Однако внутри ортодоксального бихевиоризма (Уотсон 1980) тоже наметился кризис, поскольку стали накапливаться данные, указывающие на то, что для объяснения внешне наблюдаемого поведения необходимо допущение внутренних процессов, или «промежуточных переменных» (Толмен 1980) — таких, напр., как цели или когнитивные карты (пространственные представления, сформированные на основе прошлого опыта). Эти данные, наряду с успехами компьютерных наук, новыми тенденциями в лингвистике и послевоенным бурным развитием нейропсихологии, сформировали предпосылки для развития когнитивной науки. Днем рождения когнитивной науки считается 11 сентября 1956 г. — второй день работы симпозиума по проблемам переработки информации в Массачусетском технологическом институте с тремя докладами представителей трех разных дисциплин (Gardner 1985). Во-первых, там прозвучал доклад гарвардского психолога Дж. Миллера «Магическое число семь плюсминус два», где была представлена ячеечная модель рабочей памяти человека (Миллер 1964). Во-вторых, политолог Г. Саймон и программист А. Ньюэлл из университета Карнеги представили первую в мире модель искусственного интеллекта «Логик-теоретик», которая доказывала теоремы из области формальной логики (Ньюэлл и др. 1980; Шоу, Саймон 1980). Наконец, в-третьих, с докладом «Три модели описания языка» выступил лингвист Н. Хомский. В этом докладе он противопоставил свое представление о языке моделям, по сути не предполагающим участия человека как познающего субъекта в порождении и понимании речи (Хомский 1961). Хомский и ранее был активным участником Междисциплинарного научного общества в Гарварде и интересовался не только лингвистикой, но и психологией и философией (см., напр., Thagard 2005). Именно благодаря его выступлению и последующей публикации его модели, привлекшей множество сторонников, лингвистика оказалась в числе трех первых дисциплин, сформировавших пространство когнитивной науки, а развитие порождающей грамматики Хомского и связанных с ней направлений лингвистики считаются, наряду с изобретением компьютеров и развитием экспериментальной психологии познания, одним из корней современной когнитивной науки в целом (Миллер 2005). К 1970-м гг. это пространство включало по меньшей мере шесть дисциплин, образовавших так называемый «когнитивный шестиугольник» (Gardner 1985; Миллер 2005): помимо э к с п е р и м е н т а л ь н о й п с и х о л о г и и п о з н а н и я, к о м п ь ю т е р н ы х н а у к и к о г н и т и в н о й л и н г в и с т и к и, это были н е й р о н а у к и, ф и л о с о ф и я с о з н а н и я и к у л ь т у р н а я а н т р о п о л о г и я (см. рис. 6.1). С самого начала к ним Лингвистика в контексте когнитивных наук 219 плотно примыкали исследования в области образования (education) — в этой области работал, в частности, один из «отцов-основателей» когнитивной науки Дж. Брунер (напр., Bruner 1961, 1966). К настоящему времени к числу этих дисциплин добавились экономика, литературоведение и многие другие области науки. Рисунок 6.1. «Когнитивный шестиугольник» (Миллер 2005) Интересно, что в 1948 г., когда состоялось еще одно знаковое для будущей когнитивной науки событие, известное как Хиксоновский симпозиум (он назывался «Мозговые механизмы и поведение»), в его работе еще не принимали участия лингвисты, а выступали только нейробиологи, психологи и представители активно развивающейся области компьютерных наук. Этот симпозиум важен тем, что именно на нем Дж. фон Нейман впервые предложил к о м п ь ю т е р н у ю м е т а ф о р у п о з н а н и я (Gardner 1985), которая на долгие годы стала магистральной для когнитивной науки, обеспечив единый общепринятый язык для представителей разных дисциплин и систему общих допущений, связанных с трактовкой познания и процессов использования языка как процессов передачи и переработки информации. Однако благодаря выступлениям Н. Хомского уже в 1960-х гг. лингвистика оказывается в числе ведущих дисциплин когнитивной науки. Впро- 220 М. В. Фаликман, О. В. Федорова чем, этот рост интереса к языку можно связать и с развитием компьютеров. На передний план выходит проблематика обработки естественного языка в контексте развития систем искусственного интеллекта и машинного перевода. В частности, некоторые из этих разработок опираются на классические исследования памяти как конструктивного процесса, которые проводил один из признанных основоположников когнитивной науки Ф. Ч. Бартлетт (1932). Понятие схемы, использованное Бартлеттом для объяснения результатов экспериментов с припоминанием, стало одним из ключевых в автоматических системах обработки текстов, когда такие системы стали разрабатываться когнитивистами (Schank 1984). 6.2. Основные подходы в когнитивной науке 6.2.1. Символьный подход. Первым подходом в области когнитивной науки стал прямо развивающий компьютерную метафору с и м в о л ь н ы й п о д х о д. В символьном подходе подчеркивается, что процесс переработки информации по сути является процессом оперирования символами, а сами знания человека могут быть описаны как более или менее сложные сочетания символов. Отсюда следует, что существует единый формат репрезентаций для всех типов знаний. Поскольку речь идет об оперировании символами, эти репрезентации носят амодальный характер. Перцептивные и моторные системы рассматриваются как устройства «ввода–вывода» информации, а полученное знание представляет собой абстрактный код. Особое внимание уделяется в этом случае правилам работы с кодом, т. е. операциям формирования, хранения, извлечения и преобразования репрезентаций. Как у любого технического устройства, ресурсы системы переработки информации ограничены: поскольку работу этой системы нельзя назвать безошибочной, о чем говорили результаты многочисленных эксперименталь ных исследований, то, согласно теореме Шеннона (Shannon 1948), в системе должен быть «канал с ограниченной пропускной способностью». Следствием наличия данного ограничения является предположение о последовательности (этапности) переработки информации. Первой моделью, воплотившей эти принципы, стала модель переработки информации, предложенная Д. Бродбентом (Broadbent 1958) на основе модели связи К. Э. Шеннона. Наконец, следствием представления о том, что живые и искусственные системы переработки информации управляются одними и теми же принципами, стало большее внимание к возможностям моделирования того или иного познавательного процесса, с меньшим акцентом на исследовании его нейрофизиологических механизмов, роли телесного опыта познающего субъекта и т. п. Лингвистика в контексте когнитивных наук 221 Обсуждаемые представления задали тон экспериментальным исследованиям и появившимся моделям отдельных познавательных процессов. Наиболее полно они воплотились в подходе А. Ньюэлла и Г. Саймона к мышлению как оперированию символами (Ньюэлл и др. 1980; Шоу, Саймон 1980), в двухкомпонентной и трехкомпонентной теориях памяти (Waugh, Norman 1965; Atkinson, Shiffrin 1968), в моделях внимания как отбора (подробнее см. Фаликман 2006) и др. Однако уже за первые два десятилетия движения в логике этого подхода стали очевидны его ограничения. Во-первых, был поставлен под вопрос единый неспециализированный характер системы переработки информации: экспериментальные и клинические данные указывали на то, что отдельные компоненты этой системы могут работать независимо друг от друга и выходить из строя, не нанося ущерба работе других компонентов. Во-вторых, поводом для сомнений послужил символьный характер представления знаний, не позволявший объяснять развитие и обогащение знания никаким образом, кроме как его «записи» в систему в готовом виде или «вычисления» по записанным в систему правилам. 6.2.2. Модульный подход. Единой неспециализированной системе пере работки информации была противопоставлена идея о складывающемся в ходе эволюции наборе узкоспециализированных систем — «м о д у л е й», аналогичных лезвиям швейцарского армейского ножа, каждое из которых предназначено для решения определенной узкой задачи (Tooby, Cosmides 1994). В 1983 г. вышла знаменитая книга американского философа Дж. Фодора «Модульность психики», в которой автор сформулировал новые принципы построения когнитивной архитектуры и основные критерии выделения модулей (такие как узкая специализация, локализация в мозге, врожденный характер, собственная история развития в онтогенезе и т. д.; Fodor 1983). Было выдвинуто предположение, что когнитивная система состоит из ряда входных модулей, никак не взаимодействующих и не препятствующих работе друг друга, и центральной системы планирования и принятия решения, которая подвержена влиянию слишком большого количества факторов и потому недоступна для изучения. Сначала в качестве модулей рассматривались преимущественно перцептивные системы, однако вскоре Н. Хом ский выступил с заявлением, что таким модулем является языковая способность (Chomsky 1986). Это положение было подвергнуто как теоретической, там и эмпирической критике (Bates 1994), однако и по сей день продолжает обсуждаться, в том числе благодаря научно-популярной, но влиятельной книге С. Пинкера «Язык как инстинкт» (Pinker 1994). 222 М. В. Фаликман, О. В. Федорова Главная же проблема, которая встала перед модульным подходом — это проблема когнитивного развития, которое, согласно модульной архитектуре, можно было трактовать лишь как разворачивание генетически заложенных модулей, в то время как данные о высокой пластичности человеческого мозга и познания противоречили подобного рода представлениям. Наиболее же сильным основанием для критики стали данные о том, что «модульные» по сути функции (например такие, как зрительное опознание формы и движения) могут быть реализованы на одном и том же относительно произвольном субстрате с минимальной «наследственностью», выражающейся в скорости проведения нервного импульса (O'Reilly, McClelland 1992). Эта критика появилась в рамках такого направления, как нейронные сети, или коннекционизм. 6.2.3. Коннекционизм. Разработки в области искусственных нейронных сетей начались в 1940‑е гг. (McCulloch, Pitts 1943), однако они были подвергнуты разгромной критике в книге М. Минского и С. Пейперта «Перцептроны» (Minsky, Papert 1969), где были подчеркнуты недостатки существовавших на то время архитектурных решений и не были проанализированы возможности нейронных сетей в плане моделирования познавательных процессов. И только в 1980‑х гг. начался так называемый «Ренессанс коннекционизма», вследствие которого нейронные сети прочно утвердились в ко гнитивной науке. Ренессанс этот был обязан своим возникновением психологам Д. Румель харту и Дж. Макклелланду, применившими инструментарий искусственных нейронных сетей к моделированию процессов опознания зрительных стимулов, извлечения информации из семантической памяти, феноменов когнитивного развития («феноменов Пиаже»), языкового развития и др. Наиболее громкой декларацией этого нового течения в когнитивной психологии стал выход двухтомника «Параллельная распределенная переработка» под редакцией его главных идеологов (Rumelhart, McClelland eds. 1986). Нейронные сети привнесли в когнитивное моделирование новые возможности, закрытые от символьного подхода: а именно, возможность учета эффектов контекста, возможность обработки информации, лишь частично представленной в системах входа, возможность поиска в памяти по контекстному запросу и т. п. Но самое главное заключается в том, что в данном направлении был задан новый подход к проблеме когнитивного развития (Elman et al. 1996). Вместе с тем нейронные сети оказались в большей степени прикладным инструментом, нежели основой для теоретических построений: научив сеть Лингвистика в контексте когнитивных наук 223 решать ту или иную задачу, т. е. построив работающую модель распознавания образов или, например, перевода морфем в фонемы (Rosenberg, Sejnovsky 1987), исследователь очень мало может сказать о том, как эта модель работает, и нередко оказывается столь же далек от понимания механизмов познания, как и прежде. Тем не менее не говоря о широчайшем применении в прикладных областях (системы прогнозирования в бизнесе и политике, системы распознавания лиц и почерков и т. п.), нейронные сети представлены и в разных областях современной когнитивной психологии и когнитивной нейронауки, включая моделирование когнитивных расстройств при разных видах нарушения психического развития в рамках направления, получившего название «нейроконструктивизм» (Mareschal, Thomas 2007). Несмотря на то что появление новых подходов было связано с той развернутой теоретической критикой, которой подверглась идея блочно-символьной когнитивной архитектуры, можно сразу отметить, что выбор какого-либо одного из типов архитектур в построении моделей познания так и не состоялся. В современной когнитивной психологии блочно-символьные модели сосуществуют с нейросетевыми моделями и с модульными представлениями о познании, некоторые модели объединяют признаки разных типов архитектур, а кроме того, появляются гибридные когнитивные архитектуры, сочетающие в себе элементы символьного подхода, лучше позволяющего описывать, например, процессы логического вывода, и нейронных сетей, лучше описывающих интуитивные процессы на основе неполных данных, такие как использование аналогии (Kokinov 2003). Параллельно с модульным и нейросетевым подходами развивался и сам символьный подход, внутри которого продолжали возникать новые направле ния и линии исследования, связанные с критикой исходных предположений. Внутри него также происходила эволюция представлений об общих принципах организации системы переработки информации. Первые модели, отталкивающиеся от теории связи К. Шеннона, были линейными и представляли познание как процесс передачи информации от «входа» к «выходу» (Broadbent 1958). Иногда они обогащались петлей обратной связи для настройки механизмов внимания, осуществляющих отбор наиболее важной информации (Norman 1976). Однако вскоре стало очевидно, что в переработке информации можно выделить по меньшей мере два класса процессов: восходящие (bottom-up) и нисходящие (top-down). Эти термины фиксируют различение вклада самого субъекта и воздействующей на него стимуляции (объекта) в процесс познания. Представление о двух «потоках» переработки информации складывалось на основе тех же метафор познания, что и когнитивная наука в целом. В рамках информационно-компьютерной метафоры 224 М. В. Фаликман, О. В. Федорова две образующих процесса познания рассматриваются соответственно как концептуально ведомая (или ведомая схемами) переработка информации и переработка, ведомая данными. Согласно биологически ориентированным иерархическим метафорам познания, с которыми оно соотносится, например, с иерархией мозговых структур (Hochstein, Ahissar 2003), по восходящей линии осуществляется передача информации от структур нижележащего уровня на вышележащий, а по нисходящей — в обратном направлении. На современном этапе взаимодействие восходящих и нисходящих процессов в системе переработки информации трактуется преимущественно в терминах так называемого «предвосхищающего кодирования» (predictive coding; Clark 2013; Hohwy 2013). Это сопоставление нисходящего «предсказания» (ожидаемого сигнала) и восходящего актуального сенсорного сигнала с вычислением «ошибки», которая управляет дальнейшим циклическим процессом познания и по сути делает процесс восприятия конструктивным, позволяя объяснить факты, в том числе, влияния на восприятие высоко уровневых факторов, к которым относится и язык (Lupyan, Clark 2015). 6.3. Методология и методы когнитивной науки Методы когнитивной науки условно подразделяют на частные (раз работанные и используемые внутри конкретных дисциплин, в том числе в междисциплинарных исследованиях) и собственно междисциплинарные (Dennett 1994). На первых этапах существования когнитивной науки перечень междисциплинарных методов исчерпывался моделированием, т. е. созданием описательных и компьютерных моделей когнитивных процессов. Однако в связи с бурным развитием методов регистрации активности мозга в число междисциплинарных методов к настоящему времени устойчиво вошли методы картирования мозга, прежде всего ф у н к ц и о н а л ь н а я м а г н и т н о - р е з о н а н с н а я т о м о г р а ф и я (фМРТ) — регистрация активности мозга в ходе решения познавательных задач, основанная на замерах динамики локального мозгового кровотока. В междисциплинарных исследованиях повсеместно используются также методы изучения хода переработки информации в мозге: э л е к т р о э н ц е ф а л о г р а ф и я и в ы з в а н н ы е п о т е н ц и а л ы, м а г н и т о э н ц е ф а л о г р а ф и я, а также методы воздействия на мозг, такие как т р а н с к р а н и а л ь н а я м а г н и т н а я с т и м у л я ц и я и м и к р о п о л я р и з а ц и я (транскраниальная стимуляция постоянным током). Последняя группа методов наиболее востребована в такой области, как н е й р о э к о н о м и к а — изучение мозговых механизмов выбора и принятия решения посредством вмешательства в работу мозга с Лингвистика в контексте когнитивных наук 225 использованием магнитных полей или слабого тока в ходе обработки информации и принятия решения. Наконец, сейчас характер междисциплинарного приобретает метод в и д е о о к у л о г р а ф и и или р е г и с т р а ц и я д в и ж е н и й г л а з, которая в настоящее время широко используется в исследованиях познания и сознания, языка и кросскультурных различий. В частности, это центральный метод в исследованиях чтения, начиная от анализа его закономерностей, предположительно обусловленных особенностями грамматики (Rayner 1998), и заканчивая изучением восприятия различных литературных жанров (см. обзор в Фаликман 2017). 6.4. Место лингвистики среди когнитивных дисциплин Наиболее сформированные к настоящему времени линии взаимодействия лингвистики с другими дисциплинами «когнитивного шестиугольника» — это это психолингвистика (см. главу 8 в наст. изд.), которая занимается исследованием порождения и понимания речи и нейролингвистика (см. главу 11 в наст. изд.), изучающая мозговые корреляты порождения и понимания речи, а также когнитивная лингвистика (см. главу 7 в наст. изд.), связывающая языковые явления с более широким кругом познавательных феноменов — с памятью, вниманием, категоризацией. Особое место занимают исследования взаимосвязи языка, познания и культуры, проводимые на стыке лингвистики и культурной антропологии (напр., Эверетт 2016). 6.5. Междисциплинарное взаимодействие в когнитивных исследованиях: случай рабочей памяти Исследования роли р а б о ч е й п а м я т и (РП) человека в порождении и понимании речи — типичный пример исследований, которые не могут быть отнесены ни к психологии, ни к нейробиологии, ни к лингвистике и носят общекогнитивный характер. Начало современного этапа изучения памяти в э к с п е р и м е н т а л ь н о й п с и х о л о г и и связано с именем Г. Эббингауза, который в конце XIX в. разработал первые экспериментальные процедуры для ее изучения (Эббингауз 1912). Примерно в то же время У. Джеймс предложил разделить память на первичную и вторичную (James 1890). Во второй половине XX в. в работах Д. Нормана и Н. Во (Norman, Vaugh 1963) и Р. Аткинсона и Р. Шиффрина (Atkinson, Shiffrin 1968) был сформулирован многокомпонентный подход к памяти. Термин РП был впервые использован одним из ключевых деятелей «когнитивной революции» Дж. Миллером (Miller et al. 1960). Употребление термина «рабочая память» 226 М. В. Фаликман, О. В. Федорова вместо «кратковременная память» подчеркивает функциональную значимость этой системы. Согласно модели А. Бэддели, РП состоит из четырех модулей: (1) «центрального исполнителя», (2) фонологической петли, (3) зрительнопространственной матрицы и (4) эпизодического буфера (Baddeley 2000). В области п с и х о л и н г в и с т и к и термин РП используется с 1980-х гг., когда стала очевидна роль этой системы памяти в порождении и понимании речи. Сначала тест на определение объема РП был разработан в области п о н и м а н и я р е ч и (Daneman, Carpenter 1980). М. Данеман и П. Карпентер предположили, что в процессе интерпретации текста в РП происходят процессы, связанные как с пассивным хранением поступающей информации, так и с ее активной обработкой. Разработанный ими тест “Reading span” учитывал оба этих процесса: испытуемые читали отдельные предложения (обработка) и одновременно удерживали в памяти последние слова ранее прочитанных предложений (хранение). Используя этот тест, авторы показали, что деление людей на «хороших читателей», которые умеют эффективно распределять ресурсы РП между хранением и обработкой поступающей информации, и «плохих читателей», которые делают это хуже, имеет под собой основание. Чуть позже аналогичный тест был создан и для изучения процессов п о р о ж д е н и я р е ч и (Daneman, Green 1986; Daneman 1991), при помощи которого было продемонстрировано, что объем РП коррелирует с беглостью речи при порождении. В настоящее время тест по определению объема РП — одна из самых востребованных методик в психолин гвистике. Кроме того, когнитивисты изучают роль РП в осуществлении референциального выбора (Kibrik 2011), упорядочивании слов при порождении предложений (Slevc 2011), усвоении и использовании иностранного языка (Wen 2015) и мн. др. 7. Когнитивная лингвистика Алан Ченки, О. В. Федорова Когнитивная лингвистика — это направление лингвистики, которое связывает языковые явления с широким кругом феноменов, относящихся к познавательной деятельности человека. По определению Ж. Фоконье (Fauconnier 2003: 539), когнитивной лингвистикой называется такая теоретическая и эмпирическая исследовательская программа, которая проникает внутрь видимой структуры языка с целью исследования комплексных познавательных операций, которые создают грамматику, концептуализации, дискурс и саму мысль. Согласно основополагающей работе Дж. Лакоффа (1990), существует два ключевых обязательства, которые должна выполнять когнитивная лингвистика — о б я з а т е л ь с т в о о б о б щ е н и я (generalisation commitment) и к о г н и т и в н о е о б я з а т е л ь с т в о (cognitive commitment). Первое обязательство призывает когнитивных лингвистов искать общие принципы и закономерности, действующие на разных языковых уровнях, в то время как второе гласит, что лингвистические построения должны согласовываться с идеями других когнитивных наук. Однако, как отмечается в работе Дж. Тейлора (Taylor 1995: 4), эти обязательства сами по себе не сильно ограничивают возможные исследовательские подходы. Неудивительно, поэтому, что, по мнению большинства ученых, когнитивная лингвистика в настоящее время — это не единая теория, а скорее группа отдельных теорий, объединенных подобным познавательным подходом, представленная такими именами, как Дж. Лакофф, У. Чейф, Р. Лангакер, Ч. Филлмор, Л. Талми, Ж. Фоконье и др.1 Ядро когнитивной лингвистики составляет к о г н и т и в н а я с е м а н т и к а. О когнитивных исследованиях дискурса см. Кибрик 2003, а также главу 4 в наст. изд. О функциональном подходе к когнитивной лингвистике см. обзор Кибрик, Плунгян 1997. В работе Скребцова 2011 автор приводит удачную, по нашему мнению, аналогию между когнитивной лингвистикой и идеей прототипов Э. Рош, предполагающей наличие центральных прототипических случаев и менее типичной периферии (Скребцова 2011: 25). 1 228 Алан Ченки, О. В. Федорова Пререквизиты: Лингвистика в контексте когнитивных наук; Интроспекция; Эксперимент ; Дискурс ; Невербальная коммуникация; Психолингвистика . 7.1. История когнитивной лингвистики 7.2. Методология когнитивной лингвистики 7.3. О границах когнитивной лингвистики 7.4. Когнитивная семантика Литература для дальнейшего чтения: Кибрик и др. ред. 2015; Скребцова 2011; Lakoff, Johnson 1980; Geeraerts ed. 2006; Geeraerts, Cuyckens eds. 2007; Langacker 2008. 7.1. История когнитивной лингвистики Принято считать, что когнитивная лингвистика возникла в США в первой половине 1970-х гг. усилиями трех ключевых фигур — Дж. Лакоффа, Р. Лангакера и Л. Талми2, за которыми последовали работы их учеников и коллег — когнитивных лингвистов первой волны, а именно, Ж. Фоконье, А. Голдберг, С. Кеммер, Л. Янды, У. Крофта и многих других. Одновременно эти идеи стали популярны и в Западной и Центральной Европе в лице Б. Рудзки-Остин, Р. Дирвена, Д. Герартса и др. Вторая волна когнитивной лингвистики, возникшая в 1990-е гг., распространилась на Азию, Южную Европу и Россию. Когнитивная лингвистика обрела свой официальный статус в 1989 г., ко гда по инициативе Р. Дирвена в немецком Дуйсбурге была проведена первая международная конференция по когнитивной лингвистике. На этой конференции было принято решение об основании новой организации, Международной ассоциации когнитивной лингвистики (International Cognitive Linguistic Association, ICLA), а также об учреждении журнала “Cognitive Linguistics”, первый номер которого вышел в 1990 г.; с 2003 г. издается также журнал “Annual Review of Cognitive Linguistics”. Кроме того, на этой конференции была задумана серия монографий “Cognitive Linguistic Research” (под ред. Д. Герартса и Дж. Тейлора), в которой к настоящему моменту вышло уже Ч. Филлмор также может быть отнесен к числу создателей когнитивной лингвистики, хотя сам он себя когнитивным лингвистом не считал. В статье Peeters 1998 автор делит исследователей, работающих в области когнитивной лингвистики, на две группы: Когнитивных Лингвистов (с большой буквы) и когнитивных лингвистов (с маленькой буквы). Первые сами провозглашают себя таковыми, в то время как вторые не отождествляются в научном сообществе с когнитивной парадигмой, хотя их работы могут быть к ней отнесены (напр., У. Чейф, Ч. Филлмор, А. Вежбицка, Р. Шенк, Т. ван Дейк). 2 Когнитивная лингвистика 229 60 томов. В конце 1990-х гг. и начале 2000-х гг. когнитивная лингвистика продолжает активно развиваться, о чем, в частности, говорят многочисленные учебники и хрестоматии, в частности, Lee 2001; Taylor 2002; Croft, Cruse 2004; Evans, Green 2006; Geeraerts ed. 2006; Kristiansen et al. eds. 2006; Geeraerts, Cuyckens eds. 2007. См. также некоторые заметные работы на русском языке: Кубрякова и др. 1996; Ченки 1996, 1997; Рахилина 1997, 1998; Скребцова 2011. 7.2. Методология когнитивной лингвистики На сегодняшний день наиболее распространенным методом когнитивной лингвистики продолжает оставаться л и н г в и с т и ч е с к и й э к с п е р и м е н т в смысле Л. В. Щербы (1974), то есть опора на интроспекцию и суждения носителей языка относительно приемлемости/неприемлемости тех или иных языковых форм — «как можно и как нельзя сказать». Данный подход имеет мало общего с экспериментом в общенаучном смысле слова. Однако в последние десятилетия в этой области произошли заметные изменения. Не удовлетворяясь больше исключительно методом интроспекции, многие когнитивные лингвисты начали осваивать эмпирические методы, как экспериментальные, так и корпусные. Важным поворотным пунктом на этом пути стали семинары Empirical Methods in Cognitive Linguistics, первый из которых состоялся в Корнельском университете в 2003 г. По результатам работы этого семинара в 2007 г. был опубликован сборник статей González-Márquez et al. ed. 2007, который по сути представляет собой полезное учебное пособие, вводящее когнитивных лингвистов в мир эксперимента. В работе Geeraerts 2006 автор подкрепляет этот эмпирический тренд ко гнитивной лингвистики статистическими выкладками. Основываясь на данных из библиографии когнитивной лингвистики, составленной Р. Дирвеном, он приводит такие цифры: если в работах 1985–1989 гг. термины corpus и experiment(al) встречались только в 0,5% и 2% публикаций когнитивных лингвистов соответственно, то к 2000–2004 гг. их число возросло до 9,3% и 9,2%. За последние 10 лет эта тенденция усилилась еще больше. 7.3. О границах когнитивной лингвистики Существует несколько разных пониманий термина «когнитивная лингвистика» — как более узкие, так и более широкие. В самом узком понимании когнитивная лингвистика включает в себя исследование определенных лексико-семантических и грамматических явлений, объединенных под названием к о г н и т и в н а я с е м а н т и к а, подробнее см. ниже. В самом широком понимании к области когнитивной лингвистики относятся любые 230 Алан Ченки, О. В. Федорова исследования, описывающие взаимодействия языка и разума (mind) человека (см., напр., такой подход в Кибрик и др. ред. 2015). В отечественной традиции к области когнитивной лингвистики часто относят исследования концептосферы культуры, которая фактически ближе к области (лингво)культурологии (см., напр., Попова, Стернин 2007), что несколько искажает, на наш взгляд, представления о когнитивной лингвистике в России в целом. 7.4. Когнитивная семантика Как в когнитивной лингвистике понимается языковое значение, т. е. семантика? Одной из основных отправных точек является принцип, согласно которому когнитивная лингвистика основана на у п о т р е б л е н и и (т. е. является usage-based). Исследователи, работающие в этой области, пытаются раскрыть принципы, лежащие в основе того, как люди на самом деле используют язык, и что это может сказать нам о процессах концептуализации. Данный принцип может показаться бесспорным, но на самом деле он возник как реакция на другие подходы, ориентированные на язык как формальную систему. Эти формальные подходы имели дело в основном с синтаксическими правилами, структура которых считалась независимой от значений, выражаемых языком, созданным такими правилами. С этой точки зрения значение, грубо говоря, просто «вставляется» в синтаксические структуры. В 1980-х гг. некоторые ученые начали предлагать альтернативный взгляд на то, как работает язык, ориентируясь прежде всего на исследования в области когнитивной психологии, которая бурно развивалась в то время. Они исследовали, как люди в действительности понимают различные понятия, основываясь на их представлении с точки зрения языковой формы. Этот новый взгляд, получивший название к о г н и т и в н о й с е м а н т и к и, подчеркивал, что языковое значение не является чем-то абстрактным, что может быть адекватно проанализировано с помощью формул из области формальной логики. Скорее, когнитивные лингвисты рассматривают семантику как форму концептуализации, т. е. это вопрос о том, как реальные люди (а не гипотетические идеальные говорящие или слушающие) используют язык для общения. Когнитивные лингвисты утверждают, что, в конечном счете, многие наши способы порождения и понимания языка основаны на нашем опыте как человеческих существ, телесная форма которых имеет определенные общие свойства в разных культурах, и которые должны дей ствовать в соответствии с определенными физическими законами во всем мире (такими, напр., как закон гравитации). Когнитивная лингвистика 231 Что конкретно означают для семантики эти принципы, если рассматривать ее в когнитивной перспективе? Подход, основанный на употреблении, учитывает, как мы работаем с понятиями (concepts). Мы не изучаем понятия подобно отдельным записям в словаре, которые мы просто храним в нашем мозгу. Скорее, мы изучаем различные понятия из нашего опыта в различных контекстах, так что любые конкретные понятия оказываются всегда поразному связаны с другими понятиями. Наш разум больше похож на энциклопедию, в которой понятия связаны друг с другом, чем на словарь. По существу мы всегда понимаем языковые единицы (морфемы, слова, предложения) и понятия, которые они обозначают, в некотором контексте. Слова и грамматические формы выделяют определенные идеи на ф о н е (background) других. В этом смысле когнитивная семантика разделяет позиции гештальт-психологии о том, как работает наше зрительное внимание, всегда выделяя какую-то ф и г у р у в фокусе на фоне других менее сфокусированных элементов сцены. Лангакер (1991: 8) отмечает, что мы не можем понять, что значит локоть, если у нас нет понимания того, что значит рука (arm). Данный феномен был описан также с точки зрения ф р е й м о в о й с т р у к т у р ы: некоторый топик или идею можно описывать различными способами, каждый из которых подчеркивает один его аспект и преуменьшает другой. Как лучше назвать человека, который не любит тратить много денег, экономным или прижимистым? Первое слово подчеркивает положительные стороны человека, а второе — его отрицательную оценку. Филлмор (Fillmore 1977) пишет, что можно рассматривать любую сцену с нескольких точек зрения; напр., вопрос, является ли некоторый обмен товарами продажей или покупкой, зависит от того, с чьей перспективы он описывается. Наш выбор конкретных лексем и грамматических конструкций всегда влечет за собой точку зрения на то, о чем мы говорим. Лангакер (1987, 2008) характеризовал способность описывать некоторое концептуальное содержание альтернативными способами термином к о н с т р у а л (construal). Далее, язык отражает то, как мы понимаем и классифицируем мир, и это связано с определенными принципами структурирования. Хотя мир состоит из множества континуумов в нашем чувственном опыте (температура, цвет, громкость звуков, интенсивность запахов), слова заставляют нас делить эти континуумы на дискретные категории (горячий, теплый, прохладный, холодный, красный, оранжевый, желтый). То же самое относится и к грамматическим конструкциям — мы должны выбрать, следует ли описывать событие, используя активную или пассивную форму глагола, напр.: Ее аргумент убедил меня или Я был убежден ее аргументом. Исследования из обла сти когнитивной психологии показывают, что мы быстрее связываем слова 232 Алан Ченки, О. В. Федорова с прототипическими образцами, чем с более редкими. Если кто-то произнесет слово стул, то мы, скорее всего, представим себе предмет с горизонтальным сиденьем, вертикальной спинкой и четырьмя ножками, чем, напр., пуф. Способность делать выводы о том, что имел в виду говорящий, основываясь на том, как он использовал язык в некотором контексте, — это то, что называется п р а г м а т и к о й. Например, говорящий может упомянуть сквозняк в комнате, что будет фактически означать, что нужно закрыть окно; речевое поведение говорящего зависит от наличия достаточного общего контекстного знания (Кларк (1996) называет это о б щ е й п о з и ц и е й (common ground)) с теми, кто находится в той же комнате, чтобы слушающие догадались, что они должны закрыть окно. Тот факт, что значения могут быть выражены более или менее напрямую (т. е. что понимание значения в разной степени опирается на контекст) означает, что семантика и прагматика должны рассматриваться не как отдельные категории, а как два конца континуума. Еще один вывод, сделанный когнитивными лингвистами в области семантики, заключается в том, что при порождении и интерпретации языковых форм мы исходим из разных типов когнитивных моделей. Структуры знаний, которые мы используем, соединяют разные элементы того, что мы считаем одной категорией; в этом случае мы можем ссылаться на разные элементы этой категории «под одним зонтиком», одним словом или кон струкцией. Например, Лакофф (Lakoff 1987) замечает, что слово мать может использоваться для обозначения многих ролей: не только женщины, которая родила ребенка, но и той женщины, которая воспитывает усыновленного ребенка и т. д. Исследователи в области когнитивной семантики часто используют в отношении категориальной структуры понятие семейного сходства (family-resemblances). Витгенштейн (Wittgenstein 1953) писал, как слово игра может быть применено ко многим видам деятельности, но не все игры разделяют одинаковый набор характеристик, необходимых и достаточных для описания всех игр. Он отмечал, что вместо этого категории включают наборы характеристик, некоторые из которых разделяются определенными, но не всеми, членами категории, подобно тому, как члены семьи могут быть похожи друг на друга (напр., некоторые имеют одинаковый цвет волос и черты лица), но ни один из членов семьи не идентичен другому (даже близнецы имеют индивидуальные отличия). Важную роль в понимании связи между языковыми формами и соответствующими им понятиями играет м е т о н и м и я. В частности, с и н е к д о х а (упоминание части, за которой стоит целое) используется в речи повсеместно. Мы схематизируем сцены, обозначая только важные, выделенные части ситуации. Например, если мы заказываем чашку кофе в кафе, Когнитивная лингвистика 233 мы имеем в виду чашку с кофе, которая стоит на блюдце с маленькой ложечкой сбоку. Но обычное упоминание чашка кофе метонимически означает весь набор, сопутствующие ему элементы которого нам не нужно указывать. Мы полагаемся на общие знания о соответствующей когнитивной модели того, что представляет собой чашка кофе, подаваемая в кафе, а не в пукте быстрого питания. В когнитивной семантике также широко изучается м е т а ф о р а — мы рассматриваем два понятия как связанные между собой с точки зрения того, как мы их переживаем. Напримемр, словосочетание под одним зонтиком, используемое выше, может относиться не к реальному зонтику, а к использованию одного и того же слова мать в отношении женщин с разными ролями. Исследования в этой области стали популярными после выхода в свет в 1980 г. книги «Метафоры, которыми мы живем» (Lakoff, Johnson 1980), и во многом сформировали современную когнитивную семантику. Основная идея книги заключалась в том, что метафора не просто творчески используется в поэзии, но и широко распространена в повседневной жизни. Исследователи используют метафоры, чтобы объяснять сложные явления — напр., сравнивают наследования генетического признака с передачей объекта от более старого к более молодому поколению. Однако метафора может присутствовать даже в тех словах, смысл которых обычно далек от метафорического — напр., мы говорим I see, имея в виду I mean. Лакофф и Джонсон отмечали также, что многие из метафорических отображений, найденных в разных языках, зависят от ряда простых паттернов, которые часто встречаются в нашем опыте, таких как путь, контейнер, баланс, поддержка. Они назвали такие паттерны о б р а з н ы м и с х е м а м и (image schemas; Johnson 1987; Lakoff 1987). Образные схемы являются повторяющимися, схематическими паттернами в нашем восприятии мира и в нашем физическом взаимодействии с этим миром. Образные схемы также важны в том, как мы рассуждаем, напр., понимая тот или иной процесс как движение по некоторому пути. Одно из недавних направлений исследований в когнитивной семантике связано с представлением о том, что понимание языка предполагает некоторую форму ментального моделирования концептуального содержания, которое вызвано используемыми словами и конструкциями. Это согласуется с общей предпосылкой когнитивной лингвистики, которая гласит, что говорящий (а также пишущий или говорящий на языке жестов) использует языковые формы в качестве сигналов-подсказок (cue), а слушающий (воспринимающий звуки на слух, читающий текст глазами или использующий шрифт Брайля) обращает внимание на такие сигналы для построения смысла. Представление о том, что язык — это всего лишь одна из семиотических 234 Алан Ченки, О. В. Федорова систем, которую люди используют наравне с другими, приводит нас к усилению внимания когнитивных лингвистов к и с с л е д о в а н и ю ж е с т о в. В связи с этим возникает вопрос о степени, в которой сама грамматика функ ционирует как часть более крупных комплексов полисемиотической коммуникации (Cienki 2017). В заключение рассмотрим несколько важных понятий, которые объединяют упомянутые выше направления когнитивной семантики. Одним из таких понятий является м а с ш т а б и р у е м о с т ь и г р а д и е н т н о с т ь категорий, противопоставленные категориям с жесткими границами. Данное представление противоречит бинарному, цифровому пониманию того, как языковые формы сопоставляются с понятиями. Наоборот, его можно рассматривать как связь с аналоговой природой явлений, которая является неотъемлемой частью воплощенного опыта человека. Еще одно важное понятие — д и н а м и ч н о с т ь. Использование языка динамично — в разных временных масштабах, а динамические процессы лежат в основе того, как функционирует язык. Это основополагающий принцип данного подхода, важность которого только начинает учитываться при когнитивном семантическом анализе. Необходимо развивать новые, динамические средства зрительного представления соответствующих процессов (напр., представление о том, как меняется концептуальная ориентация по мере порождения высказывания). Наконец, когнитивное понимание семантики противоречит предположению, что язык соотносится непосредственно с миром; скорее, точка зрения когнитивной семантики заключается в том, что я з ы к с о о т н о с и т с я с н а ш е й к о н ц е п т у а л и з а ц и е й м и р а. Некоторые могут предположить, что подобный подход приводит нас к постмодернистскому, высоко субъективному и релятивистскому подходу к тому, что составляет Истину. Однако исследования в когнитивной лингвистике в целом поддерживают подход, который принято называть эмпирическим реализмом (Lakoff, Johnson 1999) — Истина не считается абстрактной и воплощенной единожды, а скорее субъективно обосновывается в той степени, в которой в мире разделяется человеческий опыт. 8. Психолингвистика О. В. Федорова Психолингвистика в широком смысле слова — междисциплинарная ко гнитивная наука, исследующая процессы усвоения языка ребенком (Усвоение языка), порождение и понимание речи (Психолингвистика в узком смысле слова), а также мозговые механизмы речевой деятельности (Нейролингвистика). Несмотря на то, что порождение и понимание речи являются двумя сторонами одной и той же языковой способности, традиционно они изучаются независимо друг от друга. Процесс п о р о ж д е н и я р е ч и (рис. 8.1) начинается с намерения говорящего передать собеседнику некоторую мысль, затем говорящий выбирает слова и синтаксическую структуру и переходит к артикуляции (для простоты мы рассматриваем случай устной речи). Процесс п о н и м а н и я р е ч и начинается с того, что слушающий сегментирует и распознает звуковой сигнал, затем анализирует слова и синтаксические структуры и переходит к интерпретации сообщения. Ключевым вопросом современных исследований является вопрос о том, осуществляется ли переход от мысли к внешнему сигналу (акустическому, письменному или жестовому) и обратно одной единой системой или двумя отдельными подсистемами. Данный вопрос еще далек от окончательного решения, однако есть свидетельства, показывающие, что порождение и понимание речи тесно переплетены между собой, а важнейшим механизмом обоих является п р е д в о с х и щ е н и е (prediction; Pickering, Garrod 2013). Ментальный лексикон и → → Фонологические → Сигнал ← синтаксические репрезентации ← репрезентации ← Говорящий Язык Слушающий Мысль Рисунок 8.1. Общая схема порождения и понимания речи М е н т а л ь н ы й л е к с и к о н — хранилище в памяти слов с их значениями (Treisman 1961) — играет центральную роль как при порождении, так и при понимании речи. Пререквизиты: Лингвистика в контексте когнитивных наук; Эксперимент; Теория языка (все главы). 236 О. В. Федорова 8.1. Методология психолингвистики 8.1.1. Исследовательский цикл 8.1.2. Методы психолингвистики Опосредованные методы Непосредственные методы 8.1.3. Дизайн эксперимента Зависимые и независимые переменные Стимульный материал Правило латинского квадрата 8.2. История психолингвистики по Лефельту (2013): дохомскианская эра 8.3. История после «когнитивной революции» 8.4. Современность. Инфраструктура. Два направления по Кларку (1992) 8.5. Порождение устной речи. Модель Лефельта 8.6. Понимание устной речи 8.6.1. Восприятие и распознавание речи 8.6.2. Синтаксическая обработка Литература для дальнейшего чтения: Traxler 2012; Fernández, Smith Cairns 2010; Levelt 2013; Spivey et al. 2012; Goldrick et al. 2014. 8.1. Методология психолингвистики 8.1.1. Исследовательский цикл. Основным методом психолингвистики является э к с п е р и м е н т. Э к с п е р и м е н т а л ь н ы й ц и к л (рис. 8.2) начинается с накопления исследователем некоторого багажа знаний относительно изучаемого феномена, в результате чего он формулирует иссле довательский вопрос. Затем вопрос превращается в теорию/модель, из которой вытекает гипотеза. Чтобы верифицировать гипотезу, исследователь выбирает подходящий метод, а затем разрабатывает дизайн будущего эксперимента, включая подбор испытуемых, (не)зависимые переменные и стимульный материал. После сбора данных проводятся статистический анализ и интерпретация результатов, после чего у исследователя обычно возникает новый вопрос, теория, гипотеза или метод. 8.1.2. Методы психолингвистики. Методы психолингвистики делятся на опосредованные и непосредственные. Используя о п о с р е д о в а н н ы е (off–line) методы, исследователь получает реакцию испытуемого постфактум, т. е. уже после завершения языковой обработки стимула. К числу таких методов относятся различные рода о п р о с н и к и — метод заканчивания предложения (sentence completion study); метод определения грамматической правильности (grammaticality judgment task); метод выбора подходящей перифразы (choice between alternative interpretations). 8. Психолингвистика 237 Рисунок 8.2. Схема исследовательского цикла Н е п о с р е д с т в е н н ы е (on-line) методы позволяют исследовать языковые процессы в режиме реального времени. З а д а ч а л е к с и ч е с к о г о р е ш е н и я (lexical decision task), з а д а ч а с л о в е с н о - р и с у н о ч н о й и н т е р ф е р е н ц и и (picture-word interference task), а также метод п р а й м и н г а (priming) используются для изучения устройства ментального лексикона. Метод ч т е н и я с с а м о р е г у л я ц и е й с к о р о с т и (self-paced reading) дает возможность оценивать сложность синтаксической структуры предложения. Метод р е г и с т р а ц и и д в и ж е н и й г л а з (eyetracking) позволяет изучать процессы чтения, механизмы устного распознавания слов, общение собеседников в процессе коммуникации. При помощи метода в ы з в а н н ы х п о т е н ц и а л о в м о з г а (Event-Related Potentials) изучают семантические, синтаксические и дискурсивные процессы. Метод функциональной магнитно-резонансной томографии (fMRT) применяется для определения зон головного мозга, связанных с выполнением той или иной языковой задачи. Дизайн эксперимента. Дизайн эксперимента включает (не)зависимые переменные и стимульный материал. Н е з а в и с и м о й п е р е м е н н о й 238 О. В. Федорова называется та переменная, которую исследователь варьирует; у каждой независимой переменной может быть несколько значений (у р о в н е й). З а в и с и м а я п е р е м е н н а я представляет собой результат изменений независимой переменной. Типичная зависимая переменная в опосредованных экспериментах — количество ошибок, в непосредственных — время реакции. Психолингвисты исходят из допущения, что чем больше ошибок совершает испытуемый и чем больше времени он тратит на выполнение задания, тем больше нагрузка на его языковой аппарат. С т и м у л ь н ы й м а т е р и а л состоит из филлеров, тренировочных и экспериментальных стимулов. Ф и л л е р ы (fillers) служат для отвлечения внимания испытуемого от экспериментальных стимулов; кроме того, по тому, как испытуемый выполняет задания-филлеры, судят о его языковой компетенции — если он делает больше заданного порога ошибок в филлерах (обычно 10–15%), то полученные им результаты не включаются в общую выборку. Э к с п е р и м е н т а л ь н ы е с т и м у л ы конструируют б л о к а м и. Количество стимулов в блоке определяется количеством у с л о в и й (возможных комбинаций уровней переменных). При распределении стимулов по экспериментальным с п и с к а м (list) необходимо соблюдать два правила. Во-первых, каждый элемент из блока должен встречаться в одном списке только один раз. Во-вторых, количество стимулов каждого типа в каждом списке должно быть одинаково. Это достигается при помощи п р а в и л а л а т и н с к о г о к в а д р а т а. Распределяя стимулы по спискам, мы каждый раз делаем смещение на единицу: первый стимул в первом списке будет первого типа, во втором — второго, в третьем — третьего, в четвертом — четвертого; второй стимул в первом списке будет второго типа, во втором — третьего, в третьем — четвертого, в четвертом — первого; третий стимул в первом списке будет третьего типа, во втором — четвертого, в третьем — первого, в четвертом — второго и т. д. 8.2. История психолингвистики по Лефельту (2013): дохомскианская эра Термин «психолингвистика» был введен Дж. Кантором в 1936 г. (Kantor 1936), но оставался малоизвестным до 1946 г., пока его ученик Н. Пронко не опубликовал статью “Language and psycholinguistics: A review” (Pronko 1946). Между тем, термин «психология языка» активно использовался уже с конца XIX в. Центральная мысль Лефельта состоит в том, что «психолингвистика есть не что иное, как психология языка» (Levelt 2013: 1). Лефельт предлагает такую периодизацию психолингвистики: ее корни можно найти уже в рабо- 8. Психолингвистика 239 тах конца XVIII в., с конца XIX в. она становится сложившейся научной дисциплиной, а в первой половине XX в. наблюдается ее расцвет. История психолингвистики по Лефельту начинается в 1770 г., когда И. Г. Гердер представил Прусской Академии наук свою работу “Abhandlung über den Ursprung der Sprache”. Вопреки ожиданиям, точность измерений приборов, которые конструировали первые психолингвисты, была очень высокой, напр., измерение времени реакции при помощи фонотографа Ф. Дондерсом (Donders 1868). Самой значительной фигурой конца XIX в. стал В. Вундт, опубликовавший двухтомный труд “Die Sprache” (Wundt 1900). К наиболее значительным событиях первой половины ХХ в. относят статистический подход Дж. Ципфа (Zipf 1932) и эффект Струпа (1935) — задержку времени реакции при чтении слов-цветообозначений, цвет написания которых не совпадает с их значением (Stroop 1935). 1951-й год был отмечен тремя событиями, которые во многом предопределили «когнитивную революцию» середины 1950–х гг. Первое из них — Междисциплинарный летний семинар по психологии и лингвистике, проходивший в Корнельском университете летом 1951 г.; второй междисциплинарный семинар, прошедший летом 1953 г. в университете Индианы, завершился изданием в 1954 г. книги “Psycholinguistics: A survey of theory and research problems” (Osgood, Sebeok eds. 1954). Второе событие 1951 г. — выход в свет книги Миллера “Language and communication” (Miller 1951); Миллер не принимал участия в летнем семинаре 1951 г., однако идеи этих проектов во многом перекликались. Третье событие — выход статьи К. Лешли “The problem of serial order in behavior”, в которой была предпринята первая серьезная атака на бихевиоризм (Lashley 1951). В конце 1950–х гг. произошла резкая смена парадигмы — Н. Хомский и Дж. Миллер заменили традиционную психологию языка новой генеративной психолингвистикой, которая в первые годы своего существования тестировала «психологическую реальность» трансформационной грамматики, а затем постепенно превратилась в отдельную науку. Книга Лефельта имеет подзаголовок «Дохомскианская эра», а водораздел проходит по известной книге Б. Скиннера “Verbal behavior” (1957) — сама книга еще принадлежит к области психологии языка, а рецензия Хомского на эту книгу (1959) — уже нет. 8.3. История после «когнитивной революции» Настоящая известность пришла к психолингвистике с появлением в ее рядах Хомского, который, во-первых, вооружил лингвистику новым методологическим аппаратом (1957) и, во-вторых, в рецензии (1959) на книгу Скиннера показал, что бихевиористические идеи плохо подходят для ана- 240 О. В. Федорова лиза естественного языка. Важную роль в установлении хомскианского этапа сыграла безоговорочная поддержка этих идей Миллером, бывшим в те годы уже авторитетным психологом. После опубликования в 1983 г. книги Дж. А. Фодора “Modularity of mind” (Fodor 1983) на смену хомскианской психолингвистике пришел когнитивный модульный подход. В Советском Союзе психолингвистика, называвшаяся т е о р и е й р е ч е в о й д е я т е л ь н о с т и, возникла в середине 1960-х гг. на основе деятельностного подхода к психике, развивавшегося с середины 1930-х гг. в рамках школы Л. С. Выготского. Основы теории речевой деятельности были сформулированы в работах А. А. Леонтьева и Т. В. Рябовой-Ахутиной (Леонтьев 1969; Ахутина 2008). Фундаментом развития российской психолингвистики стали представления Выготского о социальном генезе высших психических функций, в том числе речи, о динамике значения слова в ходе развития речи и мышления у детей, о переходе от мысли к слову как процессе «формирования мысли в слове» (Выготский 1934). 8.4. Современность. Инфраструктура. Две традиции по Кларку (1992) В конце 1980-х — начале 1990-х гг. психолингвистика приобрела принципиально новый статус, превратившись в самостоятельную научную дисциплину. Об этом свидетельствуют, в частности, многочисленные учебные пособия и монографии, вышедшие в те годы (Levelt 1989; Garman 1990; Kess 1992), а также учреждение в 1988 г. ежегодной американской конференции CUNY Human Sentence Processing, а в 1995 г. и европейской конференции Architectures and Mechanisms for Language Processing. В России пик интереса к психолингвистике пришелся на самый конец ХХ в., см. учебники Горелов, Седов 1997; Леонтьев 1999; Залевская 1999; Фрумкина 2001. Среди большого количества современных психолингвистических направлений нужно выделить одно важное противопоставление, введенное Г. Кларком (Clark 1992): «язык как действие» (“language-as-action”) vs. «язык как продукт» (“language-as-product”). Направление «язык как действие» берет начало с работ философов языка Дж. Остина (Austin 1962), П. Грайса (Grice 1957) и Дж. Серля (Searle 1969), а также исследований по дискурсивному анализу и прагматике (Schegloff, Sacks 1973); в отечественной лингвистике оно известно под названием «теория речевых актов». Психолингвисты, работающие в рамках этого направления, в основном занимаются изучением речевого взаимодействия собеседников в процессе реальной коммуникации. Психолингвистическое направление «язык как продукт» восходит к работам Дж. Миллера (Miller 1962) и Н. Хомского (Chomsky 1957). Кларк назвал 8. Психолингвистика 241 это направление «язык как продукт», так как его последователи занимаются в основном языковыми представлениями, то есть «продуктами» процесса понимания высказывания. В целом, направление «язык как действие» напоминает функциональный подход к языку, а «язык как продукт» — генеративный, однако между ними нет такого острого противостояния, которое наблюдается в «чистой» лингвистике. 8.5. Порождение устной речи. Модель Лефельта Взрослый человек говорит на родном языке быстро и без видимых усилий. Скорость его речи зависит от многих факторов, напр., возраста (чем старше, тем медленнее) или известности обсуждаемой тематики (чем извест нее, тем быстрее), но в среднем он порождает от 100 до 300 слов в минуту (Yuan et al. 2006). Между тем, ментальный лексикон взрослого человека насчитывает в среднем около 50 000 слов. Как должен быть организован процесс порождения речи, чтобы так быстро и эффективно справляться с таким большим объемом информации? Некоторые модели порождения постулируют м о д у л ь н ы й подход — очередной этап не может начаться до тех пор, пока не закончится предыдущий (напр., модель Лефельта (1989, 1994)), другие предлагают к а с к а д н ы й принцип — работа некоторого этапа начинается, как только на него поступает необходимая информация (напр., модели Г. Дэлла (1985, 1988) и М. Гаррета (1975, 1988). Второе важное противопоставление связано с наличием обратной связи — в п о с л е д о в а т е л ь н ы х (top-down, serial) моделях информация более нижнего уровня не может поступать на более верхний (напр., модели Гаррета, модель Лефельта), а в и н т е р а к т и в н ы х , п а р а л л е л ь н ы х моделях (botton-up, interactive, parallel) — может (напр., модели Дэлла). Модели порождения речи во многом опираются на а н а л и з р е ч е в ы х с б о е в — ошибок, оговорок, хезитационных пауз, ошибок «на кончике языка». Одна из авторитетных моделей К. Бок и В. Лефельта (1994) устроена следующим образом (рис. 8.3). Сообщение КОНЦЕПТУАЛИЗАТОР Функциональ- Позиционная → ная обработка обработка → гическое Грамматическое кодирование кодирование Фоноло → АРТИКУЛЯТОР ФОРМУЛИРОВЩИК Рисунок 8.3. Модель порождения высказывания Бок и Лефельта (1994) Модель состоит из трех больших блоков — концептуализатора, формулировщика и артикулятора. В первом блоке создается концептуальная струк- 242 О. В. Федорова тура, во втором она переводится в языковую структуру, результатом работы третьего блока является внешняя речь. Процесс порождения начинается с этапа с о о б щ е н и я, который включает мотив и отбор информации для реализации мотива; на выходе этого этапа получается доречевое сообщение. Далее следует этап ф у н к ц и о н а л ь н о й о б р а б о т к и, на котором параллельно происходит л е к с и ч е с к и й п о и с к (lexical retrieval) и приписывание синтаксических ролей, и этап п о з и ц и о н н о й о б р а б о т к и, при котором строятся синтаксические деревья, а обращение к ментальному лексикону уже не происходит; два последних этапа объединены под названием г р а м м а т и ч е с к о г о к о д и р о в а н и я. На уровне грамматического кодирования изучают, в частности, о ш и б к и п р е д и к а т и в н о г о с о г л а с о в а н и я п о ч и с л у, возникающие в ходе заканчивания предложений: испытуемый читает начало предложения, содержащее сложную ИГ с разными комбинациями по числу главного и локального имен, напр., Ключ от кабинетов ... (потеряться). Со времен работы Bock et al. 1991 известно, что больше всего ошибок возникает, когда главное имя стоит в единственном числе, а локальное — во множественном. Если в 1990-х гг. предполагали, что процесс согласования происходят только на позиционном уровне, то теперь принято считать, что он начинается уже на функциональном уровне (Brehm, Bock 2013). На уровне грамматического кодирования исследуется также явление с и н т а к с и ч е с к о г о п р а й м и н г а — тенденция говорящего повторять синтаксическую конструкцию высказывания, произнесенного незадолго до этого (Bock 1986; Mahowald et al. 2016). Говоря об устройстве ментального лексикона, Лефельт использует понятие л е м м ы — абстрактной ментальной репрезентации слова, куда входит информация о морфосинтаксических характеристиках слова (Kempen, Huijbers 1983; Levelt 1989; Caramazza 1997). В ходе грамматического кодирования говорящий извлекает нужные леммы и располагает их в правильном порядке. Затем на этапе фонологического кодирования леммы превращаются в л е к с е м ы. Подобная двухуровневая структура ментального лексикона имеет яркое подтверждение в виде ошибок «н а к о н ч и к е я з ы к а» (tipof-the-tongue), когда говорящий помнит значение нужного слова и некоторые его грамматические характеристики (род, часть речи), но не может вспомнить звуковую оболочку (Brown, McNeill 1966; Aitchison 2003). Экспериментальное подтверждение приходит также из з а д а ч и с л о в е с н о р и с у н о ч н о й и н т е р ф е р е н ц и и — модификации теста Струпа — когда испытуемый должен как можно быстрее назвать объект, изображенный на рисунке, и не обращать внимание на слова-дистракторы, предъявляемые устно или зрительно. В работе Schriefers et al. 1990 был найден ранний се- 8. Психолингвистика 243 мантический эффект (предъявление лексемы cat при изображении собаки замедляет ответ), поздний фонологический эффект (предъявление лексемы dot при изображении собаки ускоряет ответ) и отсутствие взаимодействия эффектов, что не только подтверждает двухуровневую структуру ментального лексикона, но и говорит в пользу последовательных моделей. На заключительном этапе ф о н о л о г и ч е с к о г о к о д и р о в а н и я говорящий извлекает фонологические формы и строит артикуляторный план высказывания. Необходимость выделения этого уровня подтверждают различного рода о г о в о р к и (slip of the tongue): антиципации (потому шке в вышке вместо потому что в вышке), персеверации (шагнет штраус вместо шагнет страус), метатезы внутри слова (запонимаю вместо запоминаю), метатезы между словами (спунеризмы, названные так по имени декана колледжа в Оксфорде В. А. Спунера, который часто их допускал, the queer old dean вместо the dear old Queen) и бленды (наперек из наперекор и поперек). В модель Лефельта также входит система м о н и т о р и н г а, которая осуществляется через систему понимания речи. 8.6. Понимание речи Процесс понимания устной речи можно условно разделить на три этапа — восприятие речи, распознавание речи и синтаксическая обработка. Первые два этапа сильно переплетаются, поэтому будут рассмотрены в одном разделе. 8.6.1. Восприятие и распознавание речи. Родная речь обычно воспринимается как медленная, с длинными четкими паузами между словами, а иностранная сливается в один непрерывный поток. Какие механизмы стоят за этой почти автоматической способностью сегментировать родную речь? Подобные вопросы исследуются как в области восприятия устной речи, так и в области ее распознавания. Существующее разделение этих двух областей хотя и имеет под собой основания (при изучении восприятия исследуется, как человек воспринимает и идентифицирует отдельные звуки языка, а при изучении распознавания нас интересует вопрос идентификации целых слов), но в некоторой степени все же искусственно: нельзя утверждать, что сначала мы распознаем все звуки, а потом складываем из них слова. Наоборот, знание слова помогает правильно распознать звуки, из которого это слово состоит. Важным свойством восприятия речи является его к о н с т р у к т и в и с т с к и й характер, что можно наблюдать, исследуя ф о н о л о г и ч е с к и е и л л ю з и и. Э ф ф е к т М а к Г у р к а (1976) состоит в следующем. Испыту- 244 О. В. Федорова емому показывают видеозапись речи человека, произносящего ga-ga, в то время как фонограмма воспроизводит ba-ba. Когда испытуемый закрывает глаза и слушает фонограмму, он распознает звуки как ba-ba; при отключенном звуке, когда он видит только движения губ, он идентифицирует их как ga-ga. Однако когда ему одновременно предъявляются противоречивые слуховые и зрительные стимулы, испытуемый слышит da-da. Э ф ф е к т в о с с т а н о в л е н и я ф о н е м ы (phoneme restoration; Warren 1970) состоит в автоматическом перцептивном восстановлении воспринима емого речевого потока на основе контекста, благодаря чему пропущенные (или замененные, напр., на кашель) в речи фонемы «восстанавливаются» и испытуемый субъективно не замечает этих пропусков. Конструктивистский характер восприятия речи наблюдается также и при о с л ы ш к а х (slips of the ear; Bond 2005), напр., человек слышит в синий дым Китая вместо в синей дымке тает. Время, необходимое для распознавания слова, зависит как от свойств этого слова (напр., частоты встречаемости), так и от количества слов, на которые данное слово похоже по своему фонетическому облику, так как процесс распознавания слова слушающим начинается раньше, чем говорящий успевает произнести это слово до конца. Существует несколько известных моделей распознавания слова. Идея к о г о р т н о й м о д е л и В. МарсленВильсона (Marslen-Wilson 1973) заключается в том, что по мере того как мы слышим речь, мы строим ряд потенциальных слов, одним из которых окажется та последовательность звуков, которые мы слышим в настоящий момент. Чем ближе к концу слова, тем меньше остается различных вариантов, сводясь в итоге к единственному кандидату. Когортная модель состоит из трех этапов: (1) этапа доступа, в ходе которого активируется когортный ряд кандидатов; (2) этапа селекции, в результате работы которого из этого ряда выбирается один элемент; (3) этапа интеграции, в ходе которого семантические и синтаксические свойства слова передаются для построения синтаксической структуры высказывания. Изменения в поздних версиях модели (Gaskell, Marslen-Wilson 2001) сводятся к ограничению роли контекста — считается, что контекст может оказывать влияние на процесс распознавания слова лишь на этапе интеграции. В к о н н е к ц и о н и с т с к о й м о д е л и T R A C E (McClelland, Elman 1986), наоборот, считается, что контекст с самого начала влияет на процесс распознавания слова. Кроме того, предсказания данных моделей расходятся в отношении рифмованных слов: в модели Марслен-Вильсона построение когортного ряда происходит строго слева направо (то есть для последовательности звуков кры- возможный когортный ряд состоит из крыша, крыш- 8. Психолингвистика 245 ка, крыжовник, крыса, ...), а в модели TRACE возможны и такие слова, которые совпадают с одним из кандидатов (крышка) по последним звукам слова (например, мартышка). О распознавании п и с ь м е н н о й р е ч и см. Norris 2013. 8.6.2. Синтаксическая обработка (syntactic processing, syntactic parsing). Со времени первых работ Хомского синтаксический анализ считается ядерным компонентом любой модели понимания речи. Важная роль при тестировании формальных моделей отводится с и н т а к с и ч е с к и н е о д н о з н а ч н ы м предложениям (в отечественной традиции принят термин синтаксическая омонимия, Иорданская 1967). В зависимости от того, как модели описывают разрешение синтаксической неоднозначности, выделяют последовательные, параллельные модели и модели с отсрочкой. П о с л е д о в а т е л ь н ы е модели, напр., м о д е л ь з а б л у ж д е н и я (garden-path model; Frazier, Fodor 1978), постулируют построение одной синтаксической структуры и процедуру последующей корректировки в случае ошибочного первоначального анализа. П а р а л л е л ь н ы е модели строят одновременно все альтернативные структуры, выбор между которыми осуществляется путем конкуренции (MacDonald et al. 1994). В моделях с о т с р о ч к о й разрешение неоднозначности откладывается до появления всей необходимой информации (Marcus 1980). С и н т а к с и ч е с к а я н е о д н о з н а ч н о с т ь возникает из разных источников. Классическое неоднозначное предложение Visiting relatives can be boring может быть понято как в том смысле, что родственники скучны, так и так, что посещать родственников скучно. Этот тип неоднозначности называется р а з м е т о ч н о й синтаксической омонимией. C т р е л о ч н а я синтаксическая омонимия хорошо известна благодаря предложениям с относительными придаточными, которые модифицируют одно из двух имен, входящих в состав сложной ИГ, напр., Кто-то застрелил служанку актрисы, которая стояла на балконе. При совпадении рода и числа имен существительных они имеют два прочтения: придаточное может относиться как к главному имени, «служанка стояла на балконе», так называемое р а н н е е з а к р ы т и е, так и к зависимому, «актриса стояла на балконе», п о з д н е е з а к р ы т и е. Проведенные эксперименты показали, что носители одних языков (английский, шведский, арабский, норвежский, румынский) предпочитают позднее закрытие, в то время как носители других (русский, польский, африкаанс, греческий, нидерландский, немецкий, японский) чаще выбирают вариант с ранним закрытием. Почему языки ведут себя так по-разному? Все гипотезы можно разделить на две группы относительно 246 О. В. Федорова вопроса об у н и в е р с а л ь н о с т и с и н т а к с и ч е с к о г о п а р с е р а. Сторонники универсалистского подхода утверждают, что языки, отличаясь друг от друга лексически и морфологически, используют один и тот же синтаксический парсер (Frazier, Clifton 1997; Fodor 1998; Grillo, Costa 2014). Сторонники противоположного подхода признают существование в каждом языка своего особого синтаксического анализатора (Gibson, Pearlmutter 1994; Brysbaert, Mitchell 1996). 9. Усвоение родного языка О. В. Федорова Усвоение родного языка (лингвистика детской речи, онтолингвистика, First Language Acquisition, Language Development) — раздел психолингвистики в широком смысле слова, изучающий процессы и механизмы, при помощи которых ребенок овладевает родным языком. Ребенок усваивает родной язык за относительно короткое время и без видимых усилий, хотя любой язык представляет собой весьма сложную систему. Как это ему удается? Нативисты полагают, что усвоение невозможно без врожденного языкового компонента; конструктивисты, наоборот, ставят во главу угла опыт. Вопрос о врожденности языка, таким образом, — ключевой вопрос современных теорий. Западная лингвистика детской речи изучает в основном языковое развитие детей от рождения до 4 лет, так как в этот период происходит становление базовых языковых навыков. Отечественная онтолингвистика продолжает исследование детской речи до 8–9летнего возраста. Возраст 10–16 лет исследован мало, хотя некоторые — в первую очередь синтаксические и дискурсивные — особенности языка подростков представляют несомненный интерес (Nippold 2016). Пререквизиты: Лингвистика в контексте когнитивных наук; Эксперимент; Теория языка (все главы); Когнитивная лингвистика; Психолингвистика; Нейролингвистика. 9.1. Вопрос о врожденности языка 9.1.1. «Природа или воспитание». Современные концепции усвоения языка 9.1.2. Дети-маугли и гипотеза критического периода 9.1.3. Речь, обращенная к ребенку. Проект Деба Роя 9.2. Два вопроса из области усвоения языка глазами нативистов и конструктивистов 9.3. Этапы усвоения языка 9.3.1. Пренатальный период 9.3.2. Доречевой период 9.3.3. Речевой период 9.4. Методология изучения детской речи 9.5. История изучения детской речи 9.5.1. Отечественная история изучения детской речи 9.5.2. Современность. Инфраструктура Литература для дальнейшего чтения: Clark 2009; Hoff 2014; Томаселло 2015; de Villiers, Roeper 2011; O’Grady 1997; Fletcher, MacWhinney eds. 1995; Brooks, Kempe eds. 2014. 248 О. В. Федорова 9.1. Вопрос о врожденности языка 9.1.1. «Природа или воспитание». Современные концепции усвоения языка. За формулировкой «Природа или воспитание» (Nature vs. Nurture) стоит важнейший вопрос о том, какие факторы — связанные с наследственностью или с внешней средой — играют определяющую роль в развитии человеческого познания. Подход, метафорически названный Дж. Локком “tabula rasa”, состоит в том, что у человека нет ничего врожденного и что весь его опыт — поведение, мысли, чувства и язык — формируется под воздействием внешней среды (Locke 1690). Такой подход называется э м п и р и з м о м. Эмпиризму противопоставлен н а т и в и з м, который признает существование познания, не зависящего от опыта и происходящего вследствие наличия у человека определенных врожденных механизмов; среди основоположников этих идей можно назвать Платона и Декарта. В первой половине ХХ в. американская психология придерживалась идей б и х е в и о р и з м а — одного из направлений эмпиризма, согласно которому наука должна отказаться от умозрительных теорий о человеческой психике и ограничиться изучением внешних проявлений поведения. Язык, согласно бихевиоризму — набор навыков, приобретаемых в ходе имитации и получения подкреплений. Полагая, что речь — это «вербальное поведение», Б. Скиннер предположил, что ребенок усваивает язык путем имитации высказываний взрослых (Skinner 1957). Взгляды Скиннера были подвергнуты разгромной критике молодым Н. Хомским, который показал, что речь взрослых не может служить моделью для подражания из-за наличия речевых сбоев и ошибок (Chomsky 1959). Кроме того, ребенок не получает от взрослых достаточное количество отрицательных данных, т. е. эксплицитного исправления ошибок, в чем состоит аргумент о б е д н о с т и с т и м у л а (poverty of the stimulus; Chomsky 1965). Так Хомский сформулировал главный постулат генеративизма о существовании врожденного знания языка, которое определяет способность порождать правильные предложения и не порождать неправильные. Лингвистическую модель этого компонента сейчас называют у н и в е р с а л ь н о й г р а м м а т и к о й (в ранних работах Хомский использовал термин у с т р о й с т в о д л я у с в о е н и я я з ы к а (Language Acquisition Device; Chomsky 1965). Существует много современных конструктивистских альтернатив нативизму, в том числе: к о н с т р у к т и в и з м (Constructivism; Ambridge, Lieven 2011), э м е р д ж е н т и з м (Emergentism; MacWhinney, O’Grady eds. 2015), с о ц и а л ь н ы й и н т е р а к ц и о н и з м (Social interactionism; Snow 2014), к о н н е к ц и о н и з м (Connectionism; Elman 2001; Li, Zhao 2014), с т а т и с т и ч е с к о е о б у ч е н и е (Statistical learning; Saffran 1996; Wiess 2014; 9. Усвоение родного языка 249 Arnon, Christiansen 2014; Saffran, Kirkham 2018); у з у а л ь н а я т е о р и я (Usage-based theory; Томаселло 2015). Большинство этих теорий в той или иной форме принимают идею врожденности общекогнитивной предрасположенности к обучению, но отрицают врожденность языкового модуля. 9.1.2. Дети-маугли и гипотеза критического периода. Гипотеза о влиянии социума на развитие ребенка может быть проверена при изучении детей-маугли (wild, feral child), проведших первые годы жизни вне человеческой среды (это явление называется с о ц и а л ь н о й д е п р и в а ц и е й). Первый известный случай относится к началу XIX в. 8 января 1800 г. мальчик лет двенадцати, которого назвали Виктор, вышел из леса в окресностях Аверона на юге Франции. По-видимому, все детство мальчик провел в лесу; у него не было одежды, он передвигался на четвереньках и питался травой, корнями и сырыми овощами; Виктор мог вытаскивать руками из огня горящие поленья, различал шум шагов далеко идущего человека, не чувствовал многие человеческие запахи. Мальчик издавал отдельные звуки, но членораздельная речь у него отсутствовала. Вскоре Виктора привезли в Париж, где им начал заниматься Ж.-М. Г. Итар. Хотя Итару удалось обучить ребенка некоторым основам человеческого поведения (Itard 1802), в области языка Виктор сумел выучить только несколько отдельных слов. История мальчика стала широко известна благодаря фильму Ф. Трюффо «Дикий ребенок» (1970). Виктор умер в Париже в 1828 г. Другой случай, получивший известность, произошел в конце ХХ в. — в 1970 г. в Калифорнии была обнаружена дикая девочка Джини. Первые 6 мес. своей жизни Джини развивалась нормально, но примерно в 18 мес. отец изолировал ее в запертой полутемной комнате, где девочка провела первые 13 лет жизни; Джини кормили жидкими молочными смесями, не разговаривали с ней, не снимали подгузники, в 13 лет она была ростом с семилетнего ребенка и плохо ходила. После того, как ее матери удалось сбежать из дома, с девочкой начали работать специалисты. Хотя Джини постепенно удалось выучить некоторое количество слов, она так и не научилась строить грамматически правильные предложения (Fromkin et al. 1974; Curtiss 1977). Дальнейшая судьба Джини неизвестна. Объясняя феномен детей-маугли, в 1967 г. Э. Леннеберг выдвинул г и п о т е з у к р и т и ч е с к о г о п е р и о д а: существует определенный возрастной порог, после достижения которого овладение языковыми навыками становится невозможно. По мнению Леннеберга, критический период длится до наступления пубертатного возраста (полового созревания), после чего 250 О. В. Федорова мозг становится менее пластичным и неспособным к полноценному освоению языка (Lenneberg 1967). Насколько хорошо истории детей-маугли подтверждают гипотезу критического периода? Некоторые исследователи полагают, что эти дети могли иметь серьезные задержки умственного развития, которые бы не позволили им освоить язык в полной мере и находясь в социуме. О «гене» языка и специфических нарушениях развития речи см. главу 11 в наст. изд. 9.1.3. Речь, обращенная к ребенку. Проект Деба Роя. Еще один вопрос, по которому расходятся нативисты и конструктивисты — вопрос о влиянии на процесс усвоения языка особенностей речи взрослых (их и н п у т а). Когда мы общаемся друг с другом, наша речь изобилует речевыми сбоями — паузами хезитации, самоисправлениями и обрывами слова. Каким образом ребенок, ориентируясь на такую речь, может извлечь из нее правильные представления о языковых принципах и механизмах? По мнению Хомского, знание языка является врожденным и не зависит от характера инпута. По мнению его оппонентов, р е ч ь, а д р е с о в а н н а я р е б е н к у (Child Directed Speech; Soderstrom 2014), сильно отличается от повседневной речи и помогает ребенку освоить языковые правила. Эти отличия можно проследить на всех уровнях языка. На уровне просодии и сегментации речи взрослые говорят с детьми на более высокой частоте основного тона, медленнее и с более длинными паузами; на уровне грамматики — более короткими и простыми предложениями, с большим количеством вопросительных и побудительных предложений; на уровне лексики — чаще используют слова с конкретным значением и диминутивы. Как можно верифицировать гипотезу о роли инпута в усвоении языка? На первый взгляд кажется, что в этом могут помочь лонгитюдные записи общения матери и ребенка. Однако в них фиксируется лишь мизерная часть коммуникации. Уникальная возможность получить более обоснованный ответ появилась с созданием корпуса Human Speechome Project (HSP; Roy et al. 2006). В ходе этого проекта Д. Рой оборудовал свой дом 11 видеокамерами и 14 диктофонами, получив возможность записывать поведение своего сына и других членов семьи во всех помещениях. На протяжении трех лет он вел запись по 10 часов в день, записав в общей сложности 230000 часов, что составляет 70% всей активности ребенка (Vosoughi et al. 2010). В частности, Рой составил список из 461 слов, которые его сын научился говорить за первые 2 года, а затем для каждого слова отследил все ситуации, в которых ребенок слышал данное слово. Для каждого взрослого высказывания из инпута была 9. Усвоение родного языка 251 измерена его длина. Оказалось, что сначала высказывания взрослых были совсем короткими, а затем постепенно вернулись к обычному для взрослого языка уровню (Roy et al. 2009), см. также Roy et al. 2015; Meylan et al. 2017. 9.2. Два вопроса из области усвоения языка глазами нативистов и конструктивистов Рассмотрим различия между подходами нативистов и конструктивистов на двух примерах. Первый пример взят из области усвоения базового синтаксиса. Как ребенок усваивает предложение Девочка играет? С точки зрения нативистов, ребенок рождается с врожденным знанием о категориях Noun и Verb и способен идентифицировать слова из инпута как принадлежащие к одной из этих категорий. В частности, по мнению С. Пинкера, ребенок это делает при помощи врожденных семантических знаний, которые помогают ему в усвоении синтаксиса (s e m a n t i c b o o t s t r a p p i n g h y p o t h e s i s; Pinker 1984) — наименования людей, объектов и понятий относятся к категории Noun, а действий, событий и состояний — к категории Verb. После этого ребенку остается только настроить нужный порядок слов — напр., согласно теории установки параметров (Hyams 1986). С точки зрения конструктивистского подхода, ребенок не имеет врожденных знаний и правил, а обобщает информацию, поступающую из инпута. Он слышит высказывания Аня играет или Он играет и строит схемы-обобщения — напр., согласно известной с т е р ж н е в о й г р а м м а т и к е (pivot grammar, Braine 1963), в которой одно из слов часто употребляется в речи и выполняет роль стержня, а второе относится к открытому классу; ср. о с т р о в н у ю г и п о т е з у (verb-island hypothesis) М. Томаселло, согласно которой дети сначала усваивают наиболее частотные глаголы вместе с их типичным окру жением, а затем уже на этой основе строят схемы обобщения (Tomasello 1992). Второй пример взят из области усвоения значений первых слов. Когда ребенок слышит слово кролик, то как он может догадаться, что речь идет именно об этом животном, а не о его ушах или типичном поведении? Данный вопрос был поставлен в 1960–х гг. философом У. Куайном (Quine 1960). Отвечая на него, нативисты предлагают несколько врожденных допущений — что предпочтительно наименование целого объекта (whole object assumption), уникальность его названия (mutual exclusivity assumption) и принадлежность к тому же классу (taxonomic assumption; Fernández, Smith Cairns 2010: 113–116). Конструктивистский подход, отрицая врожденность, апеллирует к понятиям с о в м е с т н о г о в н и м а н и я (joint attention) и ч т е н и я н а м е р е н и й (intention reading; Bruner 1983; Томаселло 2015), которые подчеркивают первостепенную роль социально-прагматических факторов. 252 О. В. Федорова 9.3. Этапы усвоения языка 9.3.1. Пренатальный период. Еще одна проблема в дискуссии о врожденности языка состоит в том, что даже если ребенок рождается с некоторым набором знаний, мы не можем утверждать, что эти знания являются врожденными. Авторы работы Mehler et al. 1988 показали, что дети двух дней от роду отличают родную французскую речь от неродной русской. Однако это говорит не о наличии у них гена французского языка, а о том, что ребенок способен слышать и опознавать материнскую речь уже в по следнем триместре беременности, по крайней мере низкие частоты, которые отвечают за просодические характеристики речи (Moon 2017). 9.3.2. Доречевой период. Этот период продолжается от рождения до 12 мес. и включает пять этапов (Stark 1986). Первый этап (до 2 мес.) — этап к р и к а (crying) и других физиологических звуков; в это время младенец (infant) уже способен различать гласные звуки и хранить в памяти мелодии, которые он слышал в утробе. Второй этап — г у л е н и е (cooing) и смех; гуление возникает в 2–3 мес. как ответ на общение со взрослым; смех появляется в 4 мес. Начало третьего этапа в о к а л ь н о й и г р ы (vocal play) относят к 4 мес.; на этом этапе увеличивается количество гласно- и согласноподобных звуков, которые ребенок способен произнести; серии звуков, которые ребенок порождает к концу этого этапа, получили название маргинального лепета (babbling). Четвертый этап — л е п е т с р е д у п л и к а ц и е й, или к а н о н и ч е с к и й л е п е т, для которого характерно повторение одной и той же последовательности типа [bababa], начинается в 6 мес; в это же время ребенок уже распознает свое имя. Наконец, пятый этап — в а р и а т и в н ы й л е п е т, при котором младенец соединяет в последовательность разные слоги типа [bamiko], начинается в 9 мес; в это же время ребенок учится сегментировать звуковой поток на отдельные слова и понимает значения некоторых слов. Кроме того, в его лепете становится особенно заметна просодия, которая делает его речь похожей на взрослую. В 1941 г. Р. О. Якобсон выдвинул три гипотезы: (1) на этапе лепета дети могут порождать звуки всех языков мира; (2) между лепетом и последующей речью нет никакой связи (discontinuity hypothesis); (3) фонемы усваиваются в универсальном порядке (Jakobson 1941/1968). Долгое время эти гипотезы оставались весьма влиятельными, но затем все три были опровергнуты. 9. Усвоение родного языка 253 9.3.3. Речевой период. Во второй год жизни наиболее значительные изменения в языковом развитии ребенка наблюдаются в области усвоения слов — свои первые слова он произносит в 12 мес., а к концу второго года его словарь достигает 300 слов (Fenson et al. 1994). Фонологически первые слова ребенка мало отличаются от лепета, однако за каждым означающим за крепляется свое означаемое. Считается, что когда словарь (л е к с и к о н) ребенка достигает 50 слов (примерно в 18 мес.), у него начинается р е ч е в о й в з р ы в — быстрое увеличение объема лексикона; однако некоторые исследователи отрицают универсальность речевого взрыва и полагают, что у одних детей рост словаря происходит скачкообразно, а у других — постепенно (Bloom 2000). Первые детские лексиконы различаются по своему составу — у некоторых преобладают наименования людей и объектов (р е ф е р е н ц и а л ь н ы й с т и л ь; Nelson 1973) у других — очень разнородные слова, включая обозначения действий, эмоций и оценок, и даже замороженные слова типа Я тебя люблю (э к с п р е с с и в н ы й с т и л ь). В этот период наблюдаются с у ж е н и я значения слов и с в е р х г е н е р а л и з а ц и и — напр., ребенок может называть цветком только розу, а собакой любое животное на четырех ногах. С точки зрения синтаксиса дети говорят г о л о ф р а з а м и — однословными высказываниями. В зависимости от контекста детские голофразы могут обозначать много разных вещей — напр., высказывание Молоко! может обозначать или указание на стакан молока, или желание выпить молока, или описание ситуации, в которой кошка пьет молоко. Третий год жизни ребенка посвящен в первую очередь развитию его грамматики. В 2 года появляются первые утвердительные и восклицательные двухсловные высказывания, однако они лишены словоизменительной морфологии (т е л е г р а ф н ы й с т и л ь). К концу третьего года в речи детей появляются вопросы и отрицания. Важным показателем оценки грамматического развития ребенка является средняя длина его высказываний, которая определяется в морфемах или словах (mean length of utterances; Brown 1973). После 2 лет в речи ребенка появляются личные местоимения, хотя он еще может путать формы я и ты. Кроме грамматического развития, постепенно растет словарный запас ребенка, улучшается артикуляция звуков, развиваются навыки общения. Между 3 и 4 годами происходит дальнейшее совершенствование уже имеющихся навыков на всех уровнях — в произношении, морфологии, синтаксисе, словарном запасе и коммуникации. В частности, ребенок понимает предлоги на, над, под; правильно использует показатели множественного числа; строит короткие рассказы из двух-трех предложений; начинает порождать много вопросительных предложений. К 4 годам ребенок усваивает все базовые языковые навыки. 254 О. В. Федорова 9.4. Методология изучения детской речи В отличие от «взрослой» лингвистики важнейшим методом сбора данных в области изучения детской речи уже больше 150 лет остается метод н а б л ю д е н и я. Методология подобных записей, однако, за это время сильно усовершенствовалась, пройдя путь от спорадических дневниковых записей до л о н г и т ю д н о й (многократная запись через равные временные интервалы) видеосъемки; популярны также описания о т д е л ь н ы х с л у ч а е в (casestudy). См. также описание проектов CHILDES, MacArthur-Bates CDI и HSP. Первый э к с п е р и м е н т ребенок может пройти уже в первый день жизни. Методика в ы с о к о а м п л и т у д н о г о с о с а н и я (high-amplitude sucking) основана на том, что когда младенец слышит новые для него звуки, он совершает более частые сосательные движения (Eimas et al. 1971; ByersHeinlein 2014). В возрасте полугода ребенок эффективно участвует в экспериментах с о б у с л о в л е н н ы м и п о в о р о т а м и г о л о в ы (conditioned head-turn), поворачивая голову на новые для него звуки (Kuhl 1985). Наиболее разработанным с точки зрения методологии эксперимента является уровень синтаксиса, к числу о п о с р е д о в а н н ы х детских методов относятся направленная имитация (elicited imitation); направленное порождение (elicited production), в том числе WUG-тест (Berko 1958); разыгрывание сцен (act-out task); выбор подходящей картинки (picture selection task); метод зрительных предпочтений (preferential looking), оценка грамматической приемлемости (Ambridge 2014) и др. (McDaniel et al. 1996; Hoff 2012). К числу н е п о с р е д с т в е н н ы х методов относятся регистрация движений глаз (eyetracking), метод вызванных потенциалов мозга (event-related potentials) (Sekerina et al. 2008), функциональная магнитно-резонансная томография (Ambridge, Rowland 2013). 9.5. История изучения детской речи Научное изучение детской речи делится на три этапа: (1) с 1876 по 1926 г.; (2) с 1926 по 1957 г.; (3) с 1957 г. до настоящего времени (Ingram 1989). Начало первому этапу положила статья И. Тэна в журнале “Mind”, исследовавшего языковое развитие своей дочери от рождения до 2 лет (Taine 1876). Через год в том же журнале вышла статья Ч. Дарвина, наблюдавшего за речью своего сына (Darwin 1877). Уникальную для своего времени картотеку усво ения польского языка удалось собрать И. А. Бодуэну де Куртенэ (Baudouin de Courtenay 1869). В 1882 г. в книге «Разум ребенка», В. Прейер проанализиро- 9. Усвоение родного языка 255 вал дневниковые записи речи своего сына (Preyer 1882). Наконец, в 1907 г. вышла книга У. Штерна и К. Штерн «Язык ребенка», целиком посвященная языку детей (Stern, Stern 1907). Все известные исследования детской речи первого этапа опирались на дневниковые записи одного, двух или трех детей. Характерной чертой второго этапа стала работа с большими выборками детей. В частности, были определены последовательность и возраст усвоения звуков, темпы роста лексикона, средняя длина высказываний. Первой такой работой считается диссертация М. Смит, в которой собраны образцы речи 273 детей от 2 до 6 лет (Smith 1926). Несмотря на несомненный прогресс, исследования второго периода имели и недостатки — не учитывались индивидуальные особенности развития речи, а данные по-прежнему фиксировались на слух. См. также работы известнейшего швейцарского детского психолога Ж. Пиаже. Наконец, третий этап был ознаменован сразу несколькими важными нововведениями. Во-первых, начало этапа не случайно совпадает с годом выхода книги Хомского «Синтаксические структуры» (Chomsky 1957). Если в первые два этапа исследователи интересовались по большей части фонологией, морфологией и лексическим развитием, то с конца 1950-х гг. они переключились на изучение синтаксиса и, соответственно, речи ребенка от 2 до 3 лет. Вторая важная особенность состояла в появлении лонгитюдных исследований. В 1962 г. группа исследователей под рук. Р. Брауна записывала спонтанную речь трех детей, получивших псевдонимы Адам, Ева и Сара: Адама и Еву записывали раз в две недели, а Сару — каждую неделю; кроме того, в этой работе впервые были использованы магнитофоны (Brown 1973); см. также лонгитюдные проекты в (Bloom 1970; Braine 1963; Miller, Ervin 1964). Третьим нововведением этого этапа стало появление типологических исследований. В начале 1980-х гг. Д. Слобин возглавил проект “The Crosslinguistic Study of Language Acquisition” (Slobin 1985–1997), в ходе которого было описано более тридцати языков разных языковых семей всех пяти континентов (Berman 2014). Другой типологический проект Слобина, осущественный чуть позже, был создан на материале популярной книжки с картинками «Лягушка, где ты?» (“Frog, where are you?”). Авторы записали пересказы 268 детей от 3 до 9 лет, говорящих на иврите, английском, испанском, турецком и немецком языках, а затем проанализировали их с точки зрения видовременных характеристик, связности повествования и т. д. (Berman, Slobin 1994). 9.5.1. Отечественная история изучения детской речи. Говоря о развитии отечественной науки, нельзя не отметить выдающего психолога ХХ в. Л. С. Выготского, на чьи идеи до сих пор опирается российская лингвистика 256 О. В. Федорова детской речи (Выготский 1934). Заметным событием стала публикация в 1926 г. книг Н. А. Рыбникова «Язык ребенка» (Рыбников 1926а) и «Словарь русского ребенка» (Рыбников 1926б). Однако наиболее известный отечественный ученый — А. Н. Гвоздев, в 1943 г. защитивший докторскую диссертацию «Формирование у детей грамматического строя русского языка». Дневниковые записи речи его сына Жени, погибшего в первые дни войны, были опубликованы уже после смерти автора (Гвоздев 1981). Большой вклад в развитие московской школы внесла Н. И. Лепская, работавшая на кафедре ТиПЛ филологического факультета МГУ (Лепская 1997). В последние десятилетия центр развития российской детской речи переместился в Санкт-Петербург, где работает Лаборатория детской речи под рук. С. Н. Цейтлин, ontolingva.ru, чья книга (Цейтлин 2000) посвящена памяти К. И. Чуковского — автора «От двух до пяти» (Чуковский 1933). 9.5.2. Современность. Инфраструктура. С 1970-х гг. лингвистика дет ской речи постепенно выделилась в отдельное направление со своей структурой, журналами и конференциями. Международная ассоциация по исследованию детского языка (International Association for the Study of Child Language, iascl.net) с 1978 г. раз в три года проводит международные конгрессы. В 1974 г. в издательстве Cambridge University Press вышел первый номер “Journal of Child Language” — самого престижного современного журнала, позднее по явились “First Language” и “Language Acquisition”. В настоящее время в США и Европе открыты научные центры по изучению детской речи. Отдельно следует отметить два крупномасштабных проекта. Корпус дет ских аудио- и видеозаписей CHILDES (Child Language Data Exchange System, childes.psy.cmu.edu, рук. Б. МакВинни) представляет собой открытый ресурс записей на разных языках (арабском, баскском, венгерском, греческом, идише, ирландском, польском, русском, сербском, сесото, тамильском, турецком, хорватском) с собственными системой транскрипции и программами обработки (MacWhinney 2013, 2014). МакАртуровский тест коммуникативного развития (MacArthur-Bates Communicative Development Inventory) используется в качестве инструмента анализа ранних этапов речевого развития (Fenson et al. 2007). Этот проект, разрабатываемый с 1970-х гг., представляет собой два опросника для родителей: «Слова и жесты» (для детей от 8 до 16 мес.) и «Слова и предложения» (от 16 до 36 мес.). Опросник адаптирован для многих языков мира (албанского, арабского, бенгали, волоф, китайского, датского, идиш, исландского, ирландского, малайского, персидского, румынского, русского, сасак, тайского, финского). 10. Усвоение второго языка И. А. Секерина, О. В. Федорова Усвоение второго языка (Second Language Acquisition, L2) — раздел психолингвистики в широком смысле слова, который изучает, как второй язык представлен в голове изучающего его взрослого или ребенка и как в процессе усвоения возникают и функционируют ментальные репрезентации второго языка. Отправной точкой процесса усвоения второго языка считается полное отсутствие знания этого языка при наличии родного, а конечной — такое знание языка, которое не отличимо от компетенции носителя этого языка как родного. Усвоение второго языка подразумевает, что человек является полностью сформировавшимся (или находящемся в процессе формирования) носителем родного, то есть первого языка, а второй язык появляется в жизни этого носителя позже, приобретая таким образом статус неродного. В широком смысле усвоение второго языка относится к д в у я з ы ч и ю (б и л и н г в и з м у), но отличается от него тем, что при двуязычии возможно одновременное усвоение двух языков, в то время как термин «усвоение второго языка» обозначает только процесс последовательного усвоения, при котором сначала усваивается родной язык и только потом второй. Усвоение второго языка является т е о р е т и ч е с к о й, а не прикладной дисциплиной. Применение принципов усвоения второго языка на практике при изучении в школе, вузе или на специальных курсах является предметом п е д а г о г и к и. Пререквизиты: Усвоение родного языка; Эксперимент; Теория языка (все главы); Лингвистика в контексте когнитивных наук; Психолингвистика; Нейролингвистика. 10.1. Введение 10.2. Критический период в усвоении второго языка Исследование Джонсон и Ньюпорт (1989) Исследование Хартсхорна и его коллег (2018) 10.3. Этапы процесса усвоения второго языка и их характеристики 10.3.1. Промежуточный язык и фоссилизация 10.4. Могут ли люди, изучающие второй язык, достичь уровня носителя? 10.4.1. Гипотеза интерпретируемости 10.4.2. Исследование индивидуальных различий 258 И. А. Секерина, О. В. Федорова 10.5. Методология изучения усвоения второго языка 10.6. Современность и инфраструктура 10.6.1. Направления будущих исследований Литература для дальнейшего чтения: Juffs 2011; VanPatten, Benati 2010; MacWhinney 2017; Doughty, Long eds. 2003. 10.1. Введение Усвоение второго языка представляет собой относительно новую область, которая начала активно развиваться с 1970-х гг. Теоретические и экспериментальные работы в этой области направлены на поиск ответа на главный вопрос: (1) Почему усвоение (или изучение) второго языка так отличается от усвое ния родного, особенно, когда речь идет о взрослых? Главное отличие, лежащее на поверхности, заключается в том, что очень небольшому числу взрослых, изучающих второй язык, удается достичь уровня владения вторым языком, близкого к уровню носителя. Усвоение второго языка, как и любая другая научная дисциплина, отвечает на свой главный вопрос с разных теоретических позиций. Двумя наиболее динамично развивающимися теориями являются генеративный подход (White 2003a,b) и когнитивный подход (Tomasello 2003), о противопоставлении этих подходов см. Juffs 2010. Вопрос в (1) многогранен, и в поисках ответа на него возникает необходимость вычленить несколько более частных, но взаимосвязанных вопросов, которые и составляют повестку дня в этой области. Мы остановимся на трех из них (VanPatten, Benati 2010: 9): (1) Есть ли критический период, после которого усвоение второго языка сильно затрудняется? (2) Каковы этапы процесса усвоения второго языка, начиная с отправной точки и кончая конечным уровнем овладения? Чем они характери зуются? (3) Могут ли люди, изучающие второй язык, достичь уровня носителя этого языка как родного? В данной главе ответы на эти вопросы будут описаны в основном с позиций г е н е р а т и в н о г о п о д х о д а к усвоению второго языка по терминологии Ротмана и Слабаковой (Rothman, Slabakova 2018). 10. Усвоение второго языка 259 10.2. Критический период в усвоении второго языка Гипотеза критического периода изначально была предложена для объяснения того, почему дети так быстро и не прикладывая особых усилий усваивают родной язык (см. главу 9 в наст. изд.). С появлением в XX в. конкретных примеров начала усвоения родного языка уже после наступления полового созревания — напр., Джини (Curtiss et al. 1974) и Челси (Curtiss 2014), идея об ограничении на успешное усвоение в зависимости от возраста получила эмпирическую поддержку. Критический период, то есть биологически определенное окно от рождения до наступления раннего подросткового возраста, был предложен в качестве наиболее вероятного объяснения того, почему большинство людей, начинающих усваивать второй язык в возрасте 13– 15 лет и старше, не достигают уровня владения носителей (Lenneberg 1967). В одном из самых влиятельных эмпирических исследований Джонсон и Ньюпорт (Johnson, Newport 1989) протестировали 46 испытуемых, родным языком которых был корейский или японский, половина из которых переехала в США в возрасте между 3 и 15 годами, а другая половина — после 17 лет. Испытуемые прожили в США от 3 до 26 лет и были так или иначе связаны с академической карьерой. Их задачей было слушать предъявля емые устно предложения на английском языке, из которых половина были грамматически правильными, а половина с ошибками в 12 грамматических категориях. 7 испытуемых, которые переехали в США в возрасте между 3 и 7 годами, показали знание всех 12 категорий, которое не отличалось от контрольной группы носителей. Все остальные испытуемые, включая даже тех, кто переехал в возрасте 8–10 лет, показали значительно более низкий уровень владения английским языком; у тех испытуемых, которые начали изучать язык после 17 лет, были самые низкие показатели. Таким образом, Джонсон и Ньюпорт подтвердили гипотезу критического периода для усвоения второго языка. В качестве объяснения ДеКейзер и коллеги предложили разные механизмы усвоения языка детьми и взрослыми (DeKeyser, Larson-Hall 2005), а Блей-Вроман сформулировал г и п о т е з у ф у н д а м е н т а л ь н ы х р а з л и ч и й, которая утверждает, что взрослые теряют доступ к универсальной грамматике и вынуждены прибегать к помощи неспециализированных механизмов научения (Bley-Vroman 2009). Литература, посвященная гипотезе критического периода в усвоении второго языка, очень обширна, и в ней представлены как сторонники и по следователи Джонсон и Ньюпорт, так и их противники, утвержающие, что встречается довольно много взрослых людей, которые усвоили второй язык на уровне владения носителей (Birdsong 2005). Есть и психолингвисты, которые выдвигают более слабую версию гипотезы критического периода, выде- 260 И. А. Секерина, О. В. Федорова ляя не один, а несколько критических периодов для разных языковых уровней, с самым коротким для уровня фонологии и самым длинным для синтаксиса (Eubank, Gregg 1999). Современные технологии, позволяющие осуществлять сбор большого количества суждений о грамматической приемлемости предложений с использованием интернета, позволили группе лингвистов из Бостона (Harts horne et al. 2018) по-новому взглянуть на проблему критического периода в усвоении языка в целом и второго языка, в частности. Хартсхорн и его коллеги взяли за основу классический эксперимент Джонсон и Ньюпорт (1989) и разместили в интернете интерактивный тест (https://archive.gameswithwords. org/WhichEnglish/), пообещав участникам, что результаты теста позволят автоматически определить, на каком диалекте английского языка говорит испытуемый. Истинной же целью исследования была проверка гипотезы критического периода с использованием трех параметров: возраста начала изучения английского языка, возраста на момент прохождения теста и количества лет использования английского языка. В эксперименте приняли участие почти 670 тыс. человек, что позволило развести эти три фактора, тем самым определив с п о с о б н о с т ь к у с в о е н и ю я з ы к а (learning abi lity) и к о н е ч н ы й у р о в е н ь о в л а д е н и я (ultimate attainment). В ходе теста испытуемые определяли приемлемость 96 синтаксических конструкций английского языка (напр., предложение Throw me down the stairs my shoes оказывается приемлемым для многих жителей Ньюфаундленда, но неприемлемо для носителей других диалектов). Результаты исследования показали, что способность к усвоению второго языка сохраняется до 17 лет, после чего она начинает угасать обратно пропорционально возрасту. Хартс хорн и коллеги установили, что для того чтобы достигнуть конечного уровня овладения вторым языком, сопоставимого с уровнем носителей, надо начать его изучать не позднее 10-летнего возраста. Однако самым неожиданным результатом оказалась цифра в 30 лет: столько лет непрерывной практики необходимо для полного овладения языком, причем не только второго, но и родного. Именно продолжительность этого периода, согласно Хартсхорну и коллегам (2018), и является главной причиной того, что большинство людей, начинающих усваивать второй язык во взрослом возрасте, не достигают уровня носителей — оказывается, они просто не успевают вложить столько времени в процесс усвоения. 10.3. Этапы процесса усвоения второго языка и их характеристики Гипотеза критического периода утверждает, что процесс усвоения второго языка ограничен временныˊми рамками. Рассмотрим, каковы начальный, 10. Усвоение второго языка 261 промежуточный, и конечный этапы этого процесса. В 1980–90 гг. большое количество исследований было направлено на проверку взаимозависимо сти между критическим периодом и доступом к универсальной грамматике, а именно, имеют ли взрослые возможность использовать универсальную грамматику для усвоения второго языка в тот момент, когда этот процесс начинается. Сторонники одного направления считали, что усвоение второго языка начинается с п о л н о г о п е р е н о с а грамматики родного языка во второй язык (full transfer of L1; Schwartz, Sprouse 1996), то есть изучающий неосознанно предполагает, что родной и второй языки идентичны, а в процессе усвоения происходит постепенная замена грамматических свойств родного языка на специфические свойства второго. В генеративных терминах эта процедура представлялась в виде переключения параметров в универсальной грамматике (White 2003), значения которых варьируются от языка к языку. Например, параметр нулевого подлежащего имеет значение минуса в английском языке и плюса в испанском языке. Соответственно, опущение обязательного подлежащего испаноговорящими взрослыми, изучающими английский как второй, обуславливается наличием нулевых подлежащих в испанском (VanPatten, Benati 2010: 12). Другое направление предполагало, что усвоение второго языка начинается точно так же, как и усвоение родного, то есть изучающиe второй язык не переносят свойства родного языка на второй, а руководствуются принципами универсальной грамматики, при этом значения параметров, как, напр., параметра нулевого подлежащего, устанавливаются в процессе усвоения в соответствии с поступлением инпута (Liceras 1989). Есть и сторонники компромиссного подхода, в котором перенос грамматики родного языка во второй является не полным, а частичным (Vainikka, Young-Scholten 1996). Изучающие переносят из родного языка концептуальный словарный запас и синтаксические правила, но не переносят такие функциональные категории, как систему времен глагола или согласование по роду и числу. 10.3.1. Промежуточный язык и фоссилизация. По мере усвоения второго языка знание родного и второго языков часто начинают переплетаться, и тогда появляется п р о м е ж у т о ч н ы й я з ы к (Selinker 1972, 1992; White 2003b), который отличается как от родного, так и от второго языка. Этот промежуточный язык характеризуется переносом грамматики из родного, наличием ошибок, которые представляют собой неправильные обобщения из второго языка, и фоссилизации (fossilization; Lardiere 2007; Selinker 1972). Фоссилизация — это такой конечный этап усвоения, который характеризуется замедлением и даже полной остановкой в развитии ментальных репре- 262 И. А. Секерина, О. В. Федорова зентаций второго языка, не достигнув уровня носителя. Фоссилизация может наступать в разное время для разных языковых уровней, например, произношение перестает улучшаться, а знание грамматики продолжает совершенствоваться. Встречается и другой термин — с т а б и л и з а ц и я, который является более нейтральным синонимом фоссилизации. Примером фоссилизации может послужить исследование Лардьер (2007) с китаянкой Пэтти, которая больше 20 лет прожила в США, но и после этого продолжительного срока продолжала делать ошибки в третьем лице единственного числа английских глаголов, часто опуская обязательное окончание -s. Понятие фоссилизации, однако, является спорным, так как дать ему точное определение пока не представляется возможным. Некоторые специалисты в области усвоения второго языка вообще сомневаются в существовании фоссилизации, потому что непонятно, сколько лет надо ждать, чтобы можно было с уверенностью сказать, что конкретный человек достиг своего предела овладения вторым языком. Не ясны и причины фоссилизации, если допустить, что она существует: биологические (достижение критического периода), мотивационные или наступающее с возрастом ослабление способностей к научению. 10.4. Могут ли люди, изучающие второй язык, достичь уровня носителя? 10.4.1. Гипотеза интерпретируемости. Kак было показано в лонгитюдном исследовании Лардьер (2007), при усвоении второго языка фоссилизация оказывается конечным состоянием для большинства взрослых, что в первую очередь наблюдается на примере усвоения морфологии. Если описывать морфологию в терминах генеративной теории минимализма, то признаки, от которых зависит семантическая интерпретация предложения (время, вид) будут называться интерпретируемыми, а те признаки, от которых не зависит (падеж, род) — неинтерпретируемыми. При этом признаки часто сочетаются друг с другом в виде пучков признаков (feature bundles). Вопрос о том, есть ли у взрослых, изучающих второй язык, доступ к универсальной грамматике, был переосмыслен в виде г и п о т е з ы и н т е р п р е т и р у е м о с т и (Tsimpli, Dimitrakopoulou 2007), согласно которой при усвоении второго языка доступ есть только к пучкам интерпретируемых признаков, а неинтерпретируемые признаки становятся недоступными для переноса. Эта разница в усвоении морфологии — быстрое и безошибочное ее усвоение детьми в родном языке и длительное и полное ошибок усвоение второго языка взрослыми — остается наиболее заметной в общей теории усвоения языка. Объяснению этого феномена посвящены следующие гипотезы: 10. Усвоение второго языка 263 (1) Гипотеза б у т ы л о ч н о г о г о р л ы ш к а (Bottleneck hypothesis; Slaba kova 2016) постулирует приоритетную роль морфологии в усвоении второго языка, так как именно в морфологии отражены все грамматические и семантические признаки, различаемые в языках мира. Признаки и пучки признаков, характеризующие второй язык, должны быть усвоены первыми, и только после этого изучающий может подключить к ним универсальные синтаксические и семантические операции. (2) Гипотеза п р о п у с к а г р а м м а т и ч е с к и х м о р ф е м (Missing surface Inflection hypothesis; Prévost, White 2000) утверждает, что непоследовательность, с которой изучающие второй язык употребляют обязательные словоизменительные морфемы в речи, напр., согласование по роду, на самом деле не означает их незнание. Пропуск морфем в речи является следствием сложностей, вызванных нехваткой времени и когнитивной нагрузкой при порождении речи на втором языке в режиме реального времени. (3) Гипотеза п е р е р а с п р е д е л е н и я п р и з н а к о в (Feature reassembly hypothesis; Lardiere 2009) объясняет сложности в усвоении морфологии второго языка тем, что изучающий должен породить слова и предложения на втором языке, заменив признаки родного языка признаками второго, а это требует перераспределения признаков в пучках в тех случаях, когда они не совпадают в родном и втором языке. 10.4.2. Исследование индивидуальных различий. Эти гипотезы делают акцент на разные внутриязыковые факторы, которые, однако, не являются взаимоисключающими. При этом внутриязыковые факторы взаимодействуют с внешнеязыковыми, такими, как мотивация, способность к языкам, занятия с преподавателем, вложенные усилия и т. п. (Robinson 2001). Именно наличием большого количества самых разнообразных факторов, каждый из которых вносит важный вклад в достижение уровня знания второго языка, соответствующего уровню носителей, объясняется вариативность конечного состояния. После того как было установлено, что изучающие второй язык в одном и том же порядке проходят через одни и те же этапы в усвоении морфологии, изучение вариативности в виде и н д и в и д у а л ь н ы х р а з л и ч и й стало и продолжает оставаться одним из самых активных и перспективных направлений (Dewaele 2009). 10.5. Методология изучения усвоения второго языка Современные исследования продолжают использовать как классические методы наблюдения — описание отдельных случаев (case studies), создание 264 И. А. Секерина, О. В. Федорова корпусов устной и письменной речи, так и современные экспериментальные методы (Mackey, Gass 2012). Важным нововведением стало создание специализированной базы данных «Инструменты для исследований втoрых языков» (Instruments for Research into Second Languages, IRIS: https://www.irisdatabase.org), в которой содержится более 4 тыс. языковых и демографических опросников и материалов (Marsden et al. 2016). Б. МакВинни (2017) считает, что усвоение второго языка как самостоятельная научная дисциплина должна основываться на общей платформе, включающей в себя: (1) результаты экспериментальных исследований; (2) данные когнитивных исследований индивидуальных различий, мотивации и языкового опыта; (3) корпуса (MacWhinney 2017). Подобная работа по созданию общей платформы для изучения усвоения второго языка уже начата в рамках проекта TalkBank (https://talkbank.org), в котором имеются разделы SLABank с 25 корпусами (4.2 млн. слов) устной и письменной речи людей, изучающих в качестве второго английский, венгерский, испанский, китайский, немецкий, чешский и французкий языки. 10.6. Современность и инфраструктура Область усвоения второго языка не ограничивается тремя рассмотренны ми вопросами. ВанПаттен и Бенати (2010) приводят также такие вопросы: (1) Как выглядит процесс усвоения второго языка хронологически? (2) В чем заключается роль имплицитного усвоения и эксплицитного научения? (3) Какова роль инпута (языка на входе) и языка на выходе? (4) Что такое индивидуальные различия в усвоении второго языка и какова их роль? (5) Оказывает ли формальное обучение второму языку какое-либо влияние на его усвоение? В настоящее время область усвоения второго языка имеет свою собственную структуру, журналы и конференции. C 1976 г. ежегодно проводится конференция Бостонского университета по языковому развитию (Boston University Conference on Language Development), в рамках которой усвоение второго языка представлено наряду с усвоением родного; существуют и специализированные конференции по усвоению второго языка — напр., Generative Approaches to Second Language Acquisition conference (GASLA) и Generative Approaches to Language Acquisition — North America (GALANA). 10. Усвоение второго языка 265 Наиболее престижные журналы включают “Studies in Second Language Acquisition”, “Language Learning” и “Second Language Research”. 10.6.1. Направления будущих исследований. Предположительно, в будущем тематика усвоения второго языка будет развиваться по трем главным направлениям. Во-первых, станет более востребованным комплексный междисциплинарный подход, органично включающий в себя экспериментальные, вычислительные и корпусные методы. Во-вторых, уже сейчас начинается активное движение за п о в т о р е н и е (replication) имеющихся результатов, в особенности, когда речь идет о наиболее значимых и часто цитируемых исследованиях, как, напр., описанный выше эксперимент Джонсон и Ньюпорт (Marsden et al. 2018). В-третьих, нарастают темпы сближения научно-исследовательского направления и педагогики преподавания второго языка, получившего название п е д а г о г и к и , п о д т в е р ж д е н н о й ф а к т а м и (evidence-based applications; Roberts et al. 2018). Все эти новые идеи и направления позволят более глубоко понять, почему усвоение второго языка взрослыми так сильно отличается от усвоения родного языка детьми, а затем более эффективно использовать достижения научных исследований на практике. 11. Нейролингвистика О. В. Федорова Нейролингвистика — раздел психолингвистики в широком смысле слова, изучающий «мозговые механизмы речевой деятельности и те изменения в речевых процессах, которые возникают при локальных поражениях мозга» (Лурия 1975). Ядро нейролингвистики составляет афазиология (патология речи, патолингви стика, клиническая лингвистика) — наука об афазиях, то есть расстройствах речевой функции. Долгое время исследование афазий было практически единственным способом получения нового знания в нейролингвистике. Однако в последние два десятилетия ситуация кардинально изменилась — появление новых методов реги страции активности мозга дало возможность изучать порождение и понимание речи не только у пациентов, но и у здоровых испытуемых. Пререквизиты: Лингвистика в контексте когнитивных наук; Эксперимент; Теория языка (все главы); Когнитивная лингвистика; Психолингвистика ; Усвоение языка. 11.1. История нейролингвистики 11.2. Патология речи 11.2.1. Афазиология Бостонская модель Модель А. Р. Лурии 11.2.2. Аутизм 11.3. Межполушарная асимметрия Тест Вада Расщепленный мозг, электросудорожная терапия 11.4. Открытия и направления XXI века 11.4.1. Ген языка и специфические нарушения развития речи 11.4.2. Зеркальные нейроны 11.4.3. Биолингвистика Литература для дальнейшего чтения: Ахутина 1989, 2014; Черниговская 2013; Cummings 2008; Whitaker ed. 2010; Stemmer, Whitaker 1998, 2008. Научно–популярная литература: Лурия 1968; Лурия 1971; Сакс 2015; Бауэр 2009; Якобони 2011; Риззолатти, Синигалья 2012. 11. Нейролингвистика 267 11.1. История нейролингвистики Как и в случае психолингвистики (Levelt 2013), нейролингвистика как наука оформилась в середине XX в., хотя интерес к устройству языка в голове человека пришел из античности, а история важных идей и открытий начинается в конце XVIII в. с имени Ф. Галля. Галль первым предложил так называемый л о к а л и с т с к и й подход; согласно его идее, мозг человека разделен на небольшие участки, в каждом из которых помещается та или иная функция — память, любовь, язык, дружба, жадность и проч. Галль считал, что чем больше некоторая функция, тем больше область мозга, которая за нее отвечает. Эта концепция, получившая название ф р е н о л о г и и, в настоящее время имеет только историческую ценность, в отличие от двух других локалистских открытий, которые были сделаны во второй половине XIX в. П. Брока наблюдал больных с односторонним параличом и потерей речи, а после их смерти исследовал мозг и нашел схожие очаги поражения в задненижней части третьей лобной извилины левого полушария. В 1861 г. Брока сообщил о своих открытиях (Broca 1861); с тех пор з о н а Б р о к а (44-е поле по классификации отделов коры головного мозга К. Бродмана) стала считаться центром, связанным с п о р о ж д е н и е м речи. Несколько лет спустя К. Вернике наблюдал пациента с инсультом, у которого было относительно сохранно порождение речи, но сильно страдало понимание. Исследовав после смерти пациента его мозг, К. Вернике обнаружил очаги поражения в задней трети верхней височной извилины левого полушария; результаты его работы были опубликованы в 1874 г.; с тех пор з о н а В е р н и к е (22-е поле по Бродману) считается центром п о н и м а н и я речи. Открытия Брока и Вернике послужили основой первой классификации афазий Вернике — Лихтгейма (Wernicke 1874; Lichtheim 1885). Сам термин а ф а з и я был введен А. Труссо в 1864 г. (Trousseau 1864), Брока использовал термин афемия. Уже в конце XIX — начале XX вв. Д.Х. Джексон и его ученик Г. Хэд критиковали данный подход за излишнее упрощение и утверждали, что можно локализовать симптом, но нельзя локализовать функцию, так как она имеет сложное иерархическое строение от низшего звена к высшему (Jackson 1878; Head 1926). Интерес к нейролингвистике проявляли и лингвисты — Ф. де Соссюр, И. А. Бодуэн де Куртенэ, В. А. Богородицкий, Л. В. Щерба, а также Р. О. Якобсон, описавший афазии Брока и Вернике в терминах синтагматических и парадигматических отношений (Якобсон 1956/1990). Фундамент отечественной нейролингвистики был заложен А.Р. Лурией (Лурия 1975). С 1960-х гг. нейролингвистика приобрела статус самостоятельной науки. В 1960 г. Э. Леннеберг в рецензии на книгу Пенфилда и Робертса (1959) ввел 268 О. В. Федорова термин а ф а з и о л о г и я (Lenneberg 1960). В тот же год Э. Трагер предложила термин н е й р о л и н г в и с т и к а (Trager 1960). В 1987 г. Д. Каплан выпустил учебник «Нейролингвистика и лингвистическая афазиология» (Kaplan 1987), в котором впервые эксплицитно разделил эти области. Большая роль в становлении нейролингвистики принадлежит Г. Уитакеру, который в 1974 г. основал журнал “Brain and Language”, а в 1976 г. — серию “Perspectives in Neurolinguistics and Psycholinguistics”; кроме того, он является редактором самых известных учебников и энциклопедий по нейролингвистике (Whitaker ed. 2010; Stemmer, Whitaker 1998, 2008). Важным центром нейролингви стики стал Бостонский центр афазии, в котором работали Н. Гешвинд и Г. Гудгласс, реанимировавшие классический подход Вернике (Goodglass et al. 2001). В 1985 г. начал выходить журнал “Journal of Neurolinguistics”, а в 1987 г. — “Aphasiology”, которые дополнили более общие журналы “Brain”, “Neuropsychologia” и “Cortex”. М е т о д о л о г и я современной нейролингвистики заимствует из нейронаук следующие методы: вызванные потенциалы мозга, позитронную эмиссионную томографию, функциональную магнитно-резонансную томографию, магнитоэнцефалографию, электроэнцефалографию, транскраниальную магнитную стимуляцию. 11.2. Патология речи 11.2.1. Афазиология. А ф а з и е й называют приобретенное расстрой ство языка, вызванное локальным поражением головного мозга. Наибольшее количество афазий возникает вследствие инсульта (Fridriksson et al. 2018); другими причинами являются травмы головы, опухоли мозга и нейроинфекции. К нарушению речи приводят поражения л е в о г о п о л у ш а р и я мозга у правшей: человек полностью или частично теряет способность говорить, понимать и повторять речь. При этом могут также возникать нарушения неречевых функций — апраксии (нарушения целенаправленных движений), агнозии (нарушения восприятия) и психические расстройства. В настоящее время существует две наиболее известные классификации афазий — западная неоклассическая модель Бостонской школы и отечественная модель А. Р. Лурии, которые различаются не только названиями — в их основе лежат разные принципы: локализационизм в неоклассической модели и связь поражения определенных областей мозга с нарушениями определенных звеньев речевой деятельности в модели А. Р. Лурии. По к л а с с и ф и к а ц и и а ф а з и й Б о с т о н с к о й ш к о л ы выде ляются: 11. Нейролингвистика 269 (1) афазия Брока (моторная, или н е б е г л а я (nonfluent), афазия); симптомы: небеглая речь, аграмматизм, сохранное повторение слов, относительно хорошее понимание речи; (2) афазия Вернике (сенсорная, или б е г л а я (fluent), афазия); симптомы: беглая речь, нарушение понимания при сохранном слухе, нарушение порождения и повторения; (3) аномия, связанная с поражением задних височных и теменных отделов мозга; симптомы: порождение нарушено из-за поиска слов, относительно сохранное понимание и повторение; (4) проводниковая афазия, связанная с поражением белого вещества надкраевой извилины, из-за чего нарушены связи между зонами Брока и Вернике; симптомы: беглая речь, порождение нарушено из-за парафазий, понимание относительно сохранно; (5) транскортикальная моторная афазия, связанная с изоляцией зоны Брока от остальной коры; симптомы: грубо нарушено порождение, понимание и повторение относительно сохранны; (6) транскортикальная сенсорная афазия, связанная с изоляцией зоны Вернике от остальной коры; симптомы: беглая речь, нарушено понимание, повторение сохранно, но больной не понимает сказанное; (7) глобальная афазия, связанная с обширными повреждениями коры, включая зоны Брока и Вернике; симптомы: небеглая речь, порождение, понимание и повторение грубо нарушены (Goodglass et al. 2000). По к л а с с и ф и к а ц и и А. Р. Л у р и и афазии делятся на п е р е д н и е формы (первые два типа) и з а д н и е (последние четыре типа): (1) эфферентная моторная афазия возникает при поражении зоны Брока; у больных нарушается кинетическая сторона речи — переключение с одной артикуляторной серии на другую; характерны речевые стереотипы и персеверации; возможны проблемы чтения (дислексия) и письма (дисграфия); (2) динамическая афазия возникает в результате поражения заднелобных отделов, кпереди от зоны Брока; основной дефект вызван нарушениями внутренней речи и выражается в речевой инактивности; в речи больных много речевых штампов, коротких высказываний, пауз между словами; (3) сенсорная (акустико–гностическая) афазия возникает в зоне Вернике; основной симптом — нарушение понимания речи; нарушение фонематического слуха приводит к отсутствию контроля за порождением; (4) акустико–мнестическая афазия возникает при поражении средних и задних отделов височной области; фонематический слух сохранен, одна- 270 О. В. Федорова ко нарушена слухо-речевая память; порождение сохранно, но наблюдается забывание имен собственых, дат, названий; (5) семантическая афазия возникает при поражении теменно-затылочной области; порождение сохранно, однако больные теряют способность понимать логико-грамматические и пространственные отношения, сложные синтаксические структуры; (6) афферентная моторная афазия возникает при поражении нижних отделов теменной области; у больного нарушаются кинестетические ощущения — при произнесении звуков он не может подобрать нужное положение органов артикуляции, что приводит к затруднению порождения; понимание относительно сохранно. Другой раздел патологии речи связан с изучением речевых расстройств при психических заболеваниях (шизофрения, болезнь Альцгеймера, эпилеп сии и др.), в том числе развивающихся в детском возрасте (синдром Виль ямса). Особое развитие в последние годы получило исследование аутизма. 11.2.2. Аутизм. А у т и з м о м называют нарушение мозгового развития, которое существует с рождения и сохраняется на протяжении всей жизни; аутизм наблюдается у мальчиков в пять раз чаще, чем у девочек. Этиология расстройства до сих пор точно не известна, но считается, что оно в значительной степени обусловлено генетикой, хотя часто оказываются важны также и органические факторы (Bailey et al. 1996). Аутизм был определен Л. Каннером и Г. Аспергером (Kanner 1943; Asperger 1944). Диагностика аутизма базируется на поведенческих критериях; согласно Международной классификации болезней (APA 1994) расстройства аутистического спектра (РАС) характеризуются следующей триадой признаков: (1) качественными аномалиями в социальном взаимодействии и общении; (2) ограниченным, стереотипным, повторяющимся набором интересов и поведения; (3) отсутствием, задержкой или характерными особенностями в речи (Wing, Gould 1979). РАС часто связывают с Моделью психического (Theory of Mind; Premack, Woodruff 1978; Call, Tomasello 2008; Сергиенко 2006), а в последние годы — с зеркальными нейронами (см. ниже). 11.3. Межполушарная асимметрия П. Брока (возможно, первым был Г. Дакс; Finger, Roe 1999) заметил, что у большинства людей речевая функция локализована (или л а т е р а л и з о в а н а) в левом полушарии мозга; с тех пор левое полушарие получило название д о м и н а н т н о г о, а правое — с у б д о м и н а н т н о г о. 11. Нейролингвистика 271 Однако не у всех людей доминантным является левое полушарие. Для определения доминантности используется т е с т В а д ы (Wada 1997; Harris 1991). Этот тест проводится пациентам перед оперативным вмешательством с 1949 г., по следующей процедуре. Пациент в сознании лежит на столе, в его сонную артерию с одной стороны шеи вставлена трубка. Врач просит его поднять вверх обе руки и считать тройками от 100 в обратном направлении (100, 97, 94...). В артерию вводится вещество амитал натрий, оно доходит до соответствующего полушария мозга, и рука, противоположная той стороне тела, куда была сделана инъекция, падает, а пациент перестает считать. Если подвергшееся наркозу полушарие именно то, которое контролирует речь, пациент теряет речь на несколько минут. Если же нет, он снова начинает считать через несколько секунд. Располагая этой информацией, хирург старается действовать так, чтобы не повредить речевые области мозга. Результаты 70-летнего применения теста Вады показывают, что у более чем 95% праворуких людей речь контролируются левым полушарием, у остальных 5% — правым. Большая часть леворуких — около 70% — также имеют речевые центры в левом полушарии; у половины из остальных левшей (около 15%) речь контролируется правым полушарием, а у другой половины (15%) — обоими. Важную роль в установлении специализации полушарий мозга сыграли работы лауреата Нобелевской премии Р. Сперри с коллегами, которые исследовали пациентов с «р а с щ е п л е н н ы м м о з г о м», перенесших комиссуротомию — операция по рассечению нервных волокон, соединяющих два полушария. Эта операция применяется при эпилепсии в тех случаях, когда другие средства оказываются не эффективны; после такой операции мозг пациента оказывается разделенным на две не связанные между собой части (Sperry 1961). Значимый вклад в развитие понимания межполушарной организации речевых процессов внесло также изучение речи у больных с временным отключением функций правого или левого полушария при э л е к т р о с у д о р о ж н о й т е р а п и и, проводившееся под рук. Л. Я. Балонова. Этот метод также применяется при лечении эпилепсии, процедура заключается в том, что одно из полушарий получает удар током, после чего временно перестает функционировать. Таким образом появляется возможность сравнить речевое поведение одного и того же пациента в трех состояниях: (1) когда у него функционируют оба полушария, (2) когда «работает» только левое или (3) только правое полушарие (Балонов и др. 1985; Черниговская, Деглин 1986). В целом, исследования XX в. показали, что правое полушарие также играет важную роль в речевой деятельности. В отличие от левого полушария, кото- 272 О. В. Федорова рое «отвечает» за формально-логическое мышление, правое полушарие использует комплексное гештальтное восприятие, распознает метафоры и идиомы, отвечает за речевую просодию. 11.4. Открытия и направления XXI века 11.4.1. Ген языка и специфические нарушения развития речи. Сложная языковая система становится доступна ребенку за считанные годы жизни. Как утверждают многие, если бы не врожденные механизмы, на усвоение языка потребовалась бы целая жизнь. Отсюда вытекает желание найти ген, определяющий способность к усвоению родного языка. В 2001 г. группой ученых во главе с Э. Монако была опубликована сенсационная статья в журнале “Nature” об открытии «гена языка» FoxP2 (Lai et al. 2001). В статье другого известного коллектива под рук. С. Паабо говорится: «FOXP2 — это первый ген, имеющий отношение к человеческой способности развивать язык» (Enard et al. 2002: 869). Гены семейства Fox кодируют особый класс транскрипционных факторов — белка, регулирующего работу других генов; этот белок экспрессируется в полосатом теле, связанном в том числе с выработкой моторных программ. Один из этих генов — FoxP2 — был идентифицирован как ген, мутация которого вызывает специфические нарушения развития речи. Это открытие дало основание некоторым авторам назвать FoxР2 «геном грамматики». О с п е ц и ф и ч е с к и х н а р у ш е н и я х р а з в и т и я р е ч и (Specific Language Impairments, SLI) говорят в том случае, когда при относительно сохранном когнитивном развитии у человека наблюдается языковой дефицит. Этот дефицит проявляется на всех уровнях языка. На фонетическом уровне для людей с SLI характерна монотонная речь, неправильное членение звукового потока; на уровне грамматики синтаксические процедуры производятся за счет памяти и эксплицитных правил, а морфологические процедуры практически не производятся (Черниговская 2013: 147). По мере взросления люди с SLI вырабатывают компенсаторные механизмы и осваивают родной язык примерно в той степени, в которой здоровые люди осваивают иностранный язык. По фигуральному выражению М. Гопник, люди с SLI — это люди без родного языка (Gopnik et al. 1996). Масштабные исследования мутации гена FoxР2 при SLI проводятся на основе наблюдений за тремя поколениями большой английской семьи пакистанского происхождения, известной под сокращением KE. История этой семьи такова: женщина с SLI вышла замуж за здорового мужчину и родила пятерых детей — четырех дочерей и одного сына. Все дети за исключением 11. Нейролингвистика 273 одной дочери также страдали SLI; в третьем поколении семьи 10 из 24 детей страдают SLI. М. Гопник предположила, что основные проблемы у больных SLI возникают из-за того, что они не могут усвоить базовые правила грамматики — вместо того, чтобы применять их инстинктивно, им каждый раз приходится вспоминать их эксплицитно (Gopnik 1990). В последние годы выяснилось, что ген FoxР2 очень консервативен и давно существует в эволюции. Человеческий ген FoxP2 отличается от аналогичного у шимпанзе всего двумя аминокислотами, а у неандертальцев и денисовцев была обнаружена уже человеческая версия этого гена (Green et al. 2010; Krause et al. 2010). Также Паабо установил, что если дать мыши человеческий ген FoxP2, то такие мыши будут быстрее осваивать автоматизированные моторные навыки; более того, у них сильнее разовьется та же область мозга, которая страдает у человека при мутации гена FoxP2 (Enard et al. 2009). Однако в то же время ген FoxP2 участвует в развитии структур мозга не только человека, но и приматов, пчел, птиц, мышей и даже крокодилов, что лишает смысла утверждение о его исключительности. Кроме того, он экспрессируется во многих других зонах мозга человека, не связанных с языком, так что и специфичным для языковой функции он тоже не является. Очевидно, что отношение между отдельными генами и языком и не могло оказаться таким взаимно-однозначным — только весь геном человека может отвечать за те или иные когнитивные способности, что понимал сам Монако еще в 2001 г.: «это только один из генов, связанных с языком, а не один-единственный ген» (“National Geographic Today” 04.10.2001); см. также статью Atkinson et al. 2018. 11.4.2. Зеркальные нейроны. З е р к а л ь н ы м и н е й р о н а м и называются такие клетки головного мозга, которые возбуждаются у живого существа как при выполнении определенного действия, так и при наблюдении за выполнением этого действия другим живым существом. Впервые зеркальные нейроны были описаны Дж. Риззолатти, В. Галлезе, Г. ди Пеллегрино, Л. Фадига и Л. Фогасси в начале 1990-х гг. в экспериментах на м а к а к а х, в лобную долю которых были введены микроэлектроды (di Pellegrino et al. 1992; Rizzolatti et al. 1996; Gallese et al. 1996). В 1999 г. М. Якобони высказал предположение о наличие зеркальных нейронов и у ч е л о в е к а (Iacoboni et al. 1999). Результаты дальнейших исследований показали, что работа зеркальных нейронов у человека связана по крайней мере со следующими тремя зонами головного мозга: 274 О. В. Федорова (1) премоторная кора; (2) теменная кора; в первую очередь, передняя часть внутритеменной борозды; (3) задняя часть верхней височной борозды. Многие ученые считают открытие зеркальных нейронов наиболее значительным событием в нейробиологии последних 20 лет. Кроме подробного описания механизмов работы зеркальных нейронов при подражании, во многих исследованиях усматривается связь зеркальных нейронов с проблемой аутизма, с Моделью психического, со способностью понимать чужие эмоции путем сопереживания. Кроме того, высказываются еще более глобальные идеи о том, что появление зеркальных нейронов явилось ключевым моментом в социально-культурной эволюции и что «открытие зеркальных нейронов для психологии значит то же, что открытие ДНК для биологии» (Ramachandran 2000). С другой стороны, некоторые ученые высказывают серьезные сомнения в том, что зеркальные нейроны действительно представляют собой особый класс нейронов (Pascolo et al. 2009); в работе (Hickok 2009) отмечается, что излишний ажиотаж вокруг зеркальных нейронов привел к тому, что с момента их открытия прогресс в понимании функций зеркальных нейронов остается минимальным; в то же время, по мнению Риззолатти, вопрос «В чем состоит функция зеркальных нейронов?» в принципе неправомерен: «У зеркальных нейронов нет какой-то определенной функции. Посредством систем зеркальных нейронов мозг устанавливает соответствие между образом действия и действием. Они обеспечивают формирование в мозге наблюдателя репрезентации действия, производимого другим индивидом, и описание этого действия в терминах собственного моторного акта наблюдателя» (Мачинская, Фаликман 2012). Кроме нейробиологии и психологии зеркальные нейроны представляют несомненный интерес и для нейролингвистики, так как самые смелые исследователи полагают, что зеркальные нейроны лучше всего подходят на роль «нейронов языка», и именно они определили у наших предков само появление языка (Бауэр 2009). 11.4.2. Биолингвистика. Наконец, еще одной областью XXI в. стано вится б и о л и н г в и с т и к а. Данное направление, рожденное в середине XX в. (Meader, Muyskens 1959; Lenneberg 1967; Piattelli-Palmarini 1974), в по следние 20 лет приобрело значительную популярность, см. напр., монографию Jenkins 2000 и выход в 2007 г. нового журнала “Biolinguistics”, в первом номере которого опубликован манифест биолингвистики (Boeckx, Grohmann 11. Нейролингвистика 275 2007), а также статья Хомского “Of minds and language” (Chomsky 2007). Авторы считают биолингвистику естественнонаучной дисциплиной и с позиций генеративного подхода к языку (в первую очередь постулата о врожденно сти языковой способности) ищут ответ на «вечные» вопросы: в чем заключается знание языка, как оно формируется, как оно используется, какие мозговые механизмы за этим стоят, как это знание развилось у человека как биологического вида (Boeckx, Grohmann 2007: 1). 12. Невербальная коммуникация А. А. Кибрик, О. В. Федорова, Ю. В. Николаева Согласно традиционному подходу ХХ в., который до сих пор преобладает в современной лингвистике, язык сводится к набору иерархически организованных единиц — фонем, морфем, слов, словосочетаний и предложений. В рамках такого представления языковая форма отождествляется с вербальной, то есть с сегментным материалом, относящимся к вокальной (слуховой) модальности. Однако помимо вербального существуют и другие — н е в е р б а л ь н ы е — компоненты естественной коммуникации, включающие просодию (несегментный компонент вокальной модальности) и группу компонентов кинетической (зрительной) модальности, или я з ы к т е л а — жесты, мимику, направление взгляда. Согласно современной м у л ь т и м о д а л ь н о й перспективе, все эти компоненты также важны для успешного общения между людьми и, следовательно, заслуживают пристального изучения. Пререквизиты: Лингвистика в контексте когнитивных наук; Когнитивная лингвисДискурс. тика ; 12.1. Мультимодальная лингвистика 12.2. Вокальная модальность 12.2.1. Просодия Элементарные дискурсивные единицы 12.3. Кинетическая модальность 12.3.1. Жесты рук Классификация Эфрона Континуум Кендона Классификация Макнилла 12.3.2. Жесты головы 12.3.3. Направление взгляда Литература для дальнейшего чтения: Кодзасов 2009; Кибрик, Подлесская ред. 2009; Kendon 2004; McNeill 2005; Müller et al. eds. 2013. 12. Невербальная коммуникация 277 12.1. Мультимодальная лингвистика Мультимодальная (или мультиканальная) лингвистика изучает все реальное многообразие «живой» коммуникации между людьми: слова, интонацию, жестикуляцию, направление взгляда, мимику, см. рис. 12.1. Интерес к изучению мультимодальности возник еще в древности (см., напр., Квинтилиан 1834: XI), однако современная лингвистика, берущее начало в первые десятилетия XX в., пошла другим путем и занималась исключительно письменными текстами, то есть в е р б а л ь н ы м к а н а л о м (Linell 1982). В конце ХХ в. ситуация начала меняться в сторону изучения устного дискурса, то есть к вербальному каналу прибавился п р о с о д и ч е с к и й, см., в частности, работы У. Чейфа (Chafe ed. 1980, 1994). Наконец, в XXI в. на наших глазах формируется новый м у л ь т и м о д а л ь н ы й подход (Kress 2010; Кибрик 2010; Knight 2011; Adolphs, Carter 2013; Müller et al. eds. 2013; Кибрик 2018), принимающий во внимание все каналы общения между людьми, в том числе к и н е т и ч е с к и е (Efron 1941; Горелов 1980; Крейдлин 2002; Kendon 2004; Бутовская 2004; McNeill 2005; Гришина 2017). 75."#'. 0!"+$1(+2 %!3+$1(!.&1 /-'<+$1()* "+(+$ 45(-&56-."+2 %!3+$1(!.&1 ;'!.!356-."5* "+(+$ !"#$!%!&!'()* "+(+$ "+(+$ ,-.&!/ $5:+ "+(+$ ,-.&!/ 8!$!/) 7'#85%!3+$1(!.&5 "+(+$ ,-.&!/ '#" "+(+$ ,-.&!/ &#$!/59+ "+(+$ ,-.&!/ /.-8! &-$+ 3'#85"+(+$) Рисунок 12.1. Модель мультиканального дискурса Помимо вербального, основу мультиканальной коммуникации составляют просодический канал, канал мануальных жестов (жесты рук), цефаличе ский канал (жесты головы) и окуломоторный канал (направление взгляда). Для каждого канала выделяются базовые единицы, при помощи которых происходит сегментация информации. Для каждого кинетического канала рассматривается его соотношение с вокальным каналом, который выступает в роли якоря. Данный подход противопоставлен популярной работе из области практической психологии (Mehrabian 1971), согласно которой язык тела передает 55% информации, просодия — 38%, а вербальный канал — лишь 7%. Эти цифры, полученные в очень специфическом исследовании — при анализе вклада каналов в формирование установки слушающего по отно- 278 А. А. Кибрик, О. В. Федорова, Ю. В. Николаева шению к эмоциональным сообщениям, не подтверждаются в современных работах (напр., см. Kibrik, Molchanova 2013). 12.2. Вокальная модальность 12.2.1. Просодия. К области просодии относятся многочисленные несегментные компоненты, в том числе: (1) интонация — движение частоты основного тона голоса говорящего; (2) громкость — сила дыхательного толчка; (3) темп — количество фонетических сегментов в единицу времени; (4) тембр — форма речевых резонаторов; (5) фонация — состояние гортани и голосовых связок при произнесении отрезка речи. В основе выделения э л е м е н т а р н ы х д и с к у р с и в н ы х е д и н и ц (ЭДЕ) — единиц устной речи, квантов или шагов, которыми речь продвигается вперед, лежат просодические критерии. ЭДЕ выделяются методом экспертной оценки на основе следующего набора критериев: (1) паузация — ЭДЕ типично разделены пограничными паузами, в течение которых говорящий делает вдох, а также формирует мысленное задание на очередную ЭДЕ; (2) интонация — ЭДЕ типично характеризуются единым интонационным контуром; (3) громкость — интенсивность звукового сигнала максимальна в начале ЭДЕ и постепенно снижается к концу; (4) темп — говорящий осуществляет вокализацию быстрее в начале ЭДЕ и замедляется к концу; (5) акцент — наиболее типичная ЭДЕ содержит один главный акцент, размещенный на информационном центре (реме) (Кибрик, Подлесская ред. 2009). Прототипические ЭДЕ демонстрируют примечательную координацию физиологических, когнитивных и семантических характеристик: они произносятся на одном выдохе, отражают один «фокус сознания» (Chafe 1994), описывают одно событие/состояние. С грамматической точки зрения прототипическая ЭДЕ представляет собой одну клаузу и чаще всего состоит из 2–4 слов. Просодические средства передают разнообразные дискурсивно-семантические категории, включая завершенность/незавершенность, иллокуцию (сообщение, вопрос, директив), контраст, эмфазу, различные типы оценки и многое другое. По выражению С. В. Кодзасова, говорящий человек подобен 12. Невербальная коммуникация 279 оркестру, в котором большое количество различных инструментов (легкие, голосовые связки, гортань, резонаторы, язык, различные группы мышц и т. д.) одновременно исполняют свои особые партии (Кодзасов 2009). Графическое представление устной речи называется транскриптом (см. главу 23 в наст. изд.). 12.3. Кинетическая модальность 12.3.1. Жесты рук. Несмотря на то, что в реальной коммуникации важны все каналы, большинство исследований невербальной коммуникации посвящены мануальной жестикуляции в ее взаимодействии с вокальным компонентом (Kendon 2004; McNeill 2005). К л а с с и ф и к а ц и я Д. Э ф р о н а (Efron 1941) делит мануальные жесты на три группы по связи между означающим и означаемым: (1) эмблемы — конвенциональные, общепринятые жесты, для которых есть стандартная форма и общепринятое значение; (2) иллюстраторы — жесты, сопровождающие речь, которые гораздо менее стандартизованы и более произвольны, чем эмблемы; (3) регуляторы — жесты, участвующие в установлении и поддержании коммуникации, для которых характерна минимальная связь между означающим и означаемым. Таким образом, разные типы жестов в разной степени демонстрируют способность самостоятельно, без поддержки вокальных средств, передавать тот или иной смысл. Д. Макнилл предложил к о н т и н у у м К е н д о н а (названный так в честь А. Кендона), при движении вдоль которого уменьшается роль вокального канала: (1) иллюстративные жесты — жесты без стандартной формы и словарного значения, сопровождающие речь; (2) жесты, заменяющие отдельные слова; (3) эмблемы — общепринятые жесты с фиксированным значением; (4) пантомима — цепочки жестов, не сопровождающихся речью; (5) жестовые языки глухих — в этих языках, эквивалентных звучащим, есть свои грамматика и словарь (McNeill 2006). Наиболее частотный класс мануальных жестов составляют и л л ю с т р а т и в н ы е ж е с т ы, которые согласно к л а с с и ф и к а ц и и Д. М а к н и л л а делятся на: (1) указательные жесты, выполняющие референцию к объекту; (2) иконические жесты, изображающие конкретные объекты или события; 280 А. А. Кибрик, О. В. Федорова, Ю. В. Николаева (3) метафорические жесты, представляющие абстрактные понятия; (4) ритмические жесты, выделяющие фрагменты речи (McNeill 1992). Важный теоретический вопрос в этой области — насколько жесты и речь связаны между собой в когнитивной системе человека. Автор наиболее влиятельной гипотезы Д. Макнилл утверждает, что жесты и речь одновременно активируются в одном общем источнике (идея Макнилла о т о ч к е р о с т а (growth point)), и, следовательно, должны быть синхронизированы на фонологическом уровне, на уровне семантики (выражают один концепт) и прагматики (выполняют одну прагматическую функцию) (McNeill 1992). Базовой единицей мануального канала является м а н у а л ь н ы й ж е с т; в работах Кендона используется термин gesture phrase или G-phrase (Kendon 1980). Жесты, с одной стороны, делятся на фазы (gesture phase, G‑phase по Kendon 1980), с другой — объединяются в жестовые цепочки (gesture chains; gesture units, G-units по Kendon 1980). Кроме жестов, выделяются смены поз и а д а п т о р ы — физиологически мотивированные движения (Ekman, Friesen 1969). 12.3.2. Жесты головы. К цефалическим жестам относятся разного рода кивки, покачивания головой и проч., которые в первую очередь характерны для с л у ш а ю щ е г о собеседника. Известно, что слушающий начинает кивать и говорить не в любой случайный момент, а на границах ЭДЕ в речи говорящего; можно выделить два паттерна такого поведения (Dittmann, Llewellyn 1968): (1) перед тем, как задать вопрос или что-то прокомментировать; (2) в ответ на прямой вопрос говорящего. На долю двух этих паттернов приходится около 70% всего цефалического поведения слушающего; остальные 30% представляют собой м а р к е р ы о б р а т н о й с в я з и (backchannels; Yngve 1970). Задержка между кивком и началом вербализации составляет около 175 мс; можно предположить, что таким образом слушающий посылает говорящему сигнал о начале своего высказывания, не желая перебивать собеседника (Dittmann, Llewellyn 1968). Проанализировав цефалическое поведение г о в о р я щ е г о собеседника, А. Кендон пришел к выводу, что просодические единицы и цефаличе ские жесты имеют тенденцию к синхронизации (Kendon 1972). Кендон показал, в частности, что к концу очередной просодической единицы голова говорящего собеседника часто возвращается в то место, в котором она была в начале предыдущей единицы, тем самым обеспечивая кинетическую связность дискурса. 12. Невербальная коммуникация 281 Базовой единицей канала жестов головы является ц е ф а л и ч е с к и й ж е с т, далее цефалические жесты объединяются в жестовые цепочки. 12.3.3. Направление взгляда. Глаз человека никогда долго не задерживается на одном месте благодаря чередованию быстрых перемещений (так называемых с а к к а д, средняя длительность 30–60 мс) и относительно коротких остановок (ф и к с а ц и й длительностью в среднем 200–500 мс, но бывает и в несколько раз длиннее); даже при относительно неподвижном положении глаза происходят постоянные м и к р о д в и ж е н и я. История научного изучения направления взгляда началась в XIX в. В настоящее время движения глаз изучаются при помощи айтрекеров, которые фиксируют эти движения с разной частотой (от 30 до 2000 Гц); существует несколько моделей айтрекеров, в том числе: бесконтактная модель, в которой камера монтируется в непосредственном окружении; модель в виде легкого шлема, который надевается на голову испытуемому; модель в виде очков, в которые вмонтированы миниатюрные видеокамеры — одна из них записывает то, на что смотрит испытуемый, а вторая при помощи отраженного света фиксирует изображение глаза. Важную область современных айтрекинговых исследований составляет изучение процессов ч т е н и я. Согласно работе Rayner 1998: (1) длительность фиксаций при чтении про себя составляет в среднем 225 мс, при чтении вслух и зрительном поиске — 275 мс, при печатании на пишущей машинке — 400 мс; (2) при чтении количество символов, которые человек видит при одной фиксации, несимметрично относительно центра фиксации: при письме слева направо оно составляет в среднем 3-4 символа слева от центра фиксации и 14-15 символов справа от центра фиксации; (3) 10-15% от общего числа саккад являются регрессивными, то есть возвращающими глаза к уже прочитанному, их число коррелирует со сложностью текста; (4) при чтении вслух глаза опережают голос примерно на 500 мс; (5) высокочастотные короткие слова часто пропускаются, а на чтение низкочастотных, наоборот, требуется больше времени; чтение редкого слова часто сопровождается эффектом перелива, когда наблюдается более длительная фиксация на слове, следующем после редкого. Основы изучения распределения з р и т е л ь н о г о в н и м а н и я собеседников в ходе естественного общения были заложены А. Кендоном (1967), который выявил следующие закономерности: 282 А. А. Кибрик, О. В. Федорова, Ю. В. Николаева (1) испытуемый чаще смотрит на собеседника, когда слушает его, чем когда сам говорит; (2) взгляды на собеседнике длиннее, когда испытуемый молчит, чем когда говорит; (3) когда испытуемый молчит, его взгляды на собеседнике длиннее, чем взгляды на окружение; (4) когда испытуемый говорит, его взгляды на собеседнике короче, чем взгляды на окружение; (5) наблюдаются сильные индивидуальные различия. Так, испытуемыеслушатели фиксировали взгляд на собеседнике от 32% до 81% всего времени, а испытуемые-говорящие смотрели на собеседника от 20% до 68% всего времени (Kendon 1967). Традиционно выделяются следующие ф у н к ц и и н а п р а в л е н и я в з г л я д а (по Kendon 1967): (1) функция мониторинга — глядя на собеседника, мы определяем, куда он смотрит, какова его мимика, в какой позе он находится; (2) регуляторная функция — в частности, говорящий регулирует смену реплик в диалоге, когда в конце своей реплики при помощи взгляда передает ход слушающему; (3) экспрессивная функция — напр., взгляд в сторону во время речи собеседника может выражать неудовлетворенность его словами; (4) взаимный взгляд, глазной контакт — количество взаимных взглядов зависит от уровня эмоциональности. Базовая единица окуломоторного канала — в з г л я д (gaze); взгляды делятся на ф и к с а ц и и, с а к к а д ы и другие более мелкие движения глаз. I I I . Язы к о в о е м н о г ооб ра зи е 13. Языки мира и языковое разнообразие 1 А. А. Кибрик, Ю. Б. Коряков Лингвистические исследования можно грубо разделить на две категории. Один способ рассуждать о языковых явлениях — молчаливо предполагая, что какой-нибудь один человеческий язык может выступать в качестве достаточного представителя языков вообще, или Языка с большой буквы. В качестве такого эксклюзивного представителя использовались латинский, английский, русский и ряд других языков. Обычно эксклюзивным представителем оказывается родной язык лингвиста и/или социально престижный язык. Теоретические лингвистические исследования часто основывались и основываются именно на таком подходе. Альтернативный подход — изначально иметь в виду тот факт, что человеческих языков много, и они могут различаться по многочисленным основаниям. При этом подходе языковое разнообразие принципиально влияет на все рассуждения о языке и языках, в том числе теоретические. Разумеется, знание о языковом разнообразии должно быть эмпирическим, а не априорным. Данная глава посвящена исследованиям языкового разнообразия. 13.1. Введение 13.2. Генеалогическая лингвистика 13.2.1. Языковые семьи Евразии и Северной Африки 13.2.2. Языковые семьи Африки южнее Сахары 13.2.3. Языковые семьи Океании 13.2.4. Языковые семьи Австралии 13.2.5. Языковые семьи Северной Америки и Мезоамерики 13.2.6. Языковые семьи Южной Америки 13.3. Ареальная лингвистика 13.4. Лингвистическая типология 13.4.1. Тип выражения грамматических значений 13.4.2. Характер границы между морфемами 13.4.3. Локус маркирования 13.4.4. Тип ролевой кодировки в предикации 13.4.5. Базовый порядок слов При подготовке главы были использованы некоторые материалы публикаций А.А. Кибрик 2001, 2002, 2003; Коряков 2018. 1 286 А. А. Кибрик, Ю. Б. Коряков 13.5. Интегральная наука о языковом разнообразии 13.5.1. Генеалогическая плотность ареала 13.5.2. Типологическая однородность языковой семьи 13.5.3. Языковые контакты, конвергенция и диффузия 13.5.4. Стабильность 13.6. Диахронический аспект языкового разнообразия 13.6.1. Формирование вида Homo sapiens 13.6.2. Хронология заселения Земли человеком 13.6.3. Генеалогическая классификация языков 13.7. Заключение. Социолингвистика. Смежные науки 13.1. Введение Согласно данным широко цитируемого источника ethnologue.com, в мире существует 7097 живых и недавно вымерших естественных языков (Simons, Fennig 2018), а согласно сайту glottolog.org — 8059 2 естественных языков, включая древние языки и 183 жестовых языка). Мертвые языки, которые более не используются, также входят в сферу интересов науки о языковом разнообразии. Языковым разнообразием традиционно занимаются несколько лингви стических дисциплин, в первую очередь: генеалогическая лингвистика; ареальная лингвистика; лингвистическая типология. В последнее время, во многом благодаря исследованиям Дж. Николс (особенно Nichols 1992; см. А.А. Кибрик, Плунгян 1997: 293–301), на базе этих трех традиционных дисциплин складывается новая интегральная наука: и с с л е д о в а н и е я з ы к о в о г о р а з н о о б р а з и я. Эта наука пока не имеет устойчивого названия, но принципиально важно, что в круг ее интересов входит и родство языков, и их территориальное размещение, и их типологические сходства/различия. В разделах 13.2–13.4 каждая из трех традиционных дисциплин рассматривается по отдельности. (Следует отметить, что двум из этих дисциплин, а именно генеалогической лингвистике и типологии, посвящены также главы 14 и 15 в наст. изд., соответственно.) В разделе 13.5 характеризуется инте гральная наука о языковом разнообразии. В разделе 13.6 рассматриваются некоторые дополнительные вопросы, связанные с диахроническим аспектом языкового разнообразия. Наконец, в заключительном разделе 13.7 дают2 По данным Глоттолога (https://glottolog.org/glottolog/family) на 03.01.2019. 13. Языки мира и языковое разнообразие 287 ся сведения о социальном аспекте языкового разнообразия, а также о смежных науках, имеющих отношение к исследованию этого явления. 13.2. Генеалогическая лингвистика Г е н е а л о г и ч е с к а я л и н г в и с т и к а — область науки, которая более традиционно называется сравнительно-историческим языкознанием или компаративистикой (см. главу 14 в наст. изд.). Генеалогическая лингвистика изучает вопросы родства и происхождения языков. Это одна из классических и наиболее развитых областей лингвистики. Основное понятие данной дисциплины — языковая семья. Я з ы к о в а я с е м ь я — совокупность языков, происходящих от единого языка-предка. Для термина «языковая семья» характерен значительный разнобой в словоупотреблении применительно к конкретным генеалогическим единствам. Так, можно встретить выражения «славянская семья», «индоевропейская семья», «ностратическая семья». Мы будем употреблять термин «языковая семья» применительно к максимальным, но при этом доказанным и общепризнанным генеалогическим единствам. Так, имеет смысл говорить об индоевропейской семье, но о славянской ветви (индоевропейской семьи) и о ностратической макросемье. При определении семей часто используется критерий, согласно которому в родственных языках бывает не менее 18–20% слов общего происхождения согласно 100-словному списку базисной лексики (списку Сводеша, Swadesh 1955). Семьи, состоящиее ровно из одного языка, называются изолятами (изолированными языками). Неклассифицированными называются языки, относительно которых недостаточно данных, чтобы сделать однозначные выводы об их принадлежности к той или иной семье. Макросемья — гипоте тическое генеалогическое единство, предлагаемое некоторыми исследователя ми, но не обеспеченное консенсусом всех или большинства исследователей. Данные о генеалогическом разнообразии мира приведены в табл. 13.1. Эти данные приводятся по регионам, которые в основном совпадают с континентами. Все языки семей, присутствующих более чем в одном регионе, посчитаны в основном регионе распространения (для австронезийских — Океания, для индоевропейских и афразийских — Евразия и Северная Африка, для эскимосско-алеутских — Северная Америка, для аравакских и чибчанских — Южная Америка). Языковые семьи — наиболее классический способ группировки языков мира. Поэтому имеет смысл охарактеризовать языки мира в целом именно с точки зрения их генеалогической аффилиации. При этом надо иметь в виду, что мнения о выделении тех или иных семей могут различаться у разных лингвистов. Изложение строится согласно указанным в таблице 13.1 288 А. А. Кибрик, Ю. Б. Коряков Регионы Евразия и Северная Африка Африка южнее Сахары Океания Австралия Северная Америка, включая Мезоамерику Южная Америка Всего Семьи Изолиро- Неклассифи- СмешанЧисло ванные цированные ные языков 3 языки языки языки 23 33 71 23 13 16 55 9 29 20 3 2 16 2 2 2120 1892 2181 363 40 31 22 2 661 43 233 64 188 66 142 2 24 659 7876 3 Таблица 13.1. Количественное распределение языковых семей и языков по регионам4 регионам. Во многих случаях речь идет скорее о распространении соответствующих языков в обозримом прошлом (например, до активных контактов с европейцами), однако везде употребляется настоящее время. 13.2.1. Языковые семьи Евразии и Северной Африки. Языки индоевропейской семьи занимают бÓльшую часть современной Европы, Передней, Центральной и Южной Азии и широко представлены во многих других регионах мира. Единственным живым языком Европы, сохранившимся от доиндоевропейского населения западной Европы, является баскский язык, который вместе с древним аквитанским языком видимо образует эускарскую семью. Из письменных источников и топонимов известен также ряд других древних языков Европы, для которых не удается показать родство с известными семьями. На Пиренейском п-ове это: иберский и тартессийский; в Италии: тирренская семья, севернопиценский, камунийский и практически незасвидетельствованные языки Сардинии (палеосардский) и Сицилии (сиканский, элимский); в Эгейском регионе и на Кипре: этеокритский, этео кипрский, недешифрованные языки кипро-минойского силлабария, крит ской иероглифики, линейного письма А и Фестского диска; в Британии: пиктский язык. В Передней Азии также известен ряд древних изолированных языков: шумерский, эламский, хаттский, касситский; там же представлена хуррито-урартская семья. В это число включены только звучащие естественные языки, но не включены жестовые языки глухих, а также искусственные языки. 4 По данным Глоттолога (https://glottolog.org/glottolog/family) на 03.01.2019. 3 13. Языки мира и языковое разнообразие 289 На Кавказе представлены три семьи (условно называемые «кавказскими языками»): картвельская, абхазо-адыгская и нахско-дагестанская, последние две иногда объединяются в северокавказскую макросемью. Значительные территории Азии занимают алтайские языки, единство которых признается не всеми учеными, поэтому часто говорят об отдельных тюркской, монгольской, тунгусо-маньчжурской и японо-рюкюской семьях и корейском языке. В Северной Европе и Западной Сибири основной семьей является уральская. Также в Северной Азии представлены енисейская, юкагиро-чуванская, чукотско-камчатская, айнская семьи и изолированный нивхский язык, вместе условно называемые палеоазиатскими языками. В Южной Азии распространены дравидийская семья, изоляты бурушаски, кусунда и нихали. Значительную часть Восточной и Юго-Восточной Азии занимает сино-тибетская семья. Кроме того, в Юго-Восточной Азии представлены семьи хмонг-мьенская (мяо-яо), тай-кадайская, австроазиатская. На Андаманских о-вах можно выделить северноандаманскую и южноандаманскую семьи и неклассифицированный сентинельский язык, с носителями которого контакт до сих пор не установлен. Афразийские (афроазиатские, семито-хамитские) языки составляют самую глубокую по времени распада (около 10 тыс. лет) семью, из-за чего ее часто называют макросемьей. В ее состав входят 6 подсемей: семитская (Передняя Азия и Северная Африка), египетская (древнеегипетский язык и коптский язык), берберо-ливийская, чадская, кушитская и омотская. Вхождение омотской подсемьи в состав афразийских языков и даже генеалогическое единство омотских языков в последнее время иногда подвергаются сомнению. Так, в Glottolog (2018) выделяются четыре отдельные семьи: дизоидная, мао, ароидная (южноомотская) и гонга-гимоджская (та-не). 13.2.2. Языковые семьи Африки южнее Сахары. Остальные, неафразийские, языки Африки со времен Дж. Гринберга (Greenberg 1966) условно объединяются в три гипотетические макросемьи. К настоящему времени валидность каждой из них существенно пересмотрена и каждая из них имеет разный уровень доказанности и признанности и разную предполагаемую временную глубину. В основном эти макросемьи являются таксономическими (т. е. нужными прежде всего в качестве удобной схемы организации более надежных семей), а не генеалогическими, по крайней мере при современном уровне их изученности. Крупнейшей макросемьей является нигеро-конголезская, в состав ко торых входят периферийные семьи: догонская, иджоидная, манде, несколько семей, ранее объединявшихся под названием «кордофанские языки» 290 А. А. Кибрик, Ю. Б. Коряков (катла-тима, рашадская, лафофа, талоди-хейбанская), и ядро под названием атлантическо-конголезские языки. Последние включают несколько семей, ранее объединявшихся под названием «атлантические языки» (семьи северно-центрально-атлантическая, мель, лимба и изоляты суа и гола), и т. н. вольта-конголезские языки, куда входят семьи: кру, ква, саваннская (северные вольта-конго, включая подсемьи сенуфо, гур и адамава-убангийскую), бенуэ-конголезская (включающая среди прочего языки банту), и изоляты прэ (мбре, пэрэ), мпра (мпре), эга и фали. Распространенные в нигеро-конголезском ареале языки бангери-ме (банги-ме), семе (сьяму), лаал и джалаа (чентум) чаще считаются изолятами, неродственными окружающим языкам. Лишь для части семей, ранее включавшихся в состав нило-сахарской макросемьи, удается показать хотя бы отдаленное родство. Усеченная версия, под названием «макросуданской», включает семьи: центральносудан скую, восточносуданскую, кронго-кадугли (каду), мабанскую, фур-амданг (фурскую), кунама-илит и изолят берта (Г.С. Старостин 2014; 2017). Кроме того, ранее в состав нило-сахарских включались семьи сонгайская, сахарская, коман-гумузская, кулякская (руб) и изолят шабо (микир), родство которых друг другу и другим семьям показать не удается. От древнего мероитского языка сохранилось слишком мало данных. Под койсанскими языками понимаются не-банту языки юга Африки. Среди них выделяются семьи центральнокойсанская (кхой-квади), южно койсанская (та-къви, туу) и севернокойсанская (жу-чъоан). Имеются аргументы в пользу родства последних двух. Изолят сандаве возможно родственен центральнокойсанским. По общему мнению изолят хадза не родственен другим семьям (Г.С. Старостин 2013b). 13.2.3. Языковые семьи Океании. Большую часть островов Малайского архипелага и Океании (а также о. Тайвань и часть Индокитая) занимает австронезийская семья — крупнейшая по числу языков языковая семья мира (более 1200 языков). Аборигенные языки о. Новая Гвинея (западная часть острова относится к Индонезии, восточная образует государство Папуа — Новая Гвинея) и окружающих островов, не относящиеся к австронезийским языкам, условно называются папуасскими. Их классификация является наименее разработанной среди языков мира (Коряков 2014). По разным оценкам выделяется 60 (Foley 1986), 85 (Ross 2005), 97 (Wurm 1982), 137 (Hammarström 2012) или 160 (Glottolog 2018) семей и изолятов; часть из них объединяются в более 13. Языки мира и языковое разнообразие 291 крупные, но менее надежные генеалогические группировки — филы (макросемьи). Классификация ниже дается по Glottolog 2018. Трансновогвинейские языки — крупнейшая папуасская фила, включа ющая при строгом подходе 10 семей (ядерные трансновогвинейские языки): паниайскую (виссел-лейкс), данийскую, мекскую (голиаф), центрально-южно-новогвинейскую, энганскую, чимбу-вахгийскую, каинанту-гороканскую (восточно-нагорскую), мадангскую, финистер-хьюонскую и бинандерскую. При менее строгом отборе (согласно М. Россу) включает также семьи тиморо-алоро-пантарскую, зап.-бомберайскую, юж.-чендравасихскую, каурей скую, паувасийскую, каягарскую, колопомскую, кивайскую, момбумскую, суки-гогодальскую, элеманскую, анимскую, турама-кикорийскую, теберан скую, анганскую, фасу, вост.-кутубускую, авин-па, вост.-стриклендскую, босави, гоилальскую, коиарийскую, квалейскую, манубаранскую, яребанскую, маилуанскую, даганскую и изоляты танах-мерах, мор, дем, ухундуни, капори, мораори, пороме, паваиа, дуна, богая, камула, виру. На севере Молуккских о-вов распространены северохальмахерская семья, на западе о. Новая Гвинея (п-ов Чендравасих) — семьи зап.-чендравасихская, хатам-мансимская, яваская, майбратская, мановарская (вост.-чендравасих ская), сентанийская, и изоляты бурмесо, таусе, мпур и абун. На перешейке от п-ова Чендравасих распространены майрасийская семья и изолят танах-мерах. На севере индонезийской провинции Папуа представлены: семьи варопенская (ист-гелвинк-бей), озёрно-равнинная (лейксплейн), нижнемамберамская, квербийская, орья-торская, нимборанская, намла-тофанмийская, лепки-муркимская, изоляты кеху, мавес, масеп, абиномн, саусе, капаури, эльсенг (морвап), молоф, уску (афра) и кембра. По обеим сторонам границы между Индонезией и Папуа — Новой Гвинеей распространены семьи ско, погранично-папуасская, сенагийская и изоляты бикси-етфа, кимки и пью. К востоку от границы, на севере Папуа — Новой Гвинеи, представлены фасская, квомтарская, амто-мусанская и арайская семьи, изоляты гуриасо, буса и яле. Далее к востоку — торричелли языки, изолят урим; сепикская семья и возможно входящие в них семьи нду и валиоская, изоляты еракай, дуранмин и папи, еще далее к востоку — монгол-лангам ская, юат-марамбская, арафундийская, пиавийская, раму-нижнесепикская, монумбоская семьи и изолят таиап (гапун). В центральных районах пров. Папуа представлена байоно-авбонская семья. На юге о. Новая Гвинея, к югу и западу от реки Флай, распространены семьи булакская, морхед-васурская, пахотурийская и вост.-трансфлайская, изоляты мораори, ваиа и тирио. К северу от них — досо-турумсская и кивайская семьи и изоляты дибиясо и кибири (пороме). На островах к востоку от Новой Гвинея и на некоторых Соло- 292 А. А. Кибрик, Ю. Б. Коряков моновых о-вах распространены т.н. восточнопапуасские языки, включающие баинингскую, таулил-бутамскую, южнобугенвильскую и северобугенвильскую семьи и изоляты анем, ата, йеле, билуа, баниата, лавукалеве и савосаво. 13.2.4. Языковые семьи Австралии. Ранее все аборигенные языки Австралии объединялись в макросемью австралийских языков, однако сейчас большинство специалистов отвергает эту точку зрения. Классификация ниже дается по Glottolog 2018. Наиболее крупной австралийской семьей является пама-ньюнгская, объединяющая 3/4 всех австралийских языков. Лишь на севере континента представлены другие семьи. На северо-западе, на п-ове Кимберли представлены нюлнюльская, пунапанская, ворорская, тярракская семьи. На п-ове Арнемленд сосредоточены несколько семей дейлийских языков (западнодейлийская, южнодейлийская, севернодейлийская, восточнодейлийская), несколько семей, включавашихся ранее в макро-кунвинькускую гипотезу (изоляты кунгаракань, вакиман и какутю, семьи кунвиньку ская, манингритская (пураррская), янгманийская и мангарраи-марранская), т.н. языки района Дарвина (изолят ларакия, лимилнганская и умпукалий ская семьи), изолят тиви, киимпиюская (мангерская), иватьянская и марркувурруку семьи на крайнем севере п-ова. К югу от полуострова Арнемленд распространены миндийская семья, включающая две несоприкасающиеся ветви: йиррамскую (тяминтюнгскую) и западнобарклийскую (нгулунскую), и, на востоке плато Баркли, семьи каравская, танкийская и изолят минкин. Вымершие тасманийские языки (о.Тасмания) условно делятся на 5 групп, возможно образующих 3 языковые семьи: северо-западную с северной и западной группами; северо-восточную; восточную с группами ойстер-бей и бруни (юго-восточной). 13.2.5. Языковые семьи Северной Америки и Мезоамерики. Крайний север Северной Америки (арктическая зона) (а также оконечность Чукотки в Азии) занимает эскимосско-алеутская семья. Далее к югу распространены т. н. индейские языки. Базовые источники по классификации индейских языков: Mithun 1999; А.А. Кибрик 2008; Campbell, Grondona 2012. Субарктическую и северо-восточную зоны Северной Америки и отдельные ареалы к югу от них занимают семьи на-дене (включающие языки тлингит, эяк и атабаскские), алгская (включая алгонкинские языки), ирокезская и вымерший изолят беотук (о. Ньюфаундленд). На Северо-Западном побережье и Плато представлены изолят хайда, вакашская, салишская, чимакумская семьи, изоляты кутенаи и каюсе. Далее к югу, на Западном побережье США представлено большое количество язы- 13. Языки мира и языковое разнообразие 293 ковых семей и изолятов, большая часть которых условно включается в ги потетические макросемьи пенутийских (вкл. семьи плато-пенутийскую, цимшианскую, утийскую, шинукскую, алсейскую, кусскую, калапуянскую, винтуанскую, майдуанскую и йокуцскую и изоляты такелма и сиуслау) и хоканских (вкл. семьи кочими-юманскую, помоанскую, палайниханскую, шастанскую и изоляты уашо, яна, чимарико, карок и эсселен) языков. За их пределами остаются семьи юкийская (юки-ваппо) и чумашская и изолированный салинский язык. На Великих равнинах и Юго-западе США распространены семьи сиуанская (сиу), кайова-таноанская, каддоанская, кересская и изолят зуни. На юговостоке США представлены тимукуанская и мускогейская семьи и изоляты туника, натчез и ючи. Вдоль побережья Мексиканского залива представлено большое количество изолированных или неклассифицированных языков: калуса, читимаша, адаи, атакапа, каранкава, тонкава, аранама; далее к юговостоку — котонаме, коавильтекский, комекрудская семья, солано, наолан, кинигуа, маратино; на северо-западе Мексики — изолят сери, на самом юге п-ова Калифорния — гуайкурийская семья. Юто-астекская семья распространена на территории Большого Бассейна США и на северо-западе и в центре Мексики. Только в Мезоамерике представлены семьи: отомангейская, тотонакская, михе-соке, майянская (майя), шинканская (шинка), текистлатекская (оахакско-чонтальская), ленканская и хикакская (толь); и 3 изолята: тараско (пурéпеча), куитлатекский и уаве. 13.2.6. Языковые семьи Южной Америки. На юго-востоке Центральной Америки и в соседних территориях Южной Америки распространены мисумальпанская и чибчанская семьи. На северо-западе Южной Америки распространены барбакоанская, чокоанская, хирахарская, тимотейская семьи, изоляты юриманги (юруманги), паэс, камса (камынча) и андаки и несколько неклассифицированных языков (в т. ч. бетой-хирара, ансерма, гуасусу, идабаэс, оромина, руна). На севере Юж. Америки представлены карибская, яномамская и саливанская семьи, изоляты варао (гварао, варау) и маку и несколько неклассифицированных языков (тарума, арутани, кальяна (сапе), хоты). В западной Амазонии распространены аравакская (представленная также на соседних территориях и в Центральной Америке), туканоанская, чапакурская, араванская (мади), надахупская (маку), дьяпанская (катукинская), харакмбытская (туйонери), гуахибская (вахиво) и тыкуна-юрийская семьи, изоляты тинигуа, отомако, текирака (аэва), каничана, пуйнаве, какуа-ныкак и вымершие неклассифицированные языки гуамо (вамо), муре и муничи. 294 А. А. Кибрик, Ю. Б. Коряков В северных предгорьях Анд (Эквадор, Перу, Венесуэла и юг Колумбии) представлены бора-уитотская, хиварская, пеба-ягуанская, кавапанская, сапарская семьи и изоляты эсмеральда (атакаме), пуме (яруро), кофан, кандоши-шипра, омурано, тауширо (пинче), ваорани (сабела), урарина (шимаку), андоке. В Центральных Андах представлены кечуанская, аймаранская (хаки), катакаонская, уру-чипая и хибито-чолонская семьи и изоляты мочика (юнга), пуруха (пуругвай), кульи, сечура, тальян, леко и пукина. В юж. предгорьях Анд (север Боливии, восток Перу и запад Бразилии) расположены пано-таканская, чонская семья и изоляты юракаре и мосетен. На северо-востоке Бразилии индейские языки исчезли столь быстро, что сохранились сведения лишь об одной семье — каририйской (кирири́-шокó), изолятах туша, панкарару и шукуру и нескольких неклассифицированных языках (катембри, панкарарé, нату, гамела, уамуэ́, вамоэ, тарайриу, шоко (карири-шоко)). Гипотетическое объединение макро-же языков, распространенных в основном в восточной Бразилии, включает ядро (же языки, машакалийская, ботокудская (айморе), ябутийская семьи, изоляты рикбакца, жейко, каража и офайе) и периферию (камаканская, боророанская, пурийская (пури-короадо) семьи, языки гуато, фулнио, чикитано (бесыро) и оти). В том же ареале представлены изоляты баэнан и кукура. В Центральной Амазонии представлены намбикварская и муранская семьи, изоляты матанави, итонама (мачото), капишана (каноэ), кважа (коая), айкана (корумбиара), иранче (мынкы), трумай, мовима и каювава (каюбаба). В регионе Чако (север Аргентины, юг Боливии, Парагвай) распространены гуайкуру, матакоанская, маскойская, самукская и чарруанская семьи, изоляты луле и вилела и неклассифицированные языки гуачи, паягуа и горготоки. Во всех трех предыдущих ареалах широко представлена тупийская семья (включая язык гуарани). Наконец, на самом юге Южной Америки (юг Чили и Аргентины) представлены уарпейская и алакалуфская (кавескарская) семьи и изоляты арауканский язык, ямана, чоно и пуэльче. 13.3. Ареальная лингвистика А р е а л ь н а я л и н г в и с т и к а изучает вопросы территориального распространения языков и языковых явлений (на земном шаре, на конти нентах, в рамках более мелких географических ареалов). Альтернативное название этой дисциплины — лингвистическая география. Некоторые исследователи противопоставляют два эти понятия и придают им разный смысл (напр., Эдельман 1968), однако мы такого различия в рамках настоя- 13. Языки мира и языковое разнообразие 295 щей главы не проводим. В литературе встречаются также термины «лингвогеография» и «геолингвистика», у которых есть свои нюансы значения, но эти вопросы мы здесь также не затрагиваем. Еще одна терминологическая сложность состоит в том, что «ареальная лингвистика» иногда связывается лишь с изучением языковых контактов, см. раздел 13.5.3. Мы понимаем этот термин более широко. Основное понятие ареальной лингвистики — я з ы к о в о й а р е а л. Это любая территория, которая релевантна при обсуждении тех или иных языковых фактов. Размер ареалов может быть очень разным. Так, иногда весь мир делится на три гиперареала — Старый свет, Новый свет и Океанию (включая Австралию). В курсе ОТиПЛа «Языки мира и языковые ареалы» (см. А.А. Кибрик 2002) используется членение Земли на 10 макроареалов, см. ниже. Возможны ареалы гораздо большей степени дробности — например, можно говорить об ареале распространения группы говоров диалекта того или иного языка. Географические факторы исключительно важны для объяснения многих языковых явлений. Так, тип географической среды, в которой распространяются языки, принципиально влияет на характер генеалогических связей между формирующимися языками или диалектами. Географическая среда с явно выраженными границами (водные преграды, горы) часто формирует четкие границы между языками (ср. австронезийские языки Океании, распространенные на отдельных островах). Напротив, географическая среда без явных границ (равнины, побережья) часто приводит к возникновению так называемых диалектных цепей, или континуумов, в которых соседние популяции хорошо понимают язык друг друга, но для популяций, отдаленных друг от друга, это уже неверно (такая ситуация характерна, например, для Индии, где границы между языками проводить оказывается непросто). Географические факторы могут объяснять характер и скорость языковых изменений, а также определенные языковые явления. Например, грамматиче ский консерватизм литовского языка на фоне его родственников по индо европейской семье часто объясняется тем, что литовцы в течение многих веков жили в географически изолированной области, ограничивающей контакты с другими языками. Во многих языках имеются лексические или грамматические средства, указывающие на жизненно важные для носителей языков характеристики географической среды, такие как «вверх/вниз по реке» или «вверх/вниз по склону горы». В работах американского лингвиста Дж. Николс были указаны важные типы ареалов — так называемые протяженные (spread) и замкнутые (residual) зоны. П р о т я ж е н н ы е з о н ы, обычно представленные на равнинах, характеризуются сравнительно малым генеалогическим разнообразием. 296 А. А. Кибрик, Ю. Б. Коряков а м к н у т ы е з о н ы обычно возникают в географически ограниченных З ареалах (ограниченных горами, морскими преградами и т. п.) и отличаются высоким уровнем разнообразия. Классический пример протяженной зоны — евразийская степь, замкнутой зоны — Кавказ. Исторически ареальная лингвистика выросла из наблюдений о том, что сходства между языками могут быть вызваны не только общим происхождением, но и контактами в силу территориальной смежности. В исследованиях последней четверти XIX в., посвященных родственным, в первую очередь индоевропейским, языкам, накопилось много свидетельств того, что дискретная модель генеалогического древа, применяемая как к языкам одной семьи, так и к диалектам одного языка, является слишком грубым упрощением реальности. Наряду с общим происхождением, географическая близость также является очень важным фактором общностей между языками и диалектами. Х. Шухардт и Й. Шмидт предложили так называемую «теорию волн» — идею распространения языковых инноваций из центров, где они возникают, к периферии, подобно кругам, расходящимся по воде от брошенного камня и постепенно затухающим. В результате взаимовлияния смежных языков и диалектов границы между ними оказываются не столь четкими, возникают сходства, которые не могут быть объяснены общим происхождением. Так, в рамках индоевропейской семьи италийские языки по одним признакам объединяются с кельтскими, по другим — с германскими, по третьим — с греческим, и эти сходства в каждом случае не обязательно связаны с общим прошлым языков (отдельным от прочих индоевропейских языков), а могут объясняться более поздними контактами на основе территориальной близости. Иными словами, оказалось трудно решить, с какой ветвью индоевропейской семьи италийские языки следует сгруппировать в первую очередь при создании индоевропейского генеалогического древа. Таким образом, ареальная лингвистика зародилась как некоторое дополнение или даже альтернатива по отношению к генеалогической лингви стике (сравнительно-историческому языкознанию) — в то время практиче ски главному направлению науки о языке. В современной перспективе, однако, более осмысленно считать, что ареальная лингвистика рассматривает собственно языковые ареалы разного объема, а проблематика языковых контактов — это стык между ареальной лингвистикой и лингвистической типологией, см. раздел 13.5.3. Для формирования ареальной лингвистики (лингвистической географии) как особой дисциплины большое значение имели книги А. Доза (Dauzat 1922) и Э. Косериу (Coșeriu 1956), каждая из которых носила заголовок «Лингвистическая география». В итальянском лингвистическом направлении, 13. Языки мира и языковое разнообразие 297 известном как неолингвистика, использовался термин «ареальная/простран ственная лингвистика» (Bartoli 1925; Bartoli, Vidossi 1943). В отечественном языкознании о проблемах лингвистической географии писали такие авторы, как В. М. Жирмунский (1954), Э. А. Макаев (1964), М. А. Бородина (1966), Д. И. Эдельман (1968), Б. А. Серебренников (1973), А. В. Десницкая (1984). Практическая сторона ареальной лингвистики — создание карт и атласов, так или иначе связанных с языками и языковыми явлениями. Эту сферу деятельности можно обозначить как лингвистическую картографию. Существуют различные виды лингвистической картографии, но самыми распространенными являются два. Во-первых, это карты, отражающие распространение языков и языковых групп. Во-вторых, это карты территориального распространения языковых явлений. На таких картах с помощью тех или иных графических средств указываются изоглоссы, то есть наблюдаемые общности между языками или диалектами. Наиболее известные ранние атласы, с которыми часто связывают возникновение лингвогеографии как дисциплины, — это атлас немецких диалектов, начатый Г. Венкером в 1876 г., но изданный лишь в XX в. (Wenker et al. 1927–1956), а также атлас французских диалектов Ж. Жильерона и Э. Эдмона (Gilléron, Édmont 1902–1910), состоящий из 1920 карт. В этих диалектологических атласах предметом описания является география распространения отдельных слов. Несколько позже аналогичные начинания были предприняты и в других странах, в том числе в России (по инициативе А. А. Шахматова). В 1915 г. была издана первая диалектологическая карта европейской части России (Дурново, Соколов, Ушаков 1915). В советское время Р. И. Аванесов возглавлял работу по созданию нескольких диалектологических атласов русского языка, в т. ч. Аванесов 1957 и ДАРЯ 1986–2004. С 1958 г. была начата работа над Общеславянским лингвистическим атласом (ОЛА 1965–2011). Этот проект затем стал составной частью Лингвистического атласа Европы. Лингвистический атлас Европы — это проект, который был начат около 1970 г. при участии лингвистов всех европейских стран. С 1975 по 2015 г. было опубликованы введение, вопросники и 11 выпусков карт и комментариев (ALE 1975–2015). На картах отражается географическое распространение отдельных концептов, напр., ГРУША, РАДУГА, РОЖДЕ СТВО и т. п. в сотнях различных диалектах языков Европы. Данный атлас продолжает, в несколько модифицированном виде, традицию диалектологических атласов отдельных языков. Большинство карт характеризуют либо этимологии корней, соответствующих данному концепту в европейских языках и диалектах, либо лексические мотивации встречающихся обозначений; на картах последнего типа, например, рус. рождество и франц. Noël 298 А. А. Кибрик, Ю. Б. Коряков тражаются как сходные концептуализации, основанные на идее рождения, о а англ. Christmas и нем. Weihnachten представляют другие типы. Однако встречаются и отдельные карты, посвященные более общим языковым явле ниям, например грамматическому способу выражения значения идет дождь. В конце 1980-х гг. в рамках подготовки к созданию Европейского Союза началось финансирование ЕВРОТИПа (EUROTYP) — проекта, целью которого было грамматическое, типологически ориентированное изучение языков Европы от Атлантики до Урала. В дальнейшем была издания серия томов, посвя щенных отдельным проблемам — порядку слов (Siewierska ed. 1998), клитикам (van Riemsdijk ed. 1999), структуре именной группы (Plank ed. 2002), и т. д. В 1996 г. был издан совершенно особый лингвистический атлас — «Атлас языков межкультурной коммуникации в Тихоокеанском регионе, Азии и Америке» (Wurm et al. eds. 1996). Это коллекция из нескольких сотен карт, показывающих территориальное распространение контактных языков, а также смежных языков. Каждая карта сопровождается статьей, описывающей языковую ситуацию в регионе. В институте эволюционной антропологии им. М. Планка в Лейпциге был создан «Атлас языковых структур мира» (World Atlas of Language Structures, сокращенно WALS; первое издание — Haspelmath et al. eds. 2005, самое недавнее — Dryer, Haspelmath eds. 2013), целью которого было отобразить на картах мира множество типологически существенных изоглосс. На отдельных картах были отображены более сотни параметров, таких как размер инвентаря гласных; аналитический/синтетический/полисинтетический тип выражения грамматических значений; базовый порядок слов; тип маркера релятивизации; тип ролевой кодировки и т. д. WALS является не только собственно атласом, но и обширной типологической базой данных. Большая группа карт, начиная с 1999 г., была создана для томов издания «Языки мира» (Институт языкознания РАН) Ю. Б. Коряковым; см. также атласы Koryakov 2001; Коряков 2006. Энциклопедическое издание «Языки мира» в настоящее время включает 22 тома по языкам Евразии, Африки и Северной Америки, изданных с 1993 по 2017 гг., см. http://iling-ran.ru/langworld. На основе этого издания в Институте языкознания РАН создана одноименная база данных, см. Поляков, Соловьев 2006; Соловьев, А.А. Кибрик 2015. В рамках курса «Языки мира и языковые ареалы», преподаваемого А. А. Кибриком на ОТиПЛ филологического факультета МГУ имени М. В. Ломоносова, используется членение всех языков мира на следующие 10 макроареалов: 1. Африка южнее Сахары. 2. Северная Африка и Ближний Восток. 13. Языки мира и языковое разнообразие 299 3. Центральная и Южная Азия. 4. Китай и Юго-Восточная Азия. 5. Океания. 6. Австралия. 7. Европа, включая Кавказ. 8. Северная (Евр)азия. 9. Северная Америка, включая Мезоамерику. 10. Южная Америка. Этот список требует некоторых комментариев. Во-первых, макроареалы в целом сопоставимы по своему размеру с континентами. Некоторые из них совпадают с континентами (№№ 6, 9, 10), другие охватывают часть континента (№№ 1, 3, 4, 7, 8; это особенно характерно для Евразии как крупнейшего континента), ареал № 5 базируется за пределами каких-либо континентов, а ареал № 2 объединяет части двух соседних континентов. Если сравнить этот список с таблицей 1, то полностью совпадают с выделенными там регионами макроареалы №№ 1, 5, 6, 9 и 10, а региону «Евразия и Северная Африка» соответствуют макроареалы №№ 2, 3, 4, 7 и 8. Во-вторых, границы макроареалов, проходящие внутри континентов, неизбежно оказываются условными. В таких случаях уже невозможно опереться на физико-географические обстоятельства, а в качестве ориентира используются современные политические границы. Так, ареал № 8 включает большую часть России и территорию Турции, Азербайджана, Казахстана, Средней Азии (кроме Таджикистана), Монголии, Японии и Кореи. Это прагматический подход, который позволяет с приемлемой степенью точности выделить множество языков, которые удобно обсуждать совместно. В-третьих, можно видеть, что некоторые макроареалы оказываются относительно гомогенными с генеалогической точки зрения. Особенно это касается ареала 2, все живые языки которого относятся к одной семье, правда, очень глубокой (около 10 тыс. лет) — афразийской. Это показывает, что ареалы, выделяемые на основе географического удобства, не обязательно должны быть «перпендикулярны» генеалогическим единствам. 13.4. Лингвистическая типология Л и н г в и с т и ч е с к а я т и п о л о г и я исследует структурные параметры межъязыкового варьирования, см. главу 15 в наст. изд. Типология сформировалась как особая ветвь лингвистики во второй половине ХХ в. и все больше влияет на теоретическую лингвистику. В течение длительного времени было принято говорить о «типах языков» — о языках «изолирующего типа», «эргативного типа» и т. п. В последние десятилетия, однако, такое 300 А. А. Кибрик, Ю. Б. Коряков словоупотребление стало если не неоправданным, то по крайней мере неосторожным, т. к. изоляция и эргативность, несмотря на их важность, — не типы языков, а типы языковых явлений. Современная типология представляет собой не столько изучение типов языков, сколько изучение т и п о л о г и ч е с к и х п а р а м е т р о в, или измерений. Все же о двух поистине глобальных противопоставлениях между языками, которые можно было бы считать оппозициями языковых типов, говорить можно. Первое из них — противопоставление с точки зрения канала передачи информации, носителя — вокального или визуального. При вокальном сигнале мы имеем дело со звучащими человеческими языками, во втором — с жестовыми языками глухих и слабослышащих. Полноценное включение жестовых языков в сферу рассмотрения лингвистики — чрезычайно нужная задача будущего. Однако в данной главе мы от этого вопроса вынуждены отвлечься. Второе глобальное противопоставление языковых типов — естественные и искусственные языки. В отличие от естественных языков, искусственные языки создаются конкретными людьми. Самый известный пример такого рода — создание эсперанто Л. Заменхофом в 1880-х гг. Впрочем, искусственные языки как правило создаются по образцу естественных, поэтому не влияют на наши общие представления в такой мере, как жестовые языки. На ранних этапах развития лингвистики, вплоть до начала XX в., в науке доминировало представление о том, что существуют развитые (фактически европейские) и примитивные языки. Существовали и другие эзотерические историко-лингвистические концепции языкового развития, в частности о деградации европейских языков от классического (античного) состояния к современному. В течение XX в. в лингвистике было осознано, что противопоставления между развитыми и примитивными языками не существует. Однако еще в 1954 г. Ю. Найда полемизировал с идеей о примитивных языках (Nida 1954). Сейчас общепризнано, что все языки в принципе сопоставимы по степени структурной сложности и по своему «семантическому потенциалу». Вероятно, это связано с тем, что эволюционное усложнение языка и когнитивной системы человека произошло задолго до формирования современных языков и даже до начала глобальной экспансии человека из Африки. Хотя априорная оценка тех или иных языков как развитых или примитивных ушла в прошлое, в настоящее время происходит эмпириче ская дискуссия о различной степени сложности языков в разных аспектах, см., напр., Даль 2009; Miestamo et al. eds. 2008; Sampson et al. eds. 2009; Givón, Shibatani eds. 2009; Hengeveld, Leufkens 2018. 13. Языки мира и языковое разнообразие 301 Мнения о том, какие типологические параметры наиболее важны, могут сильно варьировать у разных лингвистов. В рамках курса «Языки мира и языковые ареалы», преподаваемого А. А. Кибриком на ОТиПЛ фиолологического факультета МГУ имени М. В. Ломоносова, в качестве наиболее центральных типологических параметров предлагаются следующие пять. 13.4.1. Тип (степень свободы) выражения грамматических значений. Традиционно различаются аналитический и синтетический типы. При аналитизме грамматические значения выражаются отдельными фонетическими словами, при синтетизме — образуют одно фонетическое слово с лексиче ским корнем. В результате при аналитическом выражении грамматических значений знаменательные слова типично состоят из малого числа морфем (в пределе — из одной), при синтетическом — из нескольких. Полисинтетизмом именуется типичное количество морфем в слове (главным образом в глагольном слове), значительно превышающее типологическое среднее. 13.4.2. Характер границы между морфемами. Традиционно выделяются три типа морфологической структуры — изолирующий (морфемы максимально отделены друг от друга, в пределе — представляют собой отдельные слова), агглютинативный (морфемы семантически и формально отделимы друг от друга, но объединяются в слова) и фузионный (и семантические, и формальные границы между морфемами плохо различимы). Этот параметр не следует путать с типом выражения грамматических значений; хотя два эти параметра отчасти взаимосвязаны, логически они автономны. 13.4.3. Локус маркирования. Это важный параметр, впервые эксплицитно сформулированный в работах Дж. Николс (Nichols 1986). Синтаксическая связь между вершиной и зависимым элементом в разных типах конструкций, в частности в посессивной именной группе и в клаузе, может маркироваться на той или составляющей. Соответственно говорят о зависимостном или вершинном маркировании. Ср. два следующих примера. (1) русский колесо машин-ы (2) навахо (семья на-дене, Сев. Америка) chidí bi-kee' машина 3-нога ‘колесо машины’, букв. ‘машина ее-нога’ 302 А. А. Кибрик, Ю. Б. Коряков В русском словосочетании (1) посессивная связь маркирована на зависимом элементе (посессоре) посредством показателя генитива. В навахо (2) маркирование производится на вершинном элементе (обладаемом) посред ством показателя лица посессора. (В иранистической и тюркологической традициях вершинная техника маркирования в посессивной конструкции име нуется изафетом, а в семитологической традиции сопряженным состоянием.) Типологически еще более важен локус маркирования в клаузе. Ср. два следующих предложения, означающих ‘мужчина написал женщине письмо’: (3) японский otoko ga ni onna tegami o kaita мужчина Ном женщина Дат письмо Акк написал (4) абхазский (абхазо-адыгская семья, западный Кавказ) axac’a apH əs asalams°q’ə i-l-z-i-j°it’ ° мужчина женщина письмо 3Cр/Пац-3Ж/Косв-для-3М/Аг-написал В японском предложении (3) все предикатно-аргументные отношения маркированы (посредством аналитических падежных показателей) в составе зависимых составляющих — в именных группах. В абхазском же (4) все маркирование сосредоточено в вершинном элементе — в глаголе. Каждый аргумент отражен в глаголе посредством соответствующего лично-родо-числового показателя. Помимо чисто вершинного и чисто зависимостного маркирования бывают случаи нулевого маркирования (пример — китайский язык), двойного маркирования (например, именные падежи плюс согласование глагола с аргументами) и различные типы варьирования. 13.4.4. Тип ролевой кодировки в предикации. Основные типы ролевой кодировки, встречающиеся в языках, — аккузативный, эргативный и агентивно-пациентивный (см. А.Е. Кибрик 1982). Чтобы продемонстрировать этот параметр в некотором языке, необходимо по крайней мере три простых предложения — с одноместным пациентивным глаголом, с одноместным агентивным глаголом и с двухместным агентивно-пациентивным (переходным) глаголом. Примеры: (5) русский a. Собак-а спит б. Собак-а бежит в. Девочк-а ударила собак-у (6) годоберинский (нахско-дагестанская семья, Дагестан) a. ʕali Rumi б. ʕali ari в. imu-di ʕali Али(Ном) заснул ‘Али заснул’ Али(Ном) убежал ‘Али убежал’ č’inni отец-Эрг Али(Ном) побил ‘Отец побил Али’ 13. Языки мира и языковое разнообразие (7) лахота (сиуанская семья, Сев. Америка) a. ma-hą́ske б. ya-hí 1Ед/Пац-быть.высоким 2Ед/Аг-пришел 303 в. ma-ya-`kte 1Ед/Пац-2Ед/Аг-убивать ‘Я высокий’ ‘Ты пришел’ ‘Ты меня убиваешь’ Русский язык (5) реализует аккузативную кодировку: специальный падеж (аккузатив) имеется для пациенса переходного глагола, а агенс переходного глагола и любой актант (агенс/пациенс) непереходного кодируется номинативом. В годоберинском языке (6) используется эргативная кодировка — специальный падеж эргатив (-di) используется, напротив, для агенса переходного глагола, а в прочих случаях — номинатив. В обеих этих системах агентивные и пациентивные одноместные предикаты кодируют свой един ственный актант одинаково — номинативом. В лахота (7) используется активная, или агентивно-пациентивная, система ролевой кодировки: агенсу всегда (независимо от местности глагола) соответствует одна форма, пациенсу — другая: напр., пациентивный показатель первого лица единственного числа — ma-, а агентивный показатель того же лица — wa-. Важно, что данный типологический параметр независим от предыдущего, то есть ролевая кодировка может осуществляться не только морфемами в составе имен, но и морфемами в составе глагола. Так, в примерах (3–4) выше японский язык является зависимостно-маркирующим и аккузативным, а абхазский — вершинно-маркирующим и эргативным; в примерах (6–7) годоберинский язык — зависимостно-маркирующий и эргативный, а лахота — вершинно-маркирующий и агентивно-пациентивный. Помимо морфологической ролевой кодировки возможна также ролевая кодировка посредством порядка составляющих (напр., в английском языке). Возможно множество более сложных случаев двойного и варьирующего кодирования. 13.4.5. Базовый порядок слов. Базовый порядок слов традиционно рассматривается как важнейший типологический параметр. Дж. Гринберг (Greenberg 1963) ввел типологию из 6 теоретически возможных базовых порядков основных составляющих предикации (S, O и V) и рассматривал их корреляции с другими грамматическими явлениями. «Базовый» порядок означает либо наиболее частотный в текстах на данном языке, либо прагматически наименее маркированный. Наиболее частые порядки в языках мира: SOV, SVO, VSO. Изредка встречаются также VOS, OVS и, с некоторыми сомнениями, OSV. Необходимо подчеркнуть, что символы S и O используются в типологии порядка слов особым образом. Они обозначают семантические сущности, а именно ‘агенс или агенсоподобный аргумент’ и ‘пациенс или 304 А. А. Кибрик, Ю. Б. Коряков пациенсоподобный аргумент’, соответственно. Символ V следует понимать как ‘глагольный предикат’. М. Митун (Mithun 1987) указала на неуниверсальность данного типологического параметра — в некоторых языках идентифицировать его объективно невозможно. М. Драер (Dryer 1997) предложил расщепить данный параметр на два и типологизировать языки, во-первых, как SV/VS, а во-вторых, как OV/VO. В течение ряда лет студенты ОТиПЛа выполняют самостоятельные описания в русской Википедии различных языков мира по схеме, включающей в том числе перечисленные пять типологических параметров 5. Подробнее об этих, а также о других типологических параметрах см. главу 15 в наст. изд. 13.5. Интегральная наука о языковом разнообразии В качестве основы для обсуждения в этом разделе мы будем использовать схему на рис. 13.1. На этой схеме изображен треугольник, в вершинах которого обозначены традиционные дисциплины, изучающие языковое разнообразие: генеалогическая лингвистика, ареальная лингвистика и типология. Для каждой из этих дисциплин также указано ее основное теоретическое понятие — языковая семья, языковой ареал и типологический параметр, соответственно. На ребрах треугольника помечены научные понятия, возникающие на попарных стыках между тремя дисциплинами. Эти стыковые понятия мы далее и обсудим. 13.5.1. Генеалогическая плотность ареала. Важнейшее понятие, возникшее на стыке генеалогической и ареальной лингвистики — генеалогическая плотность ареала (Austerlitz 1980; Nichols 1990, 1992). Г е н е а л о г и ч е с к а я п л о т н о с т ь а р е а л а — количество языковых семей на единицу площади (напр., на миллион кв. миль). Это чрезвычайно важная характеристика, по которой различные ареалы различаются совершенно радикальным образом. Исходное наблюдение Р. Аустерлица состояло в том, что Америка характеризуется гораздо большим числом языковых семей, чем Евразия, при существенно меньшей площади. Согласно количественным данным Николс, Старый Свет имеет генеалогическую плотность 1.5, а Новый Свет — 10.6. Северная Евразия имеет плотность 1.3, а такая замкнутая зона, как Калифорния — 34.1. Самая высокая генеалогическая плотность отмечена в Новой Гвинее — там она достигает 88.8! Эти и другие данные из книги Nichols 1992 5 https://ru.wikipedia.org/wiki/ Проект:Лингвистика/Студенческие_задания. 13. Языки мира и языковое разнообразие 305 Рисунок 13.1. Три дисциплины, исследующие языковое разнообразие, их основные понятия, а также понятия на стыках между ними приведены в таблице 13.2 — для всех трех гиперареалов, для ряда макроаре алов, для некоторых замкнутых и протяженных зон. Легко видеть, что такие ареалы, как Новая Гвинея, Мезоамерика или Калифорния по генеалогической плотности превосходят, к примеру, Северную Евразию во многие десятки раз. Объяснения подобных различий, предлагаемые Николс, носят отчасти физико-географический характер. Так, низкие широты, водные преграды и горы — факторы, способствующие большему генеалогическому разнообразию. 13.5.2. Типологическая однородность языковой семьи. Далее, на стыке генеалогической лингвистики и типологии формируется понятие т и п о л о г и ч е с к о й о д н о р о д н о с т и я з ы к о в о й с е м ь и. Понятно, что с течением времени родственные языки могут типологически все дальше расходиться между собой. Например, английский и русский языки по ряду основных типологических параметров относятся к разным классам. В частности, в отличие от русского и других консервативных индоевропейских языков, английский язык перешел от синтетического типа выражения грамматических значений к аналитическому и от зависимостного локуса маркирования в клаузе к нулевому. Cовременный русский язык типологически гораздо ближе, чем английский, например, к латыни — языку, существовав- 306 А. А. Кибрик, Ю. Б. Коряков Ареал Весь мир Старый свет Тихоокеанский Регион Новый Свет Северная Евразия Новая Гвинея Северная Америка Мезоамерика Южная Америка Замкнутые зоны Кавказ Калифорния Протяженные зоны Европа Центр Северной Америки Число семей Генеалогическая плотность 249 46 46 157 4,8 1,5 14,1 10,6 18 27 50 14 93 1,3 88,8 6,6 28,0 13,6 6 14 16,1 34,1 6 8 1,6 2,5 Таблица 13.2. Сравнительная генеалогическая плотность ареалов (в расчете на миллион квадратных миль), согласно Nichols 1992 шему 2000 лет назад. Существует точка зрения (А. А. Зализняк, устное сообщение), что арабский язык (даже современные его диалекты) в некоторых отношениях грамматически более консервативен, то есть ближе к прасемитскому архетипу, чем аккадский язык XXII в. до н. э. В целом очевидно, что скорость грамматических изменений у различных членов языковой семьи может быть очень различной. И, соответственно, степень типологической однородности языковой семьи тоже может оказаться весьма разной. Причины различий в скорости изменений могут быть разнообразны. Слабо изучен вопрос о том, есть ли внутриязыковые, структурные факторы устойчивости/изменчивости. Однако ясно, что есть внешние факторы такого рода — например, количество контактов с другими языками. С одной стороны, типологическая однородность семьи может быть нарушена влиянием языков другой семьи. Так, гагаузский язык утратил общетюркский порядок слов SOV и перешел к порядку SVO, очевидно под влиянием окружающих его индоевропейских языков. С другой стороны, типологическая однородность семьи может укрепляться благодаря длящимся контактам между языками данной семьи, которые, в свою очередь зависят от многих факторов, особенно географических. Примером, опять же, могут быть тюркские языки, которые постоянно соприкасались друг с другом на протяжении своей истории; это связано с их распространением в протяженной зоне — евразийской 13. Языки мира и языковое разнообразие 307 степи. Тем не менее, нужно отметить, что количество контактов с другими языками — не абсолютный фактор. Так, например, индейцы навахо за несколько столетий преодолели много тысяч километров на пути из западной Канады к своему нынешнему месту проживания (юго-запад США), но их язык не приобрел лексических заимствований из других индейских языков, не говоря уж о грамматическом влиянии. 13.5.3. Языковые контакты, конвергенция и диффузия. На стыке ареальной лингвистики и типологии находится проблематика языковых к о н т а к т о в. Языки влияют друг на друга, и трудно найти язык, который не подвергся бы влиянию каких-то других языков. В последнее время становится ясно, что языковые контакты — это одна из центральных проблем современной лингвистики. Языковые контакты осуществляются в головах двуи многоязычных людей. Поэтому языковые контакты должны исследоваться в широком социолингвистическом, психолингвистическом и даже нейролингвистическом контексте. В рамках узкой лингвистики, однако, о языковых контактах обычно говорят в довольно абстрактном духе, как если бы языки были самостоятельными сущностями, взаимодействующими между собой. Наиболее традиционно в этой области понятие я з ы к о в о г о с о ю з а. Это метафорическое понятие было предложено Н. С. Трубецким (1923) и обозначает благоприобретенное структурное сходство неродственных (точнее, необязательно близкородственных) языков, распространенных на смежных территориях. Языковой союз подразумевает наличие не единичных, а множественных и существенных сходств между языками. Трубецкой предложил идею балканского языкового союза, в который входят языки славянской, романской, греческой и албанской ветвей индоевропейской семьи. Другие примеры — поволжский, балтийский, кавказский языковые союзы и т. д. Один из наиболее ярких примеров большого языкового союза представляют собой изолиру ющие и аналитические языки Юго-восточной Азии — этот союз объединяет языки по крайней мере четырех языковых семей. Процессы, приводящие к формированию языковых союзов, являются частным случаем з а и м с т в о в а н и я. Но в отличие от обычных лексических заимствований, в данном случае речь идет о грамматических заимствованиях, оказывающих влияние на всю структуру языка. Судя по всему, «языковой союз» — это слишком сильная метафора, навязывающая идею незыблемого членства языков в таком союзе, подобно тому как державы входят в эксклюзивные военные союзы. В реальности обычно наблюдается сложная сеть взаимовлияний языков, иногда ограничива 308 А. А. Кибрик, Ю. Б. Коряков ющихся парой соседних языков, а иногда охватывающих большие ареалы. Поэтому часто предпочитают говорить о к о н в е р г е н т н ы х зонах (Weinreich 1958) или языковых ареалах — в данном смысле это словосочетание было использовано применительно к индийскому субконтиненту М. Эмено (Emeneau 1956) и К. Масикой (Masica 1976); отметим, что в этом случае термин «языковой ареал» используется в более частном смысле, чем выше его определили мы. В последнее время о взаимосближении географически смежных языков иногда говорят в терминах химической метафоры: при языковых контактах происходит д и ф ф у з и я грамматических явлений из одного языка в другой и обратно. Понятие диффузии является более общим, нежели понятие языкового союза, а химическая метафора представляется более адекватной, нежели военная. В результате диффузии по прошествии больших интервалов времени может оказываться, что неродственные языки одного ареала типологически ближе друг к другу, чем к родственным языкам, находящимся в других ареалах. Фундаментальный вопрос в области ареальной типологии — различение параллельного развития в языках как результата диффузии vs. как резуль тата внутриязыковых/универсальных/когнитивных принципов. Например, многие западноевропейские языки проделали эволюцию от синтетизма к аналитизму, и весьма правдоподобно объяснить этот параллелизм межъязыковыми влияниями. Однако нельзя исключить, что возможность такого развития была уже заложена в архаичном индоевропейском языковом типе — ср. аналогичное развитие в ряде индоиранских и южнославянских языков. Следует отметить, что влияние одного языка на другой возможно и без ареального контакта, а дистантно. Это всегда связано с особой культурной значимостью того или иного языка. Так, дистантное влияние на другие языки оказывала латынь, а в последнее время — английский язык. Конвергенция языков в результате контактов — явление, в некотором смысле обратное традиционному представлению о дивергенции, идущему из XIX в. Важно, что конвергенция на территориальной основе в принципе независима от генеалогического родства языков. Конвергенции подвергаются как родственные, так и неродственные языки. Однако конвергенция протекает по-разному в зависимости от наличия и степени языкового род ства. В случае близкородственных языков или диалектов, сохраняющих некоторую степень взаимопонятности, возможно особенно массовое заим ствование лексики и грамматических черт — это, например, произошло с восточнославянским украинским языком, подвергшимся существенному влиянию западнославянского польского языка. В случае отдаленного род 13. Языки мира и языковое разнообразие 309 ства, исключающего взаимопонятность, но сохраняющего определенную типологическую близость языков, также имеется возможность для диффузных влияний — например, одной из конституирующих черт балканского языкового союза считается постпозитивный определенный артикль (в болгарском, румынском и албанском языках), развивающийся из указательного местоимения (материально нетождественного в разных языках). Языки, вообще не родственные между собой, также способны к конвергентному сближению (ср. уже упоминавшиеся семьи Юго-восточной Азии). Иногда, однако, тип грамматической структуры препятствует иноязычным влияниям. Например, глагольная морфология атабаскских языков Сев. Америки устроена настолько своеобразно, что исключает возможность заимствования не только грамматических моделей, но и глагольных лексем. Крайним случаем влияния одного языка на другой является ситуация, когда один из языков полностью замещает второй в некоторой популяции. При этом исчезнувший язык может оставить некоторые следы (так называемый субстрат) в «победившем» языке. Например, некоторые черты французского языка (в частности, наличие губных переднеязычных гласных) иногда объясняют субстратом галльского языка (кельтская группа). Современные широкомасштабные типологические исследования непременно включают географический компонент. Это связано с тем, что типологические обобщения относительно языков Земли в целом могут базироваться только на корректно сформированной выборке языков. Современные выборки, включающие по несколько сотен языков, создаются таким образом, чтобы исключить перекос в пользу тех или иных языков — более хорошо описанных, принадлежащих к той или иной языковой семье, а также принадлежащих к тому или иному ареалу. Например, в корректной выборке не должно быть завышенного представительства языков Европы; напротив, в идеальном случае папуасские языки Новой Гвинеи должны быть представлены в той же степени, что и европейские языки. 13.5.4. Стабильность. Схема на рис. 13.1 содержит еще один элемент, который пока не был обсужден. Это г е н е а л о г и ч е с к а я и а р е а л ь н а я с т а б и л ь н о с т ь т и п о л о г и ч е с к о г о п а р а м е т р а — ключевое понятие интегральной науки о языковом разнообразии, предложенное в работе Дж. Николс (Nichols 1992). Это понятие связывает все три области — типологическую, генеалогическую и ареальную лингвистику. В табл. 13.3 приведены данные Николс относительно стабильности таких фундаментальных типологических параметров, как локус маркирования, тип ролевой кодировки и порядок слов, а также нескольких других параметров. 310 А. А. Кибрик, Ю. Б. Коряков Локус маркирования Ролевая кодировка Порядок слов Морфологическая сложность Повышение/понижение переходности Наличие инклюзива/эксклюзива Наличие неотторжимой принадлежности Наличие именных классов Генеалогическая стабильность Ареальная стабильность + + – + ± + – + + – + + – ± ± ± Таблица 13.3. Типологические параметры и их стабильность (по Nichols 1992: 181) Из табл. 13.3 легко видеть, например, что ролевая кодировка устойчиво сохраняется в языковых семьях и не подвержена контактным ареальным влияниям, а порядок слов демонстрирует обратные свойства. Другие параметры имеют более сложный профиль с точки зрения генеалогической и ареальной стабильности. Конечно, помимо вопроса о стабильности типологического параметра, наука о языковом разнообразии исследует и другие проблемы. Так, ареалы различаются с точки зрения своей типологической гомогенности. Высокое структурное разнообразие обычно сочетается с высокой генеалогической плотностью (особенно в Тихоокеанском регионе и в Новом Свете). Николс (Nichols 1992) приводит данные о преобладающих грамматических типах и категориях для каждого из макроареалов — например, базовый порядок слов с конечной позицией глагола подавляющим образом доминирует в Новой Гвинее и на востоке Сев. Америки, а в Мезоамерике самым частым оказывается порядок с начальным глаголом. Николс описывает три типа диахронических изменений, влияющих на разнообразие языковой популяции: повышение разнообразия (Новый Свет), стабилизация (Европа, центральная и южная Австралия) и вымирание языков (под влиянием новых волн колонизации). Результирующее языковое разнообразие в значительной степени является функцией географических факторов, в частности, размера территории. Исследование географического распределения языкового разнообразия — необходимая предпосылка для содержательной типологии языков и для реконструкции древнейшей языковой истории Земли. 13. Языки мира и языковое разнообразие 311 13.6. Диахронический аспект языкового разнообразия Понимание современного языкового разнообразия возможно только в контексте диахронических процессов, которые к этому разнообразию привели. Здесь будут рассмотрены несколько групп проблем, связанных с диахронией. 13.6.1. Формирование вида Homo sapiens. В современной антропологии принято выделять несколько биологических видов, являющихся непо средственными предшественниками современного человека. Родиной всех этих видов был один и тот же континент — Африка. Ранние виды гоминидов жили только в Африке, последующие виды все дальше расселялись по земному шару. Современный Homo sapiens был первым видом, распространившимся за пределы Старого Света. Таблица 13.4 суммирует основные современные представления о предыстории Homo sapiens; см. также Дробышев ский 2017. Возникновение в Африке, лет назад австралопитек Homo habilis Homo erectus архаичный Homo sapiens («неандерталец») современный Homo sapiens («кроманьонец») 5–7 млн. Объем мозга, см3 Предел распространения, лет назад Выдающиеся достижения 400–530 каменные орудия 1.8 млн. 800–1000 700 тыс. — вост. Азия освоение огня краски; похоронные 400–200 тыс. 1100–1400– всюду вытеснил (до 30 тыс.) 1750 Homo erectus обряды; язык?? Азия: 50–90 тыс. Европа: 40 тыс. 130–280 тыс. 1200–1760 Австралия: 40–60 тыс. Америка: 12–40 тыс. 2.5–2 млн. 600–800 Таблица 13.4. Краткая предыстория формирования вида Homo sapiens Комментарии к табл. 13.4 1. Диапазон датировок связан с разногласиями между данными археологии, палеонтологии и генетики, а также с потенциальной ошибкой физических методов типа радиоуглеродного анализа. Для современного человека цифра 130 тыс. лет основана на палеонтологических данных. Генетические критерии требуют большей временной глубины: 130 тыс. лет недостаточно для того, чтобы объяснить совре менное генетическое разнообразие (исходя из презумпции моноцентризма — воз- 312 А. А. Кибрик, Ю. Б. Коряков никновения современного человека в одной популяции). С развитием науки датировки имеют тенденцию углубляться. 2. Объем мозга в определенной мере коррелирует с интеллектуальными возможностями данного вида. 3. «Неандерталец» — европейский вариант архаичного Homo sapiens. Архаичный Homo sapiens и Homo erectus в течение неоторого периода времени сосуществовали, затем первые вытеснили вторых, вероятно в результате длительной борьбы. Архаичный Homo sapiens, по косвенным данным, мог обладать языком. 4. Архаичный и современный Homo sapiens также сосуществовали в течение нескольких десятков тысяч лет. Примерно 30 тыс. лет назад архаичные люди были полностью вытеснены современными людьми. 13.6.2. Хронология заселения Земли человеком. Современные представления о последовательности и хронологии распространения человека и языка по земному шару, которая привела к современному языковому разнообразию, показаны на рис. 13.2. На рис. 13.2 древнейшие человеческие миграции условно сгруппированы в виде трех основных дуг, или маршрутов. Древнейший южный маршрут пролегал в области экваториально-тропического климата и не требовал при- Рисунок 13.2. Предполагаемые пути заселения земного шара современным человеком, с приблизительным указанием временной глубины некоторых миграций (в тыс. лет до настоящего времени) 13. Языки мира и языковое разнообразие 313 способления к принципиально иным климатическим условиям. Этот маршрут завершился в Австралии, продвинуться дальше не позволил Тихий океан. Западная дуга датируется наиболее точно, посколько европейская археология наиболее развита. В Европу современный человек попал 40 тыс. лет назад. Восточная дуга связана с освоением северной Азии и далее Америки. Заселение Америки — наиболее дебатируемый вопрос в сфере древнейшего освоения Земли человеком. Большинство современных исследователей считает наиболее реалистической гипотезу, согласно которой заселение Нового Света происходило из Азии через зону Берингии, а в Южную Америку человек попал из Северной. Однако периодически появляются гипотезы о заселении Южной Америки древними мореплавателями, непосредственно пересекавшими Атлантический или Тихий океан. 13.6.3. Генеалогическая классификация языков. Несмотря на то, что генеалогическая лингвистика — один из самых старых, уважаемых, сложившихся и даже, можно сказать, точных разделов лингвистики, тем не менее разброс взглядов в области генеалогической классификации языков чрезвычайно велик. Взгляды расходятся практически во всем — и в методологии, и в моделях генеалогического родства, и в конкретных представлениях о тех или иных семьях. Конечно, существует консенсус в отношении большого числа языковых семей. Практически такой консенсус есть в отношении семей, временная глубина которых оценивается не более чем в 6–8 тысяч лет. Когда речь идет о более глубоких объединениях, как правило возникают значительные расхождения. Для одних лингвистов алтайская макросемья (включающая по крайней мере тюркские, монгольские и тунгусо-маньчжурские языки) — очевидность, всего лишь один элемент гораздо более объемного ностратического объединения, для других — недостоверная или даже неверная гипотеза. Мы считаем оправданным употребление термина «семья», когда по этому поводу есть консенсус среди специалистов. Классическая модель языковой семьи — это древесная модель, показанная на рис. 13.3. Рисунок 13.3. Традиционная модель языковой семьи: генеалогическое древо 314 А. А. Кибрик, Ю. Б. Коряков В генеалогическом древе линии, вышедшие из верхнего узла, больше никогда не пересекаются. В отличие от той области, из которой взята метафоры семьи — из человеческой генеалогии, — у языков в генеалогическом древе только один родитель. Картина, которая предполагается как нормальная, состоит в том, что язык расщепляется на несколько потомков, и такое расщепление является четким и ясным. К примеру, такие ветви индоевропейской семьи, как армянская и кельтская, несомненно происходящие от одного предка, некогда разошлись в пространстве и более никогда не встречались. Традиционная древесная модель, действительно, достаточно хорошо описывает некоторые языковые семьи или по крайней мере их части. В первую очередь это относится к крупнейшей по числу языков (более 1200) языковой семье мира — австронезийской. Эта семья распространена на островах Индийского и Тихого океанов. Австронезийцы постепенно мигрировали на восток в глубину Тихого океана, и популяция, занявшая новый остров, уже была лишена постоянных контактов с популяциями, жившими на других, отдаленных островах. Раз разошедшиеся ветви дерева больше не пересекались. Достаточно хорошо древесная модель описывает и некоторые другие семьи, члены которых в силу тех или иных географических обстоятельств утратили возможность удобного и постоянного контакта между собой. В то же время, имеется большое количество данных по разным языковым семьям, показывающих, что древесная метафорическая модель часто (если не как правило) дает сбой. Дело в том, что при отсутствии затрудня ющих контакты географических факторов территориальные границы между соседними этническими группами являются постепенными, и в результате этого границы между языками тоже недостаточно четки. Формирование континуальных границ между языками может быть вкратце описано следующим образом. Предположим, в силу каких-то исторических обстоятельств языковая группа Х разделилась на две группы Х1 и Х2. Через несколько поколений между идиомами Х1 и Х2 сформировалось определенное количе ство систематических различий, позволяющих говорить, что это разные языки или по крайней мере разные диалекты. После этого Х1 и Х2 оказались в длящемся контакте между собой. Так как Х1 и Х2 были близки и между их носителями была возможность взаимопонимания, между Х1 и Х2 происходила диффузия (либо в одну, либо в обе стороны). Через несколько поколений оказалось, что между Х1 и Х2 возникли переходные диалекты, которые имеют часть общих черт с Х1, часть с Х2. Такого рода «перекрестное опыление» между близкородственными языками — исключительно частое явление, которое подрывает древесную модель генеалогического родства. От такого 13. Языки мира и языковое разнообразие 315 рода фактов невозможно абстрагироваться как от досадного недоразумения, портящего стройную картину; см. Иванов 1990. Простой пример — граница между русским и украинским языками. Каждый из этих языков имеет некоторое ядро, хорошо определимый прототип. Но переходные диалекты имеют много общих свойств и с русским, и с украинским, и в ряде случаев решение вопроса о том, к какому из языков отнести данный диалект, может оказаться невозможным без определенной степени произвола. В тюркологии, хотя эта одна из наиболее развитых частных лингвистических традиций, нет общепринятой древесной классификации языков. Это связано с объективными трудностями. Среди тюркских языков выделяются не подгруппы, а скорее прототипы, которые возникли на раннем этапе эволюции тюркской семьи и затем продолжали беспрерывно скрещиваться. В результате они в разных пропорциях представлены в современных тюркских языках. Попытка применения древесной концепции к тюркской семье приводит к парадоксальному результату. Тюркологи обычно выделяют в тюркской семье, в частности, огузскую и кыпчакскую группы. Некоторые языки являются бесспорно кыпчакскими (или «в основном» кыпчакскими), другие — бесспорно огузскими. Иногда ситуация оказывается намного сложнее. Так, безусловно единый крымскотатарский язык имеет несколько диалектов. Но, согласно некоторым авторам, северный диалект крымскотатарского относится к кыпчакской группе, а южный — к огузской (Изидинова 1997: 299). Объясняется это тем, что северный диалект находился в тесном контакте с кыпчакскими языками Северного Кавказа и причерноморских степей, а южный — с турецким языком (огузская группа). Тем самым, группы в тюркской семье есть, но сказать про конкретный язык, к какой из этих групп он относится, невозможно. В результате тюркское дерево, если попытаться его изобразить, выглядит достаточно странно, не древообразно — см. рис. 13.4. Рисунок 13.4. Парадоксальный результат применения древесной модели к фрагменту тюркской языковой семьи. 316 А. А. Кибрик, Ю. Б. Коряков Такого рода ситуации неискоренимы во множестве языковых ареалов. К примеру, атабаскские языки Аляски не поддаются разделению на подгруппы, ибо общие черты между ними распределены слишком сложным образом. На Аляске налицо ситуация многомерного диалектного континуума. В таких случаях попытка навязать классическую древесную модель нереалистична, и необходима более адекватная континуальная модель, которую еще предстоит создать. Еще большие трудности возникают при попытке классификации языков Новой Гвинеи. Там под вопросом оказывается уже само понятие языкового родства. На Новой Гвинее часто имеет место следу ющая ситуация. В соответствии с принятыми методами генеалогического сопоставления, соседние языки А и Б оказываются достаточно близко род ственными, поскольку имеют большой общий лексический фонд. Пары соседних языков Б и В, В и Г, Г и Д точно так же близко родственны. Но языки А и В, территориально не смежные друг с другом, уже находятся в отношении менее близкого родства, а языки А и Д могут оказаться вовсе неродственными. Таким образом, «лобовое» применение традиционной древесной модели заводит в тупик — отношение генеалогического родства оказывается не транзитивным. Такого рода ситуации представляют большую проблему для современной генеалогической лингвистики. Необходимо иметь в виду, что для многих языковых семей древесная классификация является весьма огрубленным представлением реальности. Тем не менее, в силу своей простоты и привлекательности древесная модель продолжает широко употребляться. 13.7. Заключение. Социолингвистика. Смежные науки Исследование языкового разнообразия невозможно без учета социолингвистики — науки, изучающей, как язык функционирует в обществе. Для иллюстрации этого утверждения приведем два наблюдения. Во-первых, влияние одного языка на другой не обязательно имеет географическую основу (т. е. смежность территорий, на которых эти языки распространены). Например, русский язык подвергался влиянию старославянского, немецкого, французского, но ни с одним из непосредственных ареалов распространения этих языков русская территория не граничила. Во всех случаях влияние было вызваны высоким социальным престижем соответствующего языка и/ или его носителей, приезжавших на территорию России. В настоящее время английский язык влияет на большинство языков мира, и это происходит не благодаря, а вопреки географическим обстоятельствам. В любом случае языковые влияния происходят не непосредственно между языками, а через сознание говорящих на них людей. Основным механизмом межъязыковых влияний является двуязычие. 13. Языки мира и языковое разнообразие 317 Во-вторых, вопреки географическим обстоятельствам может наблюдаться и единство языка или диалекта (отсутствие дальнейшего диалектного дробления). Несмотря на географическую разбросанность групп говорящих, значительная однородность описывается для того диалекта языка идиш, который был распространен в немецкоговорящих странах, а также для современного диалекта чернокожих американцев (Black English), характерного для большей части территории США. В этих случаях социально-этническая близость групп говорящих оказывалась более сильным фактором, чем географическое расстояние. Таким образом, географическая смежность/ разделенность — лишь один из факторов, влияющих на языковые контакты и языковые изменения. Анализ языкового разнообразия с необходимостью должен включать такие социолингвистические явления, как социальная значимость языка, жизнеспособность языка, языковой сдвиг, функциональный статус, двуязычие, поддержание и возрождение языков. См. Беликов, Крысин 2001, а также главу 16 в наст. изд. В частности, социальная значимость языка может оцениваться при помощи такого количественного измерения, как число говорящих на нем людей. При этом важно учитывать, считаем ли мы только тех, кто говорит на данном языке как на родном или первом, или всех, владе ющих данным языком, в т.ч. как вторым или третьим. Списки наиболее распространенных языков, в соответствии с этими двумя подходами, представлены в табл. 13.5, 13.6. Данные представлены на 2017 год на основе Коряков 2018: 7. Место 1 2 3 4 5 6 7 8 9 10 Язык китайский испанский английский хинди арабский бенгальский португальский русский панджаби японский Число говорящих, млн. чел. 1326 472 385 375 325 248 223 153 147 125 Комментарии вкл. все китайские языки вкл. урду вкл. все арабские языки вкл. лахнда Таблица 13.5. Десять самых распространенных языков мира (по числу говорящих как на родном) 318 А. А. Кибрик, Ю. Б. Коряков Место Язык Число говорящих, млн. чел. 1 2 3 4 5 6 7 8 9 10 китайский английский хинди испанский арабский французский бенгальский русский португальский малайский 1407 1290 723 545 378 275 269 261 255 247 Комментарии вкл. все китайские языки вкл. урду вкл. все арабские языки вкл. индонезийский Таблица 13.6. Десять самых распространенных языков мира (по общему числу говорящих) В дальнейшем взаимовлияние основных лингвистических дисциплин, изучающих языковое разнообразие, и социолингвистики, будет лишь расти. Стоит упомянуть такую область, как социолингвистическая типология (ср. Trudgill 2011). Это направление исследований задается вопросом о том, как различные социальные явления порождают те или иные языковые явления. При обсуждении языкового разнообразия необходимо привлекать данные смежных наук, вовсе лежащих за пределами лингвистики. Рассмотрим этот тезис на примере проблемы заселения Америки — проблемы, которая наиболее активно обсуждается во всех науках, занимающихся реконструкцией древней истории человека. Америка — наименее изученная с данной точки зрения часть света, к тому же максимально географически отделенная от Старого Света. Активные дебаты на тему заселения Америки ведутся в направлении согласования между данными разных наук. Объяснить процесс заселения Америки и очень большое разнообразие языков Нового Света невозможно, не учитывая г е о г р а ф и ч е с к и х обстоятельств. Конкретизировать сценарий миграции из Азии в Америку через Берингию можно, используя данные г е о л о г и и и п а л е о к л и м а т о л о г и и. С 22 тыс. лет назад вход в основную часть Северной Америки был перекрыт сплошным ледниковым щитом. Примерно 14 тыс. лет назад этот ледник разделился надвое, и между этими двумя частями возник протянувшийся с севера на юг коридор, который могли использовать азиатские мигранты. Подобные сведения могут если не доказать тот или иной сцена- 13. Языки мира и языковое разнообразие 319 рий заселения Америки, то по крайней мере отвергнуть какие-то теоретические сценарии. Самые непосредственные свидетельства о прошлом человеческих популяций и языков дает а р х е о л о г и я. Археологи обнаруживают следы присутствия человека, которые датируются при помощи метода радиоуглеродного анализа и других естественно-научных методов. Если на некоторой территории обнаружены следы присутствия человека с временной глубиной х, значит, х лет назад здесь уже был человек. В Америке долгое время на обнаруживалось достоверных находок старше 12 тыс. лет и, соответственно, предполагалось, что ранее этого времени Америка и не была заселена. С учетом упомянутых выше геолого-климатических фактов, это означает, что первые люди должны были проникнуть в Америку не ранее, чем 13–14 тыс. лет назад. Позже проблема осложнилась тем, что на территории Чили была обнаружена более древняя, чем в Северной Америке, стоянка человека. Если верить гипотезе о проникновении в Северную Америку 13–14 тыс. лет назад, то древний человек должен был за 1000 лет пройти расстояние в 13 600 км, пересекая при этом все существующие на земле климатические зоны. В последнее время лингвисты также получили возможность внести вклад в эти дебаты. На основе засвидетельствованных скоростей миграций древних людей Дж. Николс (Nichols 2000) подсчитала, что распространение от Аляски до Чили должно было занять по крайней мере 8,5 тыс. лет. Кроме того, одна волна иммиграции в Америку 13–14 тыс. лет назад не в состоянии объяснить то генеалогическое разнообразие, которое имеется в Америке. По мнению Дж. Николс, для объяснения лингвистических фактов необходимо признать, что первая волна иммиграции должна была иметь место 28– 42 тыс. лет назад, и таких волн было несколько. Возможно, в процессе этой миграции генеалогическое разнообразие Евразии было во многом «перекачано» в Америку. В последние годы появились археологические данные о присутствии человека в Америке 16 тыс. лет назад. Это может означать, что человек проник в Америку до оледенения. Альтернативное объяснение состоит в том, что даже в период оледенения могли быть отдельные отрезки тихоокеанского побережья, доступные для локального перемещения по морю и пригодные для проживания людей. В целом датировка первого заселения Америки человеком постоянно углубляется. В частности, п о п у л я ц и о н н ы е г е н е т и к и в настоящее время называют такие даты, как 20, 30 и даже 40 тыс. лет назад. Другие смежные науки, также участвующие в создании сценариев распространения человека по миру — п а л е о н т о л о г и я и а н т р о п о л о г и я . Таким 320 А. А. Кибрик, Ю. Б. Коряков бразом, общая картина расселения человека по земле и формирования о современного языкового разнообразия может быть создана только совместными усилиями всех наук, занимающихся данными вопросами. Список сокращений Аг — агенс Акк — аккузатив Дат — датив Ед — единственное число Ж — женский род Косв — косвенный актант М — мужской род Ном — номинатив Пац — пациенс Ср — средний род Эрг — эргатив 14. Сравнительно-историческое языкознание С. А. Бурлак Сравнительно-историческое языкознание — раздел лингвистики, занимающийся сравнением языков с целью установления их родства, построения генеалогических классификаций языковых семей, а также реконструкции незасвидетельствованных языковых состояний. Языки все время изменяются, на месте старых появляются новые, подчас совершенно не похожие на те, что были в употреблении раньше. Но все же в языках сохраняется немало следов прошлого, так что, анализируя их и зная закономерности языкового развития, можно довольно многое узнать о языках, на которых говорили в прежние времена (а через них — и о жизни народов, на них говоривших), выяснить, какие языки с какими в родстве и насколько близком. Пререквизиты: Теория языка (все главы); Языки Социолингвистика; Когнитивная лингвистика. мира и языковое разнообразие ; 14.1. Доказательство языкового родства 14.2. Этимология 14.3. Генеалогическая классификация языков 14.4. Реконструкция Литература для дальнейшего чтения: Бурлак, С.А. Старостин 2005; Г.С. Старостин 2013a; Campbell 2004; Hock, Joseph 1996; Dybo, G.S. Starostin 2008; Gell-Mann, Peiros, G.S. Starostin 2009; С.А. Старостин 2007. Научно-популярная литература: Г.С. Старостин и др. 2016; Зализняк 2000; Зализняк 2012; Касьян 2012; Касьян 2015; Г.С. Старостин 2015. 14.1. Доказательство языкового родства Первейшей задачей сравнительно-исторического языкознания является доказательство языкового родства — без этого невозможны ни построение генеалогической классификации, ни праязыковая реконструкция. Согласно определению, предложенному А. Мейе, «два языка называются родственными, когда они оба являются результатом двух различных эво- 322 С. А. Бурлак люций одного и того же языка, бывшего в употреблении раньше» (Мейе, 1907/1938: 50). Такой подход позволяет не только обнаруживать языковое родство, но и делать выводы о дописьменной истории народов — о времени, когда жили носители языка-предка, о том, в каких природных условиях они жили, с какими народами контактировали, каков был уровень их технологического и социокультурного развития, в идеале — указать соответствующую им археологическую культуру. Для того, чтобы пользоваться определением Мейе, необходимо четко представлять себе, что представляет собой языковое тождество и различие и как происходит языковая эволюция. С точки зрения синхронной лингвистики тождество языка обеспечивается тождеством его словаря и грамматики, но для лингвистики диахронической это не так: например, русский язык времен «Слова о полку Игореве» (XII в.) и современный русский язык с синхронической точки зрения различны, а с диахронической — тождественны, это разные этапы эволюции одного и того же языка. Любой язык постоянно изменяется. Ключевым фактором этого является такое свойство языка, как избыточность. В языке всего настолько много, что его невозможно выучить полностью, каждый носитель выучивает лишь какую-то часть — и этого оказывается достаточно, чтобы получить полноценную коммуникативную систему. Избыточность бывает двух типов — парадигматическая (для любых языковых элементов может существовать несколько возможных вариантов: можно по-разному произносить звуки, ставить ударение, пользоваться синонимами и перифразами и т. д.) и синтагматическая (одна и та же информация передается несколько раз, например, фонетические характеристики согласного проявляются не только на нем самом, но и на соседствующих с ним гласных, сказуемое несет на себе некоторые характеристики подлежащего и т. д.). Синтагматическая избыточность позволяет слушающему понимать высказывания, где некоторые элементы отличается от привычных: остальных элементов оказывается достаточно для того, чтобы слушающий мог (в большинстве случаев правильно) восстановить коммуникативное намерение говорящего. Это и позволяет языку меняться — но меняться не слишком быстро, так, чтобы в каждый данный момент времени изменения, затрагивающие любое конкретное высказывание, могли быть скомпенсированы избыточностью. Эволюция языка (и не только его) представляет собой процесс изменения частотностей: какое-то слово, или способ произношения, или словообразовательная модель, или синтаксическая конструкция, или любой другой элемент языка уступает часть своих употреблений конкурирующему эле- Сравнительно-историческое языкознание 323 менту (например, на месте мягкого ш начинает иногда произноситься твердое), с течением времени соотношение частотностей меняется, направление этих изменений также может меняться со временем, так что в начале процесса изменения можно видеть достаточно хаотические колебания частотностей. Возможно, частотность нового элемента снизится до нуля, а возможно, достигнет уровня, при котором возникнет пороговый эффект: частотность этого элемента очень резко вырастет (на графике это будет выглядеть как S-образная кривая), и он вытеснит своего конкурента (так, например, в русском языке твердое ш вытеснило мягкое). Люди, говорящие на языке, хорошо осознают владение словами: они понимают, что одни слова им известны, понятны, а другие нет. Но владение фонетикой и грамматикой не осознается, воспринимается как что-то само собой разумеющееся, и нарушения в этих областях в меньшей степени препятствуют пониманию, чем замены слов или употребление их в незнакомых значениях. Поэтому, когда люди стремятся сохранять язык, говорить на том же языке, что их родители, они обращают больше внимание на то, чтобы использовать те же самые слова, чем на то, чтобы сохранять в точности такое же произношение и такую же грамматику. Соответственно, при наследовании языка лексика оказывается более сохранной, чем фонетика или грамматика. Разумеется, это относится не ко всем словам языка, а лишь к тем, которые являются наиболее часто употребляемыми в обыденной жизни и тем самым более привычными. Такие слова нет нужды заимствовать — они уже есть, среди них мало производных (потому что все настолько к ним привыкли, что распознают их как целое, не обращаясь к анализу морфологической структуры, так что после нескольких тысячелетий наследования их внутренняя форма может стать вовсе неразличимой). Пласт слов такого типа, который можно выделить во всех языках, называется б а з и с н о й л е к с и к о й (в противоположность прочей части словаря — к у л ь т у р н о й л е к с и к е) — и именно она служит решающим аргументом при доказательстве языкового родства. Языковой знак произволен (т. е. та или иная звуковая оболочка связывается с тем или иным смыслом лишь в силу привычки, традиции), поэтому вероятность того, что обозначения одного и того же в разных языках совпадут случайно, достаточно мала. Если в языках наблюдаются сходства в области лексики, это может быть общим наследием (в случае языкового родства), результатом языковых контактов или просто случайным совпадением (сходства в области фонетики и грамматики могут объясняться и иными причинами), и для того, чтобы доказывать языковое родство, надо уметь различать эти типы сходств. 324 С. А. Бурлак Классический случай языкового наследования выглядит так: дети (во время критического периода, см. главу 9 в наст. изд.) усваивают язык, на котором говорят их родители, в свое время усвоившие его в детстве от своих родителей, также усвоивших его в детстве, и т. д. Но чувствительный период сравнительно невелик, а язык потенциально бесконечен, поэтому детям не удается услышать все слова во всех формах и тем более все возможные предложения. Спасает дело выработавшийся у человека эволюционно механизм формирования порождающих алгоритмов (в применении к языку он работает у всех людей, кроме тех, у кого ген FOXP2 испорчен мутацией, в применении к музыке, стихам, танцам, вышивке и т. п. — у тех, кто получил соответствующее образование и развил соответствующие навыки), позволя ющий после восприятия некоторого количества стимульного материала самостоятельно порождать последовательности, «правильные» с точки зрения соответствующей системы. Механизм этот основан на формировании, усилении и отмирании нейронных связей (см. главу 11 в наст. изд.) и приводит к тому, что, даже если ребенок не в точности воспроизводит ту языковую систему, которой пользуются его родители (а воспроизвести ее в точности не удается никому — просто в силу ее колоссального объема и ограниченности чувствительного периода), те изменения, которые вносятся в нее, оказываются системными. Например, человек, не выговаривающий [л], не выговаривает его во всех словах, независимо от их значения. Впрочем, возможна зависимость от позиции: например, человеку может оказаться проще воспроизвести привычное родителям произношение [л] в позиции перед одними гласными, но не перед другими, или в начале слова, но не в конце, в соседстве определенных согласных или т. п. На этом основан основополагающий для сравнительно-исторического языкознания принцип р е г у л я р н о с т и ф о н е т и ч е с к и х с о о т в е т с т в и й: «Всякое фонетическое изменение, поскольку оно происходит механически, совершается по законам, не знающим исключений, т. е. направление фонетического изменения у всех членов языкового коллектива всегда одинаково, если не считать случая диалектного разделения, и все слова, заключающие подверженный изменению звук в одинаковых условиях, подчиняются ему безо всякого исключения» (Osthoff, Brugmann 1878, цит. по Мейе 1907/1938: 460). Если исследуемые языки происходят от общего языка-предка, между их словами будут непременно наблюдаться регулярные фонетические соответствия — в силу того, что каждое фонетическое изменение, происходившее в каждом из этих языков, было системным. Изменения могут быть значительны (и тем более значительны, чем больше времени успело пройти от момента распада языка-предка), условия могут быть не только фонетическими (в том числе про- Сравнительно-историческое языкознание 325 содическими), но и морфонологическими; для установления языкового род ства важно не сходство, а закономерность различий (ср.: Мейе 1934/1954: 32): если различия закономерны, вероятность случайности снижается. К появлению регулярных фонетических соответствий могут приводить и языковые контакты: если народы долго живут вместе и в каждом из них многие (возможно, даже все) владеют языком другого, но тем не менее по тем или иным причинам не переходят на другой язык, а сохраняют свой (вернее, следят за сохранением слов — а грамматика и фонетика тем временем претерпевают изменения, обусловленные контактным влиянием), формируется привычка передачи слов чужого языка средствами своего. Поскольку слов, переходящих из одного языка в другой, в такой ситуации оказывается много, привычная модель обеспечивает появление регулярных фонетических соответствий: например, на место чужого [w] всегда подставляется свое [v] (или, скажем, перед задними гласными — [v], а перед передними — [v’], несмотря на то, что в языке-источнике различия по твердостимягкости не было). Разница заключается в том, что при наследовании регулярные фонетические соответствия наблюдаются в области базисной лексики, а при контактах — прежде всего в области культурной. При очень интенсивных контактах (особенно при языковом сдвиге — переходе на другой язык) базисная лексика также может оказаться затронута, но унаследованной базисной лексики в любом случае оказывается намного больше, чем заимствованной. Даже в радикальных креолах (см. главу 16 в наст. изд.) не менее 70% слов происходят из одного источника (языка-лексификатора; остальные слова происходят из разных источников) (см. Беликов 2006: 87–89). Поскольку фонетика и грамматика не осознаются, они оказываются более, чем базисная лексика, проницаемы для контактного влияния в случае, когда контакт продолжается долгое время и большинство носителей одного языка владеет также и другим: люди привыкают к обоим способам построения высказываний (в их мозге формируются соответствующие нейронные связи) — и к тому, который характерен для их исконного языка, и к тому, который использует соседний народ. В результате для доказательства языкового родства базисная лексика оказывается более информативной, чем грамматика. Доказательство языкового родства — это, по сути, утверждение, что происхождение рассматриваемых языков из одного общего языка-предка более вероятно, чем альтернативные сценарии. При доказательстве языкового родства в качестве материала лучше брать слова, не имеющие большого количества синонимов, поскольку при сопос- 326 С. А. Бурлак тавлении между собой двух списков из десяти слов сходной семантики (например, со значением «бить», «увеличиваться», «резать, разрушать») шансы, что хотя бы для одного из десяти слов одного языка во втором найдется (по чистой случайности) слово близкой фонетической структуры, больше, чем в случае, если соответствующее значение представлено в каждом из сопоставляемых языков лишь у одной-двух лексем. Для того, чтобы не получать ложные результаты, обусловленные сравнением слов разной семантики, используется лексикостатистический подход: выделяется некоторая выборка значений, входящих в базисную лексику (таких выборок существует несколько; чаще всего используется стословный список М. Сводеша), и для каждого из сравниваемых языков указывается, какими словами передаются в них данные значения. При наличии нескольких кандидатов выбирается тот, который наиболее употребителен, стилистически нейтрален и употребляется в тех контекстах, которые больше всего нужны в повседневной жизни (контексты приведены в статье Kassian et al. 2010). Это соответствует стандартному механизму языкового наследования: ребенок запоминает значения слов, вычленяя их из фраз, что позволяет ему понимать смысл по контексту. Наилучшим образом наследуются слова из тех контекстов, которые чаще всего употребляются в повседневной жизни. Если сопоставляемые языки родственны, слова, выражающие одни и те же понятия, будут связаны регулярными фонетическими соответствиями, причем соответствовать будут не только согласные, но и гласные, и просодические характеристики (ударение и тоны), а если в сопоставляемых языках есть морфология, то и морфологические свойства (например, существительные с одинаковым значением будут относиться к одному и тому же роду, типу склонения). Разумеется, поскольку язык является объектом стохастической природы, в нем не бывает стопроцентно вероятных событий, и иногда происходят индивидуальные изменения слов (что приводит к нарушениям регулярности фонетических соответствий), однако чем больше предположений о подобных нерегулярностях использует гипотеза о языковом родстве, тем вероятнее, что автор принял за свидетельства родства случайные совпадения. Чем больше времени произошло со времени разделения родственных языков, тем больше изменений успело произойти в каждом из них (и в фонетике, и в семантике), соответственно, тем меньше шансов обнаружить их родство при непосредственном сопоставлении. Поэтому для доказательства дальнего родства используется метод ступенчатой реконструкции: сначала сопоставляются между собой языки, родство которых достаточно заметно, и выполняется реконструкция их общего праязыка (в частности, реконструк- Сравнительно-историческое языкознание 327 ция того списка базисной лексики, который используется для тестирования родства), а потом эта реконструкция сопоставляется с другими реконструкциями того же уровня глубины. В случае, если исследуемые языки род ственны, уровень сходства при сопоставлении реконструкций будет больше, чем при сопоставлении языков-потомков: например, праславянский в большей степени похож на прагерманский, чем русский на английский, а пра индоевропейский больше похож на прауральский, чем русский (или англий ский) на финский. Если же за признаки родства были приняты случайные совпадения, их количество при сопоставлении реконструированных пра языков останется прежним или уменьшится. Г. С. Старостин вводит различие между «сильным» и «слабым» обоснованием языкового родства: о сильном можно говорить лишь тогда, когда представлены решающие доказательства наличия общего праязыка (сравнительный словарь и полный список регулярных фонетических соответ ствий, позволяющий однозначно реконструировать праформы), слабое же подразумевает, что два языка могут в рабочем порядке считаться ближайшими (это существенно!) родственниками, если в их базисной лексике имеется некоторое количество сходных слов, и их процент тем выше, чем более сохранная часть лексики берется для анализа (так, базисная лексика более сохранна, чем словарь в целом, а стословный список может быть ранжирован по степени устойчивости), и при этом нет никакого другого языка, для которого эти условия выполнялись бы в большей степени (Г.С. Старостин 2013a: 55). Сравнительно-исторический метод позволяет реконструировать языковое родство значительной временной глубины. В настоящее время известны праязыки, относящиеся ко времени порядка 12–13 тыс. лет, и это, вероятно, не предел. Восходят ли все известные (ныне существующие и письменно зафиксированные древние) языки к одному общечеловеческому праязыку, неизве стно. Как показывают исследования (Бурлак 2012; Dediu, Levinson 2013), членораздельная речь появилась еще у гейдельбергского человека (общего предка нашего вида и неандертальцев), в целом накопление черт, отлича ющих человеческий язык от коммуникативных систем предшествующих видов, происходило постепенно, так что к какому моменту относится формирование того, что уже с полным правом можно было бы назвать насто ящим человеческим языком, и произошло ли это только в какой-то одной популяции или в нескольких, на нынешнем этапе развития науки неустановимо. Соответственно, невозможно доказать отсутствие родства: даже если конкретная гипотеза не подтвердилась, всегда остается возможность, что не- 328 С. А. Бурлак верно была выбрана система соответствий или что рассматриваемые языки родственны на более глубоком уровне. 14.2. Этимология Слово «этимология» имеет два значения: (1) гипотеза о происхождении того или иного слова и (2) раздел лингвистики, изучающий происхождение слов. Различают б л и ж н ю ю и д а л ь н ю ю э т и м о л о г и ю: ближняя подразумевает поиск источников производного слова в пределах соответству ющего языка, дальняя — поиск источников (как правило) непроизводного слова в других языках (в родственных, если предполагается, что слово было унаследовано из праязыка, в контактировавших с данным языком, если предполагается, что слово было заимствовано). Для обоснования ближней этимологии необходимо не только найти соответствующий корень (в самом языке или хотя бы в языках, родственных данному), но и доказать, что в языке существует (или раньше существовала) соответствующая словообразовательная модель — данный аффикс мог присоединяться к основам такого типа, при этом происходили именно такие чередования звуков, а также просодические изменения, значение модифицировалось именно таким образом, и в результате получалось слово такогото класса. Например, суффикс ‑еж в русском языке образует (с усечением тематической морфемы) от глаголов несовершенного вида существительные мужского рода со значением процесса, при склонении переносящие ударение на окончание, ср. кутить — кутеж, грабить — грабеж. Чем большее количество из этих параметров удается подтвердить примерами, тем более вероятно, что данная этимология верна. Этап поиска ближних этимологий слов исследуемого языка должен предшествовать этапу поиска дальних этимологий, это позволяет избежать сопоставления заведомо неродственных морфем. Например, тагальское слово maliit ‘маленький’ выглядит похожим на русское слово с тем же значением, но морфологический анализ показывает, что сходство это мнимое, поскольку тагальское ma- является приставкой (образующей прилагательные), а ‑t, наоборот, входит в корень. Для поиска дальних этимологий необходимо уметь отличать родственные слова от заимствованных, в том числе от заимствованных из родственных языков, а также от случайных совпадений. Родственные слова будут демонстрировать те же регулярные фонетические соответствия, что характерны для базисной лексики, заимствования из родственных языков — другие соответствия. Например, славянское *melk- ‘молоко’ (> старосл. млѣко, рус. молоко) является не родственным германскому *meluk- с тем же значе- Сравнительно-историческое языкознание 329 нием (> англ. milk, нем. Milch), а заимствованным из него: в базисной лексике славянским глухим смычным соответствуют германские фрикативные (ср. брат и brother), а германским глухим смычным — славянские звонкие (ср. two и два). Определить, из какого языка в какой пришло слово, можно по тому, что в языке-источнике слово не будет нарушать фонетических и фонотактиче ских закономерностей, скорее всего, обладать более широким кругом значений, иметь внутреннюю форму, а также соответствия в родственных языках вне зоны контакта. Так, английское слово sputnik легко опознается как заимствование из русского спутник, поскольку в русском оно имеет внутреннюю форму (приставка с‑, корень пут- и суффикс ‑ник), а в английском нет. 14.3. Генеалогическая классификация языков Лексикостатистический подход позволяет установить не только наличие родства между языками, но и его глубину: чем больше общих базисных слов имеют два языка, тем меньше времени прошло с момента распада их общего предка. Как показали исследования, выпадение слов из списка базисной лексики (обычно это не полное исчезновение слова из языка, а смена его значения, частотности или стилистической принадлежности) происходит по одной и той же формуле, независимо от сложности грамматики, количества говорящих, уровня культуры, времени существования языка, наличия литературной нормы и даже от языковых контактов. Тем самым, базисная лексика может использоваться как счетчик времени. Но для того, чтобы этот счетчик давал корректные показания, необходимо наличие хороших словарей, в том числе этимологических, показывающих, какие слова каким род ственны, а какие заимствованы, — заимствованные слова должны быть исключены из подсчета. Альтернативный способ построения генеалогического древа — по фонетическим и грамматическим инновациям. Он менее удобен, поскольку такие инновации могут возникать параллельно, причем не только в результате языковых контактов, но и потому, что родственные языки наследуют от языка-предка не только фонемы, морфемы, слова, морфологические и синтаксические структуры, но и склонность к тождественным либо сходным изменениям. Например, во многих индоевропейских языках после распада языка-предка произошли палатализации (переходы заднеязычных смычных в сибилянты или аффрикаты). Кроме того, фонетические и грамматические инновации не дают возможности датировать узлы генеалогического древа, поскольку они несравнимы между собой (так что невозможно, например, сказать, что занимает больше времени — палатализация или формиро- 330 С. А. Бурлак вание одного нового падежа). Общие архаизмы при таком способе построения древа не учитываются, поскольку им ничто не мешало сохраниться независимо. Напротив, для лексикостатистики различие между архаизмами и инновациями несущественно: чем больше будет процент совпадений по стословному списку между языками А и В, тем ближе эти языки окажутся на генеалогическом древе — независимо от того, было ли каждое из этих совпадений инновацией, возникшей лишь в последнем общем праязыке А и В, или архаизмом, унаследованным им из какого-то более древнего праязыка. В настоящее время применяется множество различных математических методов построения генеалогического древа, они различаются по тому, на каком материале производится подсчет (берется ли стандартный стословный список Сводеша, или дополненный, или модифицированный, или только какая-то его часть, учитываются ли заимствования и нелексические черты, и т. д.), как строится матрица (по расстояниям или по наличию каждой конкретной черты в каждом из исследуемых языков), как она преобразуется в граф (наиболее часто используются метод ближайших соседей, метод максимальной экономии и байесовская техника Монте-Карло с цепями Маркова). Однако, как показывает практика, главное — не в том, какой математический аппарат выбран, а в том, насколько тщательно собран и обработан сравниваемый языковой материал (Касьян 2015). Применяемые алгоритмы могут выдать дату распада языка-предка с любым количеством знаков после запятой, но следует понимать, что распад праязыка на языки-потомки не происходит одномоментно, это достаточно длительный процесс постепенного накопления различий до такой степени, чтобы уже осмысленно стало говорить не о разных диалектах одного языка, а о разных языках. Однозначного понимания того, где эта граница должна быть проведена, в настоящее время в науке нет, разные исследователи используют разные критерии (так что, например, различия между тем, что называется диалектами китайского языка, оказываются существенно большими, чем различия между такими языками, как сербский и хорватский или хинди и урду). Но в любом случае, различия есть даже между индивидуальными вариантами языка — идиолектами (в силу того, что язык потенциально бесконечен и ни один человек за время чувствительного периода не в состоянии выучить его целиком, а достраивают все немного по-разному). При любом значительном сокращении общения между какими-то группами носителей языка (это может происходить, например, потому, что часть носителей переселилась в другие места, или потому, что часть носителей вступила в контакт с другим языком), таком, что общение внутри группы происходит существенно чаще, чем за ее пределами, различия в языке этих Сравнительно-историческое языкознание 331 групп начинают увеличиваться (просто в силу того, что идиолекты различны, и подобрать их так, чтобы в совокупности частотности всех языковых элементов в одной группе оказались бы в точности такими же, как в другой, технически невозможно, а частотность влияет на то, как будут достраивать языковую систему следующие поколения). Пока различия еще невелики и не препятствуют взаимопониманию, возможны перегруппировки: диалект претерпевает те или иные инновации вместе то с одними соседними диалектами, то с другими, так что по одним критериям он может быть отнесен к одному языку, по другим — к другому, а через несколько столетий это может измениться. Так, например, древненовгородский диалект, отраженный в берестяных грамотах, ответвляется от общеславянского ствола еще до второй палатализации (и не проводит ее), но потом (в результате постепенного падения частотности новгородских языковых элементов и роста частот ности элементов, характерных для стандартного древнерусского языка) сливается с русским (внеся в него некоторое количество своих черт, в том числе в словоизменительной морфологии) (Зализняк 2012). В результате разде ление языков (как, впрочем, и разделение видов в биологии) на начальном этапе выглядит как сеть (что отражает на своих схемах языкового родства теория волн), и древо получается лишь после вымирания промежуточных звеньев. 14.4. Реконструкция В любом языке (в силу его колоссального объема) различные его элементы (слова, фонологические противопоставления, фонетические особенности отдельных звуков, аффиксы, словообразовательные и словоизменительные модели, синтаксические конструкции и т. д.) изменяются не одновременно, а постепенно, так что в каждый данный момент времени в нем присутствуют как элементы, появившиеся только сейчас (и н н о в а ц и и), так и элементы, унаследованные из предыдущего языкового состояния (а р х а и з м ы). Отделение вторых от первых позволяет провести процедуру реконструкции и восстановить более раннее языковое состояние (хотя и не полностью, а лишь частично — чем больше времени прошло, тем выше вероятность, что какие-то элементы предыдущего языкового состояния окажутся утрачены бесследно). В ряде случаев о том, какие черты архаичны, какие инновационны, можно судить по форме ареала распространения этих черт. Реконструкция призвана установить, в какие оппозиции входили элементы праязыка и как они выглядели: если речь идет о фонемах, то можно восстановить не только количество противопоставленных друг другу фонем, 332 С. А. Бурлак но и их отдельные фонетические особенности, если речь о лексемах — можно восстановить не только их фонетический облик, но и систему противопоставленных друг другу значений, выражавшихся этими лексемами. Реконструкция грамматики дает возможность установить словообразовательную и словоизменительную морфологию праязыка, сделать некоторые выводы о его синтаксисе, а также выявить источники служебных морфем в языках-потомках. Для построения реконструкции следует использовать максимальное количество источников информации — брать сведения не только из литературных языков, но и из диалектов (каждый из них имеет шанс сохранить что-то, утраченное в других языковых традициях), использовать языки древних письменных памятников, а также данные заимствований (как в изучаемый язык, так и из него). Различают в н у т р е н н ю ю и в н е ш н ю ю р е к о н с т р у к ц и ю. В первом случае исследователь обращается к системе одного языка, во втором — сравнивает несколько языков, восходящих к одному языку-предку. При внутренней реконструкции весьма надежным маркером архаично сти является непродуктивность: если продуктивные на данный момент модели позволяют порождать слова и формы слов, используя языковой навык, то формы, порожденные по непродуктивным моделям, воспроизводятся лишь в силу того, что их помнят (исключения из этого принципа очень редки), — значит, они являются наследием более раннего языкового состояния. Например, никому не составит труда проспрягать недавно появившийся глагол гуглить (гуглю, гуглишь и т. д.) — для этого достаточно представлять себе, как обычно спрягаются глаголы на ‑ить, — но спряжение глагола дать (дам, дашь и т. д.) способен правильно воспроизвести лишь тот, кто твердо помнит, как спрягается именно этот глагол. Неодновременно меняются и разные характеристики одного и того же языкового элемента: например, русская согласная фонема в является звонкой шумной, но в отличие от прочих звонких шумных не вызывает озвончения предшествующих ей согласных (ср. отзывать [дз], но отвалить [тв]) — это след того, что до появления в русском языке фонемы ф фонема в относилась к числу сонорных. Для фонетической реконструкции большое значение имеют морфонологические чередования (в том числе и продуктивные). Поскольку бо́льшая часть имеющихся в языке морфонологических чередований наследует фонетическим процессам более ранних эпох, выявление этих процессов позволяет делать надежные выводы о предшествующих этапах истории данного языка. Сравнительно-историческое языкознание 333 В языке чередуются периоды большей и меньшей стройности и упорядоченности (например, фонетические чередования ухудшают морфологическую членимость, но потом происходит унификация и морфемные границы снова становятся прозрачными, а чередования исчезают). В разных подсистемах языка это происходит независимо. Внутренняя реконструкция может продвинуться вглубь только до момента последнего упорядочения той или иной подсистемы, стершего все различия предшествующего периода. Восстанавливая более раннее состояние, мы не можем утверждать, что состояния, реконструированные для отдельных подсистем, совпадали во времени (более того, вероятнее обратное: среди реально засвидетельствованных языков нет ни одного такого, у которого все подсистемы одновременно были бы абсолютно упорядочены). Внешняя реконструкция основана на том, что в разных языках сохранение и изменение праязыкового наследия происходит независимо, поэтому сопоставление языков-потомков дает возможность выявить больше черт древнего состояния, чем сохранил каждый из них в отдельности. Например, в области консонантизма санскрит более архаичен, чем, скажем, славянские (они, в отличие от санскрита, утратили различие между звонкими и звон кими придыхательными согласными), а в области вокализма — наоборот (они сохраняют различие между е и другими неузкими гласными, а сан скрит — нет). Реконструкция праязыковой лексики позволяет делать выводы о дописьменных периодах истории. Те пласты культурной лексики, которые демонстрируют те же регулярные фонетические соответствия, что характерны для лексики базисной, могут тем самым быть отнесены к праязыковому наследию. Восстановление их значений позволяет судить о том, в какой природной зоне жили носители соответствующего праязыка, какие животные, растения, элементы ландшафта и погодно-климатические явления были им известны, были ли они земледельцами, скотоводами, или же занимались охотой и собирательством. Например, носители прауральского языка занимались охотой и рыболовством, ставя загородки в некрупных речках, а носители прачукотско-камчатского языка промышляли охотой на морского зверя и разводили северных оленей. Для получения адекватных выводов необходимо рассматривать не каждое слово по отдельности, а системы лексем, связанных с той или иной смысловой областью: так, если народ занимается скотоводством, в его языке будут отдельные названия для животных разного пола и возраста, а также для действий типа «пасти» или «доить». Любое отдельное слово может оказаться утраченным во всех языках-потомках, но наличие множества лексем, связанных с определенными видами деятель- 334 С. А. Бурлак ности (или определенной природной зоной) служит весомым доказатель ством того, что носители праязыка этой деятельностью занимались (жили в этой природной зоне). Реконструкция протокультуры и определение прародины по языковым данным дает возможность связывать результаты лингвистики с результатами археологии. 15. Лингвистическая типология О. И. Беляев Лингвистическая типология — раздел лингвистики, занимающийся сравнением и классификацией языков с точки зрения их структуры. Структуры фонетических, грамматических и лексических систем языков мира чрезвычайно разнообразны. Несмотря на это, по мере описания и документирования языков у ученых постепенно возникло понимание того, что, во-первых, эти структуры можно достаточно надежно разделять на классы, встречающиеся в самых различных семьях и ареалах, начиная с базовой типологии «изоляция — агглютинация — флексия» и заканчивая более сложными и точными моделями; во-вторых, существует ряд утверждений, верных для всех или подавляющего большинства языков мира, называемых у н и в е р с а л и я м и: как простых утверждений вида «во всех языках есть признак X» (а б с о л ю т н ы е у н и в е р с а л и и). так и зависимостей между двумя и более признаками общего вида «если в языке есть признак X, то в нем есть признак Y» (и м п л и к а т и в н ы е у н и в е р с а л и и). Лингвистическая типология зародилась в XIX веке как дисциплина, преимущественно занимающаяся классификациями первого типа, называемыми также х о л и с т и ч е с к и м и, или охватывающими весь строй языка; развитие ранней типологии связано прежде всего с такими исследователями, как братья Шлегели, В. фон Гумбольдт и Г. фон дер Габеленц. Расцвет современной типологии начался в 1960-е годы и связан с именем Дж. Гринберга; Гринберг впервые предложил ряд импликативных универсалий о порядке слов и морфем и подтвердил их на основании достаточно большой выборки языков различных семей и ареалов. С тех пор именно импликативные универсалии находятся в центре внимания лингвистиче ской типологии. Традиционно типология тесно связана с функционально-когнитивной областью современной лингвистики, хотя нередко к типологическим методам прибегают и представители формальных направлений (М. Бейкер, Г. Чинкве, Ф. Ньюмейер). В последние годы типологи все чаще прибегают к диахроническим объяснениям языковых универсалий, в том числе связанным с теорией грамматикализации; несколько влиятельных работ М. Хаспельмата также вызвали новый интерес к проблемам, связанным со сравнимостью языков и противопоставлением описательных и сравнительных категорий. 336 О. И. Беляев Пререквизиты: Теория языка (все главы); Языки Когнитивная лингвистика. мира и языковое разнообразие ; 15.1. Проблема сравнимости языков 15.1.1. «Априористские» подходы: генеративная грамматика и функциональные концепции 15.1.2. Критика априоризма М. Хаспельматом; описательные и сравнительные категории 15.2. Источники данных в типологии 15.2.1. Первичные данные: грамматики и тексты 15.2.2. Опрос носителей. Типологические анкеты 15.2.3. Методики составления выборок 15.3. Типологические обобщения 15.3.1. Абсолютные и статистические универсалии 15.3.2. Неограниченные и импликативные универсалии 15.3.3. Иерархии 15.3.4. Семантические карты 15.4. Краткая история типологических исследований Литература для дальнейшего чтения: Comrie 1989; Croft 2002; Velupillai 2012; А.Е. Кибрик 2003; Haspelmath 2010а. 15.1. Проблема сравнимости языков 15.1.1. «Априористские» подходы. Языковое разнообразие мира, высокая степень варьирования структурных признаков языков различных семей и ареалов ставит вопрос о самой возможности сравнивать грамматиче ские явления между различными языками. Исходя из общих соображений о структуре человеческого мышления, у нас нет оснований предполагать, что грамматики, независимо сформированные представителями различных языковых сообществ, будут сопоставимы между собой. Эта проблема наиболее остро встала перед лингвистами в момент структуралистской революции, когда сопоставление языков с целью установления их родства уступило место описанию частных языковых систем. Действительно, в сравнительно-историческом языкознании проблема сопоставления языков решается достаточно просто: эталоном сравнения выступает значение лексемы, которое считается достаточно диахронически стабильным или во всяком случае подчиняющимся интуитивно понятным семантическим переходам; объектом же сравнения выступает фонетическая форма слова, которая, несмотря на полную произвольность, все же в большинстве случае представляет собой достаточно просто описываемую линейную последовательность элементов, имеющих ясную звуковую реали Лингвистическая типология 337 зацию. Это позволяет сравнивать между собой семантически близкие элементы в различных языках и, в случае родства, устанавливать ряды соответствий для различных фонетических позиций. При описании структуры, напротив, лингвист не имеет доступа к независимо верифицируемым эталону и объекту сравнения. Что касается по следнего, то языковая структура на любом уровне представляет собой совокупность абстрактных элементов и отношений между ними, являющиеся результатом применения лингвистом некоторой аналитической процедуры к имеющимся языковому материалу. Использование семантики в качестве эталона сравнения затруднено: не всегда той или иной грамматической форме или синтаксической конструкции можно приписать конкретное значение; с другой стороны, одно и то же значение может выражаться в различных языках совершенно различными способами. Сравнивать же языковые структуры непосредственно невозможно, так как в рамках структурализма каждый язык описывается «в себе и для себя», и, следовательно, категории одного языка непереводимы в категории другого языка. Именно к такому выводу пришли в середине двадцатого века представители школы американского дескриптивизма, объявившие языки принципиально несопоставимыми и считавшие семантические вопросы неразрешимыми. При таком подходе лингвистическая типология как дисциплина просто не может существовать: возможно только описание конкретных языков и разработка абстрактных дистрибуционных методов такого описания; обобщения о языковой структуре групп языков, тем более всех языков мира, принципиально невозможны. Переворот в этой области произошел в 1950–1960-х гг. в результате генеративной научной революции в лингвистике. Постулат о существовании единой для всех представителей вида homo sapiens универсальной грамматики снимает проблему: любой анализ любого грамматического явления в любом языке автоматически сопоставим с другим подобным анализом, так как оба они используют один и тот же абстрактный аппарат, который предполагается врожденным. Конечно, и в рамках этой научной парадигмы существуют проблемы, связанные с интерпретацией базовых теоретических принципов, корректности анализов и т. д.; однако на методологическом уровне именно постулат о врожденности грамматики делает сопоставление языков возможным. В конечном счете, именно генеративный переворот в лингвистике заложил основу для бурного роста типологических исследований во второй половине XX века. Однако далеко не все лингвисты согласны с тезисом о наличии универсальной грамматики в его наиболее сильном варианте. В частности, боль- 338 О. И. Беляев шинство типологов относятся к функционалистскому направлению и являются радикальными оппонентами нативизма. Некоторые формалисты, принимая в целом тезис о врожденности языковой способности, все же считают универсальную грамматику устроенной достаточно просто и содержащей лишь наиболее базовые принципы устройства языка. Подобная точка зрения высказывается даже в недавних работах самого Н. Хомского, например, в известной статье Hauser et al. 2002, где единственным признаком соб ственно языковой способности человека объявлена рекурсия. Перед такими лингвистами вопрос о сравнимости встает с прежней силой: на каком основании мы можем делать утверждения о типологии таких объектов, как подлежащее, косвенное дополнение, падеж или глагол, если ни одно из этих понятий не входит во врожденный инвентарь всех представителей человеческого рода? На этот вопрос представители разных направлений отвечают по-разному. Наиболее простым является ответ сторонников альтернативных формализмов, которые не отрицают саму идею универсальной грамматики. Такие исследователи, как правило, считают, что врожденная языковая способность человека, действительно, включает ряд абстрактных понятий; однако эта система понятий представляет собой не некую единую схему, в которую вписаны все языки мира, а скорее некий и н с т р у м е н т а р и й (toolbox), из которого различные языки могут использовать различные категории (не используя некоторых вовсе). Наиболее последовательно эта позиция артикулирована в работах Р. Джэкендоффа, которому принадлежит сам термин г и п о т е з а и н с т р у м е н т а р и я (toolbox hypothesis) (Jackendoff 2002). Такой подход позволяет заниматься сравнением языков, допуская при этом значительную вариативность конкретных грамматик. Сложнее обстоит дело для представителей функционально-когнитивного подхода, не признающих никакой специфической для языка «универсальной грамматики» за пределами общих мыслительных способностей человека. В таком случае грамматические понятия и категории являются объектами частных языковых систем и не могут быть использованы для сопоставительных целей. Несмотря на это, существует ряд функционалистских концепций, предлагающие некоторые унифицированные схемы для различных языков мира. Например, Когнитивная грамматика Р. Лангакера предлагает рассматривать различные языковые явления и процессы с точки зрения некоторой единой ментальной схемы (Langacker 2008). Концепция Лангакера, впрочем, достаточно абстрактна и является скорее исследовательской программой или идеологией, а не полноценным формализмом. Ближе к генеративным моделям оказывается Базовая лингвистическая тео- Лингвистическая типология 339 рия М. Драйера и Р. Диксона (Dryer 2006; Dixon 2009). Эти исследователи считают основным недостатком нативистского подхода то, что он недостаточно эмпирически мотивирован, будучи основанным на данных английского и других европейских языков. По их мнению, адекватная лингвистическая теория (вовсе не обязательно формальная) должна быть основана преимуще ственно на тех обобщениях и наблюдениях, которые сформировались в по следние десятилетия в типологической лингвистике и в практике составления описательных грамматик. Наиболее полным представлением результатов такого подход являеться трехтомник Dixon 2009, 2010, 2012. Похожими соображениями руководствуется Р. Ван Валин при создании своей концепции Ролевой и референциальной грамматики (Foley, Van Valin 1994), которая, впрочем, отличается большей формальной проработкой, чем Базовая лингвистическая теория. Из похожих концепций можно также отметить Функциональную грамматику, изначально разработанную С. Диком; современный вариант этой теории называется Функциональной дискурсивной грамматикой и продолжает активно развиваться (Hengeveld, Mackenzie 2008). До недавнего большинство типологов, не будучи нативистами, явно или неявно следовали именно последнему подходу: предполагалось, что сущест вует некоторый инвентарь базовых грамматических понятий (ср. термин В. А. Плунгяна у н и в е р с а л ь н ы й г р а м м а т и ч е с к и й н а б о р (Плун гян 2011)), которым можно пользоваться как для описания отдельных языков, так и для задач сравнения. 15.1.2. Критика априористского подхода М. Хаспельматом. Описательные и сравнительные категории. Принципиально новый подход к сравнению языков был предложен в конце 2000-х и 2010-х годах в работах М. Хаспельмата (Haspelmath 2007, 2010a, 2010b). Признавая методологическую последовательность генеративного подхода, Хаспельмат отвергает его, не находя достаточных оснований считать лингвистические понятия е с т е с т в е н н ы м и в и д а м и (natural kind) того же порядка, что объекты природы (биологические виды, химические элементы и т. д.). В этой критике он следует за другими представителями функционалистской школы. Подобные подходы, принимающие языковые категории как данность, ученый называет а п р и о р и с т с к и м и (aprioristic). Однако Хаспельмат на этом не останавливается, обращая свою критику также против функционалистских концепций. По его мнению, их создатели совершают методологическую ошибку, предлагая единую априорную схему для всех языков, пусть эта схема, возможно, и основана на более широком типологическом материале. Показательны слова Р. Ван Валина: «Как выгля- 340 О. И. Беляев дела бы лингвистическая теория, если бы она основана на анализе таких разноструктурных языков, как лакота, тагальский и дирбал, а не на грамматике английского языка?»1. Как справедливо указывает Хаспельмат, не существует принципиальной разницы между теорией грамматики, основанной на английском, и теорией грамматики, основанной на вальбири или любом другом языке. В обоих случаях представления, сформированные на основании ограниченного числа наблюдений (или вовсе постулируемые дедуктивно), механически переносятся на все остальные языки. При отказе от нативизма такое обобщение не имеет оснований. Таким образом, для Хаспельмата функционалистские концепции обладают теми же недостатками, что и генеративные теории, однако лишены их достоинств: методологической корректности и формальной строгости. Взамен Хаспельмат предлагает вернуться к практике описания языков «в своих терминах» (in its own terms) в духе позднего структурализма. Тогда термины, используемые в грамматических описаниях, являются лишь ярлыками, в лучшем случае указывающие на некоторое поверхностное свой ство категорий одного языка с теми категориями, которые известны в других грамматиках. Прямое типологическое сопоставление таких понятий невозможно. Как же, однако, возможно сравнение языков и типологические обобщения? Разумеется, Хаспельмат, будучи типологом, не предлагает отказаться от всех результатов типологии. Вместо этого он предлагает разграничивать о п и с а т е л ь н ы е и с р а в н и т е л ь н ы е категории (descriptive vs. comparative concepts). Первые специфичны для отдельных грамматик и не могут сопо ставляться напрямую. Для сравнения языков типологи разрабатывают отдельный набор понятий, которым дается операционное определение, т. е. такое, которое можно применить к любому языку. На практике это означает, что сравнительные категории чаще всего задаются на основании семантики или таких структурных или дистрибуционных понятий, которые можно полагать достаточно надежно идентифицируемыми в различных языках. Среди примеров, приводимых Хаспельматом, например, есть следующее определение рефлексивного местоимения и соответствующее обобщение: ОБОБЩЕНИЕ: Если в языке рефлексивное местоимение используется для приименного посессора, кореферентного подлежащему, то в этом языке рефлексивное местоимение также используется для кореферентного подле«What would linguistic theory look like if it were based on the analysis of languages with diverse structures such as Lakhota, Tagalog and Dyirbal, rather than on the analysis of English?» (Van Valin 2005: 1) 1 Лингвистическая типология 341 жащему прямого объекта. (If a language uses a reflexive pronoun for an adnominal possessor that is coreferential with the subject, then it also uses a reflexive pronoun for a subject-coreferential direct object.) (Haspelmath 2008) ОПРЕДЕЛЕНИЕ: Рефлексивное местоимение — специализированное анафорическое выражение с кореферентной интерпретацией, которое может использоваться только в той же клаузе, что и его антецедент. (A reflexive pronoun is a specialized anaphoric expression with a coreferential reading that can only be used in the same clause as the antecedent.) (Haspelmath 2010b: 673) Легко видеть, что в этом определении используются в основном семанти ческие понятия: к о р е ф е р е н т н о с т ь, а н т е ц е д е н т, и н е т п р е т а ц и я; также присутствуют смешанные «структурно-семантические» понятия, идентификация которых, однако, обычно не вызывает затруднений: анафорическое выражение, клауза. Наиболее проблематичными являются понятия прямой объект и подлежащее, но и их можно определить через семантиче ские роли (пациенс и агенс соответственно), как часто и делается, например, в типологии порядка слов. В этом случае, конечно, мы исключаем те случае, когда подлежащее не является агенсом, а прямой объект — пациенсом (пассивные конструкции, глаголы с нестандартной моделью управления), однако Хаспельмат особо оговаривает, что проблемой это не является — сравнительные категории тем и ценны, что создаются для целей сравнения, а не описания, и, следовательно, они и использующие их обобщения не обязаны охватывать весь спектр грамматических явлений конкретных языков. Несмотря на убедительность аргументации Хаспельмата, его концепция не лишена недостатков. Во многом она является идеализацией, строгое применение которой привело бы к отказу от целых областей лингвистической типологии. На поверку даже те определения, которые предлагает Хаспельмат в своей программной статье (Haspelmath 2010b), оказываются далекими от его собственных стандартов (Newmeyer 2010). В вышеприведенном примере бросаются в глаза понятия к о р е ф е р е н т н о с т ь и к л а у з а: первое имеет много вариантов: связывание переменной, дискурсивная анафора, расщепленные антецеденты, ассоциативное связывание (bridging) и проч.; второе не различает, например, финитные и нефинитные клаузы, разные степени номинализованности предикаций. Несмотря на это, вопросы, по ставленные Хаспельматом, весьма важны, и дискуссия, последовавшая за его статьями, заставила типологов различных направлений критически пересмотреть методологические основания своей работы. Слишком часто исследователи уделяют недостаточное внимание операционализации своих критериев, чрезмерно доверяя ярлыкам описательных грамматик. Даже типологи, не принимающие положений Хаспельмата, вынуждены признать, 342 О. И. Беляев что хотя бы из-за недостаточной точности имеющихся у нас данных при сравнении языков приходится прибегать к ad hoc определениям, основанных на легко проверяемых критериях, но имеющих лишь косвенное отношение к стоящим за ними теоретическим конструктам. 15.2. Источники данных в типологии 15.2.1. Первичные данные: грамматики и тексты. Основным источником данных для подавляющего большинства типологических исследований являются описательные грамматики. Это естественно, т. к. позволяет получить информацию не только об интересующем исследователя явлении, но и о других особенностях языка, которые могут иметь значение для результатов. В некоторых случаях можно опираться и на специализированные работы, по священные конкретным явлениям, но редко бывает, чтобы такие работы существовали для большого числа языков в обычной типологической выборке. Грамматики, безусловно, далеки от эталона надежности и непротиворечивости. Так называемые традиционные грамматики написаны в рамках национальных лингвистических школ, и их терминология часто несопоставима друг с другом. Та же проблема касается и грамматик, написанных в рамках отдельных научных концепций и формализмов (многие структуралистские грамматики, формальные грамматики, тагмемика). В последние десятилетия большое развитие получил жанр т. н. типологически ориентированных грамматик, которые призваны представить материал максимально объективно и в терминах, доступных для однозначной интерпретации большинством специалистов. Однако, как обсуждалось в предыдущем разделе, даже типологически ориентированные грамматики могут быть несовместимы друг с другом и по-разному интерпретировать разные категории. Грамматики основаны на представлениях их составителей и часто не содержат примеров на критерии, важные для типолога. Одной из альтернатив использование грамматик является извлечение необходимой для типологического исследования информации из опубликованных текстов на языках, входящих в выборку. Это снимает проблему субъективности и позволяет учитывать данные, редко включаемые в грамматики. Кроме того, если используемые параметры учитывают частотность (как, например, определение доминантного порядка слов по М. Драйеру (Dryer 1992)), то только тексты позволяют ее оценить. При этом опора на тексты имеет и свои недостатки. Прежде всего, по-настоящему репрезентативные корпуса существуют только для небольшого числа крупнейших языков мира. В остальных случаях приходится довольствоваться сравнительно небольшими собраниями текстов, никак не сбалансированных по жанру. В ре- Лингвистическая типология 343 зультате многие типы контекстов, в том числе на достаточно базовые явления, в текстах могут быть представлены редко: так, в корпусе, состоящем из нарративов, будет мало форм второго лица и вопросительных конструкций по сравнению с диалогическим дискурсом. Наконец, большинство собраний текстов лишены глосс и содержат только перевод предложений; работа с такими текстами требует достаточно глубокого знакомства с языком. 15.2.2. Опрос носителей. Типологические анкеты. Единственный спо соб, который гарантирует единообразные данные по всем языкам в выборке, — опрос носителей, проводимый различными методами (перевод, оценка грамматичности, пересказ видео или графических материалов, эксперимент). Общим недостатком опроса носителей является неестественность данных; эта проблема, однако, относится также и к большинству грамматик, и не следует преувеличивать ее значимость. Более серьезная сложность с элицитацией состоит в том, что она требует гораздо большего знакомства со структурой языка, чем даже работа с текстами. Это обстоятельство в сочетании с трудоемкостью самого исследовательского процесса делает опору на элицитацию невозможной при работе со сколько-нибудь большими выборками. Некоторым компромиссом между элицитацией и опорой на существу ющие публикации является анкетный метод. Его суть состоит в том, что единообразная анкета рассылается специалистам, каждый из которых заполняет ее данными по своему языку. Метод сбора данных зависит от эксперта; как правило, предполагается опрос носителей языка или (в случае носителей) интроспекция, хотя, если требуемые контексты заданы достаточно широко, возможна и опора на тексты. Надежность этого метода зависит как от квалификации экспертов, так и от корректности составления самой анкеты. Требуется соблюсти баланс между излишне размытыми формулировками и, напротив, чрезмерно детализированными контекстами. В первом случае слишком велик может быть разброс между экспертами, по-разному интерпретирующими вопросы анкеты. Во втором случае контексты могут оказаться неприемлемыми по причинам, независимым от исследуемых параметров; кроме того, иногда контексты плохо переводимы по экстра лингвистическим причинам. Хорошим примером типологической анкеты, доказавшей свою ценность как для типологии, так и для описательных задач, является анкета Даля на категории времени, вида и модальности (The TMA Questionnaire), на основе которой написана известная книга Dahl 1985. 15.2.3. Методики составления выборок. Очевидно, что ни одно типо логическое исследование ни сегодня, ни в обозримом будущем не способно 344 О. И. Беляев охватить все языки мира, число которых составляет около 7000. Кроме того, даже если бы такая возможность и существовала, это было бы, скорее всего, бессмысленно. Типологические исследования чаще всего направлены на выявление универсальных свойств языка, или, во всяком случае, тенденций, действующих для любого языка вне зависимости от его происхождения и от влияния соседних языков. Даже если цели полностью исключить эти факторы не ставится, необходимо как минимум иметь возможность оценить влияние каждого из них и исключить дополнительные, не значимые для исследователя факторы. Для подобных задач выборка из всех языков мира была бы, если не считать ее размера, аналогом полностью случайной: известно, что современное распределение языков и языковых семей отнюдь не равномерно и связано с целым рядом экстралингвистических факторов: с историче скими событиями, с географическими и климатическими условиями, с особенностями культуры языковых сообществ (например, эндогамный брак, по-видимому, связан с большим языковым разнообразием (Comrie 2008)); наконец, велика роль и чистой случайности. К этому следует добавить и то обстоятельство, что пока не существует общепризнанных критериев разграничения языков и диалектов; типологу пришлось бы опираться на традицию, что привело бы к еще большему дисбалансу в представленности различных семей (где-то число идиомов будет высоким из-за традиции объявлять их языками; где-то — низким). Поэтому на практике типологи пользуются в ы б о р к а м и, соответствующими их задачам. Для пилотного исследования и в случаях, когда сбор данных по большому числу языков невозможен, допустимо использование у д о б н о й в ы б о р к и (convenience sample) — набору языков, который не соответствует более строгим критериям составления выборок, однако отвечает субъективной оценке генетического и ареального разнообразия. Однако результат исследования, выполненного по такой выборке, уязвим для критики, и к ней следует прибегать либо только на начальном этапе работы, либо в случае, если составление более репрезентативной выборки невозможно по объективным причинам (например, если изучаются признаки, не описываемые в большинстве грамматик и недоступные для простой проверки методом анкетирования). В масштабных типологических исследованиях, как правило, используются в е р о я т н о с т н ы е в ы б о р к и (probability sample). Такие выборки призваны минимизировать вероятность влияние генетических и ареальных факторов на результат. Самый простой тип вероятностной выборки — генетически сбалансированная выборка, т. е. такая, где берется по одному языку или по два языка из каждой семьи. Несмотря на свою простоту, этот метод Лингвистическая типология 345 составления выборок имеет два очевидных недостатка. Во-первых, не исключается ареальный фактор: распределение языковых семей на планете неравномерно, и в одних ареалах генетическая плотность значительно выше, чем в других; следовательно, число языков из таких ареалов будет выше. Во-вторых, само понятие семья не имеет строгого определения и включает в себя объекты различной степени внутреннего разнообразия и различной темпоральной глубины. Так, представители разных ветвей индоевропейской семьи, и даже представители одной и той же ветви, как правило, не взаимопонимаемы, и степень типологического разнообразия по таким признакам, как порядок слов и стратегия кодирования ядерных актантов, весьма велика: встречаются базовые порядки SOV, SVO, VSO; распространены как аккузативная, так и эргативная, трехчастная и смешанные стратегии. Напротив, языки тюркской семьи, особенно если они относятся к одной ее ветви, во многом взаимопонимаемы, а разнообразие по большинству базовых типологических параметров весьма невелико: во всех языках представлен базовый порядок SOV, аккузативный строй, вершинное или смешанное кодирование зависимости в именной группе; отсутствуют именные классификации. Очевидно, что включение в выборку по одному языку из этих двух семей не отвечало бы реальной степени их типологической вариативности и вызвало бы искусственное предпочтение в пользу типологических свойств тюркских языков. Эти проблемы предлагалось решать различными способами. Так, в работах М. Драйера, посвященных корреляциями между параметрами порядка слов (Dryer 1992), предложен метод, призванный исключить как ареальный, так и генетический фактор. Он имеет два отличия от стандартного метода, описанного выше. Во-первых, выбор языков производится не по семьям, а по так называемым г е н у с а м (англ. genus, мн.ч. genera)2 — группам, примерно одинаковую темпоральную глубину. Примерами генусов являются: подгруппы индоевропейской семьи (славянская, германская, иранская); семитские языки; тюркские языки. Хотя на нынешнем этапе развития лингвистики сложно объективно оценить темпоральную глубину для всех этих групп, такая классификация представляется все же более сбалансированная, чем традиционное понятие семьи. Во-вторых, Драйер оценивает надежность универсалий не для всего множества языков мира, а отдельно для шести макроареалов: Африка, Евразия, Юго-восточная Азия и Океания, Австралия и Новая Гвинея, Северная Америка и Южная Америка. Универсалия признаТермин позаимствован из биологии и имеет буквальный перевод род. Однако, поскольку термин род имеет в лингвистике совсем другие значения, чаще всего термин Драйера переводят как генус. 2 346 О. И. Беляев ется доказанной, если она подтверждается в каждом из ареалов. Например, двусторонняя импликация VO ↔ Prep, OV ↔ Postp («если в языке объект следует за глаголом, то в нем используются предлоги»; «если в языке объект предшествует глаголу, то в нем используются послелоги») проверяется следующим образом: Africa Eurasia SEAsia&Oc Aus-NewGui NAmer SAmer Total OV&Postp 15 26 5 17 25 19 107 OV&Prep 3 3 0 1 0 0 7 VO&Postp 4 1 0 0 3 4 12 VO&Prep 16 8 15 6 20 5 70 Как видно из рисунка, в каждом из ареалов универсалия подтверждается; подтверждается она и для общей выборки, но с гораздо меньше надежностью для импликации VO → Prep. Пример корреляции, которая считалась значимой, но опровергается при использовании метода Драйера — двусторонняя корреляция между порядком OV/VO и позицией прилагательного: OV ↔ AdjN, VO ↔ NAdj: Africa Eurasia SEAsia&Oc Aus-NewGui NAmer SAmer Total OV&AdjN 7 24 2 4 10 8 55 OV&NAdj 18 4 5 15 18 14 74 VO&AdjN 3 6 4 5 19 3 40 25 3 12 2 8 5 55 VO&NAdj Видно, что для языков мира в целом и для отдельных ареалов корреляция скорее подтверждается (хотя общемировой результат едва ли статистически значим), однако результат по каждому из ареалов оказывается различным. Насколько необходимо использование сложных методов составления выборок — эмпирический вопрос. В работе Haspelmath, Siegmund 2006 проверяются пять универсалий Гринберга (№№ 1, 3, 4, 17, 18) на нескольких выборках из 30 языков, составленных на базе более поздних и более репрезентативных исследований М. Драйера. Исходные результаты Гринберга были подтверждены именно на такой небольшой выборке, поэтому процедура Хаспельмата и Зигмунда, хотя и не является в строгом смысле воспроизвод ством результата на новых данных, неплохо аппроксимирует подобную репликацию. Хаспельмат и Зигмунд проверили универсалии на пяти выборках помимо исходной выборки Гринберга: несбалансированной в пользу Австралии Лингвистическая типология 347 и Новой Гвинеи; несбалансированной в пользу Южной Америки; полностью случайной; генетически стратифицированная выборка, по 5 языков на ареал; генетически стратифицированная выборка по методу Rijkhoff, Bakker 1998. Как ни удивительно, на каждой из этих выборок результаты Гринберга в целом подтвердились, хотя и с разным количеством контрпримеров, т. е. с несколько разной степенью надежности. Пилотное исследование Хаспельмата и Зигмунда показывает, что, по-видимому, для характер выборки не так важен, как это принято считать. Следует, впрочем, учитывать, что исследователи рассматривали только заведомо надежные универсалии порядка слов Гринберга; если речь идет о более слабых тенденциях, для которых необходима квантитативная оценка статистической значимости, то характер выборки становится важнее. В последние годы в типологии наметилось смещение подхода с исследования универсальной грамматики в пользу типологии как дисциплины, изучающей сегодняшнее распределение признаков в языках мира с точки зрения различных факторов; Б. Бикель сформулировал эту новую задачу типологии как «what’s where why?» (Bickel 2007). Вероятностные выборки планетарного масштаба в этом случае менее важны, уступая место частным выборкам, созданным для конкретных исследовательских задач. 15.3. Обобщения в типологии Основная задача лингвистической типологии — поиск языковых у н и в е р с а л и й, то есть утверждений, истинных для всех языков, либо для большинства языков. 15.3.1. Абсолютные и статистические универсалии. Первый параметр противопоставления универсалий — разделение на абсолютные и статистические. Абсолютные универсалии должны быть истинны во всех языках мира, без единого исключения. Практика типологии показала, что таких универсалий немного, и те, что подтверждаются, чаще всего достаточно тривиальны (например, «Во всех языках есть гласные»). Кроме того, надежность таких универсалий крайне низка, учитывая размеры наших выборок и количество языков мира. И. Ш. Козинский, говоря о выборке из 100 языков, пишет: «... предположим, что размер генеральной совокупности, т. е. множества всех языков Земли составляет 5000 … Допустим, что в генеральной совокупности имеется один язык, не обладающий признаком X, который, в силу определения “абсолютной” универсалии, делает ее неправильной. Вероятность того, что этот язык-исключение попадет в нашу выборку из 100 языков, равна 100/5000 = 0,02, то есть надежность нашей универ- 348 О. И. Беляев салии (в такой формулировке) равна всего 2 %! Легко видеть, что получить мало-мальски приемлемую надежность в 90 % для подобной универсалии можно только включением в выборку 90 % всех языков — задача явно утопическая» (Козинский 1979: 15). Кроме того, нужно учитывать и вероятность того, что языки, нарушающие универсалии, существовали в прошлом. Таким образом, даже с практической точки зрения поиск абсолютных универсалий является невыполнимой задачей. Более того, не всегда абсолютная универсалия или универсалия с меньшим число исключений лучше статистической. Б. Комри приводит следу ющий заведомо абсурдный пример (Comrie 1989: 19). Из известной универсалии RelN → SOV имеется известное исключение — китайский язык. Сделать эту универсалию абсолютной можно, заменив посылку на конъюнк цию: RelN ∧ ¬tonal → SOV. Понятно, что такая универсалия менее информативна, чем первая, хотя формально и ближе к абсолютной. Поэтому большинство типологических обобщений — статистические тенденции, а не универсалии в узком смысле. Это объясняет исторически тесную связь типологии с функционализмом. Если универсалии имеют функциональную мотивацию, то исключения не только возможны, но и ожидаемы: внешние факторы могут способствовать эволюции языка в определенном направлении, но не могут его предопределять. Напротив, свойства языка, связанные с универсальной грамматикой, не должны иметь исключений. Именно поэтому принципы формальных теорий носят абстрактный характер и не могут быть проверены стандартными типологическими методами, т. к. не имеют очевидных поверхностных проявлений. Наиболее радикальная точка зрения на данный вопрос содержится в статье Newmeyer 1998, автор которой прямо утверждает, что типология совершенно не релевантна для теоретической лингвистики. При этом Ньюмейер отнюдь не утверждает, что типологические исследования бессмысленны или методологически ошибочны. По его мнению, задачи типологии и теоретической лингвистики различны: первая занимается поиском ответа на вопрос «Какие типы языков наиболее вероятны?», вторая — на вопрос «Какие типы языков возможны?» (Newmeyer 2005). 15.3.2. Неограниченные и импликативные универсалии. Универсалии различаются не только по их области применимости, но и по логической форме. Неограниченные универсалии — экзистенциальные утверждения вида «Во всех языках есть X». Как и абсолютных универсалий, их мало, и чаще всего они тривиальны: найдется не так много свойств, общих для всех языков. Редкий пример неограниченной и при этом достаточно надежной и Лингвистическая типология 349 нетривиальной универсалии — наличие в большинстве языков фонемы /n/; исключения имеются, но довольно редки. Более интересный тип универсалий — импликативные универсалии: зависимости между признаками, утверждения вида «Если в языке есть X, то в нем есть Y» (записыватся как X → Y). Импликативные универсалии соответствуют логическому смыслу понятия импликации и предполагают следующую таблицу истинности: X ⊤ ⊤ ⊥ ⊥ Y ⊤ ⊥ ⊤ ⊥ X→Y ⊤ ⊥ ⊤ ⊤ То есть импликация ложна только при ложности посылки и истинности следствия. Важно не путать импликацию с эквивалентностью — более сильной универсалией, представляющей собой двустороннюю импликацию (X → Y, Y → X; X ≡ Y). Такие универсалии исключают существование языков, где Y истинно, а X ложно. Стало быть, для того, чтобы подтвердить импликативную универсалию, необходимо показать, что языков, где истинно X, но Y ложно, не существует. Кроме того, мы должны показать, что все остальные комбинации признаков также представлены в примерно равном количестве. Для представления такой количественной информации удобно использовать таблицы сопряженности (contigency tables). Они состоят из строк и столбцов, соответствующие попарному пересечению значений признаков; для стандартной импликационной универсалии X → Y такая таблица содержит четыре клетки (X, Y; X, ¬Y; ¬X, Y; ¬X, ¬Y) и называется т е т р а х о р н о й (tetrachoric table). В ячейках таблицы указывается количество и/или пропорция языков, имеющих такую пару параметров. В качестве примера можно привести таблицу для двусторонней импликации VO ↔ Prep (Greenberg 1963): VO Prep 16 Postp 3 OV 0 11 Существенный дисбаланс между клетками таблицы, как правило, говорит о том, что универсалия сформулирована некорректно. Если окажется, что не существует или пренебрежимо мало языков, где X ложно, а Y истинно, то мы имеем дело с эквивалентностью — более сильным случаем универсалии. Остальные случаи дисбаланса между клетками таблицы, как прави- 350 О. И. Беляев ло, свидетельствуют о том, что универсалия сформулирована некорректна. Действительно, если не существует языков, где X ложно, то и посылка, и следствие сами по себе являются неограниченными универсалиями, и импликация тривиально истинна (пример: «если в языке есть гласные, то в нем есть фонема /n/»). Также не имеет содержательного смысла «импликация», посылка которой всегда истинна, например: «Если в языке есть носовые гласные, то в нем есть и простые гласные. Если же число языков, где одновременно истинны X и Y, невелико относительно других сочетаний признаков, то, скорее всего, X является настолько редким свойством языка, что импликация малоинформативна. Б. Комри приводит следующий, опять же, заведомо абсурдный, но показательный пример: «Если язык является английским (X), то слово для собаки — dog (Y)». Формальное эта универсалия удовлетворяет всем требованиям: имеется язык, в котором истинны X и Y (английский); имеется язык, в котором X ложно, но Y истинно (австралийский язык мбабарам, где собака — по случайному совпадению — также имеет обозначение dog); не имеется ни одного языка, в котором истинно X, но ложно Y (т. е. такого языка, который был бы английским и при этом имел бы другое слово для собаки); наконец, во всех остальных языках мира X и Y ложны. Ошибочность этой универсалии состоит в том, что в качестве посылки выбран признак, истинный только для одного языка мира, а в качестве следствия — заведомо произвольный признак (фонетическая форма слова для некоторого понятия). 15.3.3. Иерархии. Когда формулируется несколько универсалий, связанных с одним и тем же разделом грамматики (например, с порядком слов), то часто оказывается, что для многих пар импликаций следствие одной выступает посылкой другой. Такие парные универсалии удобно объединять в цепочки, называемые и е р а р х и я м и (hierarchies, scales). Наиболее изве стна иерархия порядка слов в именной группе в языках с предлогами (Prepositional Noun Modifier Hierarchy) (Hawkins 1983). В таких языках истинны следующие импликации: NNum → NDem; NDem → NAdj; NAdj → NGen; NGen → NRel. Эти универсалии удобнее записывать в виде цепочки: NNum → NDem → NAdj → NGen → NRel. В то же время, по закону транспозиции, всякая имликация X → Y эквивалентна импликации ¬Y → ¬X. Следовательно, истинна также и обратная цепочка импликаций: RelN → GenN → AdjN → Лингвистическая типология 351 DemN → NumN. Можно обобщить эти две системы импликаций в виде единой иерархии Num > Dem > Adj > Gen > Rel, для которой действует правило: «Если элемент на иерархии следует за именем, то и все элементы справа следуют за именем. Если элемент на иерархии предшествует имени, то и все элементы слева предшествуют имени». Понятие иерархий или шкал применяется гораздо шире, чем для цепочек подобного рода. Например, иерархия грамматических отношений Кинэна-Комри (Keenan, Comrie 1977) описывает не только импликативную универсалию, связанную с доступностью позиций для релятивизации в языках мира, но и синтаксические процессы в отдельных языках: например, аргументную структуру каузатива во французском (Comrie 1974). Такого рода обобщения тоже в конечном счете формулируются через импликации, но не столь прямолинейно. Для того, чтобы различать разные виды шкал, удобно использовать классификацию, предложенную в (Haspelmath 2015), где предлагается делить иерархии, с одной стороны, на о п и с а т е л ь н ы е (descriptive scales; истинные для конкретного языка) и с р а в н и т е л ь н ы е (comparative scales; истинные для всех / большинства языков); с другой стороны, на и м п л и к а т и в н ы е (implicational scales; представляющие собой цепочки импликаций) и р е л я ц и о н н ы е (relational scales; описывающие отношения между элементами множества признаков). На каждую из пар этих признаков имеются свои примеры иерархий. 15.3.4. Семантические карты. В последние десятилетия большое распространение не только в типологии, но и в теоретической когнитивной лингвистике получили с е м а н т и ч е с к и е к а р т ы. Несмотря на то, что многие авторы, как, например, У. Крофт (Croft 2002), интерпретируют эти карты с когнитивной точки зрения как отображение некоторого ментального пространства (mental space), важно понимать, что в основе своей семантические карты — это не более, чем способ наглядного представления информации об импликативных универсалиях, которые, в свою очередь, могут иметь различные объяснения. В своем простейшем виде семантические карты описывают возможные м о д е л и п о л и с е м и и языковых показателей или конструкций (Haspelmath 2003). Точками на семантической карте являются «значения», встречающиеся в языках мира, причем выделяются они максимально дробно: если хотя бы пара языков в одном контексте используют разные показатели, этот контекст рассматривается, как отдельный узел карты. Поэтому, строго говоря, корректнее говорить не о значениях, а о контекстах или функциях (сравнительных категориях в терминах Хаспельмата). Соединяются точки между собой в соответствии с п р и н ц и п о м 352 О. И. Беляев с м е ж н о с т и, который гласит, что множество значений любого элемента должна образовывать непрерывную область. Рассмотрим для примера следующую простейшую карту: A—B—C Такая карта предсказывает, что существуют конструкции, выражающие одновременно значения A + B, B + C, и A + B + C, но не существует языка, выражающего значения A + C и не имеющего при этом значения B. Простейшим примером семантической карты является типология слов со значением ‘дерево, древесина’ (Haspelmath 2003): дерево — древесина — дрова — роща — лес. Слово, имеющие любое из двух значений на этой карте, должно иметь и значение, находящееся между ними. Как минимум для большинства европейских языков эта карта истинна: дерево немецкий древесина Baum датский дрова Holz arbre испанский árbol лес Wald trae французский роща skov bois madera leña forêt bosque selva Строгое следование принципу смежности приводит к тому, что на практике надежные и при этом нетривиальные карты можно составить далеко не для всех грамматических явлений. Дело в том, что методика семантиче ского картирования предполагает добавления линии между двумя значениями, если такое совмещение встречается хотя бы в одном языке (метод не предполагает различий по частотности). Ясно, что причиной отнюдь не обязательно является семантическая близость. При типологическом исследовании невозможно исключить случайные совпадения, случаи вторичного фонетического сближения показателей по аналогии, утрату ранее имевшегося значения и т. д. В результате по мере накопления языковых данных на семантической карте появляется все большее число линий, что снижает ее информативность. Возможное допущение — не учитывать редкие или периферийные модели полисемии, но такое допущение вносит в методологию элемент субъективности, что едва ли допустимо. Частичным решением этой проблемы является использование д и а х р о н и ч е с к и х семантических карт. В отличие от синхронных карт, схемы подобного рода представляют собой ориентированные графы и отражают информацию не о самом по себе совмещении значений, но о засвидетель ствованных в языках мира с е м а н т и ч е с к и х п е р е х о д а х. В этом случае для нанесения информации на карту недостаточно полисемии самой по Лингвистическая типология 353 себе; необходимо также показать, что одно из значений первично, а другое — вторично. Это предполагает гораздо более ограничительный подход к построению карты. Если считать, что утрата значений невозможна, принцип смежности сохраняется в неизменном виде. Примером диахронической семантической карты является карта инструменталиса и смежных значений, предложенная Г. Наррогом (Narrog, Ito 2007): Диахронические семантические карты также позволяют смягчить принцип связности. Известно, что семантические переходы предполагают не только развитие новых значений, но и утрату старых. Хорошим примером является развитие форм «старого настоящего времени», описанное М. Хаспельматом (Haspelmath 1998). По данным многих языков известно, что из прогрессивного значения могут независимо развиваться значения будущего времени и хабитуалиса; при этом непосредственное развитие хабитуалиса из футурума или наоборот считается невозможным (Bybee et al. 1994). Эти данные позволяют построить следующую семантическую карту: FUT ← PROG → HAB При этом, однако, все же существуют грамматические показатели, совме щающие значения футурума и хабитуалиса (например, во многих нахскодагестанских языках). Как показывает Хаспельмат, многие из этих случаев объясняются утратой прогрессивного значения у форм, изначально имевших все три функции («настояще-будущее» время)3. В терминах семантических карт это означает, что при разветвлении двух путей развития исходКак показано в работе Tatevosov 2005, хабитуалис все же может развивать футуральное значение через промежуточную модальную ступень. Схема Хаспельмата, таким образом, основана на неполной семантической карте, хотя концепция «ста3 354 О. И. Беляев ное значение может утрачиваться, что предполагает нарушение принципа смежности. Эта идея интегрирована в теоретический аппарат, использу емый в семантической карте модальности Й. ван дер Ауверы и В. А. Плунгяна (Auwera, Plungian 1998), как ослабленный принцип смежности. 15.4. Краткая история типологических исследований Идея сопоставления структуры языков, выделения грамматических типов и поиска языковых универсалий является сравнительно недавней. До XIX века лингвистика являлась преимущественно практической дисциплиной, задачей которой являлось описание конкретных языков для обучения или перевода. В некоторым виде идея «универсальной грамматики», стоящей за грамматиками отдельных языков, стоит за многочисленными попытками создания «идеальных языков» философами XVII века (Г. Лейбниц, Дж. Уилкинс и др.) — предполагалось, что это позволит устранить неточности и нерегулярности естественных языков и вскрыть стоящую за ними структуру мышления, общую для всех людей. Наиболее близка к современным универсалистским концепциям, конечно же, знаменитая грамматика Пор-Рояля, где производится сопоставление французского и некоторых других языков (в частоности, других романских, немецкого, латинского, древнегреческого и древнееврейского) с позиций универсальных категорий мышления. Все эти примеры, однако, представляют собой разрозненные попытки, которые к тому же ставили прежде всего философские, а не эмпирические задачи. Первой попыткой построения морфологической типологии считается выделения братьями Фридрихом и Августом Вильгельмом фон Шлегелями (F. Schlegel 1808; A.W. Schlegel 1818) классических языковых типов: аморф ного (изолирующего), агглютинативного и флективного. Эта идея получила свое развитие в работах В. фон Гумбольдта (Humboldt 1823), который не только предложил дополнительный инкорпорирующий тип, но и интерпретировал структурные типы как характеризующие не только характер соединения морфем, но с т р о й я з ы к а в целом. В соответствии с господствовавшей в то время в Германии гегельянской философией Гумбольдт интерпретировал строй языка как отражение д у х а соответствующего народа; предполагалось, что флективный строй является высшей формой существования языка, и любой язык последовательно проходит через стадии от изоляции к флексии. Таким образом, идеи Гумбольдта, хотя и были новаторскими для рых презенсов», по-видимому, действительно является предпочтительным объяснением хабитуально-футуральной полисемии для некоторых языков. Лингвистическая типология 355 своего времени, содержат ошибочные идею с т а д и а л ь н о г о развития и превосходства одних языков (и говорящих на них сообществ) над другими. Чрезвычайно близки к идеям современных типологов труды другого выдающегося ученого XIX века, Георга фон дер Габеленца. Китаист по основной специальности, Габеленц был первым, кто предложил термин типология (Typologie) для дисциплины, призванной сравнивать структуру языков (Gabelentz 1894)4. В этой короткой статье содержится ряд идей, знакомых любому современному типологу, но совершенно неизвестных в ту эпоху: противопоставление генеалогической и структурной классификации языков; импликативные универсалии (связь эргативного строя с порядком имени и прилагательного); проверка универсалий на выборках. С удивительной точностью Габеленц описал и анкетный метод сбора типологического материала (Gabelentz 1894: 6). Подробный обзор идей Габеленца и их соотношения с современной типологией содержится в статье Plank 1991. К сожалению, такие исследователи, как Габеленц, оставались одиночками и не оставили за собой исследовательской традиции. XIX век и начало XX века были эпохой господства сравнительно-исторического языкознания, которое интересовала генеалогическая классификация языков и связанные с ней языковые изменения (преимущественно фонетические); составление описательных грамматик и, тем более, структурное сопоставление языков независимо от их происхождения находились на периферии научного «мейнстрима» тех лет. Произошедший в первой половине XX века переход к структурализму также оставлял мало места для типологии, так как структурализм предполагал прежде всего описание языковых систем «в себе и для себя»; сопоставление считалось вторичной (если вообще осуществимой) задачей. Интерес к языковым универсалиям вновь возник в лингвистике благодаря генеративной революции 1950-х гг., начавшейся с выхода «Синтаксических структур» Н. Хомского (Chomsky 1957). При этом присущий генеративной грамматике нативизм позволяет исследовать универсальные (врожденные) механизмы исключительно на основании изучения свойств отдельных языков, не прибегая к индуктивному рассмотрению языков мира. Поэтому, хотя генеративный переворот сделал типологические исследования возможными, типология во многом развивается как отдельная традиция, начавшаяся с работ Дж. Гринберга 1960-х годов. В классической статье (Greenberg 1963) По досадному недоразумению, исходная (посмертная) публикация этой статьи содержит загадочный термин Hypologie вместо подходящего по смыслу Typologie; это вероятнее всего вызвано неверным прочтением рукописи редакторами журнала Indogermanische Forschungen (Plank 1991: 428). 4 356 О. И. Беляев он впервые предложил ряд импликативных универсалий, связанных с порядком слов и морфем и проверенных на материале достаточно масштабной для того периода выборки из 30 языков различных семей и ареалов (в дальнейшем большинство универсалий подтвердились). В последующие десятилетия на основе работ Гринберга лингвистическая типология оформилась в самостоятельную, активно развивающуюся дисциплину. Хотя сам по себе типологический метод независим от объяснения результатов его применения, из-за индуктивного и статистического характера языковых универсалий типология тесно связана с функционально-когнитивным направлением лингвистики. Среди крупнейших типологов последних десятилетний можно назвать Б. Комри, Дж. Николс, М. Хаспельмата. Типологов мира объединяет Ассоциация лингвистической типологии (Association for Linguistic Typology), основанная в 1994 г. (http://www.linguistic-typology.org). Официальное издание Ассоциации — журнал Linguistic Typology, один из ведущих лингвистических журналов. Каждые два года проводится Конгресс ALT. Трагическая история России в XX веке отразилась и на судьбе лингвистики в нашей стране и, в частности, на истории лингвистической типологии. Изоляция СССР привела к тому, что советские научные школы во многом существовали отдельно от западной лингвистики; в особенности серьезный урон развитию науки в нашей стране нанесен господствовашим при поддержке властей в 1930–1940‑х гг. псевдонаучным «Новым учением о языке» Н. Я. Марра; подробнее об этой эпохе см. Алпатов 1991. При этом господство этой теории парадоксальным образом привело к сравнительно ранней активизации типологических исследований. Внимание к структурным типам языков обусловлено прежде всего резко отрицательным отношением марризма к сравнительно-историческому языкознанию и фактическим возрождением стадиальной типологии Гумбольдта (в марксистской интерпретации). В этих условиях типология одной из немногих областей, сравнительно мало затронутых идеологией. Несмотря на наличие в их трудах формальных «реверансов» в сторону марризма, такие ученые, как И. И. Мещанинов и В. И. Абаев, на практике ставили вполне осмысленные исследовательские задачи; ср. наиболее известную работу Мещанинова «Глагол» (Мещанинов 1949), которая, хотя в основном и утратила актуальность, практически не содержит собственно марристских положений. В некоторых случаях исследователи той эпохи сумели предвосхитить более поздние достижения типологии и теоретической лингвистики; так, В. М. Алпатов высоко оценивает некоторые ранние теоретические работы В. И. Абаева (Алпатов 2013). Эту исследовательскую традицию, очищенную от марристской оболочки, продолжил Г. А. Климов — крупный кавказовед, которому принадле- Лингвистическая типология 357 жат важные работы по типологии активного строя и идея «контенсивной типологии» как типологии, ориентированной на семантическое содержание и средства его выражения в языках мира (Климов 1983). Отдельно следует отметить Ленинградскую типологическую школу, основанную А. А. Холодовичем, развитие которой связано также с именами В. П. Недялкова и В. С. Храковского. Ленинградской школой разработан новаторский метод составления коллективных трудов по типологии отдельных классов конструкций по единой схеме: редакторами тома создается (во многом дедуктивное, ориентированное на семантику) исчисление возможных типов конструкций, составляется соответствующая анкета; специалисты по конкретным языкам описывают их по единой предложенной типологами модели. Среди важнейших работ этой школы — типология пассива (Холодович 1974), типология результатива (Недялков 1983); наконец, монументальный пятитомный сборник, посвященный реципрокальным конструкциям (Nedjalkov 2007). Работы Ленинградской школы сыграли решающую роль в развитии анкетного метода в типологии. Каноническая типология Г. Корбетта и его последователей (Brown et al. ed. 2013) во многом основана именно на идеях Ленинградской школы. Центральная роль в развитии типологии в СССР и России принадлежит А. Е. Кибрику и руководимой им школе к о г н и т и в н о й т и п о л о г и и, сформировавшейся вокруг Отделения теоретической/структурной и прикладной лингвистики МГУ. А. Е. Кибрику, специалисту по нахско-дагестанским языкам, принадлежат важнейшие работы по синтаксической типологии, основные результаты которой собраны в книге А.Е. Кибрик 2003. Особо следует отметить сформулированные Кибриком «лингвистические постулаты» (А.Е. Кибрик 1983/1992), являющиеся одним из первых в мировой лингвистике последовательных изложений функционалистских принципов. 16. Социолингвистика М. А. Даниэль Социолингвистика — это направление лингвистики, исходящее из предположения о том, что, раз язык существует в человеческом сообществе и используется для коммуникации между членами этого сообщества, то и исследовать язык следует в его связи с социальными ф у н к ц и я м и и м е х а н и з м а м и. 16.1. Cоциолингвистика в ее соотношении с другими подходами к изучению языка 16.1.1. Язык и общество 16.1.2. Язык и государство 16.1.3. Язык и другие языки Литература для дальнейшего чтения: Беликов, Крысин 2001; Вахтин, Головко 2004; Meyerhoff 2006; Bayley et al. 2013. 16.1. Cоциолингвистика в ее соотношении с другими подходами к изучению языка Социолингвистика иногда определяется как наука, находящаяся на стыке социологии и лингвистики — т. е. как дисциплина, носящая по преимуществу междисциплинарный характер. Может показаться, что это следует из самого определения предмета социолингвистики — социальное в языке, или язык в социуме; или из ее методов, которые она, изучая язык, в определенной степени заимствует у социологии. Однако отрасль социологии, которая рассматривает язык в ряду других социальных объектов — стереотипы поведения, этническая и иная социальная самоидентификация — иногда предлагается обозначать особым термином с о ц и о л о г и я я з ы к а (ср. Вахтин, Головко 2004). Социология языка действительно является междисциплинарной областью, хотя и тяготеет скорее к социологической науке, чем к лингвистике. В то же время круг задач, традиционно покрываемых термином социолингвистика, как и методы их решения, составляет самостоятельную собственно лингвистическую парадигму (наряду со структурализмом, функционализмом, когнитивной лингвистикой и пр.). Ниже мы в ос- Социолингвистика 359 новном — хотя и не исключительно — сосредоточимся именно на сферах интереса социолингвистики в этом смысле слова. Действующие силы, приводящие к появлению новых научных парадигм, часто комбинируют внешние и внутринаучные, парадигматические факторы. В случае социолингвистики внешние, социально-исторические факторы играли большое значение. Это мощные социальные перестройки, такие как образование советского государства и ломка прежних социальных иерархий, в ходе которых ранее неравноправные языковые варианты оказались в некотором смысле уравненными или по крайней мере смогли взглянуть друг другу прямо в глаза. Яркой иллюстрацией таких процессов — в художественной обработке — служат сцены из повести «Собачье сердце» М. А. Булгакова (ср., например, гендерную составляющую в первой встрече Преображенского с членами домкома или подготовленный Борменталем транскрипт освоения Шариковым человеческого языка). Появляется целая плеяда советских социолингвистов послереволюционных десятилетий — идеи мировой революции, равенства народов (малых и больших) СССР, глубокие изменения в социальной структуре общества привлекали внимание исследователей к тем аспектам языка, которые в традиционной лингвистике практически игнорировались (Поливанов 1931; ср. обсуждение в Беликов, Крысин 2001). В то же время, зародившаяся существенно позже, уже в середине ХХ века, западная социолингвистика в значительной степени выросла из попыток преодолеть жесткие рамки, которые на исследование языка накладывал структурализм и другие изводы соссюровской теории языка (например, генеративная грамматика как своеобразное продолжение идеи о примате языка над речью) и, в меньшей степени, другие традиционные парадигмы языкознания (например, традиционный сравнительно-исторический метод) (Вахтин, Головко 2004). Это объясняет относительно разнородный характер исследований, которые традиционно относятся к социолингвистике. Практически каждый методологический тезис структурализма порождает своего рода антитезис социолингвистики, который определяет одно из направлений социолингвистики: т е з и с о ц е л о с т н о с т и, з а м к н у т о с т и я з ы к о в о й с и с т е м ы — язык можно изучать изолированно, сам по себе; а н т и т е з и с — различные языковые системы тесно взаимодействуют между собой как на межэтническом уровне (контактная социолингвистика), так и в голове двуязычного носителя (билингвизм, языковая интерференция); понимать и моделировать функционирование языка можно только через понимание такого взаимодействия. 360 М. А. Даниэль т е з и с о п р о т и в о п о с т а в л е н и и я з ы к а и р е ч и — речь обладает индивидуальными особенностями, но язык как система, отвечающая за речепорождение, универсален для всех носителей, поэтому он является первичным объектом изучения; а н т и т е з и с — именно система, которая существует в голове каждого носителя и определяется частными, характерными для конкретной группы людей или даже конкретного носителя свойствами (вариационная социолингвистика), и представляет главный интерес для лингвистического анализа; речевое поведение и взаимодействие между носителями является не промежуточным объектом, с помощью которого мы реконструируем абстрактную систему, а как раз основным, первичным предметом изучения (анализ речевого поведения). тезис о непроницаемости границы между синхронией и д и а х р о н и е й — исследование истории языка и синхронного состояния языка как системы являются независимыми лингвистическими дисциплинами с различной методологией; а н т и т е з и с — языковые изменения являются постоянным процессом, который можно и нужно наблюдать в текущем состоянии языковой системы (изучение механизмов языковых изменений через изучение языковой вариативности), причем традиционные методы сравнительно-исторического языкознания не представляют никаких инструментов для такого наблюдения. Было бы неправильно утверждать, что социолингвистика приняла на себя всю тяжесть преодоления методологических ограничений структурализма. Жесткое разделение на диахронию и синхронию преодолено в одном из важных направлений функциональной типологии — теории грамматикализации. Феномены билингвизма и освоения языка попали в сферу интересов психолингвистики. Изучение речевого поведения, в том числе анализ речевых ошибок (в противовес языку как системе, регулирующей «правильное» речевое поведение) стало одним из центральных предметов лингви стического анализа дискурса. Однако любой выход за пределы герметичной структуралистской модели оказывался в той или иной мере связан с внешним — в широком смысле социальным — контекстом речевого поведения, так что по крайней мере на какое-то время термин с о ц и о л и н г в и с т и к а стал своего рода обобщающим для всевозможных альтернатив структуралистскому подходу к изучению языка — как тех, которые были сильно связаны собственно с социальной ролью языка, так и тех, для которых социальная составляющая имела второстепенный характер. Социолингвистика 361 Возникло своего рода противопоставление «внутренней» лингвистики, полагавшей своим объектом языковую систему per se и долгое время остававшейся на позициях структурализма, и «внешней» лингвистики, которая рассматривала язык в его функционировании и взаимодействии с носителями, с другими языками и пр. По мере того, как представители чистой лингвистики постепенно покидали установки структурализма, некоторые области исследования становились конфликтными сферами интересов — так, исследователи, в центре внимания которых находится освоение языка (как первого, так и, особенно, второго), могут относить себя к социолингвистам или психолингвистам; исследования речевого взаимодействия могут позиционироваться как социолингвистические или собственно лингвистические (дискурсивно ориентированные) и т. п. Даже если предположить, что со временем социолингвистика постепенно сузится до тех рамок, которые наиболее соответствуют внутренней форме этого термина, современная ситуация в науке пока от этого достаточно далека. В этом — теоретически возможном — более узком смысле социолингвистика должна была бы, по-видимому, ограничиться изучением социального измерения языка, сблизиться с социологией (до определенной степени, стать социологией языка по Вахтину и Головко), в соответствии с тем, что можно было бы ожидать, опираясь на внутреннюю форму термина. Это отчасти уже происходит: сегодня социолингвистика ассоциируется в первую очередь с исследованиями языковой вариативности, где любой анализ языковых данных сопровождается социальной интерпретацией. Прекрасным и уже классическим примером такого сплава лингвистического и социального анализа является статья Пенелопы Экерт (Eckert 1986), в которой она анализирует вариативность в реализации гласных в речи подростков в пригороде Детройта не как отражение заимствованных из социологии социоэкономических категорий (рабочий класс, средний класс и так далее), а как эмпирическое основание для выделения социальных категорий, которые использует сами школьники для самоопределения (а именно Jocks, разделяющих мейнстримовые социальные ценности, своего рода «промокашки» и «ботаники»; и Burnouts, образующих подростковую контркультуру). Тем не менее, проведение однозначной границы между собственно социальным (например, отношение к языку) и несобственно социальным (например, контактные языки) объектами исследования в социолингви стике невозможно. Удачным представляется определение предмета «узкой» социолингвистики, предложенное Мириам Мейерхофф: социолингвистика занимается изучением языка как носителя социальных смыслов (Meyerhoff 2006). 362 М. А. Даниэль Действительно, если «внутренняя» лингвистика толкует смысловое содержание языкового знака, то социолингвистика может исследовать, например, социальные факторы, обуславливающие выбор того или иного варианта лексического выбора/регистра/диалекта/языка в определенной коммуникативной ситуации. Если «внутренняя» лингвистика занимается выявлением таких правил, нарушение которых ведет к аграмматичности, неправильно сти высказывания, то социолингвистика выявляет те правила выбора, которые способны нарушить уместность высказывания (в данной ситуации или для данного носителя). Для иллюстрации воспользуемся ярким примером, приведенном в Беликов, Крысин 2001. Речь идет о начале XX века. Согласно воспоминаниям провинциального учителя, в небольшом городе, где он преподавал, здесь было «гимназическим» словом и употребление его вместо тут в домашней обстановке рассматривалось неуместным и вызывающим. Напротив, в гимназии недопустимым считалось употребление тут. Никаких проблем с пониманием таких высказываний у адресатов, очевидно, не существовало. Именно понятие уместности (языкового варианта) оказывается центральным для многих областей социолингвистики. В этом примере важно то, что не только «низкий», домашний вариант стигматизируется в более «высокой» речевой ситуации — то же происходит и с неуместным использованием «высокого» варианта. Это вполне типичная ситуация. Кроме того, этот пример хорошо демонстрирует различие и комплементарность внутренней и внешней лингвистики как подходов к анализу языка. Внутренняя лингвистика будет заниматься поиском тонких семантических различий между значениями местоимений тут и здесь — и вполне преуспеет. Это, однако, никак не может помешать получить значимые результаты в исследовании их социальной дистрибуции. И те, и другие результаты будут эмпирически оправданы, так как языковые варианты могут быть одновременно противопоставлены и референциально, и ситуативно в речи даже отдельного носителя. Для социолингвистики окажется существенным, в речи каких социальных слоев сосуществуют оба варианта; как они распределены в спектре всевозможных речевых ситуациях; какую реакцию выбор неожиданной формы вызывает у собеседников и т. д. Таким образом, социолингвистика — крайне разнородная область исследований — это прямо вытекает из истории ее появления и определения сферы ее интересов «по остаточному принципу». Ниже мы проиллюстрируем лишь основные направления современной социолингвистики. 16.1.1. Язык и общество. Приведенное выше определение предмета социолингвистических исследований — язык как носитель социальных значе- Социолингвистика 363 ний — в наибольшей степени приложимо именно к исследованиям функционирования языка в социальном контексте. Важнейшая функция языка (и языковых вариантов): быть компонентом идентичности той или иной группы в обществе, осознаваемым или неосознанным маркером принадлежности к определенной группе как изнутри группы (самоопределение группы по отношению к обществу), так и снаружи (определение группы обществом). Так, основной функцией профессиональных жаргонов и немаловажной функцией региональных диалектов и малых языков в современном обществе является очерчивание границ профессионального, субэтнического или этнического сообщества. Почти любой говорящий имеет в своем распоряжении инвентарь языковых систем или подсистем, по-разному определяющих его групповую принадлежность — профессиональные жаргоны, региональные варианты языка или даже различные языки. Для обозначения различных доступных говорящему языковых подсистем используется термин к о д. Выбор кода в конкретной ситуации, с конкретным собеседником и при разговоре на определенную тему в качестве одной из функций может позиционировать его как принадлежащего к определенной группе. Действительно, аварец свободно мог бы говорить говорить с земляком по-русски, так как подавляющее большинство жителей российского Кавказа свободно говорят по-русски. Однако такое обращение может быть сочтено неуместным и вызывающим — «зачем он говорит по-русски, когда можно по-нашему». Если внутригрупповой код не характеризуется меньшим социальным престижем (в нашем примере, аварский по сравнению с русским), конфликтность ситуации полностью или отчасти снимается, но ощущение неуместности остается. Программист, говорящий с коллегой, чаще назовет драйвер дровами — выбор вполне понятного адресату, но неспециального слова драйвер покажется ему неуместным и заставит искать прагматическую причину такого неординарного выбора номинации. Нарушение социальных правил выбора варианта приводит не к аграмматичному, а к неуместному высказыванию. Процесс усвоения ребенком таких правил иногда называется языковой социализацией и может продолжаться дольше, чем усвоение грамматических правил построения правильных высказываний; считается, что инвентари языковых вариантов усваиваются до позднеподросткового возраста (согласно некоторым оценкам, до 12 лет), а определенные изменения в них могут происходить уже и во взрослом возрасте (так называемый life-span change, ср. Sankoff, Blondeau 2007). Выступая в функции выражения групповой идентичности, язык оказывается в одном ряду с такими социальными и культурными маркерами идентичности как поведенческие стратегии (например, стратегии вежли- 364 М. А. Даниэль вости), стиль одежды или другие внешние признаки групповой принадлежности (например, традиционная одежда у малых народов, пирсинг или тату у молодежных групп, и т. п.). Большая важность языка по сравнению с другими маркерами идентичности определяется тем, что он хуже поддается замещению (хотя и татуировки не всегда легко сводимы) и является опорным маркером идентификации этнической группы, а этническая самоидентификация — один из основных типов социальной идентичности. Именно поэтому фактор самоидентификации так важен для сохранения малых языков в ситуации двуязычия, где вторым языком является престижный, количественно доминирующий язык с широкой сферой функционирования. Известны случаи, когда идентичность сохраняется после полной утраты этниче ского языка, но сохранение этнического языка после полной утраты идентичности, по-видимому, практически исключено. Другим важным объектом исследования вариационной социолингви стики являются гендерные языковые варианты, то есть коды, выбор которых определяется половой принадлежностью или, точнее, гендерной самокатегоризацией говорящего. Некорректное использование этих кодов или их смешение может приводить к ощущению, что говорящая «неженственна» или, наоборот, говорящий «маскулинен». Яркой иллюстрацией является небольшой фрагмент из фильма Киры Муратовой «Астенический синдром» — в течение нескольких минут крупным планом показывается женское лицо, причем весь монолог состоит почти исключительно из обсценной лексики. В начале 1990-х эта сцена производила шокирующее ощущение, близкое к катарсису древнегреческой трагедии. Сейчас гендерные ограничения, определяющие доступность этого лексического слоя, кажется, быстро размыва ются. Интерпретация результатов исследования женского речевого поведения предложен в другой статье Пенелопы Экерт (Eckert 1989). При наличии лингвистически значимых и четко осознаваемых языковым коллективом различий между мужской и женской речью иногда говорят об особых женских языках; однако ситуация эта более характерна для традиционных обществ и является объектом лингвистической антропологии более, чем социолингвистики (см. обзор Dunn 2014). В некоторых случаях уместность или неуместность выбора того или иного варианта или кода определяется не личностью говорящего или адресата, а темой сообщения или самой ситуацией коммуникации. Носители малого языка, обычно общающиеся между собой на этом языке, могут переходить на русский, если речь заходит про их отношения с государством (пенсия, военная служба и т. п.). В дагестанских селах русских нет, но если коммуникация происходит в школе или на школьные темы, более уместным счита- Социолингвистика 365 ется общение по-русски. Тематически или ситуативно мотивированные переходы на другой код уже не будут расцениваться адресатом как неуместные или оскорбительные. Отчасти это связано с тем, что некоторые термины и реалии существуют лишь в доминирующем языке; однако это объяснение недостаточно, так как для преодоления этого ограничения существуют и другие языковые техники, например, вставки слов из одного языка в высказывание на другом языке. В некоторых социальных сферах, например, сакральной или научной, может быть закреплен язык, в целом чуждый языковому сообществу (латынь, церковно-славянский, иврит; английский как язык науки в некоторых западноевропейских странах — особенно в Нидерландах). Иногда выбор определенного кода может быть обусловлен соб ственно передаваемой информацией (переход на малый язык или секретный жаргон при посторонних), однако общество в целом склонно переоценивать эту функцию: принцип «раз говорят по-своему, значит, какие-то секреты есть у них от нас» далеко не всегда является адекватной интерпретацией перехода на другой язык. Переход с языка на язык может происходить как между различными коммуникативными ситуациями, так и в пределах одного высказывания. Построение типологии ситуаций, в которых одни и те же индивиды общаются между собой на разных языках (или разных вариантах языка) в разных речевых ситуациях в зависимости от социального контекста коммуникативного акта, моделирование функциональных разграничений двух или более кодов образует особую сферу социолингвистических исследований — исследование ситуаций д и г л о с с и и (Ferguson 1959). Исследование случаев перехода с языка на язык в пределах высказывания — п е р е к л ю ч е н и е к о д о в — имеет важные последствия для понимания как механизмов языкового контакта (как вероятная начальная стадия освоения заимствований), так и билингвизма (как способ сосуществования двух языков в мозге одного говорящего). Кроме того, некоторые подходы к переключению кода предлагают нетривиальные структурные обобщения, например, морфосинтаксические ограничения на типы смешанных составляющих, предложенные Кэрол Майерз-Скоттон (ср. обсуждение в Winford 2003); или прагматические интерпретации, например, предлагаемое Питером Ауэром понимание одной из функций переключения кода как универсального средства информационного выделения, эмфазы (Auer 1995). Социолингвистические эксперименты показывают, что отношение к коду, его оценка тесно переплетены с отношением к носителю кода. Осознается это, впрочем, редко. Мы часто считаем, что тот или иной язык или языковой вариант объективно менее красив, чем другой язык или вариант, а го- 366 М. А. Даниэль ворящие на нем — более или менее осознанно — кажутся недостойными доверия или социально неуспешными вне зависимости от объективной биографии. Вариант языка, который общество считает непрестижным, кажется тем, кто не принадлежит к группе, некрасивым и неуклюжим. Тот факт, что речь не идет об оценке объективных свойств языкового варианта, может быть доказан социолингвистическими экспериментами: из десяти предъявленных языковых вариантов англичане оценили кокни — речь лондонских низов — как самую некрасивую, в то время как американцы, для которых этот вариант незнаком или менее знаком и поэтому не имеет отрицательных социальных коннотаций, поставили кокни в середину рейтинга (Giles 1970). Сама группа — носитель кода разделяет эти стереотипы лишь частично: она может считать непрестижный код знаком меньшей социальной успешности носителя, но при этом испытывать к нему больше доверия, что отражает тесные социальные внутригрупповые отношения. Эксперименты также показывают, что адресат часто реагирует не только (и не столько) на содержание высказывания, сколько на сам используемый код. Изучение отношения к языку (language attitude) является важным компонентом моделирования социального и психологического межличностного взаимодействия. Подробнее обсуждение этой сферы социолингвистических исследований см. в Вахтин, Головко 2004: Глава 3; Панова 2006. При исследовании социальной вариативности языка часто приходится говорить не о различных социальных группах, а о шкале определенного параметра — например, шкале социоэкономической иерархии (Labov 1966) или шкале социальной интегрированности говорящего (Lippi-Green 1989). Так, границы между средним и рабочим классом более размыты, чем между разными гендерами или особенно этническими группами. Лингвистические «границы» между социальными группами тоже размыты и носят статистический, а не категорический характер. Так, при движении вверх по социальной лестнице вероятность опущения h в начале слова в британском английском (h-dropping; на письме часто обозначается апострофом — ’am вместо ham) монотонно убывает (Milroy 1983). Ясно, что для такой социолингвистики большое значение приобретают экспериментальные или корпусные методы количественной оценки вариативности — иногда вариационную лингвистику называют квантитативной социальной диалектологией. Важнейшим аспектом вариационной социолингвистики является моделирование языковых изменений. Основатель вариационной социолингвистики У. Лабов считал, что разрабатываемое им направление по сути является ветвью исторической лингвистики. Действительно, его эксперименты по определению распространенности инновационных языковых вариантов Социолингвистика 367 (в первую очередь фонетических) были направлены на выявление механизмов распространения этих вариантов в обществе, то есть определение факторов, определяющих, вариант какой социальной группы (инновация в языке) окажется со временем доминирующим (изменение языка). Один из нетривиальных эмпирических результатов вариационистских исследований заключается в том, что в самых разных языковых сообществах женщины в большей степени ориентированы на более престижный (в большинстве случаев, хотя и не всегда — на более нормативный) код, а мужчины предпочитают локальный (vernacular) вариант языка. Исследование механизмов языковых изменений получили дальнейшее развитие в работах Л. и Дж. Милроев в рамках предложенной ими методики исследования социальных сетей — каналов общения между индивидами, по которым могут распространяться инновации (ср. обзор в Milroy, Gordon 2008). 16.1.2. Язык и государство. Государство является способом организации социальной структуры, поэтому, как и в обществе, социальные аспекты языка играют в нем важную роль. Один из центральных моментов соотношения языка и государства — это придание одному из распространенных в государстве языков общегосударственного статуса. Выбор государственного языка, казалось бы необходимый единственно для обеспечения нормального функционирования административных органов, приобретает символический характер. Язык, признанный государственным, получает в глазах граждан государства преимущественное, выделенное положение. Если это родной язык определенной группы, ее члены считают такой выбор признанием своей главенствующей роли в государстве. В то же время члены группы, для которой этот язык является чужим, чувствуют свою ущемленность даже в том случае, если все ее члены свободно владеют государственным языком как вторым. Поэтому в полиэтнических государствах зачастую выбирается несколько государственных языков, хотя, во-первых, это функционально избыточно, и, во-вторых, некоторые из выбираемых языков не вполне приспособлены для целей государственной администрации. В социолингвистике различают административную и интегрирующую функции государственных языков и называют языки, исполняющие такие функции, официальным и национальным языками (Вахтин, Головко 2004; законодательно эти функции обычно не различены). Особенно это заметно в бывших колониях. Так, в Индии два государственных языка: хинди и английский. Здесь, как и в других бывших колониях, существовало стойкое неприятие языка бывших колонизаторов как государственного; с другой стороны, именно этот язык оказывался наиболее у м е с т е н для управления 368 М. А. Даниэль государством. Сейчас хинди играет роль национального, консолидирующего государство, а английский — роль официального, используемого для административной коммуникации. Отчасти схожие, но обладающие своей культурной спецификой языковые конфликты наблюдаются после дезинтеграции полиэтнических государственных образований (СССР, Югославия). В Индии ситуация усугубляется наличием десятков других крупных и сотен мелких языков; возникающая напряженность снимается введением дополнительных официальных (в социолингвистических терминах — национальных) языков на уровне отдельных штатов. Такая языковая политика, широко распространенная в многонациональных государствах (ср. различные официальные языки в различных субъектах Российской Федерации; например, в Республике Дагестан 13 языков кроме русского имеют статус официальных) преследует символические цели и служит этнической эмансипации в несравнимо большей степени, чем практическим нуждам коммуникации. С функционированием языка в обществе и в государстве тесно связаны проблемы кодификации языковой нормы. Здесь также оказываются важными не только (и даже не столько) практические вопросы (издание учебников, словарей), сколько символическая значимость, приписываемая языку обществом. В странах со старой письменной традицией элиты склонны оценивать любые изменения языка как объективные ухудшения, «порчу» языковой материи. Часто негативное отношение вызывают заимствования из других языков («замусоривание языка»), носящая очевидно символический характер угроза «языковой независимости» («так скоро от русского языка ничего не останется»). Общество — или, вернее, та его часть, которую иногда называют языковой элитой, люди с филологическим образованием, журналисты, учителя — оказывает активное сопротивление любым планам орфографической реформы. Красочный анализ связанных с нормой стереотипов предложен в статье Pullum 2004. В то же время, если отвлечься от символических ценностей, ассоциированных с архаичной нормой, очевидно, что никакое разрушение языка русскому языку не грозит ни от внешних, ни от внутренних факторов — речь идет о языковых изменениях либо неизбежных в силу природы языковых изменений (например, аналогическое выравнивание), либо естественных в существующих условиях (языковые контакты). До некоторой степени, язык с культурной традицией продолжает жить по тем же законам, по которым живут сотни бесписьменных языков, и попытки жестко контролировать его изменения в целом обречены на неудачу. Примером может служит изменение акцентной парадигмы некоторых русских глаголов. Если в семидесятые и восьмидесятые годы изолирован- Социолингвистика 369 ный вариант звóнит удалось стигматизировать, то в целом перенос ударения с окончания на основу в этой группе глаголов остановить невозможно (cр. единственно возможный сегодня дáрит с пушкинским дарúт). Более того, сам стигматизированный вариант в последние декады начинает распространяться и среди образованной части общества. Поэтому исполнимая (и очень важная) задача, которую должно ставить перед собой государство — не сдерживание процессов языковых изменений, а их своевременная фиксация средствами языкового регулирования, например, в сфере образования. 16.1.3. Язык и другие языки. Для перечисленных выше сфер социо лингвистических исследований в центре рассмотрения находится в первую очередь язык как символ. При этом свойства языковой структуры, являющие ся основным или единственным предметом описательной, «внутренней» лингвистики, оказываются более или менее вне фокуса внимания или изучаются постольку, поскольку они релевантны для задач социолингвистики (например, при изучении языковой вариативности). Однако по крайней мере для одной сферы социолингвистических исследований — изучения языковых контактов — элементы языковой структуры и их поведение в случае взаимодействия между языками оказываются основным объектом рассмотрения. Изучение структурных аспектов языковых контактов привело к новым важным результатам в области истории языка. С одной стороны, вопреки ранним обобщениям, в языке нет структурных элементов, вполне устойчивых, полностью застрахованных от замещения заимствованиями; с другой, способность заимствоваться (borrowability) различна для разных классов лингвистиче ских единиц (существительные заимствуются чаще, чем прилагательные и глаголы; словоизменительные показатели — чаще, чем словообразовательные). Подробнее о заимствуемости лексических и морфологических единиц см. Haspelmath, Tadmor 2010 и Seifart 2013, соответственно. Для понимания механизмов языковых контактов очень важным оказывается исследование многоязычных ситуаций, в особенности так называемого традиционного многоязычия в малых языковых сообществах (small scale multilingualism), сохраняющегося в таких регионах высокой языковой плотности как бассейн Амазонки, Австралия или тихоокеанский регион (ср. François 2012 о языковой ситуации на Вануату). В России чрезвычайно важным регионом, где может исследоваться традиционное многоязычие, является горный Дагестан (Добрушина 2011). Отличительная особенность Дагестана заключается в том, что, в отличие от других перечисленных регионов стабильного многоязычия, здесь оно часто асимметрично: носители одного языка владеют языком соседей, а эти соседи не владеют языком пер- 370 М. А. Даниэль вой группы. При этом, насколько можно судить по имеющимся данным, дагестанское многоязычие диахронически устойчиво и не ведет к я з ы к о в о м у с д в и г у (переход с малого языка на доминирующий язык). Взаимное влияние контактирующих языков признается всеми научными школами. Однако в отношении того, какую роль в истории языка играют эти контакты, существуют разные мнения. Традиционная компаративистика, признавая необходимость учитывать языковые контакты для правильной интерпретации данных сравниваемых языков и корректности рекон струкции праязыкового состояния, считает тем не менее, что их не следует переоценивать. Она исходит из посылки, что аккуратная и внимательная работа с языковым материалом позволяет элиминировать заимствования и строго следовать классической древесной модели. Заимствования и другие контактные явления оказываются в этом случае фактором «шума», а в ос нование языковой истории положены внутриязыковые изменения и д и в е р г е н т н ы е процессы распадения праязыка на языки потомки. Многие социолингвисты, напротив, полагают, что контакт может настолько сильно влиять на все элементы языковой структуры, что когнатные (мотивированные общим происхождением) и контактные (мотивированные взаимовлиянием), или к о н в е р г е н т н ы е, явления часто невозможно отделить друг от друга. Более того, с точки зрения контактной социолингвистики сама дихотомия «настоящей» истории языка и контактного шума вряд ли имеет смысл. Контактные явления такая же часть языковой динамики, как и внутриязыковые изменения. Ответы на вопросы о том, какие лексические классы слов чаще, а какие реже заимствуются; что такое калькирование (pattern borrowing); как контакт влияет на синтаксис и пр. становятся не просто вспомогательными инструментами для отсеивания втостепенных данных, а объектом типологизации и предметом социальной и исторической интерпретации. Языковые контакты являются не менее, если не более важным источником данных для реконструкции этнической истории человечества, чем внутренняя реконструкция. В противном случае история языка остается замкнутой в самой себе и перестает быть полезной для исследования истории человечества. Очень ярко конфликт между двумя взглядами на историю языка проявляется в дискуссии о контактных языках — пиджинах, креольских и смешанных языках. Пиджинами называются коммуникативные системы (коды), образу ющиеся в ситуации спонтанно возникающей необходимости коммуникации между несколькими этническими группами, представители которых не имеют общего языка, не владеют языком партнера, а часто по той или иной Социолингвистика 371 причине не могут или не стремятся им овладеть — так называемые ситуации «коммуникативного вакуума». Исторически частый социальный контекст возникновения пиджинов — это торговая коммуникация, например, торговое пограничье или морская торговля. Пиджины существовали и на территории России: на Таймыре (г о в о р к а), в северо-западной зоне (морской пиджин р у с с е н о р с к), а также на российско-китайской границе (русско-китайский пиджин); подробнее см. Перехвальская 2008. Сам по себе пиджин ограничен узкой функциональной сферой, неустойчив и исчезает, как только исчезает соответствующая коммуникативная ситуация. Отчасти именно поэтому пиджины, которых в истории человече ства скорее всего были многие сотни, так плохо документированы, а их роль в лингвистической истории человечества недооценена. Однако в некоторых ситуациях, например, в контексте работорговли (п л а н т а ц и о н н ы е п и д ж и н ы), пиджин имеет шанс стать единственным языком для потомков своих создателей. В таких ситуациях говорят о нативизации, или креолизации пиджина и превращении пиджина в креольский язык. В отличие от пиджина, креольский язык обслуживает широкую функциональную сферу, соответствующую любому языку «естественного» происхождения — иначе он не смог бы ни для кого стать родным языком. Следует отметить, что о механизмах, ведущих к креолизации (в том числе — обязательна ли нативизация) идут ожесточенные споры. Возникает вопрос: в какой степени креольские языки могут быть встроены в классическую сравнительно-историческую модель (McMahon 2013)? Многие компаративисты считают, что креольские данные не представляют собой особой проблемы — они принадлежат к той семье, откуда происходит большая часть лексических элементов языка (обычно, хотя и не всегда, значительный процент лексики действительно приходит из одного языка — так называемого языка-лексификатора). Однако тут имеет место подмена понятий. Вероятно, можно «вписать» креольский язык в определенную языковую семью через обычную процедуру установления фонетических соответствий, так что модель родословного древа будет сохранена. Однако установление таких соответствий является для исторической лингвистики лишь приемом реконструкции истории языка. Традиционная компаративистика имплицитно предполагает, что язык передается внутри группы естественным образом, непрерывно эволюционируя от поколения к поколению. То есть, говоря о том, что креольский язык может быть встроен в то же дерево, что и язык классификатор, мы намеренно и осознанно закрываем глаза на то, что как раз эволюция этого языка — первичный предмет сравнительно-исторического метода — по крайней мере в момент его возникновения принципи- 372 М. А. Даниэль ально иная, чем обычная дивергенция диалектов. В случае креольского языка, даже если нам удастся построить систему регулярных соответствий, мы заведомо знаем, что естественная эволюция языка была прервана (прошла через стадию пиджина). Наконец, существование так называемых с м е ш а н н ы х языков, в которых, в отличие от креольских, часто бывает затруднительно выделить основной язык-лексификатор, ставит модель родословного древа под прямую угрозу. Впрочем, это очень редкий феномен, в России засвидетельствован только один такой случай — медновский язык, который, по-видимому, является языком потомков смешанных русско-алеутских браков; само существование смешанных языков как особого феномена компаративистами иногда оспаривается. С другой стороны, многие социолингвисты, занимающиеся языковыми контактами, предлагают считать традиционные объекты компаративистики (например, английский язык, в котором обнаруживается огромный пласт романского языкового материала) языками контактного происхождения и ставят вопрос о том, как можно быть уверенным, что те или иные древние языки, на которые компаративистика традиционно опирается, не являются исходно креольскими или смешанными языками. Таким образом, проблема отнесения или неотнесения креольского языка к определенной семье должна отойти на второй план; напротив, следует сосредоточиться на диагностиках выявления следов пиджинизации и креолизации в лексическом составе языков и типологических особенностей креольских языков и пиджинов, чтобы эффективнее выявлять следы языковых контактов и контактных языков в истории языка. Другой, более простой пример расхождения между социолингвистикой и компаративистикой — акценты в исследовании диалектов. Для традиционной, исторически ориентированной диалектологии диалект представляет интерес в первую очередь как отдельный идиом (лект), результат языковой дивергенции, с традиционными же вопросами о сопоставительной грамматике и фонетике диалектов одного языка. С точки зрения социолингвистики представляет интерес взаимодействие между диалектами, в частности процессы диалектного выравнивания (создания смешанных вариантов диалектов) или динамики их утраты под влиянием литературного языка (Chambers, Trudgill 1998). Конечно, изучение взаимодействия между языками не исчерпывается дискуссией с компаративистикой. Есть и вполне классические парадигмы контактной лингвистики — такие как, например, ареальная лингвистика, ставящая собственные интересные задачи: насколько необходимо понятие я з ы к о в о г о с о ю з а (географической группы языков, сходства между ко- Социолингвистика 373 торыми не могут быть объяснены общим происхождением) или соответствующие данные лучше описывать в терминах парных взаимодействий между конкретными языками? Каковы механизмы языковой конвергенции и как они отличаются в случае контакта близкородственных и неродственных языков? Как направление заимствований связано с типом социальных взаимодействий между соответствующими этническими группами (например, симметричный контакт в регионах традиционно высокой языковой плотности и асимметричный контакт в случае иммигрантов в чуждой языковой среде)? Тем не менее, своеобразие социолингвистического подхода к межъязыковому взаимодействию в еще большей мере проявляется при рассмотрении не результатов, а механизмов распространения контактных явлений. Тут в игру вступает не язык как система, а носитель этой системы. Действительно, никакие свойства одного языка не могут попасть в другой язык в том случае, если их некому передать. Контактируют не языки сами по себе, а их носители; или, еще точнее, языковые системы в голове конкретных носителей (я з ы к о в а я и н т е р ф е р е н ц и я). Протагонистом ситуации контакта оказываются те представители контактирующих групп, которые в той или иной степени владеют обоими «контактирующими» языками. Здесь в центре внимания оказываются ситуации двуязычия, проблема свободного и несвободного владения вторым языком; влияние родного языка на второй язык (или наоборот), например, акцент или кальки; переключение кода, т. е. переход с языка на язык в рамках одного высказывания; проблема выбора языка межэтнической коммуникации (симметричный, асимметричный или пассивный билингвизм; использование лингва франка, неродного для представителей обеих языковых сообществ) и т. п. Поскольку многоязычие гораздо более распространено в мире, чем одноязычие, типология билингвальных ситуаций и изучение языковой интерференции оказываются важнейшими направлениями науки о языке. 17. Кросс-культурная прагматика М. Б. Бергельсон Кросс-культурная прагматика в широком смысле термина представляет собой совокупность дисциплин, изучающих язык в универсуме культуры, то есть — дей ствие на языковую структуру и языковую деятельность различных социокультурных факторов. Эти направления исследования крайне быстро развиваются в последние 30 лет, демонстрируя широту охвата явлений, разнообразие методов, сфер приложения и научных парадигм. Эта динамика отражается в разнообразии терминов, которыми называется данная сфера исследований и ее отдельные направления в мировой лингвистике: linguistic anthropology, anthropological linguistics, intercultural pragmatics, interlanguage pragmatics, contrastive, or cross-cultural, pragmatics, intercultural communication, cultural linguistics, interactional sociolinguistics, ethnography of communication, ethnolinguistics, а также их аналоги (не всегда полностью совпадающие при похожести названий) лингвокультурология, этнолингвистика, межкультурная коммуникация и др. Содержательно научные парадигмы различаются между собой по направлению исследований: от языка, точнее языковой практики, к различным социальным формам или наоборот — от социокультурных факторов к их влиянию на языковую форму. Для названия направления исследований также большое значение имеет и его географическое происхождение. Так, лингвистическая антропология в американской номенклатуре является одним из четырех подразделений антропологии в целом. Она сформировалось в то время, когда лингвистика в целом еще существовала в американских университетах в рамках антропологических кафедр. В зависимости от эпох, школ и направлений и лингвистическая антропология, и прагматика, в ее кросс-культурном приложении имели разные исследовательские программы. Пререквизиты: Дискурс, Семантика, Лингвистика в контексте когнитивных наук, Социолингвистика. 17.1. Язык зеркало культуры vs. язык инструмент культуры 17.2. Кросс-культурная прагматика как совокупность исследовательских программ 17.3. Кросс-культурная прагматика в контексте близких дисциплин и направлений лингвистики 17.3.1. Лингвистическая антропология — история дисциплины Кросс-культурная прагматика 375 17.3.2. Межкультурная прагматика и актуальные направления лингвокультурологии (cultural linguistics) — современное состояние дисциплины 17.3.3. Applied linguistics vs. Лингводидактика и Interlanguage Pragmatics 17.4. Методы кросс-культурной прагматики 17.5. Будущее дисциплины: дискурсивный, корпусный и инструментальный подходы Литература для дальнейшего чтения: Trosborg ed. 2010; Sharifian 2017; Kecskes 2013. 17.1. Язык зеркало культуры vs. язык инструмент культуры Одним из главных трендов современной лингвистики является коммуникативная исследовательская парадигма. Не только те области языкознания, которые традиционно занимались речевым узусом и учитывали в качестве параметров описания коммуникативные факторы, но и собственно грамматика и семантика языка обратились к прагматике речевых взаимодействий. Главное отличие коммуникативных исследований от собственно лингвистических исследований тех же проблем заключается в ориентации на сам процесс языкового взаимодействия с опорой на культурно обусловленные знания, которые в исследованиях коммуникативного толка принято называть культурно обусловленной коммуникативной компетенцией. Вопрос о взаимоотношениях языка и культуры настолько же банален, насколько и фундаментален. После великих лингвистов XIX и первой половины XX века (Гумбольдт, Гердер, Боас, Сепир) его даже как-то неудобно обсуждать. Однако культура была успешно выкинута из лингвистики на достаточно долгий период времени в таких различных парадигмах лингвистического знания, как дескриптивизм, структурализм, генеративная грамматика, модель «Смысл-Текст» и другие. Даже длившееся почти 50 лет обсуждение гипотезы лингвистической относительности (так называемой гипотезы Сепира-Уорфа) максимально сосредоточилось на взаимоотношениях языка и мышления, но не языка и культуры, выкинув последнюю из экспериментальной части решаемого уравнения. Отчасти это объяснимо тем, что став наукой, лингвистика не хотела связываться с такой неопределенной, расплывчатой и еще хуже, чем язык поддающейся формализации областью, как культура. Но и возвращение «культуры» в повестку большинства исследовательских программ лингвистики закономерно произо шло сразу по многим направлениям. В современной науке о языке общий для гуманитарных и социальных наук тренд проявился тремя составля ющими: коммуникативной (фактор адресата, дискурс), когнитивной (роль знаний, контекста) и интеракционным конструктивизмом (интерпретация 376 М. Б. Бергельсон смыслов как их совместное конструирование участниками коммуникативного события). Осознание значимости «культурных знаний» для успешной коммуникации логически вытекает из того внимания, которое современная лингвистика уделяет проблеме контекста. Контекст при этом понимается максимально широко и как ментальное, и как социокультурное пространство, в которое погружен язык. Сама языковая деятельность представляет собой форму социального действия. Языковая практика и социальный контекст взаимно обуславливают друг друга. 17.2. Кросс-культурная прагматика как совокупность исследовательских программ Кросс-культурная прагматика не является общепризнанным «зонтичным» термином на русском языке, хотя и обозначает естественную область исследований, а именно — исследования по прагматике в контексте различных лингвокультур. Это вытекает из определения прагматики как той части лингвистики, которая изучает вклад контекста в значение языковых выражений. Для кросс-культурной прагматики этот контекст во многом сопоставительный. Анна Вежбицка — ключевая фигура в этой области исследований — считает (Wierzbicka 2003), что кросс-культурная прагматика призвана изучать интеракцию между коммуникантами с учетом их ожиданий, основанных на различных культурных сценариях. Сам термин c r o s s - c u l t u r a l p r a g m a t i c s был ранее использован в Pride (1985), но именно в первом издании ее книги Cross-cultural Pragmatics — the Semantics of Human Interaction (Wierzbicka 1991) исследование речевых жанров, коммуникативных стилей, иллокутивных актов в различных языках и культурах было объединено влиянием культурных ценностей на результирующую лингвистическую форму, которая характеризовала коммуникативный акт. 17.3. Кросс-культурная прагматика в контексте близких дисциплин и направлений лингвистики 17.3.1. Лингвистическая антропология — история дисциплины. Исторически лингвистическая антропология, сформировавшаяся на американском континенте, включала в себя лингвистику и рассматривала язык с точки зрения его влияния на общественные институты. При этом язык для лингвистической антропологии в целом выступает не как объект, а скорее, как инструмент изучения, и кросс-культурная прагматика становится одним из исследовательских направлений. В рамках междисциплинарного Кросс-культурная прагматика 377 а нтропологического подхода к языку Дюранти (Duranti 2003) описывает три парадигмы лингвистической антропологии, последовательно формировавшиеся в течение целого века, но заметные и в современных исследованиях. Первая, иногда называемая а н т р о п о л о г и ч е с к о й л и н г в и с т и к о й, на рубеже XIX–XX веков фокусировалась на грамматическом описании и типологических классификациях языков Северной Америки, считавшихся «экзотическими». В рамках именно этого направления возникла одна из самых обсуждаемых и противоречивых концепций о взаимоотношениях языка, мышления и культуры — гипотеза лингвистической относительности, получившая название «гипотеза Сепира-Уорфа». Всю вторую половину XX века лингвисты, но в первую очередь — специалисты по кросс-культурной психологии, проводили многочисленные эксперименты, доказывая или опровергая тезисы касательно того, в какой степени грамматическая структура языка предопределяет мышление его носителей или только влияет на него — (Koerner 1992; Gumperz, Levinson 1991; Lucy 1997; Boroditsky 2011; Slobin et al. 2003). Относительно устоявшийся на рубеже XX и XXI веков консенсус в виде «слабой» версии гипотезы лингвистической относительности (= влияет, но не определяет) был в очередной раз взорван появлением книги Дэниела Эверетта (Everette 2005) о языке пираха(н). Дискуссия была вызвана отсутствием в этом языке многих категорий — цвета, числа и (на более абстрактном уровне) — рекурсии и способности говорить о предметах, не находящихся в дейктическом пространстве коммуникантов. Автором устанавливалась связь между влиянием культуры (мира, в котором обитают носители пирахан) на языковые структуры и последующим отражением этого в их мышлении — см. статьи в 5-ом выпуске Российского журнала когнитивной науки (РЖКН 2018). Вторая парадигма лингвистической антропологии тесно соотнесена с научной программой к р о с с - к у л ь т у р н о й (а ранее — к о н т р а с т и в н о й) п р а г м а т и к и, которая отражает сферу интересов прагматики в целом. Универсалистские принципы лингвистической прагматики — принцип кооперации Грайса (Grice 1975), стратегии вежливости Браун-Левинсона (Brown, Levinson 1987), теория речевых актов (Austin 1962; Searle 1969) — проверяются на их применимость в рамках других лингвокультур (Gass, Neu eds. 1996). В течение 10-15 лет после выхода книги Пенелопы Браун и Стивена Левинсона Journal of Pragmatics практически полностью был посвящен работам по стратегиям вежливости при реализации различных коммуникативных актов (просьб, извинений, комплиментов, запретов, адресации и др.) в разных языках. Кросс-культурные различия проявляются, в частно сти, в том, какой тип вежливости — основанный на солидарности или на 378 М. Б. Бергельсон поддержании дистанции — характерен для данной культуры (Thomas 1983; Scollon 2012 и др.). Кросс-культурные лингвистические исследования нередко принимают форму контрастивной прагматики — сопоставительного анализа «языков» двух культурно противопоставленных групп, пользующихся вроде бы одним общим языковым кодом. Яркий пример такого рода — это работы Деборы Таннен об особенностях коммуникативного поведения мужчин и женщин. Простые высказывания представителей этих двух «культур», сделанные на одном и том же английском языке, понимаются ими неодинаково в рамках разных сценариев. Так, когда «стандартная» женщина жалуется «стандартному» мужчине на какую-то проблему, они оказываются вовлеченными в совершенно разные коммуникативные акты: женщина хочет, чтобы ей посочувствовали, а мужчина считает, что от него ждут практического совета. Самая известная книга Таннен так и называется — Ты просто не понимаешь (You Just Don't Understand, 1990). В целом, исследования в русле кросс-культурной прагматики сфокусированы на культурных ошибках и прагматических неудачах (Boxer 2002). Э т н о г р а ф и я к о м м у н и к а ц и и (ethnography of communication) Делла Хаймса (1974) в отличие от собственно кросс-культурного направления всесторонне исследует коммуникативные практики некоторого сообщества как уникальные культурно-специфичные реализации контекста, жанра, регистра, языкового варианта и прочих параметров коммуникативного события — см. также Carbaugh 2005; Katriel 1990. В развитие этого направления Хаймс занимался этнопоэтикой (ethnopoetics), исследуя устную поэзию и нарративную традицию, в первую очередь, коренных жителей Северной Америки (Hymes 2003). Третьим направлением в лингвистической антропологии считается использование языковых данных и методов лингвистического анализа для изу чения различных социальных феноменов — идентичности, идеологий, дискурсивных сообществ (Duranti 2003). В современной номенклатуре лингвистических дисциплин эта проблематика отнесена к ведению социолингвистики. 17.3.2. Межкультурная прагматика и актуальные направления лингвокультурологии (cultural linguistics): современное состояние дисциплины. Классическая проблематика кросс-культурной прагматики базируется на господствовавшем во второй половине XX века представлении о культуре, которое находит свое выражение в метафорах «острова в океане» или «стеклянный и невидимый купол», то есть в подчеркивании специфических отличий, неизбежно приводящих к коммуникативной неудаче из-за Кросс-культурная прагматика 379 несовпадения априорно существующих культурных знаний. Однако к началу XXI века, частично в результате глобализации и интенсификации контактов внутри мультикультурных сообществ, изменился общий подход к изучению культуры и межкультурной коммуникации. Вместо феномена культуры на первый план вышло изучение к у л ь т у р н ы х с ц е н а р и е в (cultural scripts), а в исследовании межкультурной коммуникации фокус внимания сместился с культурных различий как причин коммуникативных неудач на ситуативные стратегии преодоления этих различий для достижения коммуникативного успеха. Такой подход опирается на изменившуюся метафору культуры как «моста», создаваемого в рамках коммуникативного взаимодействия. Теоретически и методологически обоснование смены парадигмы в области кросс-культурных лингвистических исследований произошло в рамках таких направлений, как c u l t u r a l l i n g u i s t i c s (Sharifian, Palmer eds. 2011; Sharifian 2017) и м е ж к у л ь т у р н а я п р а г м а т и к а (intercultural pragmatics — Kecskes 2013, 2017; Moeschler 2004). Перевод названия первой исследовательской парадигмы на русский язык представляет известные трудности, но с точки зрения совпадения предмета исследования cultural linguistics практически полностью повторяет положения отечественной лингвокультурологии. Отечественное направление л и н г в о к у л ь т у р о л о г и я, оформившееся в 1990-е гг., получило весьма широкое распространение, центральный термин этой парадигмы — «концепт» — встречается в названиях сотен и более диссертаций. Но лингвокультурология так и не выработала свой метод исследования связи между языком и культурой, который позволил бы более объективно оценивать и осмыслять сделанные в рамках этого направления исследования. Ср., однако, Карасик 2002 и Ларина 2003. В сравнении с отечественным изводом лингвокультурологии c u l t u r a l l i n g u i s t i c s претендует на использование методов когнитивной лингви стики и развитие ее положений вследствие анализа черт языка, кодиру ющих культурно обусловленные концептуализации человеческого опыта. Формулируется понятие c u l t u r a l c o g n i t i o n как комплексной адаптивной системы, возникающей в результате интеракций между членами речевого сообщества во времени и пространстве и неравномерно распределенной между членами сообщества (Sharifian 2017). М е ж к у л ь т у р н а я п р а г м а т и к а является относительно новым направлением исследований, институционализация которого была ознаменована, в частности, образованием в 2004 году журнала “Intercultural Pragmatics”. Эта парадигма исходит из социокогнитивной перспективы, при которой пред- 380 М. Б. Бергельсон шествующий опыт индивидуумов и опыт, возникающий в текущей коммуникативной ситуации, равно важны для конструировании и интерпретации смыслов. Межкультурная прагматика выделяет четыре основных направления исследований: (а) взаимодействие между носителями языка и людьми, для которых он не является родным; (б) коммуникация с помощью лингва франка в ситуациях, когда оба коммуниканта не являются носителями этого языка; (в) многоязычный дискурс; (г) использование языка и динамика освоения у индивидуумов, говорящих на более чем одном языке (Kecskes 2012). 17.3.3. Applied linguistics vs. Лингводидактика и Interlanguage Pragmatics. Если понимать смысл слова «прикладной», как имеющий отношение к практической деятельности, то преподавание и практическое изучение языков являются естественной разновидностью прикладной лингвистики. Именно так и понимается термин a p p l i e d l i n g u i s t i c s в современной науке о языке. Но в отечественной традиции термин п р и к л а д н а я л и н г в и с т и к а означает не совсем то, что его англоязычный перевод. С другой стороны, для обозначения этой области (теория и методология преподавания иностранного языка) по-русски имеется «свой» термин — л и н г в о д и д а к т и к а (ср., однако — Blum-Kulka, Kasper eds. 1993). Обучение иностранным языкам, едва ли не в первую очередь, примеривало на себя современные взгляды на роль культуры в гуманитарных исследованиях. Сначала через л и н г в о с т р а н о в е д е н и е, потом разрабатывая специальные курсы типа «Мир изучаемого языка», преподаватели иностранных языков реализовывали мысль о том, что владение иностранным языком, позволяющее вступать на нем в коммуникацию, включает в себя массу знаний и навыков, которые нельзя отнести к знанию языковых грамматических правил и словаря. Культура проникает во все слои и поры языка, выходя за пределы традиционных «ключевых концептов» (тоска по‑русски) или языковых лакун (англ. self не имеет адекватного перевода на русский язык одним словом), и чтобы овладеть языком, культурные, прагматические, знания и смыслы необходимы. Вопрос, который естественно ставить в данном разделе звучит так: в какой степени достижения м е ж ъ я з ы к о в о й п р а г м а т и к и (interlanguage pragmatics) влияют на положения и методы лингводидактики. Дополнительно можно задаться вопросом о том, в какой степени лингводидактика определяет эффективность изучения иностранных языков индивидуумом и в масштабе общества. В отечественной практике преподавания как иностранных, так и родного языков смена парадигмы проявилась особенно ярко. Традиционно «клас- Кросс-культурная прагматика 381 сическое» преподавание иностранного языка основывалось на изучении грамматики и базового словаря, достаточного для понимания простых текстов. Чтение, перевод, пересказ текстов, выполнение грамматических упражнений, связанных с подстановкой правильных форм при заданном значении — все эти инструменты накопления языковых знаний не были ориентированы на осуществление успешной, в частности — устной, коммуникации. Во главу угла ставилось правильное использование языка, знание правил грамматики, лексической сочетаемости, интонационных контуров. Изучение родного языка в школе происходило по тем же правилам и ограничивалось изучением основ теоретической грамматики, синтаксиса и морфологии, элементов лексикологии и стилистики. Лишь относительно недавно в школьные учебники русского языка вошли практические задания по порождению и интерпретации дискурса, направленные на развитие именно коммуникативной компетенции учащихся. Аналогично, при изучении иностранного языка коммуникативный подход должен определять зависимость заданий и оценки от целей и потребностей ученика. Для множества ситуаций успех общения на иностранном языке связан не столько с правильностью конструкций, сколько с возможностью реализовать свое коммуникативное намерение, например, купить хлеб в магазине, выбрать гостиницу при поездках за границу, или написать письмо иностранному коллеге, а если повезет, то и аннотацию на английском языке к своей статье. В целом, практическое овладение иностранным языком рассматривается как коммуникативный процесс, на начальном этапе которого база данных (знание иностранного языка) отсутствует и формируется в процессе обучения. Другой тренд в преподавании иностранного языка, являющийся своеобразным отражением успехов когнитивной психологии, связан с идеей о том, что сознательное обучение языку должно по возможности имитировать процесс естественного, не осознаваемого, овладения языком (см. skill-based theories of second-language acquisition — Van Patten, Benati 2010). Тогда цель Педагога заключается в создании у Ученика мотиваций, которые максимально похожи на когнитивные процессы, лежащие в основе коммуникативных актов на родном языке, и успешными должны считаться такие речевые стратегии Педагога (такие учебные задания), которые способствуют введению новой информации или проверке закрепленности старой, не используя в качестве транслятора (интерфейса) родной язык. Методики, на практике использующие эти положения, называются «коммуникативно-ролевыми», «игровыми», «погружением» и т. п. Все они в той или иной степени используют элементы ролевых игр. Современные методы преподавания иностранных языков уделяют внимание выработке навыков правильной интеракции. Эти методы из области 382 М. Б. Бергельсон межъязыковой прагматики опираются на достижения теории речевых актов, исследований иллокуции, социопрагматических и прагмалингвистических ошибок (Gass, Selinker 2008). Социопрагматическая компетенция (а ее отсутствие и будет соответствующей ошибкой) означает, что говорящий умеет выбрать подходящий тип иллокуции на иностранном языке в той или иной коммуникативной ситуации. Например, отправляясь в США на прогулку по горам, здороваться с проходящими навстречу незнакомыми людьми, а не проходить молча мимо, как то предполагает отечественная лингвокультура. Прагмалингвистическая компетенция в этом случае будет проявляться в выборе адекватной лингвистической формы для речевого акта «приветст вие» — например, в использовании слова hi, а не good afternoon (Thomas 1983). М е ж ъ я з ы к о в а я п р а г м а т и к а (interlanguage pragmatics) прежде всего фокусируется на усвоении и использовании норм прагматики неродного языка (L2): а именно — как изучающие язык (L2 learners) производят и интерпретируют речевые акты и как развивается их прагматическая компетенция в процессе обучения. В центре внимания находятся стратегии вежливости, косвенные способы выражения недовольства и неодобрения, юмористические эффекты, манифестирующие важные прагматические стратегии при институционализированном обучении иностранному языку. Кроме того интерес для исследователей представляют коммуникативные практики при общении учащихся между собой: двуязычие, смена кода, а также использование этих коммуникативных инструментов для конструирования лингвистической и социальной идентичности (Pütz, Neff-van Aertselaer eds. 2008). 17.4. Методы кросс-культурной прагматики Междисциплинарность кросс-культурной прагматики, ее положение на стыке таких дисциплин, как лингвистическая семантика, философия языка, социолингвистика, критический анализ дискурса, означает также и разнообразие используемых ею методов. Помимо методов социолингвистики (опросники, анкеты), социальной психологии (фокус-группы) и экспериментальной психологии (эксперименты, в том числе и с помощью инструментальных методов изучения деятельности мозга при использовании языка) можно выделить две группы методов, анализирующих непосредственно языковую форму. К первой группе можно отнести метод семантических толкований слов и выражений, описание их употреблений и лексико-семантических полей. Его ярким представителем является создатель самого термина cross-cultural Кросс-культурная прагматика 383 pragmatics Анна Вежбицка, описывающая не только к л ю ч е в ы е п о н я т и я к у л ь т у р ы, но и к у л ь т у р н ы е с ц е н а р и и в терминах более простых универсальных единиц. Сравнивая слова, конструкции, тексты, являющиеся в различных языках как будто бы точными соответствиями, Вежбицкая, используя разработанный ею метаязык семантических примитивов (Natural Semantic Metalanguage — NSM), показывает, что прямые переводные эквиваленты могут скрывать существенные культурно обусловленные различия. Когда мы говорим, например, о дружбе, свободе, гневе, мы невольно приписываем этим понятиям культурно обусловленные смыслы, присущие соответствующим словам данного языка. Тем самым мы придаем им несуществующую универсальность и совершаем серьезную культурную ошибку. Английское понятие friend не включает в себя тех смысловых компонентов, которые присущи русскому понятию «друг» (напр., возможность поделиться некоторой не предназначенной для других информацией или получить/предоставить помощь, не считаясь с затратами) (Wierzbicka 2003). Аналогично дело обстоит не только со значениями слов, но и с использованием культурных сценариев, также не универсальных в отношении той роли, которую они выполняют в конкретной коммуникативной культуре. От традиционных, собственно лингвистических сопоставительных исследований категорий вежливости, форм референции и обращения, анализа речевых актов кросс-культурная прагматика отличается прежде всего функциональной направленностью. Интерес представляют те области, где языковая структура конкретного языка не навязывает жестких запретов на употребление той или иной формы, где возможна вариативность, выбор той или иной стратегии. И то, какая стратегия будет выбрана, в какой именно культурный сценарий воплощается данный дискурс (данное выражение), зависит от культурных особенностей соответствующей коммуникативной общности. По-немецки запрет на курение звучит Rauchen verboten (приблизительно ‘Курить запрещается’). По-английски — No smoking (приблиз. ‘Здесь не курят’). Прямой перевод немецкого выражения на английский (Smoking forbidden) может быть употреблен только, когда курение связано с угрозой жизни, так как только в этом случае англоязычные (британская, американ ская) культуры допускают возможность, что некое лицо или инстанция могут диктовать человеку, как ему себя вести. В нормальной ситуации лишь сообщается, как здесь принято себя вести. Данный пример и аналогичные ему констатируют лишь наличие связи между иллокутивной грамматикой и коммуникативным стилем, характерным для данной культуры. Установление конкретного вида этой связи и, в 384 М. Б. Бергельсон особенности причинно-следственных отношений, требуют очень тщательного обоснования и привлечения данных из смежных дисциплин. В отечественной лингвистике в русле толкования ключевых концептов и сценариев русской культуры работают А. Д. Шмелев, А. А. Зализняк и И. Б. Левонтина (Анна А. Зализняк и др. 2012). Расширение этого метода с привлечением диахронической составля ющей в отношении исторических, фольклорных и духовных коммуникативных практик, культурных и языковых норм этноса имеет место в такой области кросс-культурной прагматики / лингвистической антропологии, как э т н о л и н г в и с т и к а. Цитируя Н. И. Толстого: «… этнолингвистика и социолингвистика иногда противопоставляются как дисциплины с различной хронологической направленностью: первая оперирует преимущест венно исторически значимыми данными, обращаясь к «живой истории», «живой старине» и стремясь в современном материале обнаруживать и исторически истолковывать факты и процессы, доступные историческому упорядочению; вторая базируется почти исключительно на языковом материале сегодняшнего дня и рассматривает его прежде всего в коммуникативно-функциональном, структурно-описательном и нормативно-синхронном аспектах» (Толстой 1995). Вторая группа методов кросс-культурной прагматики представляет собой интерпретативный анализ дискурса на микроуровне в духе и н т е р а к ц и о н н о й с о ц и о л и н г в и с т и к и (interactional sociolinguistics). Внимание к мельчайшим деталям языковой формы устного дискурса, рассматриваемого во всей полноте его содержания и контекста, позволяет описывать коммуникативные практики в рамках и через границы дискурсивных сообществ (Scollon et al. 2012). В последние годы интерпретативный анализ дискурса стал еще более ориентированным на интеракцию и приобрел мультимодальную составляющую. В рамках этого подхода отчетливо проявляется нарративная парадигма: анализ рассказов (stories) и мини-рассказов (small stories) является важнейшим инструментом выявления «культурной грамматики» (Polanyi 1989; Bamberg 2012; DeFina, Georgokopoulou 2011). 17.5. Будущее дисциплины: дискурсивный, корпусный и инструментальный подходы Представляется, что именно в рамках нарративной парадигмы, предметом исследования которой является конструирование и реконструирование носителями языка культурно обусловленных смыслов, ценностей и норм из личного опыта индивидуумов, лежит будущее кросс-культурной прагматики (Kecskes 2017). I V. М е т о д ы 18. Интроспекция О. И. Беляев Термин и н т р о с п е к ц и я в лингвистике употребляется в двух различных смыслах — широком и узком. Интроспекция в широком смысле — это любая оценка человеком содержания его собственного сознания. Большинство лингвистов согласны, что интроспекция в этом понимании является одной из базовых когнитивных способностей человека, значимость которой для коммуникации не подлежит сомнению. Под интроспекцией в узком смысле обычно понимают обращение к интуиции говорящего как элемент исследовательской методологии, как разновидность лингвистического эксперимента. Вокруг этого понятия в последнее время ведется обширная дискуссия. Скептицизм многих лингвистов в отношении интроспекции касается прежде всего реально существующей практики подобных исследований, а также самой технической возможности повысить их методологическую корректность. Так, многие полевые лингвисты критикуют искусственность большинства методов опроса носителей и трудоемкость более сложных методик; по их мнению, основным источником данных для описательной лингвистики должны быть естест венные тексты. Другие исследователи, не являясь принципиальными противниками интро спекции, критикуют традиционную методологию сбора и анализа языковых данных (Wasow, Arnold 2005). Они указывают, что большинство работ по теоретической лингвистике основаны на интуиции самих исследователей или, в лучшем случае, на неформальном опросе небольшого числа носителей. По их мнению, такой традиционный подход приводит к неверным и ненадежным результатам; следовательно, большинство теоретических построений, основанных на нем, также оказываются под вопросом. В качестве ответа на эту критику проводились экспериментальные сравнения этих двух методологий. Так, в работе Sprouse, Almeida 2012 показано, что данные одного из стандартных учебников по современной генеративной грамматике (Adger 2003) обладают достаточно высокой надежностью. Расхождение между традиционным и формальными методами получения интроспективного материала носителей не превышает 2 %. Следовательно, мнение о ненадежности большей части синтаксических данных, высказанное в ряде недавних работ, не имеет под собой оснований. Хотя никто не отрицает ценности — а для некоторых вопросов и безальтернативно 388 О. И. Беляев сти — формальных экспериментальных методик, традиционный метод опроса носителей пока что остается базовым методом оценки интуиции говорящих в синтаксических исследованиях. 18.1. Интроспекция как базовый компонент языковой способности 18.2. Интроспекция как исследовательская методология 18.2.1. Критика традиционного подхода 18.2.2. Эмпирические проверки надежности традиционных методов 18.3. Выводы Литература для дальнейшего чтения: Talmy 2018: 218–262; Wasow, Arnold 2005; Sprouse, Almeida 2012; Тимофеева 2015; Федорова 2013. 18.1. Интроспекция как базовый компонент языковой способности Интроспекция в широком смысле — это любая оценка человеком содержания его собственного сознания. Признание сознания легитимным объектом научного изучения уже само по себе предполагает обращение к данным интроспекции. Подходы, основанные на полном отрицании ценности обращения к интроспекции (прежде всего, радикальный бихевиоризм Б. Ф. Скиннера), были достаточно популярны в первой половине XX века, но на сегодняшний день большинство исследователей в области психологии признают существование сознания и, следовательно, рассматривают интроспекцию как валидный источник научных данных. Люди не только могут иметь и прямо высказывать некоторые идеи о собственном сознании; по-видимому, интроспекция играет роль практиче ски в любой естественной коммуникативной ситуации. Убедительные примеры подобного рода содержатся в работах Л. Талми, одного из наиболее последовательных сторонников исследования интроспекции в лингвистике. Так, используя выражения вроде первое и второе для референции к ранее сказанному, говорящий реферирует к собственному предшествующему дискурсу. Если речь идет об устной, а не письменной речи, этот дискурс не может содержаться нигде кроме рабочей памяти говорящего или слушающего; следовательно, использование таких метаязыковых выражений само по себе предполагает интроспекцию (Talmy 2018: 227). Точно так же интроспекция в процессе дискурса происходит во всех случаях, когда говорящий осознанно подбирает нужное слово (напр., делая паузу перед словом друг, говоря В школе он был моим… другом, представляя человека) или колеблется в выборе правильной формы обращения к собеседнику (что происходит во всех языках, противопоставляющих вежливость во 2-м лице, в том числе в русском). Интроспекция 389 Эти и другие подобные примеры говорят о том, что человек не только обладает абстрактной способностью к интроспекции по отношению к своему собственному употреблению языка, но и активно пользуется ею в процессе речи. Поэтому обращение к суждениям носителей следует признать как минимум одним из допустимых методов исследования языка. Вопрос, однако, состоит в пределах применения этого метода и его применимости к различным аспектам грамматики. 18.2. Интроспекция как исследовательская методология Под интроспекцией в узком смысле в лингвистике обычно понимают обращение к интуиции говорящего как элемент исследовательской методологии, как разновидность лингвистического эксперимента; именно вокруг этого понятия и ведутся в последнее время интенсивные споры. В том или ином виде интроспекция лежала в основе практически всех лингвистических работ с древнейших времен и до наших дней; любая интерпретация сколь угодно спонтанного и естественного текста требует обращения к интуиции хотя бы одного носителя языка (либо непосредственно выраженной им, либо — как в случае мертвых языков — выводимой из других письменных свидетельств). Если на ранних этапах развития лингвистики интроспекция применялась скорее подсознательно, то в первой половине XX века, под влиянием бихевиористской психологии и по мере развития структуралистского подхода, ученые стремились ограничить ее роль. Интроспекции стали вновь придавать значимую методологическую роль в конце 1950-х гг., когда генеративная научная революция поставила в центр внимания лингвистов внутреннюю языковую систему говорящего. Хотя универсальная грамматика и предполагается единой для всех представителей вида homo sapiens, местом ее локализации является именно мозг; следовательно, источником данных для ее изучения может быть только языковая интуиция отдельных говорящих. Хотя когнитивная и функциональная лингвистика и отвергает основные тезисы генеративной грамматики, она также понимает язык как прежде всего объект, относящийся к сознанию говорящего, и отводит интроспекции центральную роль (как видно хотя бы из упоминавшихся выше работ Л. Талми, одного из ведущих представителей когнитивного направления). Поскольку, как было указано выше, сама по себе интроспекция является неотъемлемой частью языкового поведения человека, принципиальных противников этого метода среди лингвистов немного. Скептицизм многих лингвистов в отношении интроспекции касается прежде всего реально существующей практики подобных исследований, а также самой технической возможности повысить их методологическую корректность. 390 О. И. Беляев 18.2.1. Критика традиционного подхода. Многие специалисты по полевой, описательной и документарной лингвистике считают, что основным объектом лингвистического анализа должны быть естественные тексты. Не оспаривая принципиальной возможности корректного построения эксперимента, эти лингвисты считают такую задачу слишком трудоемкой и малоосуществимой в полевых условиях в качестве регулярной практики. Часто упоминается т. н. п а р а д о к с н а б л ю д а т е л я (Labov 1972b): при наличии стороннего исследователя любой дискурс неизбежно искажается, но элицитация подвержена этому в наибольшей степени. При документации и первичном описании языка спонтанные тексты различных жанров должны быть первичны; традиционный опрос носителей допустим на первоначальном этапе, но должен со временем смениться более объективным методом (Mosel 2006). Критический обзор различных методов сбора данных при документации языка содержится в работе (Himmelmann 1998). Другой вид критики, не отрицая важности субъективной оценки языкового материала говорящими, направлен на корректность методологии получения таких данных в современной науке. Такие критики указывают, что большинство работ по теоретической лингвистике основаны на интуиции самих исследователей или, в лучшем случае, на неформальном опросе не более десятка носителей. Они призывают к использованию в теоретической лингвистике методов построения эксперимента, применяемых в других областях, в частности, в психолингвистике, психологии и социологии. По их мнению, традиционные методы использования интроспекции приводят к некорретным выводам и произвольной, оппортунистической интерпретации полученных данных. Так, в работе Wasow, Arnold 2005 указывается на так называемые предложения с дативным вопросительным словом (dative questions): в работе Fillmore 1965: 29–30 и в большинстве последующих теоретических работ считается, что английские предложения с вопросительным словом в позиции реципиента в конструкциях с двойным объектом вроде Who did I buy a hat? (‘Кому я купил шляпу?’) неграмматичны, тогда как уже в экспериментальном исследовании Langendoen et al. 1973 показано, что реальная ситуация значительно сложнее и не укладывается в схему, предложенную Ч. Филлмором и другими. По мнению авторов, опора на простую интуицию и отказ от учета более точных экспериментальных данных приводит к построению некорректных теоретических концепций. Т. Уосо и Дж. Арнольд также критикуют другой тип лингвистических интуиций: так называемые в т о р и ч н ы е и н т у и ц и и (secondary intuitions) — интуиции лингвиста, касающиеся не самих языковых данных, а п р и ч и н ы их грамматичности или неграмматичности. Здесь также Интроспекция 391 субъективные ощущения теоретиков часто не проходят проверки эксприментальными данными. Так, классическое объяснение контраста между английскими предложениями the detective brought in [the man who was accused of having stolen the automobile] и ??the detective brought [the man who was accused of having stolen the automobile] in состоит в том, что фактором, влияющим на приемлемость предложений второго типа, является не линейная длина именной группы, а ее структурная сложность. Уосо и Арнольд показывают, что экспериментальные данные как минимум не отдают однозначного предпочтения структурной сложности; в лучшем случае, оба фактора играют роль примерно в равной степени. Аналогичная критика традиционного подхода к интроспекции содержится в работах Gibson, Fedorenko 2010, 2013. Общий вывод авторов этих работ состоит в том, что в теоретическом синтаксисе приняты недопустимо низкие эмпирические стандарты, что снижает валидность выводов. По их мнению, следует распространить на теоретическую лингвистики методы построения эксперимента, принятые в социальных науках, психологии и психолингвистике. В более широком смысле исследователи призывают повысить престиж собственно экспериментальных исследований, в том числе с отрицательным результатом. 18.2.2. Эмпирическая проверка надежности традиционных методов. Общий призыв к большей эмпирической строгости не может вызывать принципиальных возражений: действительно, при прочих равных условиях корректно построенный эксперимент обладает большей надежностью, чем традиционный опрос небольшого числа носителей или опора на собственную интуицию лингвиста. Весь вопрос, однако, состоит в том, каковы «прочие условия» — во многих случаях проведение полноценного экпсеримента с большим числом носителей или вовсе невозможно (как в случае малых языков), или существенно затруднено. Полный отказ от простых экспериментов, к тому же, привел бы к значительному снижению темпов появления новых теоретических работ. Поэтому, даже в целом принимая изложенную выше критику, имеет смысл поставить эмпирический вопрос о том, какова реальная погрешность традиционных экспериментальных методов по сравнению с более сложными и строгими методологиями. При этом важно рассматривать именно теоретический синтаксис в целом, а не отдельные, заведомо спорные вопросы, обсуждавшиеся в критических исследованиях. Такого рода проверка действительно была проведена, и она показывает, что эмпирические стандарты, принятые в теоретической лингвистике, не так плохи, как можно было бы думать. В работе Sprouse, Almeida 2012 предпри- 392 О. И. Беляев нята попытка оценить корректность присвоения уровней грамматичности предложениям в стандартном учебнике по минималистскому синтаксису (Adger 2003). Рассматривался корпус из 469 примеров — все предложения, представленные в книге. Было опрошено 440 носителей при помощи сервиса Amazon Mechanical Turk; использовалось два метода элицитации (количественная и бинарная оценка приемлемости примера) и три разных метода статистического анализа. По оценке исследователей, максимальное расхождение между данными учебника и результатами формальных экспериментов составляет всего 2%; это означает, что традиционные неформальные экспериментальные методы, на которых преимущественно основаны данные в подобных учебниках, обладают достаточно высокой надежностью. Если считать, что учебник такого рода представляет достаточно широкий срез актуальной проблематики современного теоретического синтаксиса, то такая оценка надежности должна быть приблизительно верна и для всей области в целом. 18.3. Выводы Из литературы по методологии эксперимента, основанного на интроспекции, можно сделать следующие выводы. С одной стороны, никто из лингвистов не отрицает важности и полезности формальных экспериментальных методов: для ряда задач (например, исследования вариации между носителями, или исследования отдельных синтаксических вопросов, по которым носители не имеют уверенных интуиций) они не имеют альтернативы, в иных случаях они позволяют получить более точные, более подробные данные (формальные эксперименты обычно основаны на градиентной оценке по шкале из нескольких пунктов, тогда как традиционные методы предполагают, с некоторыми оговорками, бинарную оценку). С другой стороны, критика традиционной методологии, представленная в таких работах, как Wasow, Arnold 2005; Gibson, Fedorenko 2010, 2013, явно выглядит чрезмерной: данные, на которых основаны все крупные современные лингвистические теории, по-видимому, весьма надежны. Как замечают Дж. Спрауз и Д. Алмейда (Sprouse, Almeida 2012), все теории основаны на примерно одинаковых данных, и дискуссия между ними связана прежде всего с теоретическими, а не эмпирическими расхождениями между лингвистами. Традиционный способ опоры на интроспекцию остается незаменимым для языков с небольшим числом носителей и должен, по причине своей простоты, скорости и дешевизны, рассматриваться в качестве базовой методологии для синтаксических исследований. Всеобщее вытеснение традиционных интроспективных методов являлось бы неоправданно жестким ответом на реально имеющиеся проблемы лингвистических данных. 19. Эксперимент О. В. Федорова Традиционно выделяется три метода сбора языкового материала — метод и н т р о с п е к ц и и, основанный на интуиции самого исследователя, метод н а б л ю д е н и я в естественных условиях, составной частью которого является популярный в последнее десятилетие корпусный метод, а также метод э к с п е р и м е н т а, который является основным исследовательским методом многих когнитивных наук, в частности, экспериментальной психологии. В одной из статей Г. Кларка (Clark, Bangerter 2004) эти три метода фигурально названы по типичному местонахождению исследователя — «кресло», «поле» и «лаборатория». Каждый метод имеет свои несомненные плюсы и минусы. Почти любое лингвистическое исследование задумывается в кресле, а потом проверяется в поле или в лаборатории. В лингвистических исследованиях методология эксперимента используется в первую очередь в области психолингвистики (см. главу 8 в наст. изд.). Пререквизиты: Лингвистика Интроспекция. в контексте когнитивных наук ; Психолингвистика; 19.1. «Эксперимент по Щербе» 19.2. Определение эксперимента (Не)зависимая переменная Надежность Внутренняя валидность Экологическая валидность 19.1. «Эксперимент по Щербе» Отечественная традиция экспериментирования в лингвистике идет от известной работы Щербы «О трояком аспекте языковых явлений и об эксперименте в языкознании» (1931), в которой автор пишет: «Большинство лингвистов обыкновенно и к живым языкам подходит, однако, так же, как к мертвым, т. е. накопляют языковой материал, иначе говоря — записывает тексты, а потом их обрабатывает по принципам мертвых языков. Я утверждаю, что при этом получаются мертвые словари и грамматики. Исследователь живых языков должен поступать иначе. Конечно, он тоже должен исхо- 394 О. В. Федорова дить из так или иначе понятого языкового материала. Но, построив из фактов этого материала некую отвлеченную систему, необходимо проверять ее на новых фактах, т. е. смотреть, отвечают ли выводимые из нее факты действительности. Таким образом, в языкознание вводится принцип эксперимента. Сделав какое-нибудь предположение о смысле того или иного слова, той или иной формы, о том или ином правиле словообразования или формообразования и т. п., следует пробовать, можно ли сказать ряд разнообразных фраз (который можно бесконечно множить), применяя это правило. Утвердительный результат подтверждает правильность постулата и, что любопытно, сопровождается чувством большого удовлетворения, если подвергшийся эксперименту сознательно участвует в нем» (Щерба 1931/1974: 38). Другими словами, эксперимент по Щербе — это есть вынесение суждений о приемлемости на основании собственной интуиции. Однако по сути данный метод является методом и н т р о с п е к ц и и (см. главу 18 в наст. изд.). Данная «экспериментальная» процедура не удовлетворяет ни одному из приводимых ниже обязательных признаков (естественно)научного эксперимента. 19.2. Определение эксперимента В строгом смысле слова э к с п е р и м е н т о м называется проверка некоторой научной гипотезы каузального характера на основе применения определенных правил, то есть гипотезы о причинно-следственной связи одного явления с другим. Если мы проверяем просто гипотезу о связи одного явления с другим, то, в соответствии с общепризнанной психологической практикой, подобное корреляционное исследование экспериментом в строгом смысле слова не является. Наиболее важными правилами являются контролируемость экспериментальных условий и воспроизводимость его результатов. В эксперименте, в отличие от наблюдения, исследователь манипулирует одной или несколькими н е з а в и с и м ы м и п е р е м е н н ы м и, определяя их воздействие на з а в и с и м у ю п е р е м е н н у ю. В экспериментах, имеющих простой дизайн, бывает одна зависимая и одна независимая переменные; в более сложном случае зависимых и независимых переменных может быть несколько. Проведя лингвистическое экспериментальное исследование с необходимым для получения статистически значимых результатов количеством испытуемых и стимульных языковых выражений, он получает некоторые результаты, из которых впоследствии выводит надежные и валидные заключения. Н а д е ж н о с т ь (reliability) эксперимента — это воспроизводимость и стабильность его результатов в другом подобном исследовании, ко- Эксперимент 395 торое будет проведено тем же самым или иным исследователем. В а л и д н о с т ь (validity) эксперимента — это степень достоверности выводов и заключений, сделанных на основе этого эксперимента. όϙϝϚϝϒϗϦϔϠϙϏϮ ϑϏϚϗϓϜϝϠϡϫ ϑϪϠϝϙϏϮ ϜϗϖϙϏϮ Ɋɟɚɥɶɧɚɹ ɠɢɡɧɶ Ʌɚɛɨɪɚɬɨɪɢɹ ϜϗϖϙϏϮ ϑϪϠϝϙϏϮ αϜϢϡϟϔϜϜϮϮ ϑϏϚϗϓϜϝϠϡϫ Рисунок 19.1. Соотношение внутренней и экологической валидности Эксперимент как метод научного исследования обладает большим количеством различных достоинств по сравнению с наблюдением в естественных условиях, однако имеет и существенные недостатки, один из которых непосредственно связан с понятием валидности. Один из постулатов экспериментальной психологии об обеспечении постоянных условий (holding conditions constant) гласит, что хорошо продуманный эксперимент предполагает, что экспериментальным манипуляциям подвергается только независимая переменная (независимые переменные), а все остальные факторы, которые потенциально способны повлиять на результаты эксперимента, поддерживаются одинаковыми для всех испытуемых. В таком случае все различия в значениях зависимой переменной, которые будут получены в результате проведенного эксперимента, могут быть объяснены действием независимой переменной. Если же найдется некоторая неучтенная переменная (она обычно называется в н е ш н е й (extraneous variable), или в м е ш и в а ю щ е й с я (confounding variable)), то происходит с м е ш е н и е п е р е м е н н ы х (variable confound); в таком случае результаты эксперимента могут быть поставлены под сомнение. Безупречность экспериментальной процедуры, строгая продуманность контроля за переменными обеспечивают в н у т р е н н ю ю в а л и д н о с т ь (internal validity) эксперимента. Однако часто такой эксперимент теряет в своей э к о л о г и ч е с к о й в а л и д - 396 О. В. Федорова н о с т и (ecological validity), частном виде в н е ш н е й в а л и д н о с т и (external validity): случается, что те результаты, которые мы получаем в лабораторных условиях, плохо экстраполируются на реальное поведение людей в реальной жизни. В лабораторных условиях мы имеем дело с закрытой системой, когда все факторы находятся под почти полным контролем; в реальном же мире значительно чаще встречаются открытые системы, когда мы слабо контролируем переменные или же не контролируем их вовсе. Таким образом, внешняя и внутренняя валидности эксперимента находятся как бы на разных полюсах: улучшая одну, мы тем самым ухудшаем другую, и наоборот, см. рис. 19.1. Таким образом, традиционное экспериментальное исследование (напр., в области современной психолингвистики) имеет высокую внутреннюю валидность, непосредственно связанную с контролируемостью условий эксперимента, и низкую экологическую валидность. Однако в некоторых экспериментальных исследованиях дискурса удается найти определенный компромисс, который достигается, в частности, при использовании метода регистрации движений глаз, подробнее см. главу 8 в наст. изд. Современные лингвистические науки когнитивного спектра используют экспериментальный метод в разной степени. Так, психолингвистика на 90 % основана на методологии эксперимента, см. главу 8 в наст. изд. В области современных исследований детской речи по-прежнему активно используется метод наблюдения; по оценкам разных исследователей распределение экспериментальных методов и методов лонгитюдного наблюдения близко к 50 % на 50 %, подробнее см. главу 9 в наст. изд. Наконец, в нейролингвистике метод наблюдения (описания отдельных случаев, case-study) продолжает превалировать над экспериментальным методом, см. главу 11 в наст. изд. 20. Полевая лингвистика А. Е. Кибрик Полевая лингвистика — это комплекс эвристических методов для исследования и описания языка, которым исследователь не владеет и всю информацию о котором получает от его носителей. Название отражает тот факт, что обычно изучение неизвестного языка происходит в среде обитания носителей языка, «в поле», однако это в общем случае не обязательно: иногда работа с носителем проводится исследователем дома или на третьей территории c использованием тех же полевых методов. Методы полевой лингвистики — средство для получения сведений о языке. Конечной целью является построение формальной модели (фрагмента) языка. 20.1. Специфика полевой лингвистики 20.2. Метод коллективных полевых исследований 20.3. Ограничения и сложности коллективного метода 20.4. Преимущества коллективной полевой работы Пререквизиты: Теория языка (все главы); Типология; Языки мира и языковое разно- образие . Дополнительная литература: А.Е. Кибрик 1972; Crowley 2007. 20.1. Специфика полевой лингвистики Специфика полевой лингвистики по сравнению с более традиционными видами лингвистической науки состоит в том, что исследователь не является носителем описываемого языка и поэтому на начальной стадии знакомства с этим языком ничего или почти ничего не знает о его свойствах. Соответ ственно, проблемы, которые приходится решать полевому лингвисту, касаются — методики работы с консультантами-носителями языка (информантами); — использования языка-посредника; — эвристических методов обнаружения грамматических фактов; — соотнесения получаемых языковых данных с современными теоретическими знаниями о возможном устройстве языковой системы. В первую очередь организация полевой работы зависит от ее метода. А н а л и т и ч е с к и й метод состоит в пассивном наблюдении за языковой 398 А. Е. Кибрик деятельностью носителей языка. Исследователь только анализирует эту деятельность в меру своих возможностей. Применяя э к с п е р и м е н т а л ь н ы й метод, исследователь активно воздействует на поведение носителя языка, выступающего в роли информанта. Он задает вопросы, заполняя свою анкету, просит преобразовать какое-то предложение, оценить правильность сочиненного им предложения, рассказать какой-нибудь эпизод из своей жизни и т. п. Экспериментальный метод используется в полевой работе наиболее широко. На схеме на рис. 20.1 в обобщенном виде представлены различные объекты и участники полевой деятельности, проводимой экспериментальным методом: я з ы к о в о й м а т е р и а л (данные), я з ы к - и д и о л е к т (язык конкретного носителя языка), и с с л е д о в а т е л ь, к о н с у л ь т а н т — н о с и т е л ь я з ы к а (информант-переводчик). Модель (фрагмента) языка Исследователь Носитель языка Данные Языкидиолект Рисунок 20.1. Полевая лингвистика с использованием экспериментального метода Как видно из схемы, в качестве «генератора» данных на языке, который подвергается исследованию (я з ы к е - о б ъ е к т е) используется отличный от исследователя носитель этого языка (информант-переводчик), с помощью которого лингвист добывает интересующие его факты о языке-объекте. Специфика полевой работы требует различения языка-объекта, языка общения между информантом и исследователем (я з ы к а - п о с р е д н и к а) и языка, средствами которого дается описание языка-объекта (м е т а я з ы к а). Следует помнить, что хотя практически в качестве метаязыка обычно используется родной язык исследователя, это не всегда имеет место, в частно сти, исследователь может использовать несколько метаязыков. Возможна ситуация, когда между исследователем и информантом нет общего языка-посредника, с помощью которого исследователь мог бы контролировать и стимулировать получаемые данные. В этом случае необходим и н т е р п р е т а т о р, выступающий переводчиком между исследователем и информантом. Такой организации полевой работы соответствует схема на рис. 20.2. Модель (фрагмента) языка Исследо ватель Интер претатор Информант Данные Языкидиолект Рисунок 20.2. Полевая лингвистика экспериментальным методом с участием интерпретатора Полевая лингвистика 399 Знакомство с ранее никогда не описывавшимся бесписьменным языком с чистого листа с целью его д о к у м е н т а ц и и (см. главу 26 в наст. изд.) и построения целостного описания предполагает решение весьма разнообразных и разнонаправленных задач. Во-первых, при отсутствии письменности каждое языковое выражение должно быть системно и адекватно ф о н е т и ч е с к и з а ф и к с и р о в а н о и п р о и н т е р п р е т и р о в а н о. Это предполагает решение множества проблем фонетического, фонологического и морфологического членения, которые должны быть сняты на самых начальных этапах изучения языка. Эту стадию желательно пройти как можно быстрее, по крайней мере в ее основных чертах. Если этот этап затягивается и соглашения об интерпретации и форме записи данных постоянно меняются, это может замедлить весь исследовательский процесс. Во-вторых, нужно выявить в с е г р а м м а т и ч е с к и е с у щ н о с т и и з у ч а е м о г о я з ы к а (на морфемном, словесном и синтаксическом уровнях) и их функции, для чего необходимо определить дистрибутивные характеристики и собрать все релевантные парадигмы для всех обнаруженных классов морфем, слов и синтаксических конструкций. В-третьих, нужно собрать м а к с и м а л ь н о п о л н ы й л е к с и к о н с достаточно богатой словарной информацией для каждой его единицы, характеризующей ее употребление. В-четвертых, следует записать и проанализировать п р е д с т а в и т е л ь н ы й к о р п у с р а з н о о б р а з н ы х п о ж а н р у т е к с т о в, демонстрирующих реальное употребление языковых единиц в разнообразных кон текстах. В-пятых, полевой лингвист должен использовать теоретические знания из области практически всех современных областей лингвистики. Поскольку современная лингвистическая теория бурно развивается и представляет собой чрезвычайно разветвленную область знания, каждому исследователю поневоле приходится с переменным успехом заменять собой целый лингвистический институт. Таким образом, объем эмпирической полевой работы требует значительного времени и больших трудовых затрат. В мировой практике изучения крупных языков, имеющих длительную лингвистическую традицию, естественно сформировалась детальная про фессиональная специализация. Малоописанные языки, наоборот, чаще всего изучаются исследователями-одиночками (см., напр., Pereltsvaig 2017: ch. 5). 400 А. Е. Кибрик 20.2. Метод коллективных полевых исследований В конце 1960-х годов на Отделении теоретической и прикладной лингвистики филологического факультета была разработана методика коллективных полевых исследований, описанная в монографии А.Е. Кибрик 1972, которая обобщает опыт первых пяти таких исследований — коллективных лингвистических экспедиций в лакский, арчинский, шугнанский, алютор ский языки. В отличие от индивидуального изучения языка-объекта, когда все исследовательские функции сосредоточены в руках одного человека, эта методика предполагает разделение труда между членами коллектива; происходит расчленение цели исследования на отдельные подзадачи так, из решения которых складывается решение всей задачи. Поскольку отдельные компоненты системы языка тесно связаны и понимание одних компонентов часто невозможно без знания других, а также ввиду того, что получаемые данные всегда несут, наряду с требуемой информацией, и сведения о многих других фактах языка, при коллективном методе критически важной становится координация работы в пределах коллектива исследователей. История коллективных лингвистических экспедиций по изучению малочисленных языков народов СССР и России началась летом 1967 г., когда была организована первая такая экспедиция в Дагестан. На филологическом факультете МГУ с 1940-х годов существовала традиция проведения диалектологической практики студентов с выездом в различные сельские районы для сбора материала по русским диалектам. Однако полевое изучение совершенно незнакомого языка осуществлялось впервые. Первая поездка показала, что, несмотря на скептицизм многих известных русистов, извлечение языковой информации о незнакомом языке методом активного опроса информанта на языке-посреднике вполне реалистично. Однако для этого необходим широкий кругозор в области варьирования естественных языков, в идеале предсказывающий возможные комбинации языковых явлений. Необходимо также владение методикой успешного взаимодействия с информантом, обеспечивающей достижение поставленных целей в кратчайшие сроки. Проблема исчисления параметров языкового варьирования относится к области лингвистической типологии. Ясно, что к неизвестному языку нельзя относиться как к чему-то совершенно непредсказуемому, не помещая его эмпирические данные в некоторую универсальную схему и считая, что в неописанном языке может встретиться «все, что угодно». Если в языке обнаруживаются какие-то удивительные вещи, то это продукт недостаточности знаний о границах языкового варьирования, а не внутренней природы самого языка. Удивительное в языке делает этот язык замечательным в Полевая лингвистика 401 том смысле, что вскрывает неполноту лингвистической теории и позволяет исследователю уменьшить степень своего типологического невежества. Что касается работы с носителем языка, то основы ее технологии являются универсальными для всякой лингвистической полевой работы, и в этом плане должен быть учтен весь накопленный мировой лингвистикой опыт. Особый технологический компонент связан, однако, с коллективным характером экспедиции. Программа полевой работы не предполагает обязательного учета результатов предшествующих исследований, она может начинаться «с чистого листа». Часто такая постановка задачи обусловлена еще и тем обстоятель ством, что исследователь имеет дело со слабо документированными языками. Даже при наличии публикаций по фонетике и морфологии, имеющиеся могут быть далеко не полными и нуждаться в серьезной проверке. Нередко в распоряжении полевого лингвиста нет даже минимальных исходных эмпирических данных (словарей, текстов, парадигм и т. п.). Опыт работы с языками, не имеющими глубокой лингвистической традиции описания, показывает, что это наиболее благоприятная исследовательская ситуация. Такое утверждение может показаться парадоксальным: кажется, что легче изучать язык, когда о нем предварительно многое извест но. Однако следует иметь в виду, что всякая традиция навязывает некоторое априорное видение фактов. Усвоенная до знакомства с фактами, она заменяет их в нашем сознании, гипнотизируя творческую волю и мешая увидеть факты в их непосредственной данности. Впоследствии, под давлением языкового материала, начинается мучительное преодоление традиции, на что затрачивается много лишних усилий. При наличии некоторой традиции предпочтительнее действовать в другой последовательности. Сперва собираются и анализируются факты, а затем, когда некоторая самостоятельная гипотеза их обобщения сформирована, она сопоставляется с имеющимися описаниями. При совпадении правдоподобность собственной гипотезы существенно увеличивается, приразличии имеется конкуренция независимых описаний. Конечно, не исключается ситуация, когда традиционное описание предпочтительней «полевого», но в этом случае выбор принимается автором сознательно и с учетом языковых данных. 20.3. Ограничения и сложности коллективного метода Отметим реальные и кажущиеся ограничения коллективного метода и связанные с ним сложности. Часто считается, что привлечение многих исследователей к изучению языка экономически неоправданно, так как требует больших финансовых 402 А. Е. Кибрик средств. Действительно, пребывание в поле одного человека дешевле, чем нескольких. Однако экспедиционный период во втором случае во много раз короче. Кроме того, совокупное время на подготовку лингвистического продукта также существенно сокращается при коллективной работе. Более принципиально другое ограничение. Метод требует не только достаточного количества лингвистов, но и достаточного количества информантов-переводчиков (не менее одного переводчика на двух лингвистов), готовых работать на регулярной основе. Далеко не всегда это возможно изза малого количества носителей языка, проживающих в одном пункте, или малого количества носителей, владеющих контактным языком и/или име ющих возможность несколько недель посвятить себя работе в качестве переводчика. Коллективное пребывание лингвистов в поле требует ритмичной работы и свободного доступа к носителям языка. Если эти условия не соблюдаются, даже исследователь-одиночка также работает в поле неэффективно. На практике очень часто приходится отказываться от лингвистически очень перспективного языка по указанной объективной причине. Тонкий этический аспект связан с вопросом об «интеллектуальной соб ственности». Во всякой коллективной деятельности полное разделение интеллектульной собственности невозможно, поскольку многие открытия делаются коллективно и принадлежат не индивидууму, а группе индивидуумов. Известно, что в серьезной науке нередко серьезные достижения достигаются не одиночками, а коллективами, и полевая работа здесь не исключение. Тем не менее, при коллективной полевой работе желательно выработать средства фиксации личного вклада каждого исследователя в общий проект, хотя готовность подарить некоторую часть своего вклада партнеру должна присутствовать у членов исследовательской группы. Реша ющим мотивом такой деятельности должно все-таки быть достижение описательной цели как таковой, а не исключительное стремление выделить лично тебе принадлежащую часть. В целом следует сказать, что коллективная деятельность несовместима с абсолютным индивидуализмом, и не всякий готов в ней участвовать. Вся практика полевой работы показывает, что в этом творческом процессе никакие текущие решения не могут считаться окончательными. Напротив, очень многие элементы интерпретации многократно видоизменяются. Это касается как транскрипционной записи и принципов глоссирования, так и понимания сущности языковых явлений. При коллективной работе нужно, чтобы все члены коллектива синхронно отслеживали текущую исследовательскую ситуацию, в противном случае могут возникнуть всевозможные недоразумения, иногда очень нежелательные. Полевая лингвистика 403 Кроме того, обычно разные люди одну и ту же задачу решают по-разному, а всякая коллективная работа требует слаженных действий. В коллективной работе с языком, особенно при его документации и описании, неизбежно возникает разнобой в фонетической записи языковых выражений, их переводе и интерпетации, в использовании терминологии и формальных средств, а также в способе их применения. Поэтому достижение единообразия и по следовательности описания требует постоянной координации всех действий и согласования множества вопросов теоретического и технического порядка. Достичь этого можно только прилагая к этому специальные усилия и постоянно это контролируя. Исследователю-одиночке в этом плане работать значительно легче, поскольку он не должен ничего ни с кем согласовывать, хотя следует отметить, что и индивидуальный метод сам по себе не гарантирует от разнобоя и противоречий в описании. Следует признать, что указанное свойство коллективной работы относится к ее органическим издержкам. Однако те же проблемы имеются во всякой коллективной деятельности. Солисту в каком-то смысле легче исполнять музыкальное произведение, чем оркестру или хору, но солист не может заменить собой оркестр или хор. Итак, объективные сложности коллективной полевой работы существуют, но в большинстве случаев они преодолимы. 20.4. Преимущества коллективной полевой работы Рассмотрим преимущества группового метода полевой работы. Этот етод позволяет во много раз ускорить эмпирический этап сбора языковых м фактов. То, на что обычно требуются годы, осуществляется за несколько недель. Исследователь, занимаясь своей более или менее узкой темой, в той или иной степени затрагивает явления, изучаемые его коллегами. Такое дублирование не является избыточным, оно позволяет компенсировать невозможность обращаться к собственной интроспекции для проверки правильности языкового материала и повышенную опасность совершать ошибки при документации и интерпретации данных. Множественность исследователей, изучающих одно и то же явление, позволяет видеть его «стереоскопически», с разных индивидуальных точек зрения. Это, разумеется, требует их согласования и выработки единообразного взгляда на каждое явление. Но это обстоятельство в принципе позволяет достичь большей объективации описания и избежать многих случайных, недостаточно продуманных или ошибочных решений как в представлении данных, так и в их теоретической интерпретации. 404 А. Е. Кибрик При групповом методе достигается более высокий уровень профессиональной подготовки исследователей. В самом начале экспедиционной деятельности Отделения теоретиче ской и прикладной лингвистики МГУ, когда преимущественно исследовались традиционные уровни грамматики языка — фонетика и морфология, — разделение функций руководителей проходило по этим уровням. Так создавалось описание хиналугского и арчинского языков (А.Е. Кибрик и др. 1972; А.Е. Кибрик и др. 1977a; А.Е. Кибрик 1977a,b). Действительно, каждый из этих уровней обладает известной автономностью языковых объектов и требует своих профессиональных навыков у исследователя. Высокий фонетический профессионализм в области общей фонетики совершенно необходим полевому лингвисту, поскольку при отсутствии опоры на орфографию адекватная фиксация звуковой стороны языковых выражений является необходимым условием всякого лингвистического описания. Даже если фонетика не является самостоятельной целью изучения, например, при лексикографическом исследовании, избежать ее невозможно. Известно, сколько проблем бывает у исследователей-одиночек, вынужденных многие годы биться с загадочными сегментными и особенно просодическими явлениями, которые они не могут научиться слышать и фиксировать, а тем более описать. Что касается морфологии, то в ней существует свой арсенал средств обнаружения и описания ее единиц, которым должен владеть полевой лингвист, и он существенно отличается от современного арсенала в области синтаксиса. Конечно, современная специализация в лингвистике столь глубока, что невозможно спроецировать ее в полном объеме на коллективную полевую работу. Каждый полевой исследователь должен быть специалистом широкого профиля. Вместе с тем при коллективной работе целесообразно сочетать в себе широкие лингвистические знания по большому числу проблем с глубокими знаниями в индивидуальных более узких областях. Опыт показывает, что коллективная работа исследователей, специализирующихся на различных конкретных явлениях языка, технологически выводит исследование малоописанного языка на уровень описания языков с развитой лингвистической традицией. Коллективная работа в поле предоставляет всем участникам проекта возможность межличностного взаимодействия в реальном масштабе «полевого» времени. Важным механизмом интегрирования коллективного взгляда на язык являются, как правило, ежедневные семинары, цель которых — текущее отслеживание всей новой информации о языке, полученной в индивидуальной работе с информантами. Благодаря этому каждый исследователь Полевая лингвистика 405 имеет доступ к знаниям, далеко выходящим за рамки собранного лично им материала. Формы работы могут быть различными: или это краткие сообщения о «горячих новостях», или, например, коллективный разбор текстов. В текстах естественным образом «вместе и сразу» представлены все компоненты языка, и установка на детальный анализ каждого языкового выражения с целью объяснить, как оно устроено, позволяет активизировать текущие знания всех членов коллектива. Часто загадочное для многих языковое выражение понятно тому, кто с ним уже встретился в своей работе и нашел для него объяснение. Даже если какое-то явление в тексте никому не понятно (а на начальных этапах работы такая ситуация очень обычна), то, как правило, сразу становится ясно, кто должен позаботиться о его изучении. Разбор текстов хорош не только естественностью языкового материала, но и статистическим распределением частотных и редких языковых явлений. Наиболее частотные языковые факты обычно входят в ядро языка, и освоить их желательно как можно быстрее. В то же время благодаря их по вторяемости они быстро теряют свою новизну и перестают быть в центре внимания обсуждений. Фокус внимания перемещается на более редкие явления языковой периферии, объяснение которых часто дает возможность лучше понять или даже переинтерпретировать базовые явления. Из практики известно, что в конце второй недели разбор текстов проходит уже довольно быстро, застревая только на новых фактах, составляющих «изюминку» семинара. Семинары часто выявляют разное понимание одного и того же языкового феномена и являются площадкой для дискуссий и средством выбора оптимального описательного решения и выработки единого коллективного взгляда на язык. Благодаря семинарам каждый исследователь ежедневно узнает о языке не только то, с чем он сам встретился на сеансе общения с информантом, но и то новое, что обнаружили его коллеги, и тем самым стремительно расширяет свои знания об изучаемом языке, что помогает ему эффективнее работать над своей темой. Семинары экспоненциально расширяют знания о языке, и через неделю полевой работы каждый исследователь имеет о информацию, для получения которой одиночке понадобились бы многие месяцы. Это, пожалуй, наиболее мощный ресурс коллективной полевой работы, аналогичный конвейеру на производстве, превращающий ее из кустарного промысла в лингвистическую индустрию. Обычно при работе с редким языком лингвист находится в ситуации вынужденного профессионального одиночества. Нередка ситуация, когда полевой лингвист, изучающий малый исчезающий язык, так же одинок на 406 А. Е. Кибрик планете, как и изучаемый им язык. Он не может ни с кем посоветоваться, ему некому рассказать о своих находках. Наоборот, коллективная лингви стическая полевая работа собирает группу партнеров по интересам, и их профессиональное взаимодействие создает комфортную творческую среду и является мощным психологическим стимулятором. Этот фактор научной деятельности тоже трудно переоценить. Наконец, коллективная экспедиционная работа создает живую среду общения и восприятия жизни, поэтому для многих она становится притягательной и романтической целью. Коллективный метод предполагает, таким образом, «сыгранную команду», где во многом все могут заменить друг друга, а в чем-то каждый умеет делать то, чего не может делать никто другой. 21. Корпусная лингвистика С. Ю. Толдова Корпусная лингвистика — это раздел прикладной лингвистики, который занимается разработкой общих принципов и методов создания л и н г в и с т и ч е с к и х к о р п у с о в (корпусов текстов) и методов использования корпусных данных в лингвистическом исследовании. Одним из основных источников языкового материала, необходимого для проведения лингвистических и филологических исследований, является текст, письменный или устный. На основе анализа множества текстов можно сделать вывод о некотором языковом явлении, например, о поведении грамматической конструкции, использования выразительных средств в языке и т. п. Развитие вычислительной техники способствовало тому, что большое количество текстов стало доступно в электронном виде. Для того, чтобы можно было работать с такими объемами текстов, извлекая из них нужную информацию, во всем мире стали создавать л и н г в и с т и ч е с к и е к о р п у с а, представляющие собой коллекции текстов, специально отобранных, размеченных по различным лингвистическим параметрам и обеспеченных системой поиска. Увеличение объема материала исследования по требовало применения новых методов анализа лингвистических данных, включая их статистическую обработку. Таким образом, корпусная лингвистика включает два аспекта: во-первых, создание и р а з м е т к а (аннотирование) корпусов текстов и разработка средств поиска по ним — и, во-вторых, собственно лингвистический — экспериментальные исследования на базе корпусов. Это активно развивающееся направление, тесно связанное с компьютерной лингвистикой. Одним из основных методов исследования в этой области являются квантитативные методы (см. главу 24 в наст. изд.). Пререквизиты: Теория языка (все главы) 21.1. Цели, задачи и основные направления корпусной лингвистики 21.2. Понятие лингвистического корпуса 21.3. История корпусной лингвистики 21.4. Основные понятия корпусной лингвистики 21.5. Разметка корпусов 408 С. Ю. Толдова 21.6. Поиск в корпусе 21.7. Важнейшие корпуса текстов 21.8. Примеры применения корпусных методов исследования Литература для дальнейшего чтения: Копотев 2014; Biber et al. 1998; McEnery, Hardie 2012; Захаров 2005. 21.1. Цели, задачи и основные направления корпусной лингвистики Основным материалом лингвистических и филологических исследований являются тексты. Имеется в виду «текст» в самом широком смысле слова: это речевые произведения, написанные или произнесенные когда-либо при каких-либо обстоятельствах и с какой-либо целью. Текст как источник знаний о языке привлекал исследователей давно. Однако поиск данных относительно некоторого конкретного языкового феномена был затруднен. Возможность пользоваться ресурсами, представленными в электронном виде и доступных для автоматической обработки, значительно облегчила процесс сбора материала в лингвистических исследованиях. Доступность языковых данных радикально повлияла на требования, предъявляемые к доказательной базе лингвистических исследований. Для исследования того или иного явления необходимо не просто предъявить несколько случайно обнаруженных в некотором тексте примеров. Для верификации выдвигаемых гипотез необходимо представить выборку данных, которые собраны в результате продуманной и обоснованной процедуры. Использование корпусов позволяет обеспечить такую процедуру. Однако в результате доступности огромного количества очень разнородного материала возникла другая проблема. Работать с мегабайтами «сырых» текстов не менее трудно, чем искать примеры вручную. Для компактности представления данных, выявления среди многообразия текстовых примеров некоторых основных закономерностей и тенденций в корпусной лингвистике разрабатываются и применяются квантитативные методы, статистический анализ языковых явлений. Необходимость и возможность обработки большого массива текстов для извлечения из них лингвистических, литературоведческих и др. данных обусловило рост электронных лингвистических ресурсов, включая корпуса текстов, снабженных лингвистической аннотацией. В свою очередь, задача создания таких ресурсов, которые могли бы обеспечить корректность полученных на их материале выводов, породила необходимость разработать принципы подбора текстов для таких ресурсов, принципы экспертной разметки и т. п. Корпусная лингвистика 409 Таким образом, корпусная лингвистика призвана ответить на следу ющие вопросы: — какими принципами необходимо руководствоваться при создании различных корпусов (при отборе текстов, организации разметки, при разработке интерфейса); каким принципам должна соответствовать разметка различных лингвистических параметров (жанров текстов, морфологических характеристик словоформ и т. п.) для того, чтобы получать на основе поиска в корпусе надежные данные; — какие лингвистические и литературоведческие задачи можно решать с помощью корпусов; — как использовать поисковый интерфейс к корпусу для того, чтобы найти языковые примеры, максимально соответствующие исследовательской задаче; а также как пользоваться специализированными языками запросов к корпусам. Корпусные методы в некотором смысле совмещают два метода научного исследования: наблюдение и эксперимент. С одной стороны, корпусная лингвистика имеет дело с текстами, порожденными в реальных условиях, а не с искусственно сконструированными исследователем. С другой стороны, современные технологии создания корпусов позволяют включать в них тексты, полученные при различных условиях, отражающие разнообразные лингвистические феномены. Специальные возможности корпусных интерфейсов (программ, обеспечивающих поиск в корпусах) и наличие в корпусе экспертной лингвистической разметки позволяет подбирать данные, соответствующие строго определенным условиям. При этом разные пользователи при использовании одних и тех же данных корпуса получают одни и те же результаты. То есть корпус может обеспечить исследования, которые обладают рядом свойств, характерных для эксперимента: воспроизводимостью и верифицируемостью данных. Создание и аннотирование корпуса является необходимым этапом при разработке систем и отдельных компонентов автоматического анализа есте ственного языка. С одной стороны, такие корпуса могут служить «золотым стандартом». Сравнение результатов работы системы с данными корпуса позволяют оценить качество работы системы. Размеченные корпуса используются в качестве обучающих данных для систем машинного обучения. Обращение исследователей к выскоуровневым задачам, например, к построению иерархической структуры текста, извлечению фактов и т. п. стимулирует разработку и создание корпусов с глубокой лингвистической аннотации. 410 С. Ю. Толдова Одним из центральных направлений корпусной лингвистики некоторое время оставалось создание универсальных н а ц и о н а л ь н ы х к о р п у с о в. Задача создания такого корпуса — отразить некоторое состояние языка с максимальной полнотой. Национальные корпуса созданы для многих языков. Одним из первых национальных корпусов, на опыт создания которого опирались разработчики национальных корпусов для других языков, является Британский национальный корпус (BNC). Среди корпусов славянских языков выделяется Чешский национальный корпус, созданный в Карловом университете Праги (http://ucnk.ff.cuni.cz/). Национальные корпуса существуют также для немецкого, китайского, финского и др. языков. С 2003 г. начал функционировать Н а ц и о н а л ь н ы й к о р п у с р у с с к о г о я з ы к а (НКРЯ). В процессе создания корпусов, содержащих аннотацию разнообразных языковых феноменов, в ходе разработки универсальных корпусных менеджеров — специальных программ, обеспечивающих удобную работу с корпусными данными, были выработаны универсальные стандарты и технологии построения корпусов. В результате стало возможным создавать большие, представительные корпуса за короткий срок. В силу того, что корпуса представляют данные и инструментарий для эмпирических исследований, возникает целый ряд вопросов. Так, исследователи задаются вопросом, является ли использование корпусов лишь особым методом исследования лингвистических феноменов, который может применяться в рамках различных теоретических подходов, или же это нечто большее (см. обсуждения в Gries 2009). Среди лингвистов, использующих корпуса в своих исследованиях, отсутствует единое мнение по этому вопросу. Так МакЭнри (McEnery et al. 2006: 7) и Грис считают, что это лишь особая методология исследования. Однако многие лингвисты сходятся на том, что создание корпуса не просто позволяет быстро искать примеры, или подтверждать те или иные утверждения количественными методами, это особая идеология, которая задает исследовательский взгляд на предмет исследования. Джеффри Лич (Leech 1992) утверждает в своей работе, что корпусная лингвистика отсылает не к области знания, а к методологическому базису исследований, к особому философскому подходу. Аналогичные мысли высказывает В. А. Плунгян (Плунгян 2008). Таким образом, предметом корпусной лингвистики являются «теоретические основы и практические механизмы создания и использования представительных массивов языковых данных, предназначенных для лингви стических исследований в интересах широкого круга пользователей» (Захаров 2005). Корпусная лингвистика 411 21.2. Понятие лингвистического корпуса (Л и н г в и с т и ч е с к и й ) к о р п у с — это множество собранных в единую коллекцию языковых данных (как правило, множество текстов), которая отвечает следующим требованиям: — тексты в коллекции отобраны в соответствии с определенной исследовательской целью; — отбор текстов осуществляется на основе принципов, соответствующих исследовательской цели; — тексты коллекции должны иметь специальную лингвистическую разметку; — они должны быть структурированы и представлены в унифицированном виде; — как правило, корпус снабжен специальным интерфейсом, позволяющим как искать в корпусе языковые данные в соответствии с заданными параметрами поиска. Сейчас корпуса создаются и размещаются в электронном виде. Специальные принципы отбора текстов в корпус и аннотация текстов отличает лингвистические корпуса от простых электронных библиотек. 21.3. История корпусной лингвистики Первые корпуса и корпусные методы появились задолго до возникновения корпусной лингвистики как научного направления. По сути, любое лингвистическое исследование, основанное на сопоставлении и анализе контекстов, является корпусным. Первыми попытками создавать корпуса и использовать их в целях исследования языковых единиц можно считать массивы текстов, которые отбирались исследователями еще в конце XIX — начале XX в. для исследования частотных характеристик языковых единиц. Такие исследования проводились в целях усовершенствования средств связи, для создания стенографического письма, а также в целях создания частотных словарей языка для быстрого обучения людей иностранному языку. В 1897 г. Käding использовал огромный корпус на немецком языке — 11 миллионов слов — чтобы подсчитать частоту букв и буквенных сочетаний в немецком языке. Американские лингисты, исследуя языки индейцев в полевых условиях, собирали и транскрибировали тексты. Собрания таких текстов также можно считать прообразами возникших в середине XX в. электронных корпусов. 412 С. Ю. Толдова Интересны в этом отношении дневниковые записи детской речи. Такие образцы детской речи были собраны и опубликованы их родителями, напри мер, Вильямом Прейером (Preyer 1889), Кларой и Вильгельмом Штернами. Первые корпуса в строгом смысле этого слова появились в 1960-х гг. Прообразом для них послужили словарные картотеки — собрания фрагментов текстов, обычно в виде карточек, содержащих то или иное слово, и систематизированные относительно описываемого слова (в основном, по алфавиту). Принято считать, что первые полноценные лингвистические корпуса появились в 1960-е гг. В 1963 г. в Брауновском университете (США) для создания частотного словаря американского варианта английского языка был создан большой корпус на машинном носителе (Brown Corpus), включа ющий 1 млн. слов. При оценке частоты некоторого слова в языке возникает проблема «сбалансированности» выборки. В языке частотность многих слов обусловлена тематикой текстов. Так, например, слово переменная будет чрезвычайно частотно в математических текстах. Вероятность же встретить данное слово в художественной литературе очень мала. Для обеспечения корректности данных относительно частоты употребления слов создатели корпуса У. Френсис и Г. Кучера разработали строгую процедуру отбора тек стов: в корпус вошли 500 фрагментов прозаических текстов, относящихся к 15 наиболее массовым жанрам и напечатанных в 1961 г. Возникновение корпусных методов связано с бурным развитием компьютерных технологий во второй половине ХХ в. Возможность сканирования и распознавания текста (перевод в текстовый формат), появление баз данных и систем управления базами данных сделали возможным сбор, хранение и обработку огромных массивов текстовых данных. Не последнюю роль в развитии корпусной лингвистики сыграла популяризация мировой сети Интернет, т. к., с одной стороны, корпуса стали доступны широкому кругу пользователей, а с другой стороны, значительно расширились возможности их наполнения. С тех пор накоплен значительный опыт разработки и применения корпусов. Ежегодно публикуется множество работ по данной тематике. Обсуждению проблем корпусной лингвистики посвящена специализированная электронная рассылка Corpora List и периодические издания International Journal of Corpus Linguistics, Corpora, Corpus Linguistics and Linguistic Theory, ICAME Journal. Теоретические и практические проблемы корпусной лингвистики обсуждаются на специализированных семинарах и в рамках научных конференций по прикладной и компьютерной лингвистике: ежегодная международная конференция по компьютерной лингвистике «Диалог», конференция Корпусная лингвистика 413 Мегалинг, конференция «Корпусная лингвистика» при кафедре математической лингвистики СПбГУ. Компьютерной лингвистике посвящен раздел форума на сайте конференции «Диалог». Важной вехой в развитии отечественной корпусной лингвистики явилось создание Н а ц и о н а л ь н о г о к о р п у с а р у с с к о г о я з ы к а. Работы по созданию Корпуса были начаты в 2001 г. группой лингвистов из Москвы, Петербурга, Воронежа и других городов. В рамках развития проекта ведется работа по созданию новых ресурсов на базе корпуса. 21.4. Основные понятия корпусной лингвистики Центральное понятие корпусной лингвистики — это, конечно, л и н г в и с т и ч е с к и й к о р п у с. Тексты в корпус выбираются не случайным образом, а в соответствии с проблемной областью, т. е. с областью реализаций интересующих исследователя языковых явлений. Проблемная область имеет два аспекта: языковой и речевой. Языковой аспект — это само изучаемое явление, а речевой — это множество контекстов, в которых это явление представлено. Проблемная область может быть как очень широкой (все произведения Достоевского), так и достаточно узкой (случаи согласования сказу емого с количественной группой по числу). Одним из принципиальных вопросов является вопрос о том, какие тексты и в каком объеме необходимо отобрать в корпусе. С одной стороны, хотелось бы, чтобы исследуемое явление, как бы оно ни было редко в языке, нашло отражение в корпусе. Одним из требований, предъявляемым к составу и структуре корпуса, является т р е б о в а н и е п о л н о т ы. Данное требование входит в противоречие с другим важным принципом создания корпуса — требованием р е п р е з е н т а т и в н о с т и. Задача создателей корпуса — собрать как можно большее количество текстов, относящихся к тому подмножеству языка, для изучения которого корпус создается. Каким бы специфичным ни был феномен, ни один корпус не может содержать все его реализации. Поэтому корпус — это всегда определенная выборка из проблемной области, которая осуществляется на основе некоторых критериев, устанавливаемых исследователем в зависимости от задачи. Требование репрезентативности заключается в том, что такая выборка должна отражать те или иные параметры исследуемого языкового явления в той же пропорции, что и в языке вообще или в некотором исследуемом подмножестве языка. С точки зрения отбора текстов в корпус различают с б а л а н с и р о в а н н ы е к о р п у с а (см. также р е п р е з е н т а т и в н о с т ь к о р п у с а) и м о н и т о р н ы е корпуса. В сбалансированных корпусах в корпус включаются тексты, представляющие разные модусы дискурса (включая как пись- 414 С. Ю. Толдова менные, так и устные тексты), разнообразные по жанрам, стилям и тематике. При разработке корпуса устанавливаются пропорции, в которых должны быть представлены тексты разных жанров, стилей и т. п. Такие корпуса имеют фиксированный объем. Пополнение таких корпусов происходит только после тщательной процедуры отбора новых текстов. М о н и т о р н ы е корпуса постоянно пополняются новыми текстами на данном языке, при этом баланс текстов разных модусов, стилей и жанров не соблюдается. Создатели мониторных корпусов считают, что «статистическая» обоснованность данных, полученных из корпуса, будет достигнута за счет объема корпуса, исчисляемого в миллиардах слов. В последнее время с усовершенствованием технологий обработки больших данных (когда объемы текстовых данных исчисляются гигабайтами), технологий сбора текстовых данных из сети Интернет выросло целое направление корпусной лингвистики, представители которого занимаются созданием web-корпусов, разработкой специальных технологий для их создания и для осуществления поиска в таких гигабайтных корпусах. Важным параметром корпуса является его о б ъ е м. Если первые корпуса достигали миллиона слов (точнее, с л о в о у п о т р е б л е н и й или т е к с т о ф о р м или т о к е н о в 1), то объем современных корпусов исчисляется сотнями миллионов (например, объем Национального корпуса русского языка на данный момент составляет около 140 млн. слов) или миллиардами (например, объем корпуса английского языка Bank of English превышает 2,5 миллиарда слов). Как уже отмечалось, для решения различных лингвистических задач необходимо, чтобы тексты и отдельные языковые единицы внутри текстов содержали дополнительную лингвистическую и металингвистическую информацию — р а з м е т к у (аннотацию). В современных корпусах помимо м е т а р а з м е т к и (отражающей различную экстралингвистическую информацию о тексте, включая его название, автора, жанровую принадлежность и т. п., подробнее см. раздел 21.5), содержится разметка, соответствующая различным уровням лингвистического описания, — морфологическая, синтаксическая, фонетическая, дискурсивная и др. Поиск в корпусе в соответствии с запросом пользователя обеспечивается с помощью специальных программ — к о р п у с н ы х м е н е д ж е р о в. Они обеспечивают сортировку результатов поиска, статистические подсчеты, выдачу списка всех контекстов, в которых встретилось искомое языковое Токен — в компьютерной лингвистике это минимальная значимая единица текста (в большинстве случаев соответствующая словоупотрблению), которая подвергается автоматической обработке. 1 Корпусная лингвистика 415 выражение и словников (списков слов, систематизированных некоторым образом) на основе корпуса. Большинство современных корпусных менеджеров позволяют осуществлять поиск различного рода информации: поиск конкретных словоформ; поиск словоформ по л е м м а м (поиск всех форм одной и той же лексемы, встретившихся в тексте); поиск неразрывных и разрывных словосочетаний. При наличии соответствующей разметки осуществляется поиск по набору морфологических признаков (например, поиск всех словосочетаний вида «предлог по + существительное в предложном падеже») и др. информацию, соответствующую уровням лингвистической разметки, представленных в корпусе. Благодаря наличию метаразметки пользователь имеет возможность создавать свой подкорпус текстов, отобранных по жанру, тематике, времени написания и т. п. Результат выдачи представляет собой к о н к о р д а н с (множество контекстов, в котором встретилось запрашиваемое языковое выражение). Каждый из примеров снабжается информацией об источнике, откуда взят пример. В ряде корпусов возможно также получить статистическую информацию о запрашиваемом языковом выражении: его относительную частоту по всему корпусу, распределение по жанрам или временным срезам, информацию о частоте его сочетаемости. 21.5. Разметка корпусов Корпуса текстов отличаются от других электронных текстовых ресурсов, например, от электронных библиотек, тем, что тексты имеют разметку, отражающую как общие характеристики текста (жанр, авторство и т. п.), т. е. метаразметку, так и аннотацию (tagging), отражающую лингвистические характеристики текстовых фрагментов (словоформ, предложений, морфем), соответствующие различным уровням анализа языка. (Л и н г в и с т и ч е с к а я) р а з м е т к а (tagging, annotation) — это процесс или результат приписывания текстам и их компонентам специальных меток. Лингвистическая разметка — одно из основных понятий корпусной лингвистики. Разметка дает возможность идентифицировать тексты по различным параметрам, позволяя осуществлять осмысленный поиск по корпусу. Разметка должна удовлетворять ряду требований. Требования к разметке были сформулированы Джеффри Личем и известны в корпусной лингвистике как семь максим Лича (Leech 1993): разметка должна быть независима от текста (должна быть возможность убрать разметку и просмотреть текст без нее и, наоборот, вычленить только разметку); принципы разметки и их разработчики должны быть известны конечному пользователю; пользователь должен быть поставлен в известность о том, что разметка не является 416 С. Ю. Толдова безошибочной, а представляет собой лишь потенциально полезный инструмент; в основу разметки должны быть положены общепринятые и, по возможности, теоретически нейтральные лингвистические принципы; ни одна разметка не может априорно считаться стандартом. Экстралингвистическая, или м е т а р а з м е т к а, сообщает сведения о данных. Метаразметку можно условно подразделить на внешнюю, структурную и техническую разметки. Внешняя разметка содержит сведения об авторе и сведения о тексте (автор, название, год и место издания, жанр и тематика). Структурная разметка маркирует главы, абзацы, предложения и словоформы. Техническая разметка отмечает кодировку, даты обработки, исполнителей и источник электронной версии. Метаразметка нужна для исследования условий существования языка, выявления в нем взаимосвязей и для изучения отдельных подмножеств языка. Метаразметка играет особую роль в социолингвистических исследованиях. Также она необходима в совре менных гигабайтных мониторных корпусах для того, чтобы пользователи могли создавать представительные и репрезентативные корпуса, соответству ющие собственным целям исследования. В таких корпусах разметка базируется на автоматической классификации текстов по жанрам и типам текстов. Лингвистическая разметка отражает лингвистические характеристики элементов текста на всех уровнях лингвистического анализа. В корпусах представлены следующие типы разметки: — частеречная и грамматическая (каждой словоформе в тексте приписана исходная форма (лемма), часть речи и другие грамматические характеристики, так словоформе глины ставится в соответствие лемма глина, а также пометы — сущ., ж.рода, мн. числа, им. падежа, см. рис. 21.1); — в корпусах, создаваемых в рамках полевых исследований языка, также используется поморфемная аннотация, где каждой морфеме приписана ее значение; — синтаксическая (тип синтаксической разметки зависит от того формального представления синтаксической структуры предложения, на которой базируется разметка; наиболее часто используется либо разметка в терминах непосредственных составляющих, либо в терминах зависимостей; в последнем случае каждой словоформе приписывается номер словоформы, которая является вершиной в словосочетании, а также тип синтаксической связи); — семантическую (каждой лексеме для каждого из ее значений приписыва ется таксономический класс, к которому данное значение относится; напри мер, лексема глина в НКРЯ получает семантическую помету, см. рис. 21.1); — дискурсивную (реплики, коммуникативные акты и т. п.). Корпусная лингвистика 417 Рисунок 21.1. Морфологическая и семантическая разметка в НКРЯ для словоформы глина Обычно корпус аннотирован сразу по нескольким или по всем видам разметки. В последнее время в связи с активным развитием различных приложений автоматического анализа текста востребованными оказываются корпуса с различными типами прагматической разметки: разметки тональности (мнений), именованных сущностей, фактов и событий определенного типа и т. п. Корпусы, как правило, предназначены для многократного использования многими пользователями. Для унификации работы с разными корпусами, для обеспечения «независимости» корпусных данных от конкретной программной реализации интерфейса работы с корпусом разрабатываются различные стандарты разметки текстовых корпусов. В настоящее время выработались стандарты представления метаданных, базирующиеся на описании текстов в рамках проекта Text Encoding Initiative (TEI) и на рекомендациях EAGLES (Expert Advisory Group on Language Engineering Standards). В качестве языка разметки используются универсальные языки разметки данных, такие как, например, SGML и XML. В современных системах, обеспечивающих корпусной менеджмент, используются также другие форматы разметки (conll, JSON и т. п.). 21.6. Поиск в корпусе Корпусные менеджеры обеспечивают пользователю быстрый и удобный поиск в корпусе текстовых примеров. В их базовые функции обычно входит предоставление пользователю всех контекстов, в которые входит искомое языковое выражение, т. е. конкорданса. Найденные контексты могут представлять собой предложения, см. рис. 21.2, либо некоторые фрагменты предложений в так называемом формате KWIC (key word in context), см. рис. 21.3. Помимо поиска конкретных словоформ или лексем современные корпусные менеджеры позволяют искать примеры на достаточно сложные синтаксические конструкции, например, последовательность сочиненных прилагательных или предложения с дативным субъектом. 418 С. Ю. Толдова Рисунок 21.2. Выдача НКРЯ Рисунок 21.3. Выдача НКРЯ в формате CWIC Кроме того, корпуса предоставляют информацию о частотном распределении исследуемого языкового явления. Во-первых, мы можем получить информацию о частоте того или иного языкового выражения или об относительной частоте (отношение количества примеров с искомым языковым выражением к общему числу слов в корпусе или подкорпусе, в котором осуществлялся поиск). Поскольку относительная частота большинства лексем в корпусе является очень малой величиной, принято оценивать частоту языковой единицы в ipm (item per million). Во многих корпусах также предоставляется информация о сочетаемости языковой единицы. Эта информация представляет собой некоторую стати стическую так называемую коллокационную меру, которая оценивает, насколько неслучайно два слова встретились в корпусе рядом. Пример лексем, упорядоченных по убыванию коллокационной меры для глагола давать представлен ниже: Collocation Joint давать возможность давать покой давать основание давать интервью давать показание 1516 277 288 163 148 Freq1 Freq2 LL score 35393 5006 13942 3849 2650 2988.78 579.82 459.81 318.86 310.36 21.7. Важнейшие корпуса текстов Одним из наиболее широко используемых в лингвистических исследованиях корпусов являются национальные корпуса. Н а ц и о н а л ь н ы й к о р п у с — это собрание текстов в электронной форме, представляющих данный язык (на определенном этапе его существования), отображающий данный язык во всем многообразии жанров, стилей, территориальных и социальных вариантов и т. п. Корпусная лингвистика 419 Общепризнанными образцами являются, в частности, Британский национальный корпус (BNC), на который ориентированы и многие другие корпуса; среди славянских корпусов выделяется Чешский национальный корпус, созданный в Карловом университете Праги, Национальный корпус русского языка (НКРЯ). Национальный корпус создается лингвистами для научных исследований и обучения языку. Глобальной задачей создания такого корпуса является отразить в полной мере всю картину употребления языка, по возможности во всех его проявлениях, в некоторый период времени. Таким образом, уже в силу поставленной задачи национальный корпус представляет собой наиболее представительное, сбалансированное, лингвистически аннотированное собрание текстов на данном языке. Это означает, что корпус содержит по возможности все типы письменных и устных текстов, представленные в данном языке (художественные разных жанров, публицистические, учебные, научные, деловые, разговорные, диалектные и т. п.), и что все эти тексты входят в корпус по возможности пропорционально их доле в языке соответствующего периода. Следует иметь в виду, что хорошая представительность достигается только при значительном объеме корпуса (десятки и сотни миллионов словоупотреблений). В последнее время становятся все более популярными корпуса, по объему в тысячи раз превышающие национальные корпуса, веб-корпуса, которые собираются и размечаются автоматически и содержат миллиарды словоупотреблений. Например, для русского языка при поддержке компании ABBYY создан Генеральный Интернет-корпус Русского Языка (ГИКРЯ) — мегакорпус (более 20 млрд. слов). Помимо корпусов общего назначения существуют корпуса, которые создавались для решения некоторой конкретной исследовательской задачи или в рамках одного лингвистического направления исследования. Для решения задач анализа дискурса создается целый ряд специализированных корпусов с дискурсивной разметкой. В разных корпусах разметка варьируется в зависимости от теоретической базы представления дискурсивной структуры. Например, некоторые корпуса имеют разметку в терминах теории риторических структур (Mann, Thompson 1988). В последнее время возникают глобальные проекты по созданию корпусов на разных языках, размеченных исходя из единых принципов и использующих единую систему разметки. Одним из значимых проектов является проект по синтаксической разметке корпусов на совершенно разных языках, включая редкие языки. Это корпуса, размеченные в терминах универсальных зависимостей (Universal dependencies). 420 С. Ю. Толдова Важным направлением в корпусной лингвистике является создание параллельных корпусов, корпусов текстов сразу на двух или более языках, где каждому предложению одного языка поставлено в соответствие предложение другого языка. Такие корпуса позволяют более эффективно изучать неродной язык, поскольку очень часто конкретный переводной эквивалент какого-то слова или выражения невозможно найти просто по словарю, так как выбор из числа возможных кандидатов зависит от реального контекста. В корпусе же иллюстрируются реальные употребления той или иной лексемы в контексте. Также параллельные корпуса являются главным набором данных для машинного обучения при создании систем машинного перевода. Активно развиваются так называемые «Learners corpora» — корпуса, содержащие тексты, порожденные людьми, для которых данный язык не является родным. Такие корпуса представляют собой как бесценный источник изучения различных лингвистических феноменов с позиции психолингвистики, так и важные ресурсы, используемые при преподавании иностранных языков. Главным корпусом, на материале которого происходят исследования русского языка, является Национальный корпус русского языка. Объем корпуса — более 200 млн. словоупотреблений. Корпус имеет морфологическую и семантическую разметку. Подкорпус из 6 млн. словоупотреблений имеет морфологическую разметку со снятой морфологической омонимией: каждой словоформе в конкретном контексте приписан только один морфологический тег — та морфологическая характеристика, которую данная словоформа имеет в данном контексте, в остальных текстах каждой словоформе приписаны все возможные морфологические характеристики вне зависимости от контекста. Так, например, в подкорпусе со снятой омонимией словоформе ключ в предложении Отдай мой ключ будет приписан один падеж — винительный, в остальном корпусе аннотация этой словоформы содержит два падежа: именительный и винительный. Эталонным корпусом, размеченным синтаксически для русского языка является корпус СинТагРус — корпус, созданный в Лаборатории машинного перевода ИППИ РАН. 21.8. Примеры применения корпусных методов исследования Методы корпусных исследований достаточно разнообразны и зависят от области исследования. В области грамматических и лексикологических исследований корпуса используются для расширения эмпирической базы исследования: корпуса Корпусная лингвистика 421 позволяют достаточно быстро найти примеры на некоторые не очень частот ные языковые явления и оценить некоторые параметры таких явлений. Например, такое явление, как безличный пассив в немецком, достаточно редки в текстах, что затрудняет исследование вопроса о том, какие факторы обуславливают выбор безличного пассива в реальных текстах, какие непереходные глаголы образуют такие конструкции и т. п. Мангеймовские корпуса газетных текстов на немецком языке позволяют не только получить достаточное количество примеров на это явление, но и статистически оценить некоторые зависимости. Корпуса позволяют исследовать частотное распределение различных лингвистических параметров. Корпусные данные о частотных характеристиках лексем позволяют получить сбалансированные частотные словари, отражающие реальные частотные характеристики лексем в языке. Также такие данные позволяют судить о жанровых особенностях текста. Корпуса используются для создания современных словарей. В отличие от традиционных словарей, в которых те или иные значения лексемы выделяются на основе интуиции исследователя, а примеры, их иллюстрирующие, как правило, представляют собой цитаты из классической литературы, при создании современных словарей используются корпуса большого объема. Значения лексем определяются на основе анализа большого корпуса примеров. Для обработки большого количества примеров используются специальные квантитативные методы, позволяющие компактно представлять наиболее типичную для лексемы сочетаемость. В результате, такие корпуса содержат более актуальную информацию о значении лексем, об их употреблении в тех или иных контекстах. Многие современные грамматики, основанные на эмпирических данных, используют данные корпусов не только для иллюстрации описываемых в них языковых феноменов, но и для того, чтобы количественно оценить представленность того или иного явления в языке, на основе корпусных данных выявить тенденции в случаях, когда не действуют жесткие грамматические правила. С использованием корпусных данных, например, можно оценить продуктивность той или иной морфемы в языке (Baayen 1992; Plag 2004). Корпуса широко используются при исследованиях в рамках такого направления, как грамматика конструкций (см., напр., Goldberg 2017; Ляшевская 2017). Существует грамматическое описание русского языка, в основе которого лежат корпусные исследования: http://rusgram.ru/. Отдельную большую область корпусных исследований представляют собой исследования сочетаемостных свойств как лексем, так и комбинаций 422 С. Ю. Толдова лексем и грамматических характеристик контекстов. Так называемые коллокационные меры позволяют автоматически или полуавтоматически получать списки коллокаций и лексико-грамматических конструкций (ср. коллоконструкционный анализ, Stefanowitsch, Gries 2003). 22. Моделирование С. Ю. Толдова Одним из методов научного исследования является моделирование. Создание модели того или иного исследования используется как метод научного познания, в частности, в случае, если тот объект, который мы исследуем, не дан нам в непо средственном наблюдении, мы можем наблюдать и регистрировать только какие-то его проявления. В таком случае создается некоторый идеализированный аналог исследуемого объекта. Исследуемые свойства аналога переносятся на оригинал. Также исследователи нередко прибегают к моделированию, когда реальное явления управ ляется сложным взаимодействием огромного количества различных факторов, которые имеют очень разное влияние на результирующее событие. Для определения действия одного фактора или небольшого подмножества факторов исследователь может абстрагироваться от каких-то факторов (ср. допущения в физике, напр., относительно реальных размеров объекта — физическая точка, или относительно действия некоторых сил). Таким образом, главная особенность моделирования в том, что это метод опосредованного познания с помощью объектов заместителей. Модель выступает как своеобразный инструмент познания, который исследователь ставит между собой и объектом и с помощью которого изучает интересующий его объект. Именно эта особенность метода моделирования определяет специфические формы использования абстракций, аналогий, гипотез, других категорий и методов познания. Моделирование также позволяет нам верифицировать выявленные в процессе других исследований закономерности. М о д е л ь — объект или описание объекта, системы для замещения (при определенных условиях, гипотезах) одной системы (т. е. оригинала) другой системы для изучения оригинала или воспроизведения его каких-либо свойств. Модель — результат отображения одной структуры на другую. В лингвистике понятие модели начало активно использоваться в рамках структурной лингвистики в работах К. Л. Бюллера, З. З. Харриса, Ч. Хоккета, хотя идеи о необходимости моделирования при исследовании языка высказывались еще в начале ХХ в. в работах Ф. де Соссюра и Э. Сэпира. Э. Сэпир считал именно идеальную систему — «реальным и наисущественнейшим началом в жизни языка» (цитируется по Апресян 1966: 38). 424 С. Ю. Толдова 22.1. Метод моделирования и типы моделей 22.2. Формальные модели 22.3. Статистические модели 22.4. Модели и компьютерная лингвистика Литература для дальнейшего чтения: Апресян 1966; Пентус, Пентус 2004. 22.1. Метод моделирования и типы моделей М о д е л и р о в а н и е — один из методов исследования в науке. Для того, чтобы исследовать некоторое явление, некоторые свойства объекта, неподдающиеся непосредственному наблюдению, можно построить м о д е л ь этого объекта, т. е. реальное или мысленное устройство, воспроизводящее свойства или поведение данного объекта, и исследовать свойства модели. В лингвистике то, что мы непосредственно наблюдаем, это результат языковой деятельности — текст в широком понимании этого слова, точнее графическое или акустическое его представление. Мы также можем наблюдать условия языковой коммуникации. Но мы не можем наблюдать то, что же этот текст означает, смысл текста не дан нам в непосредственном наблюдении. Мы также не можем наблюдать то, каким образом слово разбивается на более мелкие компоненты, морфемы, каждый из которых соотносится с некоторым лексическим или грамматическим значениям, или то, как говорящий строит грамматически правильное предложение, или то, как связан выбор некоторой грамматической категории в процессе порождения речи с различными параметрами контекста, внешними условиями и т. п. Таким образом, в различных областях лингвистики, в различных направлениях лингвистических исследований достаточно широко используется метод моделирования. Сам термин «моделирование» может обозначать как процесс построения модели, так и исследование модели. Одним из подходов к моделированию является моделирование методом «ч е р н о г о я щ и к а» (Эшби 1959). Термин «черный ящик» используют по отношению к системе, внутреннее устройство которой очень сложно, неизвестно, не наблюдаемо. Такую систему можно представить как некое устрой ство, которое имеет вход и выход. Мы не видим, какие именно процессы происходят внутри этого устройства, но нам известно, что мы «подаем на вход» этой системе и что мы получаем на «выходе». Основное допущение при таком подходе — это то, что то, что получается на выходе, функционально зависит от того, что на входе. Меняя входные данные, мы получаем изменения в выходных данных. Задача состоит в том, чтобы построить другой Моделирование 425 объект (это может быть некоторый абстрактный математический объект), который при таких же входных данных выдавал такие же данные на выходе. Если полученная модель может предсказывать реакцию исследуемого объекта на некоторые входные условия, можно считать, что мы получили некоторые знания об исследуемом объекте. В книге Ю. Д. Апресяна (Апресян 1966) характеризуются наиболее важные свойствами модели. Они приводятся ниже в соответствии с их описанием. Модель условна. Как правило, она похожа на исходный объект далеко не по всем своим свойствам. Обычно моделируются функциональные свойства объекта. Например, модель русского спряжения не должна быть «закодирована состоянием нервных клеток мозга» (Апресян 1966), она может быть изображена на бумаге или реализована в виде компьютерной программы. Модель является идеализацией объекта. При построении модели мы можем пренебречь какими-то деталями поведения исследуемого объекта. Например, при описании типа синтаксической связи прилагательного и существительного утверждается, что в русском языке они согласуются. При этом не рассматриваются неизменяемые прилагательные типа бордо, напр. ленточка цвета бордо. Идеализацией лингвистического объекта является утверждение Н. Хомского о том, что длина предложения ничем не ограничена в языке. В реальности предложения, произнесенные или написанные на любом языке, имеют конечную длину. В данном случае для модели синтаксиса важно, что в языке нет правил, ограничивающих длину предложений. Например, нет правил, ограничивающих построение именного словосочетания, в которое входит в качестве зависимого существительное в родительном падеже, напр. построение прообраза модели управления вершины сочетания… Модель оперирует часто не понятиями о реальных объектах, а к о н с т р у к т а м и. Правила, которые описывают поведение модели, описывают поведение идеальных объектов, которые не существуют в реальности. Так, например, при описании склонения существительных в русском языке по стулируют нулевое окончание у существительных мужского рода един ственного числа именительного падежа или говорят о нулевом предикате в предложениях типа Вася ∅наст. вр. умный (ср. наличие глагола быть, если предложение относится к прошедшему времени: Вася был умный). Модель должна быть формальной. При описании модели необходимо задать исходные объекты и правила обращения с ними, а также описать правила интерпретации, т. е. описать, каким образом объектам модели следует ставить в соответствие объекты некоторой предметной области. 426 С. Ю. Толдова Интерпретированная модель должна обладать свойством э к с п л а н а т о р н о с т и. Она должна объяснять наблюдаемые факты или результаты экспериментов. Она должна быть способна предсказывать новые факты. Конкретный тип модели, используемой в лингвистических исследованиях, зависит от целого ряда параметров. Модели могут различаться по охвату структуры языка: это могут быть модели языка в целом или модели отдельных языковых явлений. Моделироваться могут как сами языковые явления, так и лингвистические знания об этих явлениях или же собственно деятельность лингвиста. Модели могут различаться по конечной цели исследования: в задачи моделирования может входить построение лингвистической теории (например, модель «Смысл–Текст», теория управления и связывания), а может — построение прикладной системы для конкретных практических задач (например, создание автоматической системы, которая устанавливает синтаксические связи между словами в предложении). В зависимости от того, какая сторона речевой деятельности моделируется, различаются модели синтеза и модели анализа. При моделирование языковой способности в фокусе может находиться способность порождать высказывания разной степени сложности на некотором естественном языке, либо способность приписывать сложным языковым выражениям семантическую интерпретацию, либо способность отличать грамматически правильные выражения на некотором языке от грамматически неправильных. Построение лингвистических моделей является задачей формальных теорий в лингвистике. Направления, в основе которых является метод моделирования, объединяют часто под терминами «Формальный аппарат линг вистики», «Вычислительная лингвистика». Термин же «математическая лингвистика» нередко используется как синоним термину «компьютерная лингвистика», направлению прикладной лингвистики, связанному с применением компьютеров в лингвистических исследованиях. Существует два основных подхода к «математизации» лингвистических знаний. Во-первых, для того чтобы понять, как устроен язык, или отдельные его уровни, требуется разработать его формальную «модель» или же модели отдельных языковых уровней. Для этого может быть использован аппарат математики — специальные формальные языки и формальные системы, которые разрабатываются в таких областях математики как дискретная математика (напр., в таких разделах как формальные грамматики, теория графов, формальная семантика, теория алгоритмов и т. д.). Такой подход и составляет основу математической лингвистики в узком смысле слова. Во-вторых, реальное употребление тех или иных слов, грамматических категорий, синтаксических конструкций не подчинено одним только жестким правилам. Существует значительная вариативность в выборе тех или Моделирование 427 иных языковых средств для выражения одной и той же мысли. Таким образом, распределение языковых элементов в тексте, в речи подчинено стати стическим законам, и, следовательно, возможно построить вероятностные модели тех или языковых явлений, функционирования языка. 22.2. Формальные модели Первый подход был предвосхищен еще в работах Ф. де Соссюра. Дальнейшее развитие он получил в трудах лингвистов, придерживающихся структурного подхода к языку. Поворотным моментом в вычислительной лингвистике можно считать работы Н. Хомского. Она сформировалась как направление в 1950-х гг., когда появились первые компьютеры и первые языки программирования. Точнее, математическую лингвистику часто рассматривают как ветвь науки «Искусственный интеллект». В тот момент исследователям казалось, что возможности машин не ограничены, что можно создать «мыслящую» машину. Широко известен тест Тьюринга, как определить, способна ли машина мыслить как человек. В то же время появились первые эксперименты по машинному переводу. И работы самого Тьюринга, и работы Хомского, положили начало активному развитию теории формальных систем, с одной стороны, и применению этих систем в области лингвистики, с другой. В частности, в своей диссертации Хомский предложил классификацию формальных языков и формальных грамматик (Иерархию Хомского). В то же время Хомский известен во всем мире как лингвист — основатель порождающей (генеративной) грамматики. Его работы дали толчок не только к дальнейшему развитию генеративных синтаксических теорий, но и к применению других формализмов к лингвистическому моделированию. В нашей стране первое применение формальных методов, и грамматик разного вида (как математических объектов) к моделированию языка, прежде всего, связано с работами А. В. Гладкого и С. К. Шаумяна. С. К. Шаумян является создателем так называемой аппликативной порождающей грамматики. Среди работ А. В. Гладкого есть как работы, относящиеся к области теории алгоритмов, посвященные теории формальных грамматик, так и книги, в центре внимания которых различные способы формального описания синтаксических структур. 22.3. Статистические модели Еще в конце 1950-х гг. в нашей стране возникло направление «математического» осмысления языка в рамках статистического подхода, возникли 428 С. Ю. Толдова попытки разработать вероятностные модели языка. Одним из активных представителей данного направления является Р. Г. Пиотровский. Он является основателем группы «Статистика речи». Его работы находятся на стыке математики, лингвистики и информатики. Такое междисциплинарное научное направление он предложил назвать «Инженерной лингвистикой». Р. Г. Пиотровскому и его группе принадлежит целый ряд работ, посвященных статистическим характеристикам языковых единиц, математической лингвистике. Еще одним направлением деятельности Р. Г. Пиотровского была разработка систем машинного перевода. В 1962 г. была создана Кафедра математической лингвистики филологического факультета Санкт-Петербургского государственного университета. Ученые ленинградской научной школы сыграли огромную роль в развитии математической лингвистике в России. Создание статистических моделей того или иного языкового явления как метод исследования широко применяется в исследованиях в рамках таких направлений, как грамматика конструкций, корпусная лингвистика. 22.4. Модели и компьютерная лингвистика Разработка математических моделей того или иного языкового явления непосредственно входит в задачи компьютерной лингвистики. С одной стороны, для того, чтобы компьютер мог обрабатывать текст с точки зрения того или иного лингвистического явления (например, автоматически приписывать словоформам их грамматические характеристики или устанавливать семантические связи между предложениями), необходимо формализовать наши знания об этом явлении. Можно задать формальные правила анализа, описав, какие данные компьютер должен учитывать на входе, что он должен выдавать на выходе (например, построить конечный автомат, который бы распознавал цепочку правильно приписанных словоформе грамматических характеристик). Можно построить некоторую модель, основанную на числовых данных, которая бы с некоторой вероятностью предсказывала бы характеристики лингвистических объектов, поступающих ей на вход (например, с некоторой вероятностью предсказывала часть речи словоформы из текста). С другой стороны, можно использовать созданные в рамках теоретической лингвистики моделей в прикладных системах. Можно оценить результат работы системы, оценив количество ошибок в работе системы. В таком случае использование теоретической модели в прикладной системе может служить методом верификации такой модели. В последнее время наблюдается тенденция к использованию методов компьютерной лингвистики, в частности методов машинного обучения, в Моделирование 429 теоретических лингвистических исследованиях. Так, методы машинного обучения (например, регрессионный анализ, методы автоматической классификации и кластеризации) могут быть использованы для моделирования многофакторных языковых явлений. Например, невозможно описать с помощью правил возможность выбора анафорического местоимения для отсылки к той или иной сущности реального мира в тексте (ср. Вася поздно пришел домой. Он/мальчик/?Вася был очень уставшим). На выбор местоимения влияет много различных факторов. При применении методов машинного обучения компьютер на входе имеет множество текстов с разметкой, где для каждого анафорического местоимения указано, к какой сущности оно относится, какие грамматические характеристики оно имеет, как выражается предыдущее упоминание сущности, какую синтаксическую позицию оно занимает и т. п. На основе большого количества эмпирических данных такого рода он может оценить вероятность увидеть в тексте местоимение при различных комбинациях тех или иных факторов. На основе таких оценок строится математическая модель, которая способна с некоторой долей вероятности предсказывать появление местоимения в тексте (см. А.А. Кибрик и др. 2010). Таким образом, с некоторой долей условности можно считать, что полученная модель описывает выбор, который делает человек при порождении текста. Она может подтверждать или опровергать полученные в ходе собственно лингвистических исследований гипотезы о важности тех или иных факторов (см. о таком современном подходе к моделированию в лингвистических исследованиях Бонч‑ Осмоловская 2016). 23. Транскрибирование устной речи В. И. Подлесская Транскрибирование — это представление устной речи в графической форме. В «дотехнологическую» эпоху письменная фиксация была единственным средством документирования живой речи, однако и в современных условиях транскрипт, наряду с аудио- и видеозаписью, является золотым стандартом документирования. Живая речь это многоплановый динамический процесс, разворачивающийся во времени, и для его адекватного анализа нужна возможность фиксировать отдельные его срезы в виде статических объектов. Эту роль и выполняет транскрипт. Массивы транскриптов (в том числе в виде корпусов и баз данных) составляют эмпириче скую основу исследований в лингвистике и смежных науках — социологии, антропологии, фольклористкие, педагогике и др. (Davidson 2009). Разумеется, графическими средствами невозможно передать все многообразие явлений, формирующих устную речевую коммуникацию, поэтому транскрибирование представляет собой аналитическую процедуру: транскрайбер отбирает явления, подлежащие нотированию, в соответствии с задачами исследования, теоретическими установками и методологическими подходами (Ochs 1979; Bucholtz, Du Bois 2006; Bucholtz 2007). Формат транскрипта должен быть установлен эксплицитно, с тем чтобы одинаковые явления нотировались бы одинаковым способом, а решения, принимаемые разными транскрайберами, демонстрировали бы высокий уровень согласованности результатов; система нотации должна быть, по возможности, компактной, использовать иконические символы (O'Connell, Kowal 1995). В современной лингвистике существует несколько школ, в рамках которых сложились определенные традиции транскрибирования. Одна из самых устоявшихся традиций связана со школой анализа бытового диалога (conversation analysis), ориентированной на изучение взаимодействия говорящих в ходе речевой коммуникации. Этот формат известен как «джефферсоновская транскрипция» по имени Гейл Джефферсон — одной из ее главных разработчиков (Jefferson 2004; Atkinson, Heritage 1999). Ряд базовых конвенций джефферсоновской транскрипции был заимствован и усовершенствован в транскрипционном стандарте, известном как CHAT (Codes for the Human Analysis of Transcripts, MacWhinney 2000; обновление 2018 г. https://talkbank. org/manuals/CHAT.pdf). Этот стандарт используется в масштабном международном проекте Child Language Data Exchange System (CHILDES); проект первоначально был направлен исключительно на документирование и анализ образцов детской речи на языках мира, однако сейчас это гораздо более широкая программа, в которую Транскрибирование устной речи 431 входят банки данных по билингвизму, по речевым нарушениям, по усвоению как родного, так и второго языка: лонгитюдных записей бытовой коммуникации и др. (https://talkbank.org). Все банки данных выполнены на единой компьютерной платформе к которой и адаптирована транскрипция CHAT. К джефферсоновской транскрипции восходит и система транскрибирования устного немецкого дискурса GAT (Gesprächsanalytisches Transkriptionssystem, Selting et al. 2009). Сильной стороной этой системы является более подробная нотация для просодических аспектов дискурса и паралингвистических деталей (вздохов, смеха, типов фонаций и проч.); система исполь зуется в корпусах немецкой разговорной речи, функционирующих под эгидой AGD (Archiv für Gesprochenes Deutsch, http://agd.ids-mannheim.de/index.shtml) и совместима с компьютерным редактором транскриптов FOLKER (http://agd.ids-mannheim.de/folker. shtml), работающего, в свою очередь, как составная часть платформы для транскрибирования и аннотирования корпусов устной речи EXMARaLDA (http://exmaralda.org/en/). Другая мощная традиция связана с разработкой одного первых крупных компьютерных корпусов разговорной речи — корпуса разговорного американского английского в Калифорнийском университете в Санта-Барбаре (Du Bois 1991; Du Bois et al. 1993; Du Bois et al. 2002-2005, http://www.linguistics.ucsb.edu/research/santa-barbaracorpus). Эта традиция опирается на фундаментальные работы У. Чейфа по анализу дискурса (Chafe 2001, 2018) и ставит во главу угла задачу отразить в транскрипте (а) членение потока речи на сегменты, обладающие просодической, структурной и смысловой целостностью, (б) коммуникативную функцию каждого такого сегмента. Этот подход был в дальнейшем адаптирован и воплощен в целом ряде корпусов устной речи, в т.ч. на романских и германских (Raso, Mello 2014) и афроазиатских (Mettouchi et al. 2015) языках. В этом русле разработан и формат русской дискурсивной транскрипции (РДТ), принятый в коллекции корпусов «Рассказы о сновидениях и другие корпуса звучащей речи» (http://www.spokencorpora.ru/) и в мультиканальном корпусе «Рассказы и разговоры о грушах» (http://multidiscourse.ru/main/); теоретические и методологические основы данной транскрипции обобщены в монографии А.А. Кибрик, Подлесская ред. 2009 и ряде последующих публикаций (Коротаев 2015, 2018 inter alia). На примере РДТ ниже иллюстрируются основные лингвистические компоненты дискурсивной транскрипции. Пререквизиты: Дискурс, Корпусная лингвистика, Фонетика и фонология. 23.1. Временна́я развертка. Слова и не слова. Паузы 23.2. Элементарные дискурсивные единицы 23.3. Иллокутивная сила и фаза. Просодия 23.4. Речевые затруднения. Другое Литература для дальнейшего чтения: Ochs 1979; Du Bois et al. 1993; Jefferson 2004; Bucholtz, Du Bois 2006; Bucholtz 2007; Davidson 2009; А.А. Кибрик, Подлесская ред. 2009; Коротаев 2015, 2018. 432 В. И. Подлесская 23.1. Временна́я развертка. Слова и не слова. Паузы В таблицах 23.1 и 23.2 приведены два фрагмента диалога между двумя собеседниками N (нарратором) и C (комментатором), обсуждающими видео сюжет о мальчике, который везет корзину с грушами, установив ее на велосипед; фрагменты приведены в так называемом партитурном формате РДТ. В транскрипте ко временно́й оси привязаны все речевые события диалога. Видно, что реплики собеседников могут следовать непосредственно друг за другом или отделяться абсолютной паузой — периодом полной тишины: так, абсолютная пауза vp155 продолжительностью 0.50 сек (см. колонки Pauses в табл. 23.1) наступает после того как N закончила реплику N-vE285, а C еще не начал реплику C-vE087 (см. колонки Narrator и Commentator в табл. 23.1). Кроме того, в диалоге реплики собеседников часто накладываются друг на друга: так, из табл. 23.2 видно, что С начал реплику C-vE095 (ну он не достает) в момент 608.82 сек от начала диалога (см. колонку TimeS «время старта») и закончил ее в момент 609.77 (см. колонку TimeE «время финиша»), а за это время N успела произнести последовательность N-vE292, N‑vE293, N-vE294 и даже приступила в момент времени 609.72 к произнесению реплики N-vE295, однако тут снова вступает С и успевает произнести свою реплику C-vE096 (поэтому он и свалился) еще до того, как N закончила текущую реплику N-vE295. Паузы возможны не только между репликами, но и внутри них, ср. абсолютные паузы продолжительностью 0.40 сек внутри N-vE296 и 0.14 сек внутри C-vE097. Паузы могут быть не абсолютными: например, заполняться сигналами хезитации (ср. «экание» продолжительностью 0.42 сек, нотированное как (ə 0.42) в N-vE296) или физиологически мотивированными звуками (ср. громкий вдох продолжительностью 0.45 сек, нотированный как (ɥ 0.45) перед началом N-vE296). В РДТ все слова записываются в стандартной орфографии — это облегчает чтение транскрипта и делает возможным автоматический поиск по корпусу. Несловесные элементы нотируются с помощью знаков латинского алфавита и ряда других символов — это делает их более заметными на фоне слов. Вся числовые значения временно́й развертки и сегментация речевого потока переносятся в транскрипт из разметки, выполняемой в звуковом анализаторе PRAAT (Boersma, Weenink 2018); анализатор используется и как инструмент просодической разметки (см. подробнее в следующих разделах). На рис. 23.1 показано, как выглядит в окне анализатора сегмент N-vE296 вместе с предшествующим громким вдохом: синхронизированы осцилло грамма, интонограмма и границы слов и пауз. (0.50) (0.79) (0.24) vp155 vp156 vp157 Pauses 590.32 589.61 594.41 596.06 596.29 597.69 593.37 594.16 594.41 596.06 596.29 N-vE289 N-vE288 N-vE287 N-vE286 N-vE285 N-vE284 Narrator я бы \свалилась точно. там˗м || там || \там еще такая /–дорога˗а,,, \ɯДа, \/Нет? Ну –так она. Ну он ее по-моему \придерживает. C-vE088 он просто наверное \аккуратно \едет. C-vE087 Он ее не /придерживает, Commentator Таблица 23.1. Фрагмент 1 записи 04 из корпуса «Рассказы и разговоры о грушах» 591.79 593.37 594.16 591.70 591.70 590.82 589.61 588.32 590.32 590.82 591.52 TimeE TimeS Pauses 616.89 617.12 610.94 612.41 612.86 614.87 609.77 608.89 609.09 609.20 609.72 TimeE что он даже не \сидит на се= || на се= || на /седле, N-vE298 \как-то. N-vN052 (ɥ 0.45) N-vE296 он˗н (ə 0.42) (0.40) либо /\стоит,,, либо прямо не знаю на эту /→раму саN-vE297 дится,,, N-vE295 N-vE292 я == N-vE293 он == N-vE294 я \сказала, N-vE291 \ɯДа, Narrator C-vE097 /ˀВелосипед такой с вы= || (0.14) с \высокой рамой. C-vE096 поэтому он и –свалился. C-vE095 Ну он не \достает, Commentator Таблица 23.2. Фрагмент 2 записи 04 из корпуса «Рассказы и разговоры о грушах» 616.89 615.06 614.87 612.41 612.86 609.77 609.72 608.89 609.09 609.20 608.82 608.62 TimeS Рисунок 23.1. Русская дискурсивная транскрипция в окне анализатора PRAAT 436 В. И. Подлесская 23.2. Элементарные дискурсивные единицы В транскриптах РДТ произведено деление на элементарные дискурсивные единицы (ЭДЕ), каждая из которых записывается как отдельная строка (см. «словесные» колонки партитурной записи). ЭДЕ — минимальный фрагмент дискурса, который способен вступать в смысловые («риторические» в понимании Mann, Thopmson 1988) отношения с другими фрагментами в структуре дискурса. Просодически, ЭДЕ — это автономная единица, интонационно организованная вокруг одного рематического (фразового) акцента. С синтаксической точки зрения ЭДЕ в сильной степени коррелирует с клаузой: канонические ЭДЕ совпадают с клаузой (см. во фрагменте 23.1 — N-vE284, N-vE289. C-vE087, C-vE088), неканонические ЭДЕ также сохраняют связь с клаузальным прототипом. Например, так называемые субклаузальные ЭДЕ — это просодически автономные фрагменты, грамматическая структура которых определяется соседней, «опорной» клаузой, они возникают, в частности, при парцелляции (см. N-vE298, представляющая собой парцеллированный сирконстант предшествующей клаузальной ЭДЕ N-vE297). Так называемые параклаузальные ЭДЕ — это просодически автономные единицы, не име ющие полноценной структуры, типичной для клаузальной составляющей, но наделенные собственной коммуникативной функцией (приветствия, прощания, согласия и т. п.), ср. да и нет, в N-vE286, N-vE287, N-vE291. Так называемые гиперклаузальные ЭДЕ имеют в своем составе — помимо вершинного предиката — другие просодически интегрированные предикативные элементы, ср. N-vE297, где имеется встроенный дискурсивный маркер прямо не знаю, развившийся на базе личной глагольной формы. Таким образом, в РДТ применяется многофакторный подход к сегментированию дискурса, учитывающий просодические, риторические и синтаксические критерии; это отличает РДТ от многих транскрипционных форматов, выполненных в духе Du Bois et al. 2002-2005, где ведущим признается один критерий, обычно — просодический (ср. однако близкий к РДТ многофакторный подход, предложенный в Degand, Simon 2008, 2009). 23.3. Иллокутивная сила и фаза. Просодия ЭДЕ могут объединяться в последовательность, именуемую иллокутивной цепочкой. Каждая ЭДЕ в транскрипте завершается пунктуационным знаком, которым нотируется коммуникативная функция ЭДЕ: иллокутивная сила (сообщение, вопрос, директив и ряд других) и так называемая фаза — статус ЭДЕ внутри иллокутивной цепочки (последняя vs. непоследняя ЭДЕ в цепочке). Во фрагменте 23.2 последовательность ЭДЕ C-vE095, C-vE096 об- Транскрибирование устной речи 437 разует иллокутивную цепочку, ЭДЕ C-vE095 завершается знаком «запятая», показывающим, что данная ЭДЕ — незаключительная, а ЭДЕ C-vE096 знаком «точка», показывающим, что (а) данная ЭДЕ — заключительная в цепочке, и (б) что вся цепочка является сообщением. Ядром просодической нотации является обозначение движения тона в акцентированном слове — оно указывается перед словом иконически с помощью косых черт; ударный слог в слове — носителе главного фразового (рематического) акцента подчеркивается; значимые движения тона в заудар ных и предударных слогах обозначаются иконически с помощью стрелок. Движения тона фиксируются транскрайбером с опорой на визуализацию в программе PRAAT c учетом перцептивного анализа. Движение тона в главном фразовом акценте коррелирует — но не однозначно соответствует! — закрывающему пунктуационному знаку. Так, незаключительный статус ЭДЕ C-vE087 (фрагмент 23.1) нотируется запятой, просодически этот статус обеспечивается подъемом тона в акцентированном слове придерживает (нотируется косой чертой перед словом). Быстрый подъем в высокий регистр по типу ИК-3 в терминологии интонационных конструкций (Брызгунова 1982) является типичным, но не единственным для русского языка просодическим способом выражения незавершенности. Так, ЕДЕ C-vE095 (фрагмент 23.2) также является незаключительной (закрывающий знак — запятая), однако в главном фразовом акценте наблюдается падение тона (нотировано обратной косой чертой). Такое явление наблюдается, в частности, при так называемом «даунстепе», т. е. последовательном градуальном понижении тонового интервала в нескольких последовательных ЭДЕ в ил локутивной цепочке. При этом если в заключительной ЭДЕ цепочки тон падает до некоторого финального для данного говорящего уровня, то в незаключительных ЭДЕ падение происходит в менее глубокий уровень. Запятая является дефолтным, но не единственным закрывающим пунктуационным знаком для незаключительной ЭДЕ в иллокутивной цепочке. Среди других возможных — знак «,,,» (три запятых), нотирующий незавершенность открытого списка: это сигнал слушающему, что не только данная ЭДЕ не является заключительной, но и следующая за ней заключительной не будет. Этот статус обычно обеспечивается просодическим паттерном по типу ИК-6 в терминологии интонационных конструкций (Брызгунова 1982): на ударном слоге слова — носителя главного фразового акцента происходит подъем в невысокий уровень с последующим ровным тоном внутри самого́ ударного слога (как в N-vE288), или на заударных слогах (как в N-vE297), или подъем в невысокий уровень с последующим падением внутри ударного слога (как в N-vE296). 438 В. И. Подлесская Таким образом, в РДТ просодия и коммуникативная функция ЭДЕ нотируются раздельно. Это отличает РДТ от многих транскрипционных форматов, выполненных в духе Du Bois et al. 2002-2005, где просодия и коммуникативная функция нотируются синкретично: например, закрывающий знак запятая нотирует одновременно незаключительный статус сегмента и подъем тона. 23.4. Речевые затруднения. Другое В РДТ систематически нотируются характерные для спонтанной устной речи нарушения плавного развертывания речевого потока — так называемые речевые сбои. В некоторой точке дискурса говорящий может решить, например, что им выбрана неверная или неточная номинация, фрагмент артикулирован преждевременно и не может в нынешнем виде быть адекватно встроен в последующий дискурс, и т. д. Реагируя на возникшее несоответ ствие изначальной программе, говорящий может прибегнуть к самоисправлению, т. е. к «отбраковке» некоторого фрагмента. Чаще всего при самоисправлениях в точке прерывания речевого потока имеется просодический «шов» (который воплощается, например, в сломе интонационного контура), заполненная или незаполненная пауза, реже — лексические маркеры коррекции (ой, то есть, вернее, точнее). После прерывания говорящий заменяет забракованный фрагмент на правильный или повторяет первоначально забракованный фрагмент и продолжает развертывать речь таким образом, чтобы забракованный фрагмент мог быть безболезненно «стерт» и мате риал до и после него, сомкнувшись, образовал бы правильную последовательность. В РДТ забракованный фрагмент маркируется знаком «==» на границе ЭДЕ и знаком «||» внутри ЭДЕ. Так, во фрагменте 23.2 ЭДЕ N-vE292 (я) и N‑vE293(он) забракованы говорящим как неудавшиеся попытки приступить к последовательности я сказала, что он. А в ЭДЕ N-vE288, N-vE295 и C‑vE097 сбои происходят внутри ЭДЕ и приводят к неоднократным повторам материала (служебных слов, частей слов), вызвавшего затруднения. Помимо самоисправлений в РДТ нотируются и другие многочисленные явления, симптоматические для устной неподготовленной речи: нефонологичекое удлинение звуков (N-vE288), гортанные и губные смычки в начале и/или конце слова (N-vE287), редуцированное произнесение отдельных слов (N-vE284) и проч. В целом, транскрибирование дискурса — процесс трудоемкий; по име ющимся свидетельствам (Atkinson 1984; Travis, Cacoullos 2013) на транскрибирование одной минуты аудиозаписи уходит от одного до нескольких часов работы. Эта процедура требует как хорошего знания лингвистической Транскрибирование устной речи 439 теории (дискурсивного анализа, супрасегментной фонетики, корпусной лингвистики), так и практического опыта. Научиться транскрибировать можно только по принципу learning by doing. Полезно взять на вооружение слова Г. Джефферсон, которыми она открывает свою знаменитую работу «Словарь транскрипционных обозначений и введение к нему» (Jefferson 2004): «Я предпочитаю транскрибирование любой другой работе (аналитической, теоретической, преподавательской), и тем не менее, единственное чего я хотела бы избежать — это бесед о транскрипции. Что о ней говорить?!» (перевод мой — ВИП). 24. Квантитативные методы С. Ю. Толдова Квантитативные методы исследования в лингвистике предполагают оценку ч а с т о т н о с т и тех или иных языковых переменных, зависимостей между различными лингвистическими и экстралингвистическими параметрами, способными влиять на частотную дистрибуцию собственно языковых данных. Квантитативные методы позволяют выявить законы, связанные с частотным распределением языковых единиц, а также предложить статистические модели их функционирования. В литературе понятие «квантитативные» методы употребляется в двух смыслах. С одной стороны, имеется в виду оценка частотных распределений языковых единиц и связь их частотных характеристик с другими параметрами, например, с многозначностью или с морфологической сложностью и т. д. Такими исследованиями занимается специальное направление лингвистики — квантитативная лингвистика. В центре внимания многих исследований данного направления — исследование частотного распределения языковых единиц в текстах и соотношения частотного поведения этих единиц и других их свойств, например, частоты лексемы в языке и ее многозначности, частоты лексемы в языке и ее морфологической сложности и т. п. С другой стороны, часто под квантитативными методами исследования имеются в виду статистические методы, применяемые для оценки средних тенденций относительно различных языковых параметров (ср. распределение средних длин слов в морфемах в языках различного строя), а также для верификации различных гипотез о зависимостях между несколькими лингвистическими, социолингвистическими и другими параметрами (например, о связи между видовыми характеристиками глагола в предложении и маркированием определенности прямого дополнения, между возрастом говорящего и выбором той или иной грамматической формы). Пререквизиты: Эксперимент. 24.1. Задачи квантитативного (статистического) анализа данных 24.1.1. Частотные характеристики языковых переменных 24.1.2. Описательная статистика: типы и примеры различных типов шкал в лингвистике 24.1.3. Исследование зависимостей 24.2. Квантитативная лингвистика как направление лингвистических исследований 24.3. Корпусные квантитативные исследования Литература для дальнейшего чтения: Арапов 1988; Пиотровский и др. 2007; Baayen 2008; Gries 2009; Ляшевская 2016. Квантитативные методы 441 24.1. Задачи квантитативного (статистического) анализа данных Исследования в различных областях лингвистики, как и в других научных областях, имеют своей целью выявить и доказать существование некоторых закономерностей, общих тенденций, связей между различными явлениями. Одним из возможных путей достижения цели, а также одним из способов доказательств является статистическая оценка собранных в ходе наблюдений или в ходе эксперимента данных. Кроме того, иногда простая оценка частотности того или иного явления может помочь сформулировать исследовательскую гипотезу, прийти к выводам, которые далеко неочевидны при простом рассмотрении примеров, материала или оценки грамматической правильности высказывания. Таким образом, основные цели квантитативного анализа следующие: 1. Сокращение данных и их обобщение (summarization): большое количество разнообразных примеров, иллюстрирующих некоторое языковое явление, отображается в сжатое представление о средней тенденции и степени вариативности данных. Таким образом, все многообразие данных момент быть представлено всего несколькими числами, по которым можно восстановить поведение всей популяции. Так, например, при реализации смычных согласных в потоке речи длительность голосового приступа варьируются как среди информантов, так и у одного информанта; при каждом произнесении оно разное. Однако, можно оценить среднее время голосового приступа для каждой согласной, а также для звонких и смычных согласных отдельно. В результате, многообразие реально наблюдаемых событий будет представлено несколькими числовыми характеристиками (средним и средне-квадратичным отклонением). Описательная статистика помогает суммировать представление о некоторых языковых явлениях не только в фонетике, но и в других лингвистических областях. 2. Вторая цель — выявление закономерностей; статистические методы проверки гипотез позволяют обобщить данные, полученные в ходе наблюдений или экспериментов, на всю совокупность исследуемых объектов. Если говорить о характеристиках смычных согласных, то знание о среднем времени голосового приступа для звонких и глухих согласных может помочь установить, что между этими двумя классами согласных существует статистически значимое различие. Т. е. этот признак является различительным для противопоставления звонкий-глухой. Более того, мы можем сравнить эту характеристику в произнесении детей разных возрастов и установить момент, с которого время голосового приступа у ребенка при произнесении звонких и глухих начинает различаться. Так мы можем определить, когда 442 С. Ю. Толдова дети начинают различать это фонологическое противопоставление. Т. е. помимо просто оценки средней тенденции мы можем сравнивать эти тенденции в двух разных классах языковых выражений, отслеживать динамику изменений. 3. Выявление зависимостей между различными лингвистическими переменными. Так, например, иногда выбор конкретного грамматического показателя в реальных текстах зависит от множества различных факторов: например, выбор оформления прямого дополнения, выбор видовых характеристик глагола и т. д. Статистические методы позволяют оценить, в какой степени тот или иной фактор действительно влияет на дистрибуцию некоторой грамматической формы, в какой степени некоторые лингвистические параметры коррелируют между собой. Например, можно показать, что оформление именной группы показателем определенности (или маркером винительного падежа) коррелирует с совершенным видом глагола. 4. Построение статистических моделей. Современные статистические методы и технологии позволяют строить статистические модели, которые умеют предсказывать те или иные характеристики языковых выражений на новых данных. Например, такие модели могут предсказывать части речи слов или строить синтаксический анализ предложения с достаточно высокой точностью. 24.1.1. Частотные характеристики языковых переменных. Нередко даже наблюдение над частотой того или иного языкового явления позволяет сформулировать некоторые гипотезы. Одной из иллюстраций может служить исследование Бонч-Осмоловской дативных предикатов в русском языке (Бонч-Осмоловская 2003). В работе рассматривались различные глаголы, при которых субъект получает оформление дательным падежом: казаться (мне кажется), хотеться (мне хочется), нравиться (мне нравиться). Если рассматривать возможные грамматические конструкции, которые данные глаголы могу присоединять, то оказывается, что многие из глаголов данного класса могут управлять и существительным в именительным падеже или номинализацией Мне нравится Петино пение, и инфинитивным оборотом Мне нравится петь, и финитным предложением Мне нравится, что Петя поет. Распределение конструкций по глаголам представлено в табл. 24.1. Однако, оценка частоты распределения различных конструкций с данными глаголами в корпусе показывает, что это распределение неравномерно. Три наиболее частотных глагола тяготеют в значительной степени только к одной из возможных конструкций: казаться значительно чаще присоединяет зависимую финитную предикацию по сравнению с другими конструкциями Квантитативные методы Глагол Казаться Нравиться Хотеться Надоедать Представляться Помниться Сниться Чудиться Мерещиться Думаться 443 NULL NOM INF S R ANAPH Всего 4% 7% – 4% – – 3% – 9% – 1% 59% 3% 45% 22% 53% 52% 31% 30% – – 9% 86% 32% – – – – – 5% 68% 8% 9% 20% 22% 34% 31% 41% 35% 95% 25% – – – 56% 2% – – – – 2% 17% 2% 20% – 10% 14% 28% 26% – 652 450 448 83 69 41 35 29 23 21 Таблица 24.1. Экспериенциальные глаголы и количество их употреблений (Бонч-Осмоловская 2003) (в 68% примеров); нравиться предпочитает выражение аргумента номинализацией (59% примеров); хотеться чаще всего управляет инфинитивной конструкцией (86% примеров). Оценка частоты появления той или иной языковой единицы в тексте лежит в основе такого метода анализа смысла текста, как к о н т е н т - а н а л и з. Этот метод применяется не только как метод исследования в семантике, он применяется в различных гуманитарных областях таких, как история, социология, политология, а также в маркетинговых исследованиях. Информацию о частотных характеристиках слов в некотором языке (насколько часто слово встречается в речи) обычно отражают в специальных частотных словарях. Частотные характеристики слова представляют как частоту слова в тексте объемом в миллион слов, т. е. количество упоминаний данного слова на миллион — item per million — ipm. Информация о частоте слова в некотором тексте, а также информация о том, в скольких текстах в некоторой коллекции текстов слово встретилось, лежит в основе характеристики слова, используемой в информационном поиске. Это tf.idf — term frequency*log(inversed document frequency). Данная характеристика отражает степень «тематичности» слова. Эта характеристика отражает следующую тенденцию. Лексема представляет тематику текста, если она в нем упоминается достаточно часто. Однако, самые частотные слова, такие как артикли, некоторые союзы и предлоги, упоминаются часто в любом тексте. Для того, чтобы оценить в какой степени специфично то или иное слово для некоторого текста, учитывается количество текстов, в кото- 444 С. Ю. Толдова рых оно встречается. Если оно встречается во всех или в большинстве текстов коллекции, то оно мало говорит о тематической специфике конкретного текста, оно не помогает отличить по тематике этот текст от большинства текстов коллекции. 24.1.2. Описательная статистика: типы и примеры различных типов шкал в лингвистике. Для проведения статистического исследования необходимо конкретные примеры на исследуемое языковое явление превратить в некоторые числовые данные, т. е. представить, как некоторый измеряемый признак. В данном случае говорят о шкалах измерения. В лексико-грамматических исследованиях мы чаще всего встречаемся с ситуацией, когда наши данные не могут быть измерены на вещественной шкале. Скорее мы можем просто зарегистрировать, встретилась ли та или иная категория в случайной выборке примеров или нет. То есть чаще всего мы можем только отнести объекты нашего исследования в тот или иной класс, не имеющий никакого числового выражения. Например, мы можем констатировать, что в данном предложении выбран совершенный вид глагола, а в другом предложении — несовершенный. Такой тип шкалы называют н о м и н а л ь н ы м (или категориальным). Единственно, что мы можем оценить — это частоту того или иного оформления в некотором массиве данных, т. е. вероятность появления некоторого значения переменной. Опрашивая носителей языка относительно грамматической правильности того или иного примера, мы можем предложить ему оценить приемлемость примера не в бинарной шкале (да/нет), а на так называемой порядковой шкале: например, различать несколько степеней приемлемости: совсем неприемлемый пример, малоприемлемый, но потенциально возможный, возможный, но «я так бы не сказал», приемлемый. В данном случае мы можем поставить в соответствие этим оценкам числа от одного до четырех. Сравнения между числами больше-меньше представляет собой в данном случае осмысленное действие. Т. е. мы можем ранжировать данные по порядку, но арифметические действия с такими числами не имеют под собой физического смысла. Такие «измерительные» шкалы называют п о р я д к о в ы м и. В психолингвистических экспериментах мы можем, меняя разные грамматические параметры, оценивать, например, скорость реакции испытуемого или скорость чтения того или иного предложения или какие-то другие объективные данные, которые можно измерить и выразить некоторым произвольным числом. В таком случае мы имеем и н т е р в а л ь н у ю ш к а л у. Квантитативные методы 445 24.1.3. Исследование зависимостей. Во многих исследованиях основной задачей является выявить некоторые закономерности, определить, как влияет на дистрибуцию той или иной языковой характеристики (например, некоторого значения грамматической категории) различные другие языковые и внеязыковые характеристики (факторы). Например, исследователей может интересовать: — влияют ли разные методики обучения на результат овладения языком (а также пол студента, место, откуда он прибыл и т. п.); — влияет ли возраст ребенка на длину фраз, обращенных к нему; — влияют ли факторы рода, специфичности, одушевленности именной группы на выбор клитик в испанском языке; — влияет ли синтаксическая структура предложения-стимула на синтаксическую структуру предложения-реакции (эксперименты на синтаксический прайминг); — влияет ли возраст, пол, социальный статус франкоговорящих канадцев, район их проживания и т. п. на употребление ими английских заимствований и т. п. Для определения, есть ли какая-то зависимость между двумя языковыми переменными, обычно используют различные статистические методы проверки гипотез (с т а т и с т и ч е с к и е к р и т е р и и). 24.2. Квантитативная лингвистика как направление лингвистических исследований Еще в древнегреческой и древнеиндийской культуре существовали исследования, которые опирались на подсчет частот, такие, например, как стихометрия. Активно «квантитативное» направление в лингвистике стало развиваться в конце XIX — начале XX вв. Стимулом к этому послужил целый ряд обстоятельств. Во-первых, в связи с развитием различных средств передачи информации, например, телеграфа, разработкой стенографического письма возникла необходимость некоторым образом оптимизировать средства кодирования информации. Во-вторых, в связи с интенсивными миграционными процессами возникла задача помочь людям освоить иностранный язык в кратчайшие сроки. Так, в США в начале XX в. эмигрировало очень большое количество людей, не владеющих английским языком. Возникла необходимость в короткие сроки обучить людей хотя бы в минимальной степени понимать и общаться на английском языке. Все эти обстоятельства вызвали интерес исследователей к частотным характеристикам слов. Необходимость исследования частотного распределения слов в языке моти- 446 С. Ю. Толдова вирована достаточно простым когнитивным принципом: чем частотней слово, тем проще и важнее его запомнить, тем меньше усилий надо для его кодирования. Так, например, система стенографического письма должна быть устроена таким образом, чтобы количество символов, которые тратятся на запись слова, было как можно меньше, если это слово очень часто встречается в речи. Для редкого слова лучше отвести больше символов. Тогда не придется для каждого редкого слова запоминать какой-то уникальный знак. Для того, чтобы быстро научиться общаться на каком-то языке, нужно выучить некоторый минимум общеупотребительных слов, а, значит, слов, которые чаще всего употребляются в речи. Первые исследования частотного распределения языковых единиц были посвящены вопросу о том, существуют ли какие-то статистические закономерности появления слов в текстах. Поиск ответа на этот вопрос является центральным для квантитативной лингвистики. В нашей стране квантитативная лингвистика как отдельное лингвистическое направление стало активно развиваться в 1960-е гг. Его развитие неразрывно связано с Ленинградской школой математической лингвистики, одним из основателей которой является Раймунд Генрихович Пиотровский, а также с работами в области информационного поиска. Действительно, появление того или иного конкретного слова, морфемы, фонемы в тексте можно рассматривать как случайное явление. В данном случае можно говорить о том, что различные явления языка можно описать с помощью математических законов, а именно, статистических законов. Часто на выбор того или иного грамматического оформления влияет очень много факторов, которые невозможно описать строгими алгоритмическими правилами. Например, возможность/невозможность употребить местоимение 3 лица вместо полного имени не описывается такими правилами. Если вспомнить правила выбора артикля из школьной грамматики, можно сказать, что они устроены очень сложно, приводятся большие списки исключений, множество мелких правил-«исключений». Когда же мы начинаем применять их в жизни, оказывается, что существует еще много случаев, когда они не работают. Многие явления в языке невозможно описать только в терминах грамматической правильности. Да и само понятие «грамматической правильности» оказывается размыто. Нередко мы сталкиваемся с ситуацией, когда между носителями языка возникают споры, можно ли так сказать. Часто грамматическая категория представляет собой некоторую шкалу. Например, понятие продуктивности морфемы (степень участия морфемы в образовании слов в языке) невозможно описать как бинарное противопо ставление. Скорее, можно сказать, что морфема более продуктивна, если с ее Квантитативные методы 447 Рисунок 24.1. Закон Ципфа: ранговое распределение частот слов помощью образуется больше слов. Аналогичная ситуация с языковыми универсалиями. Большинство выявленных типологами закономерностей не являются непреложными законами, скорее фриквенталиями, т. е. свойственными значительному большинству языков. Именно в таких ситуациях выявить основные тенденции и закономерности позволяет квантитативный подход: статистические оценки распределения тех или иных явлений и категорий. В настоящее время знания о статистическом распределении языковых единиц, статистические модели широко применяются в различных областях прикладной лингвистики, начиная от языковой дидактики (разработки методик обучения языку), и кончая компьютерной лингвистикой, где статистические методы стали главенствующими в последнее десятилетие. Также выявление статистических закономерностей распределения тех или иных лингвистических категорий является одной из задач относительно молодого направления лингвистики — корпусной лингвистики. Интерес к статистическим исследованиям в области языкознания неразрывно связан с исследованиями американского лингвиста Джорджа Ципфа из Гарвардского университета. Его именем назван основополагающий закон квантитативной лингвистики — З а к о н Ц и п ф а: эмпирический закон распределения частоты слов естественного языка. На этот закон опираются все дальнейшие исследования в области квантитативной лингвистики, а также современные приложения компьютерной лингвистики и информаци- 448 С. Ю. Толдова онного поиска. Этот закон говорит о следующем. Если взять достаточно большой текст, содержащий более сотни тысяч слов, и расположить их в порядке убывания частот, то самое частотное слово будет употребляться примерно в два раза чаще, чем следующее по частоте и т. д. Т. е. если перенумеровать слова в порядке убывания частот, то, оказывается, что для большей части слов соблюдается такое соотношение: частота слова обратно пропорциональна его порядковому номеру (рангу), это соотношение выражается следующей формулой (1). fr= C1 r (1), где fr — относительная частота слова в тексте (в корпусе), r — ранг слова, С — константа. Реально этот закон выявляет закономерности частотного распределения слов в тексте, но никогда в точности не выполняется. Существуют множественные попытки предложить «поправки» к нему. После опубликования работ Ципфа (Zipf 1949) возникло целое направление в лингвистике, в центре внимания которого стояло выявление закономерностей распределения разных лингвистических характеристик языковых единиц (напр., морфологической сложности, фонетической сложности и т. п.) в зависимости от их частотных характеристик. Например, статистические исследования доказали, что морфологическая глубина слова (количество морфем в слове) связано с его частотными свойствами: чем чаще встречается слово в тексте, тем скорее оно будет состоять из одной-двух морфем. Исследовалась также связь частоты слова и его возраста, его фонетиче ской сложности, степенью его многозначности. Так оказалось, что чем частотнее слово, тем скорее оно будет иметь достаточно большое количе ство значений. Перечисленные выше закономерности наводят на мысль о том, что, во-первых, они универсальны и свойственны разным языкам, во‑вторых, за ними стоят какие-то базовые когнитивные механизмы функционирования языка, порождения речи. В рамках этого направления был сформулирован целый ряд законов: — закон распределения длин морфов; — закон распределения длин ритмических единиц; — закон распределения длин предложений; — закон распределения длин слогов; — закон распределения длин слов; — закон Менцерата (также, в особенности в лингвистике, известный как закон Менцерата-Альтмана): данный закон гласит, что размеры составля ющих конструкции уменьшаются с увеличением самой изучаемой кон Квантитативные методы 449 струкции. Чем длиннее, например, предложение (измеренное количеством входящих в его состав придаточных предложений), тем короче входящие в его состав придаточные предложения (измеренные количеством слов), или: чем длиннее слово (в слогах или морфах), тем короче сами слоги или морфы; — закон изменения языка: процессы роста в языке (как, напр., рост словаря), распространение иностранных и заимствованных слов, изменения в флективной системе и т. д. подчиняются закону, известному как закон Пиотровского: скорость роста словаря пропорциональна его текущему объему; закон Пиотровского - это частный случай так называемой логи стической модели (ср. с логистическим уравнением). Классической областью применения методов квантитативной лингвистики является с т и л е м е т р и я и а т р и б у ц и я текста. Существует целый ряд текстов, авторство которых оспаривается. Вопрос о том, принадлежит ли текст одному автору или разным, волнует людей давно. Споры об этом ведутся, в частности, относительно текстов Нового Завета. Споры об авторстве возникали и относительно целого ряда статей Ф. М. Достоевского, до сих пор ведется спор об авторстве «Тихого Дона». Возникает вопрос, можно ли выявить такие признаки текста, которые бы могли однозначно указать на его автора — авторский инвариант. В качестве авторского инварианта предлагались различные признаки: частотное распределение трехбуквенных сочетаний, средняя длина и сложность предложения, частота служебных частей речи и др. Чаще за авторский инвариант принимается целый ряд взаимосвязанных признаков. Для определения авторства используются специальные статистические процедуры, например, корреляционный или факторный анализ. Как уже отмечалось, частотные характеристики лексем играют важную роль при изучении языка, а также при смысловом анализе текста. Необходимо учитывать частотные характеристики лексем в различных лингвистических исследованиях. Такая информация обычно представлена в специальных словарях: ч а с т о т н ы х с л о в а р я х. Технологии составления таких словарей, отбора слов, подсчета частот и т. п. также входит в задачи квантитативной лингвистики. Проверке универсальности выявленных статистических закономерно стей, а также исследованию распределения вариативности различных лингвистических переменных в языках мира посвящены многочисленные исследования в области к в а н т и т а т и в н о й т и п о л о г и и. Одно из первых таких исследований принадлежит Джозефу Гринбергу. Он первым применил количественные методы для определения морфологического типа язы- 450 С. Ю. Толдова ка (Гринберг 1963). Существует целый ряд типологических проектов, в задачи которых входит не только описать различные проявления тех или иных грамматических категорий в разных языках, сформулировать универсалии, но и описать частотное распределение категорий и их значений в языках мира (напр., проект WALS). В современной типологии представлено направление, в рамках которого исследование типологических характеристик различных языковых феноменов опирается на методы математического моделирования. Одним из примеров может служить исследование соотношение «богатства» падежной системы и порядка слов в языке (Bickel 2018). Как было сказано выше, выявленные закономерности частотных распределений языковых единиц как внутри языка, так и по разным языкам неизбежно ведут к задаче найти им когнитивное объяснение. Именно таким образом ставится задача в исследованиях Гертруды Фенк-Ослон (Fenk-Oszlon, Fenk 1999). Эти исследования посвящены выявлению корреляций между распределением длин языковых единиц различного уровня (слогов, слов, предложений) и морфологическим типом в языках мира. Они служат еще одним обоснованием тезиса о том, что естественные языки стремятся сохранять информационный поток постоянным (напр., они стремятся поддерживать длину простых предложений (и отдельных предикаций) постоянной). 24.3. Корпусные квантитативные методы Квантитативные методы исследования языковых феноменов получили дальнейшее свое развитие в рамках корпусной лингвистики. Современные корпуса текстов достигают значительных объемов. Это позволяет применять в исследовании современные статистические методы, требующие достаточно большого объема данных. Существование аннотированных по разным лингвистическим параметрам корпусов текстов (напр., корпусов, где каждой словоформе поставлена в соответствие ее морфологическая характеристика), возможности автоматического поиска в корпусах большого объема позволило применять различные методы квантитативного анализа, такие как регрессионный анализ, кластеризация и классификация. Одним из направлений современного квантитативного анализа стало квантитативное исследование контекстной сочетаемости лексем в тексте. В частности, в современной лексикографии достаточно активно используется коллокационный анализ. При этом коллокациями считаются пара лексем или словоформ, которые появляются вместе в пределах некоторого контек ста (напр., в пределах 10 слов) чаще, чем случайно. Для оценки характерис- Квантитативные методы 451 тики «чаще, чем случайно» используются различные коллокационные меры, или меры ассоциативной связи. Методами, которые позволяют выявить коллокации, можно исследовать также не сочетаемость конкретных лексем, а появление лексемы в некоторой конструкции, т. е. появление некоторой грамматической формы в контексте лексемы или некоторого словосочетания (например, появление существительного в дательном падеже в контексте словосочетания А мне по …). Методы выделения коллоконструкций развиваются и активно используются в рамках такого направления, как грамматика конструкций (Goldberg 2011; Stefanovich, Gries 2004; Ляшевская 2016). Таким образом, практически любое исследование, выполненное на современном уровне, требует того, чтобы первичная проверка гипотезы либо обоснование выявленных языковых закономерностей строились на «статистически значимой» выборке. Иными словами, исследования должны быть подкреплены данными, полученными на основе анализа больших по объему корпусов текстов. На стыке корпусной лингвистики и лексикографии, а также лингводидактики образовались отдельные направления, в рамках которых описание любого языкового явления, любой языковой единицы строится с учетом их частотности. Так создатели словарей серии Collins Cobuild используют для описания лексемы огромный корпус текстов в несколько миллиардов слов. При составлении словарных статей учитывается разница в частоте того или иного значения лексемы. В результате, мы получаем словарь, в котором значения расположены в соответствии с их «актуальностью», типичностью. В рамках такого подхода создан целый ряд грамматик, в которых не просто описывается то или иное явление, а указывается его частотное распределение. Например, для русского языка существует проект Rusgram (http://rusgram.ru/about), в задачи которого входит представить грамматическое описание, верифицированное корпусными данными Национального корпуса русского языка. Статистическое моделирование языка нашло дальнейшее развитие в современных технологиях автоматической обработки текста. Многие системы лингвистического автоматического анализа на всех языковых уровнях (синтаксическом, морфологическом, семантическом), современные системы машинного перевода (напр., Гугл-переводчик) основаны на различных вычислительных моделях (в том числе и вероятностных), моделях машинного обучения. Исходными данными в этих моделях служат все то же частотное распределение языковых элементов в текстах / в языке. V. П р ик лад на я и комп ь ю т е р н ая ли н гв и ст и к а 25. Лексикография И. М. Кобозева Л е к с и к о г р а ф и я — раздел прикладной лингвистики, посвященный созданию с л о в а р е й — инвентарей единиц языка, относящихся к разным уровням языковой системы (морфологическому, лексическому, синтаксическому), в которых эти единицы охарактеризованы по заданному набору лингвистических параметров1. Разработка типологии словарей, принципов и методов создания словарей разных типов входит в компетенцию т е о р е т и ч е с к о й л е к с и к о г р а ф и и, а п р а к т и ч е с к а я л е к с и к о г р а ф и я — это собственно деятельность по созданию словарей, воплощающих ту или иную теоретическую концепцию. Первый и основной тип словарей — это инвентари слов, лексиконы. Любой естественный язык состоит из двух основных компонентов — лексики, т. е. множества слов, и грамматики — системы правил их соединения в предложения. Поэтому полное научное описание языка с необходимостью включает в себя не только грамматику, но и с л о в а р ь (l e x i c o n). Принципы и методы выделения слов, установления их грамматических, и семантических категорий, описания их значений и способов соединения значений слов между собой рассматриваются в соответствующих разделах общей теории языка (морфологии, синтаксисе, семантике) и в основанных на общетеоретических положениях разделах описаний конкретных языков. Однако ни в задачи теории языка, ни в задачи описания конкретного языка обычно не входит сколько-нибудь полное описание его словарного состава. При этом потребность в достаточно полных описаниях как лексических, так и других языковых единиц своего или чужого языка существует. Они нужны людям самых разных возрастов и профессий, которые хотят узнать значение, или написание, или произношение, или происхождение или какое-то другое свойство слова, или понять, можно ли его Ограничение «лингвистические» применительно к параметрам характеристики слова в словаре важно для отделения лингвистических словарей от словарей энциклопедических, входом в которые служат также единицы языка — слова, но описываются в них не слова как единицы лексической системы, а стоящие за ними объекты и явления, и потому параметры их описания относятся не к лингвистике, а к той предметной области, к которой принадлежит данный объект или явление. Так, создание словарей, подобных «Словарю камней-самоцветов» (Куликов 1982), не имеет отношения к лексикографии как разделу лингвистики. 1 456 И. М. Кобозева употребить в заданном контексте. Эти потребности и удовлетворяет традиционная лексикография, которая, используя достижения теоретической лингвистики, создает разнообразные словари, предназначенные для разных категорий пользователей (от школьника до ученого). В эпоху компьютеризации возникает такой раздел компьютерной лингвистики, как к о м п ь ю т е р н а я л е к с и к о г р а ф и я, разраба тывающая словари для автоматической обработки текстов на естественном языке. Такие словари пишутся на специальных формальных языках, они составляют один из модулей системы обработки текста и не предназначены для конечного поль зователя. Пререквизиты: Теория языка. 25.1. Определение словаря 25.2. Типология словарей 25.2.1. Типы словарей, различающиеся по формальному и/или семантическому типу описываемых в них единиц языка 25.2.2. Общие и частные словари 25.2.3. Одноязычные и двуязычные словари 25.2.4. Нормативные и дескриптивные словари 25.2.5. Типы словарей, различающиеся по характеру информации, сообщаемой в них об описываемых единицах 25.2.6. Типы словарей, различающиеся по их адресату 25.3. Структура словаря 25.4. Компьютерные технологии в лексикографии 25.5. Связь лексикографии с фундаментальными лингвистическими дисциплинами Литература для дальнейшего чтения: Апресян 1995; Новое в зарубежной лингвистике 1983; Шимчук 2003. 25.1. Определение словаря Словарем в широком смысле слова (словарем1) может быть названо любое описание единиц языка определенного типа, имеющее вид определенным образом упорядоченного инвентаря, в котором каждая единица охарактеризована по заданным параметрам. В таком определении словаря уже заложены два признака, которые могут быть положены в основу типологии словарей: 1) тип инвентаризуемых единиц; 2) параметр(ы), по которым охарактеризованы единицы словаря, они же — типы информации о единицах словаря. Эти два признака не являются независимыми: выбор параметров описания зависит от типа описываемых в словаре единиц. Словарем в узком смысле (словарем2) называется словарь1, в котором описываются слова (= лексические единицы) языка. Лексикография 457 25.2. Типология словарей 25.2.1. Типы словарей, различающиеся по структурному типу описываемых единиц языка. Из самой морфемной структуры слова словарь очевидно, что основным структурным типом единиц, описываемых в словарном формате, являются слова. Поэтому по умолчанию продукт, именуемый словарем, является словарем2. Но существуют и словари языковых единиц, меньших или больших, чем слово, и тогда тип инвентаризуемых единиц обычно отражается в их названии в виде определения к слову словарь. Так, «Словарь м о р ф е м русского языка» (Кузнецова, Ефремова 1986) содержит инвентарь морфем, а «Ф р а з е о л о г и ч е с к и й объяснительный словарь русского языка» под ред. А. Н. Баранова и Д. О. Добровольского описывает идиоматичные фраземы (словосочетания, значение которых не может быть выведено по общим правилам из значений составляющих их слов). «Синтаксический словарь» Г. А. Золотовой имеет подзаголовок «Репертуар е д и н и ц р у с с к о г о с и н т а к с и с а», где в качестве таковых выступают синтаксемы, под которыми понимаются падежные граммемы (напр., дательный падеж), а также предложно-падежные конструкции (напр., дательный падеж с предлогом к). Иногда в случае инвентаризации единиц языка, отличных от лексических, слово «словарь» в названии может вообще отсутствовать, хотя описание и выполнено в формате словаря (ср. «Пословицы русского народа» В. И. Даля). Словари2 могут различаться в зависимости от того, какая категория слов в них описывается. Если в словаре инвентаризуется такой особый тип слов, как и м е н а с о б с т в е н н ы е, то словарь может называться о н о м а с т и к о н о м, или в названии словаря указывается тот вид имен собственных, которые в нем описываются, ср. «Г е о г р а ф и ч е с к и е н а з в а н и я мира: Т о п о н и м и ч е с к и й словарь» (Поспелов 1998), «С о б с т в е н н о е и м я в русской поэзии ХХ века: словарь л и ч н ы х и м е н» (Григорьев 2005). В конце ХХ в. связи с возросшим интересом лингвистов к семантике служебных (структурных) слов появилось много словарей служебной лексики в целом или той или иной ее категории, см., напр., «Словарь с т р у к т у р н ы х с л о в русского языка» (Морковкин ред. 1997) или «Lexikon deutscher P a r t i k e l n» (Helbig 1998). Существуют и словари, посвященные словам определенной лексико-грамматической категории знаменательных слов, см., напр. «Большой толковый словарь русских г л а г о л о в» (Бабенко 2007), или определенной семантической группы таких слов, см., напр., English s p e e c h a c t verbs: a semantic dictionary (Wierzbicka 1987). Особой популярностью у неспециалистов пользуются словари так называемых «иностранных», или «иноязычных» слов, то есть слов языка, заимствованных из других языков 458 И. М. Кобозева относительно недавно (напр., для заимствований в русский язык — в XVIII– XX вв.) и не относящихся при этом к общеупотребительной лексике, см., напр., «Толковый словарь иноязычных слов» (Крысин 2000). Могут инвентаризоваться не только отдельные слова, но и группы слов, связанных определенными формальными и/или семантическими отношениями. Так, объектом описания в с л о в а р е с и н о н и м о в оказываются с и н о н и м и ч е с к и е р я д ы — группы слов, близких по значению (см. напр., «Новый объяснительный словарь синонимов» (НOCC 2004), в с л о в а р е а н т о н и м о в, о м о н и м о в и п а р о н и м о в — группы слов, связанных соответственно отношениями антонимии, омонимии и паронимии, см., напр., «Школьный словарь антонимов русского языка» (Львов 1980), «Словарь антонимов русского языка» (Ахманова 1986), «Словарь паронимов русского языка» (Вишнякова 1984). Особой разновидностью словарей являются и д е о г р а ф и ч е с к и е словари, чаще называемые т е з а у р у с а м и по названию первого словаря такого типа — Roget Thesaurus of English Words and Phrases (Roget 1982/1852). Входом в таких словарях выступают не слова, а семантические единицы — п о н я т и я, или к о н ц е п т ы , которым ставятся в соответствие слова и фраземы, выражающие эти понятия в данном языке. О структуре таких словарей мы скажем в соответствующем разделе. 25.2.2. Общие и частные словари. Словари2 подразделяются на о б щ и е, претендующие на инвентаризацию всей лексики национального языка и ч а с т н ы е, описывающие лексику того или иного территориального (диалектного) или социального варианта языка (жаргона). Так, напр., «Словарь живого великорусского языка» (Даль) является словарем общим, так как в нем описываются как слова литературного языка, так и диалектные слова, как общеупотребительная лексика, так жаргонная. К частным словарям можно отнести и словари т е р м и н о в, поскольку в них отражена лексика определенной предметной области, которой пользуются преимущественно представители соответствующей профессии. 25.2.3. Одноязычные и двуязычные словари. В одноязычных словарях и инвентаризуемые единицы и их описание даны на одном и том же языке. В двуязычных словарях инвентаризуются единицы одного языка, а информации о них дается на другом языке. Основной тип двуязычных словарей — словари, предназначенные для перевода с одного языка на другой. В них словам «исходного» языка ставятся в соответствие слова другого языка с тем же значением, т. наз. переводные эквиваленты. Лексикография 459 25.2.4. Словари нормативные и дескриптивные. Нормативный словарь фиксирует только те свойства инвентаризуемой единицы, которые лексикограф признает языковой нормой для данного языка или подъязыка. Такой словарь предписывает своему читателю, как надо произносить, упо треблять, понимать и т. д. данную единицу. Дескриптивный словарь фиксирует те свойства инвентаризуемых единиц, которые лексикограф наблюдает в «узусе», т. е. в реальной речевой практике носителей данного языка. Чтобы понять различие между двумя этими типами словарей, достаточно сравнить нормативный «Орфоэпический словарь русского языка. Произношение, ударение, грамматические формы» (Аванесов 1988) с дескриптивным «Большим орфоэпическим словарем русского языка (Каленчук и др. 2017). Как правило, нормативными являются терминологические словари, поскольку их цель — обеспечить унификацию употребления терминов в той или иной области науки и техники. 25.2.5. Типы словарей, различающиеся по характеру информации, сообщаемой в них о единицах словаря. Данный параметр словарного описания не независим от первого параметра. Так, например, информация о произношении может фиксироваться в словаре слов, но не в синтаксическом словаре в силу абстрактности описываемых в нем единиц — синтаксем. Наибольшим разнообразием параметров описания характеризуются лексические единицы. Перечислим основные т и п ы л е к с и ч е с к о й и н ф о р м а ц и и, т. е. информации, которая в принципе может быть приписана слову в словаре2 и укажем соответствующие им типы словарей. — информация о б о з н а ч а ю щ е м слова. На подачу только этой информации в виде полной фонетической транскрипции ориентированы с л о в а р и п р о и з н о ш е н и я, напр. Cambridge English Pronouncing Dictionary (Jones 2006), или о р ф о э п и ч е с к и е с л о в а р и, напр., Аванесов 1988; Каленчук и др. 2017. В словарях других типов (толковых, грамматических и т. п.) эта информация может также сообщаться, но в редуцированном виде, напр., проставляется словесное ударение, но транскрипция не дается. Тем же типом информации, но только примени тельно к письменной форме языка, ограничиваются о р ф о г р а ф и ч е с к и е с л о в а р и. Вообще говоря, словари кодифицированного литературного языка всегда побочно содержат орфографическую информацию о слове, поскольку написание слов в них соответствует нормам орфографии, но посмотреть, как пишется то или иное «трудное» слово удобнее именно в орфографическом словаре: он компактнее, а инвентарь слов 460 И. М. Кобозева (словник) в нем обычно не меньше, чем в словарях других типов. С появлением персональных компьютеров роль «бумажных» орфографических словарей во многом взяли на себя встроенные в программу текстовых редакторов модули проверки орфографии, отслеживающие орфографические ошибки и предлагающие варианты их исправления. Однако иногда они излишне предупредительны и не всегда угадывают то слово, которое имел в виду пишуший, не говоря уже о том, что и по сей день некоторые тексты пишутся от руки; — информация о г р а м м а т и ч е с к и х х а р а к т е р и с т и к а х и г р а м м а т и ч е с к и х ф о р м а х слова. Полной информацией такого типа слова снабжаются только в специальных г р а м м а т и ч е с к и х с л о в а р я х. Выдающимся лексикографическим трудом этого типа является «Грамматический словарь русского языка» (Зализняк 1977), на базе которого были впоследствии созданы морфологические парсеры (анализа торы) для текстов на русском языке; — информация о с о ч е т а е м о с т и с л о в а . Есть словари, дающие подробную информацию о м о р ф о с и н т а к с и ч е с к о й с о ч е т а е м о с т и, или у п р а в л е н и и слова, т. е. о том, в какой грамматической форме должны при нем выступать другие слова, связанные с ним определенным синтаксическим отношением (напр., о том, что при глаголе скучать в значении ‘испытывать скуку’ дополнение должно оформляться при помощи конструкции от + Nрод, , а в значении ‘томиться из-за отсутствия кого/чего-л’ — о + Nпредл. или по + Nдат. Примером специального словаря, предоставляющего информацию такого типа для наиболее частотных глаголов английского языка, может служить «Англо-русский словарь глагольных словосочетаний» под ред. Э. М. Медниковой. Есть словари, в которых помимо морфосинтаксической описывается также л е к с и ч е с к а я с о ч е т а е м о с т ь, то есть ограничения, налагаемые словом на способ выражения при этом слове того или иного значения. Напр., англичанин может знать, что русский переводной эквивалент англ. слова rain — дождь, а heat — жара, но чтобы правильно по-русски выразить смысл ‘дождь/жара имеет место’, он должен также знать, что говоря о дожде, следует употребить глагол идти или лить (выбор между последними определяется интенсивностью дождя), а говоря о жаре — глагол стоять. Догадаться об этом трудно, поскольку прямое номинативное значение слов идти, лить и стоять отличается от значения ‘иметь место’. Такое «связанное» значение данные глаголы получают, только сочетаясь с ограниченным множеством слов или даже с одним словом, как лить, означающее ‘иметь место’ только при слове ‘дождь’. Лексикография 461 Информацию о лексической сочетаемости в том или ином виде и объеме содержат с л о в а р и с о ч е т а е м о с т и, см., напр., Словарь сочетаемо сти слов русского языка (Денисов, Морковкин ред. 2002). Но только в «Толково-комбинаторном словаре русского языка» (Мельчук, Жолков ский 2016), сокращенно ТКС, описание сочетаемости обоих типов имеет под собой солидную теоретическую основу — семантическую теорию моделей типа «Смысл  Текст» (Мельчук 1974), предоставляющую лексикографам для описания сочетаемости такие лингвистические кон структы, как «модель управления» и «лексические функции — параметры». ТКС невелик по количеству описанных в нем слов, но он может служить образцом для создания более объемных словарей сочетаемости слов любого языка. В обычных толковых словарях данная информация если и отражается, то неполно и непоследовательно; — информация о с л о в о о б р а з о в а т е л ь н ы х д е р и в а т а х с л о в а, их м о р ф е м н о й с т р у к т у р е и с п о с о б а х о б р а з о в а н и я может быть представлена в специальных с л о в о о б р а з о в а т е л ь н ы х с л о в а р я х (см., напр., Тихонов А.Н. Словообразовательный словарь русского языка: В 2-х томах. М. 2003). — информация о я з ы к о в о м (л е к с и ч е с к о м) з н а ч е н и и слова, подаваемая в виде т о л к о в а н и я, или д е ф и н и ц и и — главный тип информации в т о л к о в ы х с л о в а р я х. Помимо толкования значения, как правило, даются примеры употребления слова в данном значении, дающие некоторое представление и о сочетаемости слова. Кроме того, в толковых словарях обычно отражены и основные грамматиче ские характеристики слова (часть речи, вид глагола, род и форма множественного числа существительного и нек. др.), приведены некоторые фраземы с данным словом, его основные словообразовательные дериваты. Так, в рассчитанном на широкую аудиторию «Словаре русского языка» (Ожегов 1990) слово ладонь представлено так: Л А Д О Н Ь , -и, ж. Внутренняя сторона кисти руки. Загрубелые ладони. Как на ладони (о том, что хорошо видно; совершенно ясно). В ладони хлопать, бить, ударять (то же, что в ладоши хлопать, бить, ударять). || уменьш. л а д о ш к а , -и, ж. Бить, хлопать в ладошки (ударять одной ладошкой о другую). || прил. л а д о н н ы й , -ая, -ое. Ладонная поверхность рук, пальцев. — э н ц и к л о п е д и ч е с к а я информация в широком смысле того слова — это все те знания и представления, которые связаны с обозначаемым данным словом объектом, свойством или явлением на данном этапе развития общества. Такая информация не зависит от языка и носит универ- 462 И. М. Кобозева сальный характер. Она содержится в э н ц и к л о п е д и ч е с к и х с л о в а р я х, которые не являются лингвистическими. Но в эти словари обычно не попадают самые обычные обиходные слова, поскольку связанные с ними знания и представления справедливо считаются общеизвестными. Так, слова ладонь, карман, расческа и многие подобные отсутствуют в «Большом энциклопедическом словаре» (БЭС 1991). Вместе с тем, энциклопедическая информация о любых словах бывает важна и для собственно лингвистических целей. Учет связанной со словами энциклопедической информации необходим для объяснения развития у слова новых значений или объяснения соответствия между буквальным и действительным значением фразеологизмов. Так, мы говорим как на ладони о том, что хорошо видно, потому что мы действительно часто подносим мелкие предметы на нужное расстояние к глазам и рассматриваем их на раскрытой ладони, чтобы обеспечить себе хорошую видимость. Поэтому в новейших толковых словарях наряду с толкованием лексического значения в особой зоне фиксируется и релевантная для лингвистических целей энциклопедическая информация, см., напр., Мельчук, Жолковский 2016; Апресян 2010; — с т и л и с т и ч е с к а я информация обычно включается в разные словари в качестве дополнительной: она фиксируется при помощи стилистических помет, за которыми стоят разные условия употребления слова (ср. пометы бран. — бранное, высок. — высокого стиля, книжн. — книжного стиля, офиц. — официальное и др.); — информация об и с т о р и и с л о в а, в частности о первом письменно зафиксированном его употреблении, о времени появления или исчезновения у него у него того или иного значения, которую дают и с т о р и ч е с к и е с л о в а р и, см., напр., первый том «Словаря истории русских слов» под. ред. Э. Ф. Володарской и М. Л. Ремневой (СИРС 2009), образцом для которого послужил The Oxford English Dictionary (OED 1998). Исторические словари одновременно являются и толковыми, поскольку сообщают о значениях слова в разные периоды его существования. — информация о п р о и с х о ж д е н и и (э т и м о л о г и и) с л о в а, которую можно почерпнуть из э т и м о л о г и ч е с к о г о с л о в а р я, см., напр., сведения о слове ладонь в «Школьном э т и м о л о г и ч е с к о м с л о в а р е русского языка»: ЛАД О НЬ. Искон. Возникло в результате метатезы и закрепления аканья на письме из долонь < общеслав. *dolnь после развития полногласия, суф. производного от той же основы, что и дол «низ», долина, Лексикография 463 долой. Ладонь буквально — «низменное место» > «нижняя сторона» (кисти руки). — информация о словах, связанных с данным а с с о ц и а т и в н о. Она выявляется в ходе психолингвистических ассоциативных экспериментов с носителями языка и содержится в а с с о ц и а т и в н ы х с л о в а р я х, где снабжается еще и сведениями о частотности слов-ассоциатов, см., напр., «Русский ассоциативный словарь» (РАС 2002). — информация о ч а с т о т н о с т и слова в том или ином корпусе текстов дается в ч а с т о т н ы х с л о в а р я х, см., напр., Частотный словарь современного русского языка (на материалах Национального корпуса русского языка) (Ляшевская, Шаров 2009). Данный список типов лексической информации не является исчерпывающим. Набор параметров характеристики слова растет по мере того, как лингвистическая теория обнаруживает новые типы информации о слове, знание которых важно для тех или иных целей. Так, развитие лингвистической прагматики (которую можно рассматривать как особый раздел семантики), исследующей влияние ситуативного контекста на порождение и понимание высказываний, привело к выделению прагматической информации в качестве особого типа лексической информации, см., напр., Апресян 1998. В словарях, описывающих не слова, а другие типы языковых единиц, могут быть представлены некоторые из уже перечисленные типов информации и появиться новые. Так, в фразеологическом словаре помимо описания актуального значения фразеологизма и его синтаксических характеристик может быть представлена и и н ф о р м а ц и я о в а р и а н т а х его означающего (поскольку фразеологизмы, в отличие от слов, часто существуют в нескольких вариантах при тождестве их значения), и и н ф о р м а ц и я о «в н у т р е н н е й ф о р м е» фразеологизма, т. е. экспликация связи его буквального значения с актуальным, ср. следующий фрагмент описания фразеологизма в «Фразеологическом объяснительном словаре русского языка», где зона внутренней формы выделена курсивом: Нет… конца-края; [Нет/не видно] ни конца ни края; [Нет/ не видно] конца и края. (чему-л.) Что-л. занимает так много места в пространстве, что невозможно определить его границы. (Баранов, Добровольский ред. 2015: 372). Набор параметров, по которым характеризуется лексическая единица (типов и информации) зависит от цели, которую ставит перед собой лексикограф. Если ставится задача построения «словаря активного типа», то есть словаря, ориентированного на производство речи, а не на ее понимание, то набор типов информации, которые необходимо учитывать говорящему для 464 И. М. Кобозева правильного употребления слова включает большинство из вышеуказанных типов: информацию об означающем (фонетическую, просодическую, орфографическую), информацию семантическую (о значении слова), прагматическую, наивно-энциклопедическую, информацию о синтаксической и лексической сочетаемости слова, а также информацию о тех словах, которые связанны с данным определенными семантическими парадигматическими отношениями (синонимах, антонимах и нек. др.) (Апресян 2010: 56–152). 25.2.6. Типы словарей, различающиеся по их адресату. Словари могут адресованы разным категориям пользователей. Есть а к а д е м и ч е с к и е словари, адресованные лингвистам, а также преподавателям языков. Они, как правило, являются дескриптивными и стремятся к предоставлению максимально полной и детальной информации об инвентаризуемых единицах. Есть словари, рассчитанные на массового читателя. Они, как правило, нормативные, поскольку такого читателя чаще всего интересует вопрос, «как правильно» употреблять или понимать единицу языка, и такие словари дают минимально достаточную информацию, позволяющую решить эти задачи. Адресованные школьникам ш к о л ь н ы е словари, конечно, все нормативные и содержат самую основную часть информации об описываемых единицах языка, к тому же изложенную в популярной форме. 25.3. Структура словаря Разработка структуры словаря является основополагающей задачей лексикографа. Структура словаря во многом определяется типом инвентаризуемых единиц, которые, как говорится, образуют «с л о в а р н ы е в х о д ы», и характером сообщаемой о них информации. В «словарях слов» такими входами служат в о к а б у л ы — слова в канонической грамматической форме. Каждой вокабуле сопоставляется «с л о в а р н а я с т а т ь я», структура которой зависит от того, какие типы информации о слове дает данный словарь. Так, словарная статья стандартного толкового словаря делится на зоны грамматической информации, стилистической информации, информации об управлении (в основном у глаголов), семантической информации (толкования с примерами употребления); зоны устойчивых сочетаний. К структуре словаря относится и с п о с о б у п о р я д о ч е н и я е д и н и ц о п и с а н и я. В словарях самого разного типа единицы упорядочиваются по алфавиту обычным образом: от первой буквы слова к следующим. Иначе устроен «Грамматический словарь русского языка» А. А. Зализняка, в котором слова упорядочиваются также по алфавиту, но от последней буквы к предшествующим, что объясняется сходством грамматических характе- Лексикография 465 ристик у слов, имеющих сходные окончания. Словари, в которых слова упорядочены таким образом, называются о б р а т н ы м и. Существенно иную структуру имеют тезаурусы, входом в которые служат не слова, а понятия, концепты. Хотя концепты по необходимости обозначаются при помощи слов, их односторонняя, чисто семантическая сущность отражается при помощи особых нотационных приемов, например, имена концептов записываются прописными буквами. В классических тезаурусах, подобных тезаурусу Роже, концепты упорядочиваются не по алфавиту их имен, а в соответствии с концептуальной иерархией, построенной на родо-видовых отношениях между понятиями. Такая иерархия, которая может называться онтологией или синоптической схемой, является одним из обязательных компонентов в структуре тезауруса. Каждому концепту в тезаурусе сопоставляются группа выражающих его слов и устойчивых словосочетаний, предоставляющая информацию о том, какими средствами может быть выражено в языке данное понятие. Эту группу, иногда именуемую таксоном, можно считать «словарной статьей» тезауруса. Таксоны нумеруются при помощи позиционной нотации. Еще один компонент тезауруса — это упорядоченный по алфавиту словник — множество всех слов, появляющихся в таксонах тезауруса, с приписанными им номерами таксонов, в которые они входят. Этот словник образует еще один «вход» в тезаурус — от слова к тем понятиям, в выражении которых оно участвует. 25.4. Компьютерные технологии в лексикографии Компьютеризация научных исследований произвела революцию в области создания словарей. Специальные компьютерные ресурсы и программы поддержки лексикографических работ — размеченные корпуса текстов, базы данных, конкордансы — позволяют получать необходимые данные в автоматическом режиме и хранить собранную информацию в удобном для компоновки словарных статей виде. Однако такая лексикографическая операция, как формулирование толкования лексического значения, остается и, наверное, всегда будет оставаться прерогативой человеческого интеллекта, а не компьютерной программы. Еще одним следствием компьютеризации в области лексикографии стало появление электронных версий словарей, предоставляющих удобный интерфейс для быстрого нахождения нужной единицы или извлечения из словаря всех единиц, обладающих заданной пользователем характеристикой. 466 И. М. Кобозева 25.5. Связь лексикографии с фундаментальными лингвистическими дисциплинами Как и всякое описание языка, лексикографическое описание базируется на теоретических концепциях и использует концептуальный аппарат тех разделов фундаментальной лингвистики, в которых изучаются соответствующие единицы языка и типы информации о них. Для словарей произношения такой теоретической базой является фонетика, для грамматических — морфология, для синтаксических — синтаксис, для толковых словарей и тезаурусов — прежде всего лексическая семантика. С другой стороны, практика составления словарей, требующая приписать информацию определенного типа любой инвентаризуемой единице, часто ставит перед фундаментальными дисциплинами вопросы, ответа на который они пока не успели дать, и тем самым стимулирует их развитие. Так, необходимость приписать в общем словаре характеристику «часть речи» любому, в том числе и служебному, слову русского языка, остро ставит проблему выработки строгих критериев определения этой грамматической характеристики слова, которые пока не выработаны; необходимость разбить все множество употреб лений многозначного слова на конечное количество отдельных значений стимулировало разработку проблем лексической неоднозначности и т. д. Поэтому лексикографическую деятельность иногда называют экспериментом, поскольку при создании словаря проходят проверку на адекватность теоретические конструкты фундаментальной лингвистики. 26. Документация языков А. Е. Кибрик Документация языков — область лингвистики, которая занимается накоплением систематизированной информации о естественных языках, представлением этой информации в формате, пригодном для использования в решении исследовательских и практических задач, разработкой методов и практических приемов ее сбора, хранения и распространения. Документация языков имеет важное значения для накопления знаний о языковом разнообразии, о параметрах межъязыкового варьирования и об ограничениях на него. Она имеет междисциплинарный характер и, помимо собственно лингвистики, тесно смыкается с этнографией, антропологией, социологией, психологией, компьютерной наукой. Документация языков имеет множество методологических и практических аспектов, из которых ниже освещается наиболее важный — практическая процедура документирования. 26.1. Процедуры документирования 26.2. Тексты 26.3. Лексика 26.4. Грамматическое описание Пререквизиты: Теория языка (все главы), Типология, Языки мира и языковое разнообразие , Социолингвистика. Дополнительная литература: Austin 2010; Himmelmann 2006; Woodbury 2010. 26.1. Процедуры документирования Существует множество различных подходов к процедуре документирования, и нельзя сказать, что один из них лучше другого. Так, имеется семидесятилетний опыт американского Летнего лингвистического института (Summer Institute of Linguistics, сокращенно SIL), основанного Кеннетом Пайком, известным специалистом по переводу Библии на языки мира, создателем так называемой тагмемной теории, одним из крупнейших теоретиков и практиков полевой лингвистики. Пайк полагал, что можно начинать изучать язык, ничего о нем предварительно не зная и даже не имея возможно 468 А. Е. Кибрик сти использовать язык-посредник, монолингвальным методом. Он показывал, как вступить в речевой контакт с носителем языка, используя вместо языка-посредника «язык тела» (body language) и несколько предметов, знакомых всякому человеку независимо от его культурного опыта. Летний лингвистический институт имеет большое количество проектов изучения малых языков и рассылает лингвистов во все уголки земного шара. Преследуется двуединая цель: перевести Евангелие на малые бесписьменные языки, совсем или почти не изученные, а для этого предварительно изучить эти языки и создать письменность. Молодые исследователи проходят лингвистическую подготовку в институте в летних школах, а затем едут в поле. Это исследователи-одиночки или семейные пары, поскольку программа изучения рассчитана на много лет, может быть, на всю жизнь. Существенно отличается от такой подхода к документирования методика коллективной полевой работы, разнаботанная на Отделении теоретиче ской и прикладной лингвистики филологического факультета МГУ (см. А.Е. Кибрик 1972, а также главу 20 в наст. изд.). Эта методика предполагает совместную работу над описанием языка группы из нескольких исследований, что позволяет сократить временные затраты на порядки. При любом подходе, однако, эффективность процедуры полевого исследования в наибольшей степени зависит от личности исследователя и его п р о ф е с с и о н а л ь н о г о с о о т в е т с т в и я стоящей перед ним задаче. Практика показывает, что полевая работа в известной мере такой вид деятельности, которой нельзя научиться теоретически. Требуется поработать с различными языками в течение ряда лет, прежде чем в своей полевой работе исследователь начинает руководствоваться не методом проб и ошибок, а накопленным опытом. Есть простые, более сложные и сверхсложные операции, и учиться осваивать их надо от простого к сложному. Простые операции может достаточно быстро освоить неофит (в нашем случае — студент младших курсов, впервые участвующий в полевом исследовании), более сложные требуют определенного полевого и лингвистического опыта, а со сверхсложными вообще не всякий может успешно справляться. Исследовательская полевая деятельность состоит из очень разнообразных, часто рутинных элементарных умений, которыми нужно овладеть. Главное умение, которое необходимо в такой работе — это чувство ответст венности за результат и скрупулезность во всех мельчайших этапах работы. Главное требование — не делать ошибок в презентации языкового материала, многократно перепроверяя каждую букву, каждый перевод на точность и адекватность. Для этого существует множество методов верификации данных. Незнание изучаемого языка не освобождает исследователя от ответ Документация языков 469 ственности за фактические ошибки. Наличие фактических ошибок в конечном описании подрывает доверие и к качеству теоретического анализа данных. Ниже коротко описаны приемы работы с тремя наиболее важными компонентами документируемого языка — с текстовой, словарной и грамматической информацией. 26.2. Тексты Специфика документации малых бесписьменных языков состоит в том, что ее потребитель этого языка не знает. Поэтому весь языковой материал требует адекватного перевода, обеспечивающего любому пользователю легкий доступ к нему. Под адекватным переводом понимается не просто идиоматичный перевод, точно передающий значение исходного текста средствами переводного языка, а специальный м е т а я з ы к (формализованный научный язык, построенный на базе переводного языка), отражающий значение всех элементов текста. Как минимум потребитель должен легко устанавливать значения всех слов, входящих в исходное высказывание. Для этой цели может быть использован буквальный пословный перевод, если переводной язык это позволяет. Русский язык со свободным порядком слов в значительной степени может быть использован для такого пословного перевода. Этот способ был использован в презентации текстов арчинского языка (А.Е. Кибрик и др. 1977b). Однако и русский язык не всегда справляется с требованиями пословного перевода. Например, в арчинском языке русским предлогам соответствуют послелоги, и пословный перевод послеложных групп дает неприемлемое в русском языке выражение: вместо выражения в лесу пословный перевод требовал бы перевода лесу в. В таких случаях используется нумерация переводных слов, указывающая реальный порядок слов в оригинале: 2)в 1)лесу. Если переводным языком является английский с его строгим порядком слов, использование пословного перевода невозможно. Видимо, поэтому в англоязычных грамматиках пословный перевод в качестве метаязыка не используется, за исключением особых локальных случаев. При переводе оригинала однозначного соотнесения входящих в него слов со словами буквального перевода недостаточно. Не менее важно эксплицитно представлять внутреннюю морфемную структуру исходного выражения и значения всех морфем. Эту информацию с помощью буквального перевода выразить невозможно. Поэтому с конца 1970-х гг. в практику описаний редких языков постепенно входит специальный метаязык перевода и представления оригинала. А именно, все слова оригинала членятся на мор- 470 А. Е. Кибрик фемы, а под каждым словом стоят значения морфем в том же порядке, что в оригинале. Элементы такого перевода обычно называются г л о с с а м и, а процесс перевода — г л о с с и р о в а н и е м. В наших изданиях принято значения лексических основ переводить по-русски, а значения грамматических морфем — стандартными глоссами в латинской графике. Это обусловлено стремлением к следованию международным стандартам; один из популярных стандартов глоссирования — так называемые Лейпцигские правила1. Пример глоссировананного предложения приводится в табл. 26.1. При п е р в о м с л о в е «вина» в круглых скобках после словарного значения указывается, что это слово относится к 4-му согласовательному классу (роду). Кроме того, через точку указывается, что это слово стоит в номинативе (в другой терминологии — в абсолютиве), который не имеет специального показателя и совпадает с основой. В т о р о е с л о в о содержит три морфемы, разделенные дефисами. Первая морфема — корневая. Стоящий перед переводом в квадратных скобках показатель [4.SG] означает, что этот глагол согласуется по 4 классу ед. числа со словом в номинативе «вина», но согласователь в этом случае не имеет материального выражения. Вторая морфема (r) имеет видовое значение имперфектива, а третья указывает на показатель наклонения — прохибитива (digi). Первые два слова являются составным глаголом, состоящим из имени «вина» в номинативе и глагола «делать», то есть по-арчински «винить» буквально значит «делать вину». 1 2 3 4 ʕejb a-r-digi, lo-bur xom, вина(4).nom [4.sg]делать-ipfv-prh ребенок(HPL)-pl.nom женщины(hpl).nom 5 6 7 8 ž˳en, zon eImm-u-li bo-na. вы(NPL).ERG я(2).nom плакать-pf-EVID говорить.pf-cvb Вы, дети (и) женщины, не вините (меня), говоря, что я плакала. Таблица 26.1. Глоссирование арчинского предложения Т р е т ь е с л о в о относится к классу личных (human) имен мн. числа (HPL) и состоит из основы и показателя мн. числа (bur), а номинатив не имеет материального показателя. Ч е т в е р т о е с л о в о переводится как «женщины», поскольку оно всегда имеет значение мн. числа, а ед. число имеет совершенно особый корень (ɬ̄onnol), то есть множественное число образуется супплетивно. Это сло1 https://www.eva.mpg.de/lingua/resources/glossing-rules.php. Документация языков 471 во также относится к классу личных имен мн. числа и в номинативе не имеет материального показателя. Третье и четвертое слово являются обращением, поэтому они выделены запятыми. Отметим, что обращения стоят в номинативе. Следующее, п я т о е с л о в о, местоимение «вы», стоит в эргативе. Это слово относится к классу личных местоимений 1-2-го лица мн. числа (локуторов). Локуторы во мн. числе противопоставлены прочим личным именам: они требуют такого же показателя согласования, как неличные имена мн. числа (NPL). В арчинском языке местоимения 1-2 лица мн. числа формально не различают номинатив и эргатив (поэтому специальный показатель отсутствует), но глагол «говорить» требует постановки имени этого участника в эргативе. Ш е с т о е с л о в о «я» (zon) может означать как мужчину, так и женщину, но в данном контексте это женщина, т.е. слово 2-го класса. Глагол «плакать» не имеет позиции для согласования, поэтому сохраняется формальная неоднозначность. Это слово также стоит в номинативе. Наличие запятой перед данным словом указывает, что начинается новая клауза (деепричастный оборот). С е д ь м о е с л о в о «плакать» содержит основу, показатель перфектива (u) и эвиденциальности (заглазности) -li. Показатель заглазности означает, что «вы» не видели, как «я» плакала. В о с ь м о е с л о в о «говорить» состоит из основы перфектива (bo) и показателя конверба na. Как легко видеть, идиоматичный перевод существенно отличается от глоссированного буквального перевода. Неглоссированный пословный буквальный перевод мог бы звучать так: «Вину не делайте, дети-женщины, вы я плакала говоря». Отмечу, что в идиоматичном переводе имеется два слова в круглых скобках: (и) и (меня). Это не случайно. Скобки в данном случае указывают, что в русском переводе эти слова необходимы в главном предложении, а в арчинском оригинале их физически нет. Этот небольшой пример показывает, насколько в такого типа переводе объемна информация о структуре данного предложения. Любой читатель, знакомый с правилами глоссирования, может составить достаточно полное представление о данном предложении, почти ничего не зная об арчинском языке. Этот пример также показывает, как много должен знать об арчинском языке исследователь, делающий такой перевод, и насколько трудоемким является процесс его создания. Собрание глоссированных текстов — это особая разновидность базы данных, позволяющая осуществлять автоматический поиск примеров на упо требление грамматических форм. Таким образом, любой пользователь может 472 А. Е. Кибрик самостоятельно исследовать язык, тестируя правильность грамматического описания и получая ответы на вопросы, которые отсутствуют в грамматиче ском описании. В самые последние годы для престижных языков начинают создаваться компьютерные корпуса текстов с грамматической разметкой, в том числе Национальный корпус русского языка, см. (НКРЯ 2005, 2009). Объемы таких корпусов огромны по сравнению с корпусами, которые можно создать для малых бесписьменных языков, но такой способ представления текстовых данных является очень перспективным. В докомпьютерную эпоху 1960-80-х гг. технология глоссирования текстов еще не была разработана. Поэтому в грамматических описаниях х и н а л у г с к о г о (А.Е. Кибрик и др. 1972) и а р ч и н с к о г о (А.Е. Кибрик и др. 1977b) языков использовалась техника буквального пословного пере вода, дополняемого отдельным литературным переводом. В то время это было новшеством в практике грамматических описаний. Последующие грамматики г о д о б е р и н с к о г о (A.E. Kibrik ed. 1996), ц а х у р с к о г о (Кибрик ред. 1999), а л ю т о р с к о г о (Кибрик и др. 2000) и б а г в а л и н с к о г о (А.Е. Кибрик ред. 2001) языков содержат коллекции текстов со строкой глоссирования2. 26.3. Лексика Второй разновидностью языкового материала является лексика. Традиционный способ представления лексики — это двуязычные словари. Обычно словари малых языков представляют собой по существу словники, в которых каждому слову исследуемого языка сопоставляется его перевод на переводном языке. Изредка имеется также и обратный словник, в котором входами выступают слова переводного языка. Желательно, однако, максимально приблизить словари малых языков к переводным словарям больших языков, содержащих, кроме переводов, различную грамматическую информацию и зону примеров на употребление. К грамматической информации относится указание на исходную форму слова, часть речи, грамматический класс слова (особенно в языках с именными классами), морфологические сведения о типе словоизменения и неправильных формах. Обычно эта информация подается в виде основных, не выводимых из исходной формы или друг из друга форм (в качестве аналога можно Эта же практика используется и в более поздних публикациях, продолжающих традицию документации языков, заложенную А. Е. Кибриком — Лютикова и др. 2006, Лютикова и др. ред. 2007, Татевосов ред. 2009, Кузнецова ред. 2012, Татевосов и др. ред. 2017 (прим. ред.) 2 Документация языков 473 вспомнить способ представления глагола в латинских словарях с четырьмя основными формами типа: «победить» vinco — vici — victum — vincere). Существенное новшество — введение в словари информации о модели управления предикатных слов. Такая информация обычно систематически не дается даже в переводных словарях больших языков, в то время как она играет фундаментальную роль для построения грамматичных высказываний, содержащих соответствующие предикатные слова. В зоне примеров используются высказывания из корпуса текстов, из грамматического описания, а также специально собранные примеры. Каждый, кто когда-либо занимался словарем, знает, сколь кропотливая это работа. С одной стороны, каждая словарная статья — это небольшое отдельное эссе о мире данного слова, с другой стороны, каждая статья тесно связана с грамматикой и текстами. Все контекстные варианты значения слова, встречающиеся в тексте грамматики, должны быть отмечены в словарной статье, и наоборот, каждое слово в грамматике должно соответствовать тому, что о нем написано в словарной статье. Требует специального внимания и тождественность фонетических оболочек слова во всех случаях его появления в грамматике, что для бесписьменного языка представляет собой отдельную задачу. 26.4. Грамматическое описание Грамматическое описание — это результат теоретического моделирования языка. Оно зависит от теоретической подготовки и научных предпочтений исследователя, а также от уровня его общелингвистических знаний. С течением времени лингвистическая теория претерпевает радикальные изменения, и объем информации, которая должна содержаться в хорошем описании, существенно увеличивается, а способ изложения, терминология, уровень понимания механизмов языка во многом изменяются. Традиционно грамматические описания редких языков значительно отстают от текущей лингвистической теории и поэтому стареют, едва появившись на свет. Давно известно, что обычно находят то, что ищут. Случайные, не зависящие от воли человека находки — редкая удача, подарок судьбы. Если исследователь не знает, что такое относительное предложение и какие оно может принимать формы и если он не включил эту конструкцию в формат описания и не собирал соответствующий эмпирический материал, мало надежды, что оно будет описано полно и удовлетворит читателя, интересующегося ею в описываемом языке. Какой тактики должен придерживаться исследователь, стремящийся избежать архаичности своего описания, и насколько возможно продлить срок 474 А. Е. Кибрик его жизни? Опыт показывает, что, с одной стороны, полевой лингвист должен иметь широкую эрудицию в общей лингвистической теории, быть, так сказать, на переднем крае науки, владеть сегодняшней информацией в тех областях языковой структуры, которыми он непосредственно занимается. С другой стороны, само описание не должно быть ориентировано на текущую новомодную теорию, жизнеспособность которой еще не проверена временем. Описание не должно быть заложником этой теории. В противном случае оно может оказаться бесполезным для последующих поколений читателей, как только эта теория изменится до неузнаваемости или выйдет из лингвистической моды. Иными словами, существующие на момент работы теории должны входить в инструментарий самого исследовательского процесса, служить ориентиром и проверочным тестом на его правильность, но находиться за кулисами, а не на сцене, где разворачивается грамматический нарратив. Характерный пример — работа над описанием арчинского языка, имевшем место в 1968–1977 гг. В то время наиболее популярной теорией, претендовавшей на интегральную модель языка, была модель «Смысл — Текст» И. А. Мельчука, и в ней ощущалась большая объяснительная сила. Теория представляла язык как многоуровневую иерархическую структуру, с достаточно разработанным формальным аппаратом представления структуры каждого уровня и правил перехода с уровня на уровень. В идеале предполагалось, что по внешней фонетической форме предложения, переходя с уровня на уровень, можно построить соответствующий ей смысл, и наоборот, заданный смысл можно, двигаясь по уровням в обратном направлении, преобразовать в фонетическую цепочку. Эта теория была вершиной структурного подхода к языку, а ее формат требовал достаточно строгого и эксплицитного описания, не просто фиксирующего встретившиеся языковые явления, но исчисляющего их. Например, рассматривая словоизменительные средства языка, надо было проверить существование всех допустимых в языке комбинаций значений грамматических категорий. Арчинский язык имеет много глагольных грамматических категорий, каждая из которых принимает много частных значений. Кроме того, возможны различные регулярные отглагольные деривации, образующие отглагольные имена, атрибуты (причастия) и наречия (деепричастия). При этом деривационный процесс является цикличе ским. Каждая из производных частей речи также имеет свою словоизменительную парадигму, увеличивая количество форм от одного глагольного корня. Некоторые комбинации значений очень частотны, и мимо них невозможно пройти, но большинство комбинаций встречается редко, и в запи- Документация языков 475 санных текстах их может просто не оказаться. Модель «Смысл — Текст» предписывает эксплицировать, какие формы возможны, а какие нет. Для этого нужно специальное исследование. Оказывается, что потенциально от одного глагольного корня можно получить более миллиона (sic!) словоформ. Этот нетривиальный результат невозможно было бы получить, не следуя формализму данной теории. Возникал вопрос, какой формат грамматического описания следует выбрать: более традиционный, понятный читателю, ничего не знающему о данной модели, или авангардный, в духе формализмов модели Мельчука. В грамматике арчинского языка избран компромиссный подход, а именно описание в двух вариантах. Так называемая таксономическая грамматика, не использующая терминологии и формализмов модели «Смысл — Текст», была опубликована в одном томе (А.Е. Кибрик 1977а), а динамическая грамматика, написанная в духе этой модели — в другом (А.Е. Кибрик 1977b). В то время поклонники модели «Смысл — Текст», в том числе автор грамматики, верили, что в последующем динамическая грамматика будет основным способом грамматического описания арчинского языка, а таксономическая устареет и будет иметь не более как историческую ценность. Однако в дей ствительности использовалась и продолжает использоваться именно таксономическая грамматика, а к динамической грамматике мало кто обращается. Следует подчеркнуть, что эти две грамматики содержательно эквивалентны, но читателю удобнее работать с более привычным и не требующим специальных усилий форматом. 27. Алфабетизация В. М. Алпатов Создание письменности было величайшим событием в истории человечества, позволившим людям как угодно долго хранить и передавать накапливаемую информацию. С глубокой древности обозначились два типа письма: иероглифическое письмо, знаки которого передают некоторые значения, и фонетическое письмо, в котором передается звучание. Иероглифическое письмо Фонетическое письмо Алфавитное письмо Языковое строительство в СССР И е р о г л и ф и ч е с к о е п и с ь м о исторически было первичным, оно изобреталось в Древнем Египте и некоторых других странах. Наиболее устойчивый тип иероглифики был создан в Древнем Китае во II тысячелетии до н. э. и используется для китайского языка до настоящего времени; вместе с алфавитными знаками китайские иероглифы употребляются также для японского и корейского языков. Однако большинство народов мира постепенно пошли по пути создания ф о н е т и ч е с к о г о п и с ь м а, хотя отдельные иероглифы используются и в языках с кириллическим или латинским письмом (цифры, знаки параграфа, номера и т. д.). Фонетическое письмо у разных народов может по-разному соотноситься со звуковыми единицами. Японское звуковое письмо, используемое наряду с иероглифами, часто не вполне точно называют слоговым; там слоги типа «согласный + гласный» (или слоги из одного гласного) обозначают одним знаком, но для вторых компонентов дифтонгов и долгих гласных применяют отдельные знаки. В арабской, еврейской и других семитских письменностях используется консонантный принцип: обозначаются лишь согласные звуки. Наиболее распространено в мире а л ф а в и т н о е п и с ь м о, обознача ющее отдельными буквами согласные и гласные. Самым древним алфавитным письмом стало греческое, созданное в I тысячелетии до н. э. на основе консонантного финикийского письма, к которому были добавлены буквы для гласных. Впоследствии независимо друг от друга на основе греческого письма были созданы латинское и кириллическое. Алфабетизация 477 Следует различать создание письменностей и с о з д а н и е а л ф а в и т о в для тех или иных конкретных языков на основе уже существующих систем письма. Все употребляемые в наше время системы письма созданы уже давно, самая поздняя из них — корейское письмо (алфавитно-слоговое), изобретенное в XV в. Однако продолжается создание алфавитов для языков, ранее бесписьменных или употреблявших иные системы письма. Первоначально письменности для отдельных языков создавались стихийно, однако в последние два столетия в этих целях стали применяться научные методы. Полноценная научная база для алфавитной работы появилась в начале ХХ в., когда сложилась особая научная дисциплина — фонология, изучающая (в отличие от фонетики) не всякие звуковые различия, а лишь различия, значимые для передачи смысла. Именно такие различия и необходимо передавать на письме; создатели первых фонетических письменностей были, по выражению Н. Ф. Яковлева, «стихийными фонологами». Особое значение создание алфавитов на научной основе приобрело в СССР в первые два десятилетия после Октябрьской революции. Тогда новой властью была поставлена задача развить все культуры и языки страны до уровня культур и языков передовых стран, дать возможность каждому гражданину СССР читать Шекспира и Ленина на родном языке. Для осуществления этой задачи нужно было, в частности, создать алфавиты для бесписьменных языков и языков, использовавших письменности, признанные не соответствующими новым задачам (арабская, старомонгольская); арабское консонантное письмо, кроме того, было неудобно для тюркских или иранских языков. Отвергнуто в 1920-е гг. было и кириллическое письмо: как указывал Е. Д. Поливанов, само по себе оно не лучше и не хуже латинского, но вызывает ассоциации с колонизаторской политикой царской власти до революции. Наиболее подходящей основой для создания новых письменностей было признано латинское письмо как наиболее нейтральное и распространенное в мире. Влиял и происходивший одновременно переход с арабского письма на латинское за пределами СССР (Турция). Процесс создания новых письменностей и новой литературной нормы для языков народов СССР получил название я з ы к о в о г о с т р о и т е л ь с т в о. Оно во многом основывалось на утопических целях, однако его научное обеспечение было высококлассным. К работе по языковому строительству были привлечены многие крупные ученые-языковеды, в основном специалисты по фонологии. Среди них особо следует выделить Николая Феофановича Яковлева (1892–1974) и Евгения Дмитриевича Поливанова (1891–1938). Центром алфавитной работы стал В с е с о ю з н ы й ц е н т р а л ь н ы й к о - 478 В. М. Алпатов м и т е т н о в о г о а л ф а в и т а (1925–1937) в Баку, с 1930 г. в Москве, его научным руководителем был Н. Ф. Яковлев. Создатели алфавитов исходили из того, что в практическом письме (в отличие от фонетической транскрипции) должны передаваться не всякие звуковые различия, а лишь те, которые имеют смыслоразличительное значение. Имеющие такую функцию единицы языка — фонемы — должны передаваться буквами алфавита. Однако соотношение между фонемой и буквой для разных языков может быть различным. Для некоторых языков оно может быть взаимно однозначным, однако для ряда языков, в которых, например, 40-50 фонем, количество букв может быть уменьшено с помощью специальных приемов. Н. Ф. Яковлев предложил в 1928 г. «м а т е м а т и ч е с к у ю ф о р м у л у п о с т р о е н и я а л ф а в и т а», в которой обобщено строения современного русского алфавита, где большое количество пар согласных фонем, различающихся твердостью/мягкостью, передается не парами согласных букв, а различными буквами для гласных (а-я, у-ю и др.) плюс дополнительная буква — мягкий знак, что сокращает число букв по сравнению с числом фонем. Для русской письменности такое соотношение сложилось стихийно, но Н. Ф. Яковлев обобщил его в виде формулы, которая сознательно применялась для построения алфавитов. В 1920–30-х гг. Н. Ф. Яковлев, Е. Д. Поливанов и их сотрудники создали более 70 новых алфавитов на латинской основе, большинство из которых применялись на практике, хотя носители некоторых языков так и не стали их использовать, предпочитая читать и писать на русском языке или на языке более крупного народа. Алфавиты иногда создавались и для языков зарубежного Востока (китайский и др.), но они не были введены в действие. В 1929–1930 гг. комиссия во главе с Н. Ф. Яковлевым создала и латинский алфавит для русского языка, удачный с чисто научной точки зрения, но не имевший перспектив в связи с изменением государственной политики; работы по латинизации русского языка были прекращены по указанию И. В. Сталина. В связи с изменением политической конъюнктуры в предвоенные и послевоенные годы все новые алфавиты на латинской основе были переведены на кириллицу, при этом, как правило, научные принципы их строения были сохранены. В 1980–90-е гг. для ряда языков бывшего СССР (азербайджанский, узбекский, туркменский, молдавский) кириллический алфавит (также по политическим причинам) был заменен латинским, однако без возврата к системам, использовавшихся в 1920–30-е гг. Для тюркских языков ориентиром обычно служит турецкая орфография. Сейчас объявлено о предстоящем перех

AEK et al corrected 2020 (1)

Related documents

Products

Support

AEK et al corrected 2020 (1)

Related documents

Add this document to collection(s)

Add this document to saved

Suggest us how to improve StudyLib