Выявление случаев параллельной эволюции с помощью базы

advertisement
10.02.00
Байрашева В.Р., Соловьев В.Д.
Казанский (Приволжский) федеральный университет,
Институт вычислительной математики и информационных технологий,
кафедра теоретической кибернетики,
Казань, maki.solovyev@mail.ru
ПРИМЕР ИСПОЛЬЗОВАНИЯ БАЗЫ ДАННЫХ “ЯЗЫКИ МИРА”:
ПАРАЛЛЕЛЬНАЯ ЭВОЛЮЦИЯ ЯЗЫКОВ
В
работе
описана
техник,
позволяющая
выявлять
случаи
независимого возникновения и параллельной эволюции грамматических
признаков. Для этих целей используется грамматическая база данных
“Языки мира”. Рассмотрен пример тоновых языков.
Ключевые слова: эволюция языков, типологически базы данных, тоны
Появившиеся в последние годы типологические базы данных создают
новые возможности для типологических, сравнительно-исторических и
ареальных
исследований,
в
том
числе,
для
уточнения
понятия
грамматической категории. В данной статья обсуждаются вопросы
эволюция
грамматических
категорий,
в
частности,
проблема
“параллельная эволюция vs. общее происхождение”.
Многочисленные
нестыковки
в
трактовке
грамматических
конструкций в разных языках выявились при создании крупных
типологических баз данных – WALS [5] и “Языки мира” [1]. Так в WALS
утверждается, что абхазский язык имеет категорию ‘род’, в то время как в
базе данных “Языки мира” считается, что абхазский имеет не роды, а
согласовательные классы. Большое количество подобных несоответствий
затрудняет сопоставительные типологические исследования и ставит на
повестку дня вопрос об уточнении концепции грамматической категории.
Возможный
подход
к
решению
этой
проблемы
состоит
в
установлении происхождения грамматических категорий в разных языках
с сопоставлением категорий, имеющих общего предка. Таким образом,
можно говорить не только о родстве языков, но и о родстве
грамматических категорий.
При
последовательном
проведении
этой
линии
описания
грамматических свойств необходимо иметь средства, как для установления
родства
грамматических
независимого
категорий,
возникновения
так
и
(исключающего
для
установления
не
только
их
общее
происхождение, но и заимствование). Мы продемонстрируем возможности
базы данных “Языки мира” для установления независимого возникновения
грамматических признаков.
Для того чтобы можно было с достаточной степенью уверенности
говорить о независимом возникновении некоторой грамматической
категории в двух языках должны, очевидно, выполняться два условия:
- языки должны относиться к разным семьям,
- языки не должны контактировать друг с другом.
Для повышения надежности результатов добавим еще одно весьма
сильное требование:
- в макрообласти, в которой располагаются рассматриваемые два
языка, никакие другие языки не обладают этой категорией.
В данной работе мы не будем уточнять понятие макрообласти,
ограничившись указанием, что она должна быть не менее чем
континентальных размеров. При использовании базы данных “Языки
мира” речь будет идти о макрообласти, охватывающей Европу, Северную
Африку и всю Азию, кроме Юго-Восточной.
Продемонстрируем на конкретном примере, как типологические базы
данных могут быть использованы для обнаружения случаев параллельной
эволюции в вышеопределенном смысле.
Используемая нами база данных “Языки мира” создана в Институте
языкознания
РАН
и
содержит
описания
315
языков
по
3821
грамматическому признаку. Признаки охватывают практически все
разделы грамматики. Описаны языки, распространенные, в основном, на
территории Европы, Северной Африки, Северной и Центральной Азии,
Дальнего Востока. База данных доступна в Интернете по адресу:
www.dblang2008.narod.ru и подробно описана в монографии [1].
Для поиска случаев параллельной эволюции возьмем две группы
языков,
располагающихся
максимально
далеко
друг
от
друга
и
географически, и генеалогически – палеосибирские (термин, принятый в
проекте “Языки мира”) и афразийские языки. Выделим признаки, которые
присутствуют в языках этих групп, но отсутствуют в языках всех
остальных семей, представленных в базе данных, т.е. в вышеопределенной
макрообласти. В Excel-версии базы данных это можно сделать простым
введением нескольких установок значений столбцов. Оказалось, что
существует только один такой
признак. Это признак № 2122
‘качественность’, имеется в виду способ действия.
Примеры. Алеутский язык: камлизах ‘стреляет он’, камли-зу-зах
‘стреляет хорошо
он’.
Эфиопский
язык:
halaia
‘думать’,
hallaia
различный
способ
‘обдумывать всесторонне’.
Обращает
на
себя
внимание
существенно
выражения качественности в этих языках – суффиксация и геминация. Это
является дополнительным аргументом в пользу параллельной эволюции.
Вероятно, имеет смысл ослабить третье из сформулированных выше
требований. Для отработки методологии применения типологических баз
данных необходимы тщательные дополнительные исследования.
Рассмотрим теперь вопрос о происхождении и времени возникновения
в языках тонов. Являются ли тоновые системы существующих языков
развитием системы тонов некоего протоязыка или они возникали в ходе
эволюции неоднократно, независимо в разных местах?
Приведем результаты, полученные в [2] с использованием WALS и
касающиеся возможной корреляции тоновых языков и генотипов их
носителей.
В работе [2] рассмотрены 49 популяций, для носителей которых
имеются данные по присутствию/отсутствию указанных генов. Это:
Southeastern and Southwestern Bantu, Northeastern Bantu, San, Turu, Mbuti
Pygmy, Biaka Pygmy, Baroka Pygmy, Bamoun, Yoruba, Mandenka, Mozabite,
Druze, Palestinian, Bedouin, Kalash, Sindhi, Hezhen, Mongola, Daur, Orogen,
Miaozu, Yizu, Tujia, Han, Xibo, Uygur, dai, Lahu, She, Naxi, Tu, Cambodian,
Japanese, Yakut, NAN Melanesian, French Basque, French, Sardinian, North
Italian, Tuscan, Orcadian, Russian, Adygei.
В WALS выбраны 24 признака, по которым языки, на которых говорят
эти народы, описаны достаточно полно, и к ним добавлено еще два
признака, данные по которым получены авторами статьи [2]. Для каждого
из 26 признаков подсчитывается коэффициент корреляции Пирсона между
значением признака и частотой генов ASPM-D и MCPH-D.
В итоге обнаружено, что присутствие этих генов коррелирует с
отсутствием в языке тонов. На рис. 1 из [2] по оси х отложена частота гена
ASPM-D, по оси у – частота гена MCPH-D, белые прямоугольники
обозначают тоновые языки, черные – не тоновые.
Таким образом, видимо, впервые было установлено наличие прямой
связи некоторых генов с определенными типологическими чертами.
Разумеется, остается неизвестным способ, которым эти гены могут влиять
на типологические свойства языков.
Рис.1. Связь частоты генов ASPM-D и MCPH-D с наличием в языке
тонов
Гены ASPM-D и MCPH-D возникли относительно недавно 6 и 37 тыс.
лет назад соответственно [4]. Это означает, что тоны генетически старше,
чем их отсутствие. Тоновые системы всех существующих в настоящее
время языков могут быть родственными категориями, восходящими к
единому предку.
Распространение гена ASPM-D по языковым группам (ареальногенеалогическим)
следующее:
индоевропейцы
–
41%,
народы,
находившиеся в длительном контакте с индоевропейцами, – 40%, ЮгоВосточная Азия – 16%, алтайские народы – 10%, остальной мир – 7%.
(Подсчеты выполнены авторами данной статьи по материалам [3].)
Заключение. В статье обсуждаются методологические проблемы
описания и сопоставления грамматических категорий в разных языках.
Наиболее остро они встают при создании типологических баз данных.
Приведены примеры применения типологических баз данных. Первый
пример демонстрирует возможность обнаружения случаев параллельной
эволюции с использованием базы данных “Языки мира”. Второй пример,
показывающий неожиданные связи генетики и типологии, может помочь
лучше понять эволюцию тоновых систем в различных регионах Земли.
Исследование
проводилось
интернет-комплексы:
создание
в
рамках
и
темы
методология
«Лингвистические
использования»
тематического плана научно-исследовательских работ, проводимых по
заданию Министерства образования и науки Российской Федерации.
Список литературы
1. Поляков В.Н., Соловьев В.Д. Компьютерные модели и методы в
типологии и компаративистике. Казань: КГУ, 2006.
2. Dediu D., Dadd D. Linguistic tone is related to the population frequency of
the adaptive haplogroups of the two brain size genes, ASPM and Microcephalin.
Proc Natl Acad Sci USA. V. 104. 2007. p. 10944–10949.
3. Evans P.D., Gilbert S.L., Mekel-Bobrov N. et al. Microcephalin, a gene
regulating brain size, continues to evolve adaptively in humans science. Science.
V. 309. 2005. p. 1717–1720.
4. Mekel-Bobrov N., Gilbert S.L., Evans P.D. et al: Ongoing adaptive evolution
of ASPM, a brain size determinant in Homo sapiens. Science. V. 309. 2005. p.
1720–1722.
5. The World Atlas of Language Structures. Haspelmath M., Dryer M., Gil D.,
Comrie B. (eds.). Oxford: Oxford University Press. 2005.
Bayrasheva V.R., Solovyev V.D.
The example of database “Jazyki mira” using: parallel evolution of languages
Keywords: language evolution, typological databases, tones
In the paper a technique that uses the grammar database “Languages of
the world” and allows revealing cases of independent appearance and parallel
evolution of grammatical features is described. An example of tonal languages is
considered.
Download