БОТАНИКА

advertisement
БОТАНИКА
УДК 581.55
О ФИТОЦЕНОТИЧЕСКОЙ ИНФОРМАТИВНОСТИ
ПРИМЕНИТЕЛЬНО К КОЛИЧЕСТВЕННОЙ
КЛАССИФИКАЦИИ РАСТИТЕЛЬНОСТИ
И.В. Боряков, В.П. Воротников
Нижегородский госуниверситет
Рассматривается проблема неравнозначности видов для целей количественной классификации растительности. Предложены различные подходы к
определению фитоценотической информативности видов и соответствующие алгоритмы расчета. В рамках сравнительного исследования проведен
кластерный анализ двух серий геоботанических описаний при использовании исходных данных разного характера: полного списка видов и активных
таблиц, содержащих наиболее фитоценотически информативные (по двум
предложенным критериям) виды, виды с наибольшей встречаемостью в данной выборке, а также наиболее ценотически значимые. Для рассматриваемых выборок показано, что редукция числа видов протекает с меньшими искажениями при отборе видов по их фитоценотической информативности.
В большинстве современных школ классификации растительности присутствуют представления о неодинаковой информативности различных видов. В настоящее время не существует определения этого понятия, а из методик оценки
информативности вида можно назвать лишь те, что основаны на учете суммы корреляций его с другими видами (Goodall, 1953, цит. по: Василевич, 1969; Gower,
1967; Нешатаев, 1987). Однако известно, что классические корреляции не
выявляют всей полноты стохастической взаимозависимости, которая подразумевает, в частности, множественные корреляции и т. п., так что вопрос формализации этого понятия остается открытым. Нами предпринята попытка развития данной темы.
Теоретическая основа метода. Оценить фитоценотическую информативность
вида можно различными путями. Соответствующие методы отличаются по своей
математической основе, границам применимости и, как показали результаты исследования, эффективности. Ход рассуждений был следующий.
1. Можно предположить, что если степень участия1 вида достаточно сильно
фитоценотически обусловлена, то упорядоченная по данному виду выборка будет
характеризоваться постепенным изменением состава сообщества. Действительно,
если принять, что в сходных сообществах вид имеет близкие значения встречаемости (или другого признака), то в ряду описаний, ранжированном по степени его
участия, рядом будут располагаться сходные сообщества; следовательно, и изме-
1
Под степенью участия здесь понимается любая количественная оценка ценотической
значимости вида в данном сообществе – его проективное покрытие, встречаемость и т. п.
7
нение состава сообществ вдоль ряда будет происходить без резких скачков. Это и
лежит в основе предложенного метода. В качестве критерия постепенности изменения состава фитоценозов в ряду использовалось среднее линейное сходство —
СЛС (Боряков и др., 1999):
n −1
ÑËÑ =
∑ Sim(i, i + 1)
i =1
n −1
,
где n — число описаний, Sim(i,i+1) — оценка сходства двух соседних описаний
в ряду по количественным данным (во всех предложенных алгоритмах в ходе расчета сходства рассматриваемый вид опускается). Поскольку некоторые пары описаний могут иметь равные значения участия данного вида, равно как и все
описания, где вид отсутствует, неопределенность при анализе этих частей выборки исключается методом Монте-Карло. Степень увеличения среднего линейного
сходства при упорядочении описаний в соответствии с участием данного вида
по сравнению со случайным расположением (определяемым через среднее сходство всех пар описаний) рассматривается как мера его информативности. Результаты применения этой методики обсуждаются ниже.
2. В основе предыдущего алгоритма лежит факт, что отсутствие связи степени
участия вида с интегральным составом сообщества приводит к тому, что упорядоченная по этому виду выборка имеет среднее сходство всех соседних описаний,
не отличающееся от такового для случайного расположения. То, что критерий
СЛС оценивает сходство лишь ближайших соседей, обусловливает гибкость метода, который не содержит никаких предположений о характере распределения
отдельных видов по градиенту растительности. Однако может возникнуть потребность в более строгом подходе к оценке фитоценотической информативности. Для этого ее можно определить следующим образом: мерой фитоценотической информативности вида в данной совокупности описаний является величина
связи степени участия вида с определенным составом сообщества. Речь здесь идет
о хорошо известном явлении фитоценотической приуроченности. Такое понимание информативности делает ясной ее суть — при условии существования указанной связи определенное значение участия вида «информирует» о том, что сообщество лежит в соответствующем участке фитоценотического диапазона.
Стохастический характер связи (которая оценивается методами корреляционного
анализа) придает выводам вероятностный характер, но при работе с объектом
низкой целостности, таким как растительность, это неизбежно. На этом пути, однако, возникает некоторое методическое затруднение. Задача оценки связи участия вида с составом сообщества, который, как известно, нельзя охарактеризовать
одной величиной, на первый взгляд не имеет очевидного решения. Выходом из
ситуации является использование не самих величин, а их разниц для пары описаний. Для всех неповторяющихся пар описаний выборки рассчитываются разница
в участии данного вида и суммарное различие описаний (для чего на основании
количественного сходства описаний вычисляется расстояние D = 1 – S). Оценка
корреляции разницы в степени участия вида и расстояния между описаниями в
многомерном пространстве признаков–видов (при определении расстояния рассматриваемый вид не учитывается) является мерой его информативности (далее
обозначается как КРР).
8
Следует отметить, что расчет информативности указанным способом допускает различные варианты. Прежде всего, можно рассмотреть все пары, т. е. n×(n–1)
описаний. Но в этом случае часть вариантов ряда может относиться к паре описаний, ни в одном из которых данный вид не присутствует. Учитывая то, что мы
оцениваем корреляцию разницы участия вида и сходства площадей, становится
очевидно, что такие пары целесообразно исключить. Далее, среди рассматриваемых значений часть будут составлять варианты, полученные при сравнении пар
описаний, из которых одно не содержит данный вид. Проблема заключается в
том, что разница участия вида произвольно взятой площади, на которой вид
встречен, с любой площадью, где вид отсутствует, постоянна и равна оценке участия данного вида на указанной площади. Но совокупность описаний, где данный
вид не встречен, может быть очень гетерогенной в отношении сходства с рассматриваемым описанием. Связь разницы участия вида с суммарным расстоянием
между описаниями в этом случае оказывается лишенной смысла, что делает нецелесообразным рассмотрение соответствующих пар описаний. Расчет информативности видов проводился с учетом этих соображений.
Результаты исследования. Для проверки описанных выше методов была исследована серия из 25 геоботанических описаний березняков Керженского заповедника. В пределах каждого описания закладывалось 50 площадок 1×1 м, на которых учитывалось обилие видов по Друде. Для обработки серии описаний березняков данные по обилию не использовались, а рассчитывалась встречаемость видов. Локальная (в данном сообществе) встречаемость использовалась как более
объективный параметр по сравнению с глазомерными оценками обилия. Результаты расчета информативности видов и показатели их участия приведены в таблице 1.
Таблица 1
Информативность видов серии описаний березняков
Керженского заповедника
Вид
Antennaria dioica (L.) Gaertn.
Asarum europaeum L.
Calamagrostis arundinacea (L.) Roth
Calamagrostis epigeios (L.) Roth
Calluna vulgaris (L.) Hull
Carex ericetorum L.
Carex lasiocarpa L.
Convallaria majalis L.
Fragaria vesca L.
Hieracium umbellatum L.
Linnaea borealis L.
Luzula pilosa (L.) Willd.
Средняя локальная
встречаемость
Встречаемость
0.05
0.05
0.34
0.18
0.11
0.04
0.03
0.16
0.23
0.04
0.08
0.03
0.24
0.12
0.56
0.32
0.16
0.08
0.08
0.44
0.60
0.28
0.48
0.08
Информативность
СЛС
КРР
19.32
19.3
5.84
8.73
14.22
0.18
11.44
24.41
25.97
9.17
3.32
6.07
0.33
1.0
0.16
0.05
0.70
–
–
0.08
0.19
–0.32
0.03
–
9
Продолжение табл. 1
Lysimachia vulgaris L.
Maianthemum bifolium (L.) F. W.
Schmidt
Melampyrum pratense L.
Molinia caerulea (L.) Moench.
Orthilia secunda (L.) House
Oxalis acetosella L.
Pteridium aquilinum (L.) Kuhn ex
Decken
Rubus saxatilis L.
Solidago virgaurea L.
Stellaria holostea L.
Trientalis europaea L.
Vaccinium myrtillus L.
Vaccinium vitis-idaea L.
Viola canina L.
0.02
0.04
2.35
–
0.12
0.52
14.65
–0.07
0.30
0.09
0.02
0.04
0.64
0.24
0.16
0.12
11.21
5.74
12.61
18.17
–0.09
0.21
–0.14
0.50
0.29
0.60
19.26
–0.18
0.05
0.13
0.05
0.06
0.14
0.19
0.04
0.20
0.52
0.40
0.36
0.48
0.48
0.24
8.08
19.13
1.93
–1.33
11.33
9.74
1.08
0.02
–0.09
0.03
–0.09
0.13
0.15
–0.33
Чтобы провести сравнение описанных методов, обратимся к результатам кластерного анализа на основе активных таблиц, содержащих наиболее информативные виды. Анализ проводился средствами пакета Stadia с использованием метода
средней связи (Факторный…, 1989; по терминологии указанного пакета — «стратегия группового соседа») и манхэттенской меры сходства (Williams et al., 1973).
Редукция ведется до 9 видов. В данном случае это число взято, в общем-то, произвольно — вопрос обоснования размерности активной таблицы наиболее информативных видов заслуживает отдельного рассмотрения.
Одним из побудительных мотивов поиска методов оценки фитоценотической
информативности является задача отбора немногих видов, использование которых дало бы результаты, близкие к таковым по всему списку. Учитывая, что при
количественной (в узком смысле) классификации на конечный результат сильнее
всего влияют признаки, имеющие бóльшие абсолютные величины, самым естественным решением кажется отбор ценотически наиболее весомых видов (что можно оценить по-разному в зависимости от характера исходных данных, в нашем
случае — это виды с наибольшей средней локальной встречаемостью). Кроме того, есть смысл провести аналогичное исследование с использованием видов,
имеющих наибольшую встречаемость в рассматриваемой выборке (т. е. долю
описаний, содержащих данный вид). Для такого предположения есть основания,
поскольку в данном случае ими оказываются виды со средней встречаемостью
(максимальная из наблюдаемых встречаемостей не достигает 0.7), а именно они
считаются в некоторых школах классификации наиболее информативными (Миркин, Розенберг, 1978).
Необходимо сравнить схемы, полученные по редуцированным данным (виды,
информативные по СЛС и КРР, виды с наибольшей средней локальной встречаемостью и с наибольшей встречаемостью в выборке), со схемой по полному списку
видов (рис. 1). На уровне 6 кластеров на исходной схеме наблюдаются скопления,
поддающиеся удовлетворительной интерпретации. Не вдаваясь в рассмотрение их
содержания, проследим их поведение на редуцированных схемах. Для этого при10
мем, что чем больше скоплений на редуцированной схеме соответствует схеме по
исходным данным, тем более корректен метод. Это, однако, есть известное упрощение ситуации, т. к. редуцированная схема, отличаясь от полной, в принципе
может дать даже более естественную классификацию. Ниже мы отчасти коснемся
этого аспекта при сравнении схем.
Рис. 1. Результат кластерного анализа серии описаний березняков
на основании локальной встречаемости по всем 52 видам
Как можно видеть, схема по наиболее информативным видам (критерий СЛС,
рис. 2А) наиболее близка к результатам анализа данных по полному набору видов. На ней полностью сохраняются четыре из шести кластеров полной схемы.
Обе схемы, построенные по информативным видам, отличаются от остальных
схем меньшими внутрикластерными расстояниями.
На схемах по видам высокой встречаемости наблюдается смешение (обмен
элементами) кластера 1, самого четкого на исходной схеме, с кластером 3. Эту
особенность надо рассматривать как искажение, т. к. оба кластера имеют конкретное фитоценотическое содержание — первое скопление включает в себя вересковые березняки, а второе — участки с господством Calamagrostis epigeios и
Carex lasiocarpa, причем характерным только для этой группы видом выступает
Comarum palustre (со встречаемостью 0.2–0.3).
11
12
Рис. 2. Результат кластерного анализа серии описаний березняков по редуцированным наборам данных:
А, Б — наиболее информативных видов по критериям СЛС и КРР; В — видов с наибольшей средней
локальной встречаемостью; Г — видов, имеющих наибольшую встречаемость в данной выборке
Г
Подводя итог изучению серии описаний березняков, можно сказать, что при
кластеризации по редуцированным данным некоторые скопления, найденные на
полной схеме и поддающиеся хорошей интерпретации, имеют искажения. Наименьшие искажения дает использование информативных видов, выделенных по
критерию СЛС, наибольшие — использование видов с наибольшей встречаемостью.
Рассмотрим результаты исследования (аналогичного описанному выше) серии
из 20 описаний осинников Керженского заповедника. Анализ велся по данным о
среднем обилии вида в описании; информативность видов и показатели их участия в выборке приведены в таблице 2.
Таблица 2
Информативность видов серии описаний осинников
Керженского заповедника
Вид
Calamagrostis arundinacea
Pteridium aquilinum
Vaccinium myrtillus
Trientalis europaea
Molinia caerulea
Fragaria vesca
Oxalis acetosella
Orthilia secunda
Convallaria majalis
Maianthemum bifolium
Solidago virgaurea
Stellaria holostea
Vaccinium vitis-idaea
Melampyrum pratense
Lysimachia vulgaris
Equisetum sylvaticum L.
Angelica sylvestris L.
Rubus saxatilis
Средняя локальная
встречаемость
0.33
0.19
0.16
0.14
0.21
0.14
0.04
0.05
0.25
0.27
0.14
0.24
0.13
0.12
0.07
0.08
0.05
0.06
Встречаемость
Информативность
(СЛС)
0.65
0.45
0.45
0.45
0.35
0.35
0.25
0.15
0.80
0.80
0.70
0.70
0.50
0.50
0.40
0.30
0.20
0.20
19.60
14.54
15.14
7.07
12.96
9.07
1.30
0.92
13.76
26.25
11.89
–12.28
23.84
23.08
48.28
19.52
21.87
0.11
Активная таблица наиболее информативных видов по сравнению с предыдущей выборкой здесь имеет несколько больший размер — 11, что связано с характером динамики величины информативности по ранжированному списку.
13
Рис. 3. Результат кластерного анализа
серии описаний осинников по всей совокупности видов
Рис. 4. Результат кластерного анализа серии описаний осинников
по видам с наибольшей средней локальной встречаемостью
14
При кластерном анализе получены результаты, более сходные для различных
схем анализа по сравнению с березняками, что объясняется наличием здесь более
четких групп сходных описаний. Тем не менее различия наблюдаются.
Рис. 5. Результат кластерного анализа серии описаний осинников
по наиболее информативным видам
Как можно видеть на рис. 4, анализ по наиболее часто встречающимся видам
приводит к размыванию кластера 1, в то время как при использовании информативных видов этого искажения не наблюдается. С другой стороны, на схеме, полученной в ходе анализа активной таблицы информативных видов (рис. 5), из
кластера [5,11;14] выпадает описание 11, что, казалось бы, также является искажением. Но детальное ознакомление с описаниями приводит к противоположному выводу. Описание 11 присоединяется к остальным описаниям этой группы, повидимому, в силу сходных величин встречаемости нескольких наиболее частых
видов — ведь именно такие виды вносят основной вклад в величину суммарного
сходства / различия при кластерном анализе. Однако это описание в действительности достаточно сильно отличается от остальных элементов кластера. В нем
преобладает Calamagrostis arundinacea, что отличает его от остальных описаний,
в которых наибольшую локальную встречаемость имеет Maianthemum bifolium. В
отличие от 5 и 14, в этом описании присутствуют виды, характерные для более
сухих и светлых местообитаний: Antennaria dioica (локальная встречаемость 0.10)
и Pteridium aquilinum (0.16). Hieracium umbellatum здесь встречается достаточно
часто (0.18), в то время, как в описании 5 ее только 0.02, а в 14 нет совсем. По
сравнению с обоими описаниями (0.72 и 0.82), здесь меньше Maianthemum
bifolium (0.60), а Trientalis europaea в них довольно частый (0.26 и 0.56), здесь совсем отсутствует. С учетом всего сказанного выше, выделение группы [5,14] по
15
наиболее информативным видам представляется даже более фитоценотически
корректным, чем выделение группы [5,11;14] по всему списку.
Таким образом, сравнение результатов анализа свидетельствует о большей осмысленности схем, рассчитанных по активным таблицам наиболее информативных видов, чем видов с наибольшей степенью участия. На примере рассмотренных данных применение критерия СЛС дало лучшие результаты. Оценка
информативности по второму из рассматриваемых алгоритмов (для серии описаний березняков) оказалась менее успешной, что вполне объяснимо. Используемый в этом случае критерий предполагает монотонное уменьшение сходства описаний при увеличении разницы в участии данного вида. В действительности же
сходство площадок изменяется монотонно лишь в пределах узкого фитоценотического диапазона — многомерность варьирования растительности в значительной
степени ослабляет рассматриваемую связь. В связи с этим можно предположить,
что конкретизация фитоценотического диапазона выборки приведет к более корректному выявлению информативных видов. Целесообразно искать информативные виды не на основании всей совокупности площадок, а для серии площадей,
расположенных по степени уменьшения сходства. Такой подход основывается на
представлении, что вид можно считать фитоценотически информативным, если
существует интервал фитоценотического ряда (полученного путем ординации
по растительности), в пределах которого степень участия вида изменяется монотонно. Этот подход был алгоритмически реализован путем выделения серий
сходных площадей по методу ближайшего соседа. Но для рассмотренных выше
данных конкретизация фитоценотического диапазона не была возможна в связи с
достаточно малым объемом выборок. В то же время применение этого метода целесообразно при большом числе описаний, т. е. именно в ситуации, когда рассмотренные выше алгоритмы имеют низкую эффективность анализа на всей совокупности объектов.
Заключение. Таким образом, в ходе исследования установлено, что количественная классификация по активной таблице из наиболее информативных видов дает схемы, близкие к результатам кластеризации на основании всего списка
видов. Даже если считать, что построенные по полному списку схемы являются
наиболее корректными (а это, как показано выше, не всегда так), не вызывает сомнения, что редукция числа признаков (Василевич, 1972; Колодяжный, Пааль,
1981) при решении некоторых задач имеет смысл. В данном случае важно то, что
редукция успешнее протекает при сохранении наиболее информативных в терминах предложенного подхода, видов, чем доминант, что подтверждает верность
принципиальной основы метода.
В методическом отношении лучшие результаты достигаются при оценке фитоценотической информативности вида по критерию СЛС. Полученные данные
свидетельствуют о том, что информативность вида напрямую не связана с его
встречаемостью.
ЛИТЕРАТУРА
Боряков И.В., Воротников В.П., Казупица Н.А., Лютова О.В. Количественная классификация и анализ структуры производных типов леса Керженского заповедника. Н. Новгород, 1999. (Деп. в ВИНИТИ 20.09.99, № 2874-В99).
Василевич В.И. Статистические методы в геоботанике. Л., 1969.
16
Василевич В.И. Количественные методы изучения структуры растительности // Ботаника. М., 1972. Т. 1. C. 7–83.
Колодяжный С.Ф., Пааль Я.Л. О сокращении видового списка при классификации
растительности // Флористические критерии при классификации растительности. Уфа,
1981. C. 28–30.
Миркин Б.М., Розенберг Г.С. Фитоценология. Принципы и методы. М., 1978.
Нешатаев Ю.Н. Методы анализа геоботанических материалов. Л., 1987.
Факторный, дикриминантный и кластерный анализ. М., 1989.
Goodall D.W. Objective methods for the classification of vegetation. IV. Pattern and minimal
area // Ausral. J. Bot. 1961. V. 9, № 2. P. 48–59.
Gower J.C. A comparison of some methods of cluster analysis // Biometrics. 1967. V. 23.
P. 623–637.
Williams W.T., Lance G.N., Webb L.J., Tracey J.G. Studies in the numerical analysis of
complex rain-forest communities. VI. Models for the classification of quantitative data // J. Ecol.
1873. V. 61, № 1. P. 47–70.
17
Download