Вперед К следующему разделу Назад К предыдующему разделу Конец К концу разделу Список К оглавлению

4. Оценка коэффициентов пространственной автокорреляции (I Морана и C Джири)

Тест Мантеля не дает полной информации о характере структурированности популяции, а лишь служит для проверки гипотезы, что близко расположенные регионы более подобны по феноструктуре, а более отдаленные – менее подобны. Таким образом, он дает адекватное отражение о структуре популяции в случае наличия более или менее выраженного градиента частот признака. В случае сложной, “пятнистой” структуры, когда отношения между соседними участками имеют “нелинейный” характер, более точную картину можно получить, используя показатели пространственной автокорреляции (Spatial autocorrelation), например, коэффициент I Морана.

Пространственная автокорреляции по своей сути подобна коэффициенту автокорреляции, который используется в анализе временных рядов. Только в случае пространственной автокорреляции производится оценка степени коррелированности между различными значениями одного и того же признака, которые пространственно смещены друг от друга на заранее заданную величину. Эта величина (так же как и в анализе временных рядов) носит название “лаг” (от английского “lag” – смещение) и имеет свое выражение в единицах длины (например, метрах).

В общем виде формула для расчета коэффициента Морана имеет следующий вид:

,

(1.15)

где n – число точек или пространственных единиц (в нашем случае, субпопуляций); x – значение интересующей нас переменной (в нашем случае, частота фена); - среднее значение признака по всей совокупности значений; wij – “вес”, который отражает степень близости (или удаленности) между точками i и j в пространстве. В наиболее простом варианте в качестве весовой переменной может быть использовано расстояние между каждой парой точек в прямоугольной системе координат (см., например, табл. 1.9).

В случае отсутствия какой либо пространственной автокорреляции, значение коэффициента Морана будет близко к:

.

(1.16)

Выборочные значения коэффициента Морана могут принимать любые значения в интервале от –1 до +1 (как и коэффициенты корреляции Пирсона, Спрмена или Кендалла). Значения I принимающие положительные значения свидетельствуют о наличии положительной пространственной автокорреляции (т.е. пространственно более близкие точки более подобны в отношении частоты анализируемого признака), тогда как отрицательные значения – о наличии отрицательной пространственной автокорреляции (т.е. пространственно более удаленные точки более подобны в отношении частоты анализируемого признака).

Оценка уровня значимости выборочных оценок коэффициента Морана может быть произведена двумя способами.

При использовании первого способа вначале рассчитывается варианса этого показателя – Var(I), а затем производится оценка величины

,

(1.17)

которая имеет стандартное нормальное распределение. Таким образом, значение |z| > 1,96 будет свидетельствовать от необходимости отвергнуть нулевую гипотезу с вероятностью p < 0,05.

Мы здесь не будем приводить формул для оценки вариансы коэффициента Морана; во-первых, они достаточно громоздки, во-вторых, в них нет никакой необходимости, поскольку все необходимые расчеты проводятся автоматически, используя специализированные программы (мы ниже остановимся на них), ну а в-третьих, желающим все же познакомиться с этими выражениями, мы может порекомендовать следующие сайты, а которых можно найти весь математический аппарат для коэффициента Морана:

http://geography.uoregon.edu/bartlein/courses/geog414s06/topics/moran.htm
http://zappa.nku.edu/~longa/geomed/stats/MoranI/example.html

Второй способ подразумевает процесс рандомизации. При этом оценки анализируемого признака (частоты фена), используемые в анализе, распределяются случайным образом по отдельным точкам (т.е. субпопуляциям) и рассчитывается оценка коэффициента Морана. Так производится много раз (например, 1000, 5000 или 10000; Nruns). Далее подсчитывается, сколько значений, полученных в результате перестановок значений были больше или равны выборочной оценке I (NGE). Тогда двусторонний уровень значимости выборочной оценки коэффициента Морана будет равен:

.

(1.18)

Мы в своем анализе использовали программу ROOKCASE, написанную доктором M.Sawada (University of Ottawa), которая встраивается в MS Excel. Это очень удобно, поскольку позволяет производиться обработку данных в одной среде. (Напомним, описанная выше программа для оценки коэффициента Мантеля также имеет вид Add-in.) Программа является free-версией и может быть легко “скачана” с сайта автора.

Формат исходных данных для расчета коэффициента пространственной автокорреляции Морана (также, как и других показателей; например, коэффициента С Джири) прост. Он представляет собой три столбца цифр: первый – это координаты точек по оси X, второй – по оси Y, третий – собственно значения анализируемого признака (частоты признака, размеры, и т.п.). Результаты могут быть получены как в целом для всей совокупности значений, так и по отдельности для точек, расстояние между которыми задаются исследователем. Например, нас интересовало, как изменяется значение коэффициента Морана при рассмотрении частот признака в различных масштабах.

Мы выбрали четыре интервала расстояний: от 0 до 4 м, от 4 до 8 м, от 8 до 12 м и от 12 до 16 м. На рисунке 1.5 приведен коррелограмма для анализируемого признака. Для каждого интервала лага приведена оценка коэффициента Морана плюс-минус одна статистическая ошибка, а также уровень значимости данных величин, полученный в результате 1000 рандомизаций.

Рис. 1.5. Коррелограмма частоты встречаемости раковин с пигментированными пестринами в анализируемой популяции B.bidens

Лишь одно значение коэффициента Морана оказалось достоверным; для величины лага от 4 до 8 м (I = -0,361±0,182). Это свидетельствует о том, что выборки, удаленные на 4-8 м оказываются более отличающимися, чем это можно было ожидать при случайном формировании фенетической структуры популяции моллюска B.bidens.

 

Назад К предыдующему разделу Начало К концу разделу Список К оглавлению