Дальше К следующему разделу Назад К предыдующему разделу Конец К концу разделу Список К оглавлению На главную На главную страницу сайта

2.5. МЕРЫ СХОДСТВА И РАЗНООБРАЗИЯ В ОЦЕНКЕ ФЛУКТУИРУЮЩЕЙ АСИММЕТРИИ БИЛАТЕРАЛЬНЫХ ПРИЗНАКОВ

Д.Б. Гелашвили, Е.Н. Солдатов, Е.В. Чупрунов

Симметрия, точная или приблизительная, является важнейшим свойством подавляющего числа живых организмов (Гиляров, 1944; Урманцев, 1974; Марченко, 1999 и др.). С общих естественно-научных позиций симметрия как имманентная характеристика тел материального мира может быть определена как инвариантность физической и геометрической системы по отношению к различного рода преобразованиям (Вейль, 1968; Чупрунов и др., 2000). Вид этих преобразований определяет тип симметрии рассматриваемого объекта. Чаще всего под симметрией понимают инвариантность относительно изометрических преобразований пространства (операций симметрии) – поворотов, отражений в плоскости, инверсии в точке, параллельных переносов пространства, а также всевозможных их комбинаций. Однако можно говорить относительно перестановок отдельных частей системы, о симметрии подобия и т.д. (Шубников, Копцик, 1972).

Будем называть симметричным объект, который состоит из частей, равных относительно какого-либо признака. Проверить равенство объектов или частей системы можно с помощью некоторого преобразования, которое совмещает равные объекты или части одного и того же объекта. В природе чаще всего встречаются лишь приблизительно симметричные (псевдосимметричные) системы, об инвариантности которых относительно операций симметрии также можно говорить лишь приблизительно. Приблизительная симметрия может возникать, например, в результате процессов, сопровождающихся нарушением идеальной симметрии. К такому типу изменений можно отнести флуктуирующую асимметрию (ФА) билатеральных признаков, под которой понимают незначительные и случайные (ненаправленные) отклонения от строгой билатеральной симметрии биологических объектов (Захаров, 1987). Авторы статьи считают, что асимметрия, наряду с симметрией, – имманентная дуалистическая характеристика объекта, неизбежно проявляющаяся в онтогенезе. Таким образом, ФА организмов по билатеральным признакам можно рассматривать как случайное макроскопическое событие, заключающееся в независимом проявлении признаков, в разной степени выраженных либо на левой, либо на правой, либо на обеих сторонах объекта, являющихся итогом стохастических микроскопических процессов.

На макроскопическом уровне ФА предлагают использовать в качестве меры в оценке стабильности развития организма (Захаров, 2001; Захаров и др., 2001). В качестве показателей стабильности развития обычно рассматривают нарушения развития (фенодевиации) и онтогенетический шум (Захаров и др., 2001). Как подчеркивают В.М. Захаров с соавторами (2001, с. 405), “…преимущество подхода состоит в том, что при этом известна генетическая заданная норма – симметрия, отклонения от которой в ходе развития и представляют собой онтогенетический шум”.

Перспективы применения ФА в системе биомониторинга требуют разработки корректных методов количественной оценки ее величины (Кожара, 1985; Захаров, 1987; Гелашвили и др., 2001, 2004б; Palmer, Strobeck, 1986, 2003).

Применение в формулировках таких терминов, как "симметрия/асимметрия", "флуктуации", "шум", имеющих вполне содержательное наполнение в физико-математической литературе, дает основание рассмотреть проблему ФА с междисциплинарных позиций физики, теории вероятностей и теории информации.

Таким образом, целью настоящей работы является обоснование возможностей и ограничение применения для количественных оценок ФА алгоритмов и методов, апробированных в кристаллографии, прикладной теории информации и популяционной биологии.

Меры сходства для оценки величины флуктуирующей асимметрии

Количественная оценка сходства между различными биосистемами или различными частями одной системы – традиционная задача генетики популяций, популяционной экологии, фенетики, для решения которой вводятся те или иные меры сходства или родственные им меры расстояния (например, генетического) между популяциями (Животовский, 1979).

Рассмотрим в качестве рабочей гипотезы предположение о том, что сходство между биосистемами (популяциями, организмами, частями организмов) можно оценить по равенству этих систем относительно какого-либо признака. Тогда, как указывалось выше, для проверки этого равенства необходимо с помощью некоторого преобразования "совместить" равные по данному признаку объекты. Очевидно, что мы приходим к определению симметрии, а поскольку живая природа характеризуется изменчивостью и разнообразием, речь должна идти о количественной оценке псевдосимметрии биосистем. Таким образом, псевдосимметрия может рассматриваться как универсальная характеристика биосистем различного масштаба и сложности, а ФА – как ее частный случай.

Критический анализ существующих подходов к оценке ФА, учитывающих либо частоту проявления меристических признаков, либо величину пластических, дан в работе Д.Б. Гелашвили и др. (2004б).

Очевидно, что для оценки величины ФА по интегральному показателю имеет значение как частота проявления асимметричного признака (т.е. "пенетрантность"), так и его выраженность (величина), или "экспрессивность".

Алгоритмом, удовлетворяющим не только этим требованиям, но и позволяющим оценивать полностью симметричные и антисимметричные объекты, является свертка функций, успешно применяемая для оценки степени инвариантности атомных структур псевдосимметричных кристаллов относительно изометрических преобразований пространства (Чупрунов и др., 1988) и предложенная нами для оценки степени симметричности биообъектов (Гелашвили и др., 2001, 2004б). Свертка может быть интерпретирована как скалярное произведение функций, образующих бесконечномерное пространство векторов, и записана в виде функционала

=,

(1)

где интегрирование ведется по всей области W определения функции ƒ (x1, x2, x3).

Величина асимметрии в этом случае может быть представлена выражением

, (2)

где Lij и Rij значение j-го признака, соответственно, слева и справа от плоскости симметрии; m – число особей в выборке; n – число признаков.

Метод оценки степени инвариантности биосистем, основанный на использовании функционала (1), является достаточно универсальным и эффективным по следующим причинам:

Проверка применимости свертки функций для количественной оценки ФА по меристическим и пластическим признакам у растений, насекомых, амфибий, рептилий, млекопитающих показала ее приемлемость и эффективность (Гелашвили и др., 2001, 2004а; Радаев, 2001).

В упоминавшейся работе Л.А. Животовского (1979) приводится несколько мер сходства популяций по полиморфным признакам, предложенных разными авторами:

,

,

в том числе предложенная самим Л.А. Животовским (1979) мера .

Очевидно, что все рассматриваемые меры алгоритмически являются свертками, а мера S3 полностью аналогична предложенной нами. Заметим, что ранее И.М. Хохуткин и Ю.А. Елькин (1982) также применили алгоритм свертки для оценки видового сходства биотических сообществ наземных моллюсков.

Заметим, что показатель r Л.А. Животовского с точностью до преобразования также соответствует формуле (2), если использовать следующее преобразование:

, ,

, , или в общем случае .

При этом утверждение Л.А. Животовского (1979) об исключительных статистических преимуществах показателя r несколько преувеличено и не согласуется с данными приведенного в статье тестового примера относительно редких морф.

Таким образом, мера сходства, основанная на свертке функций, может считаться достаточно универсальной для оценки псевдосимметрии биообъектов различной сложности и масштаба.

Меры разнообразия для оценки ФА билатеральных признаков

Меры сходства, рассмотренные выше дают количественную оценку степени симметрии/асимметрии, но не отражают вероятностный характер проявления признаков. Между тем "фенотипическая судьба" флуктуирующего признака такова, что он может проявиться или не проявиться у конкретного объекта. В том случае, если признак проявился, он может встречаться в одном из двух альтернативных состояний: асимметричном (с вероятностью p1) и симметричном (p0). Очевидно, что должно выполняться соотношение p1+ p0 = 1. Оценка вероятностей состояний признаков дает возможность перейти к характеристике их разнообразия. Перефразируя Р. Маргалефа (1992), можно сказать, что разнообразие – мера информации, подразумевающая, что признаки одного типа неразличимы. Традиционно применяемые в биологии меры разнообразия имеют междисциплинарное происхождение. Так, индекс доминирования Симпсона , вероятно, впервые был использован немецкими криптографами как мера частоты повторов (Хэйек, 2003). В экологии величина известна как индекс видового разнообразия Симпсона, а в популяционно-генетических исследованиях – как мера эффективного числа аллелей (Животовский, 1980). Л.А. Животовский (1980) предложил для оценки внутрипопуляционного разнообразия по комплексу признаков меру , которая принимает максимальное значение , равное числу признаков при их равновероятности p1=1/n.

Широкое распространение в экологических исследованиях получила информационная энтропия К. Шеннона (Shannon, 1948): .

Впоследствии А. Реньи (Rйnyi, 1961) расширил концепцию информации К. Шеннона и предложил семейство обобщенных энтропий: , где .

Наконец, М.О. Хилл (Hill, 1973) для оценки биоразнообразия предложил параметрическое семейство индексов, взяв экспоненту от обобщенной энтропии А. Реньи: .

Детальный анализ этих и других мер разнообразия приведен в работе Ю.А. Песенко (1982). Преимущество той или иной меры разнообразия во многом определяется задачами исследования. Следует согласиться с Л.А. Животовским (1980, с. 835), который считает, что “задача полного установления "сфер действия" всех мер разнообразия остается нерешенной”, и Ю.А. Песенко (1982, с. 113), указывающим, что “…при более общем подходе следует признать правомерным одновременное существование нескольких индексов разнообразия, что математически связано с неоднозначностью мер плохо организованных множеств”. Учитывая вышеизложенное, при оценке разнообразия флуктуирующих признаков мы основывались на классических представлениях теории вероятностей. Сформулируем задачу следующим образом.

Пусть имеем выборку из m объектов, оцениваемых по набору из n признаков, проявляющихся случайным образом в одном из двух альтернативных состояний: асимметричном или симметричном. Обозначим наличие асимметричного состояния 1, а симметричного – 0. Основой для дальнейшего анализа является таблица {Bij} с размерами mґN, где m – число объектов, обладающих n признаками: . Таблицу можно рассматривать как выборку из ансамбля сообщений с алфавитом из двух символов. При равной вероятности (const) символов 0 и 1 для каждого из n признаков в сообщении возможны варианты M = 2N их комбинаций (текстов), вероятность каждой из которых p = M-1 = 2-N.

Мера неопределенности, соответствующая этому ансамблю, задается энтропией Р. Хартли (Shannon, 1948): бит. Энтропия P. Хартли задает максимально возможную неопределенность в системе из N ячеек для двухбуквенного алфавита равную N бит, или 1 бит/символ.

Количество информации I, получаемой в результате каждого измерения n признаков объекта, равно величине неопределенности (энтропии) с обратным знаком:

= -H.

Если вероятности появления символов в сообщение не равновероятны, то для вычисления средней неопределенности в появлении j-го признака в состоянии 1 используется информационная энтропия К. Шеннона, которая в данном контексте может быть записана в следующем виде: .

Для получения оценки набора вероятностей, соответствующим вероятностям {pj}, следует провести подсчет числа и появления признака в состояниях 0 и 1 по m строкам базовой таблицы для каждого из n признаков. Тогда вероятности появления этого признака в состояниях 0 и 1 вычисляются по формулам

и .

Неопределенность j-го признака, определяющая его информативность в указанном выше смысле, вычисляется по формуле

.

Неопределенность для набора из n признаков (при условии их независимости) равна сумме неопределенностей для каждого из этих признаков: ,

а среднее количество неопределенности (информативность на один признак) -

.

Формулу К. Шеннона в этом случае следует трактовать как количественную оценку средней неопределенности в реализации условия симметрии, которая описывается признаками этой симметрии.

Пример. Пусть имеем табл. 1 размером , ячейки которой заполнены случайным образом, так что 1 – асимметричное, а 0 – симметричное проявление признака.

Таблица 1

Распределение асимметричных признаков в модельной выборке

m

n

1

2

3

1

1

1

0

2

0

0

1

3

0

0

1

4

0

1

1

Для признака n1 и ; для n2 и ; для n3 и . Тогда бит, бит,  бит,  бит,  бит/признак.

В рамках информационной модели ФА следует интерпретировать исходя из основных свойств функции H(α) = -(p0 log2 p0 + p1 log2 p1), являющейся мерой неопределенности исхода опыта α.

Максимальное фенотипическое разнообразие достигается при равной вероятности представленности симметричных (p0) и асимметричных (p1) состояний признаков, т.е. p1 = p0 = 1/2, так как p1 + p0 = 1. Опыт, имеющий все исходы равновероятными, предсказать труднее всего. Поэтому он имеет наибольшую степень неопределенности, или энтропию: h(p)= -p log2 p - (1- p) log2 (1 - p) при p1 = p0=, h(p) = log2 2 = 1.

Живые организмы характеризуются структурной упорядоченностью, но для утверждения, что упорядоченность одной системы выше, чем другой, нужно эти упорядоченности измерить. Такая измеряемая и выражаемая числом упорядоченность может относится только к макросостояниям системы. В распоряжении физики пока имеется лишь одна величина, характеризующая степень упорядоченности – энтропия. Если ФА организмов по билатеральным признакам рассматривать как случайное макроскопическое событие, заключающееся в независимом проявлении либо на правой, либо на левой, либо на обеих сторонах объекта, но в разной степени выраженных признаков, являющихся итогом стохастических микроскопических процессов, то подходы статистической физики будут вполне оправданы. Флуктуации, рассматриваемые в статистической физике – особый класс процессов, при которых система из более вероятного (менее упорядоченного состояния) переходит в менее вероятное (более упорядоченное состояние и ее энтропия уменьшается). Н. Винер (2003, с. 92) писал: “Описывая организм, мы не пытаемся точно определить в нем каждую молекулу… мы стремимся разрешить некоторые вопросы, раскрывающие форму строения организмов – форму строения, которая становится более значимой и менее вероятной по мере того, как организм становится, так сказать, более цельным”.

В рассматриваемом контексте снижение уровня ФА как меры отклонения от идеальной билатеральной симметрии следует интерпретировать как поддержание или увеличение биологической упорядоченности, за что приходится "расплачиваться" переходом в менее вероятное состояние, оцениваемое уменьшением энтропии. Действительно, в рамках информационной модели ФА уменьшение вероятности встречаемости асимметричных признаков в случае двухсимвольного "алфавита" влечет и H(α). Отметим, что аналогичные рассуждения справедливы при уменьшении вероятности встречаемости симметричных признаков , тогда и H (α). Эти рассуждения полностью основываются на характере зависимости функции H (p1, p2, …, pn) от отдельных вероятностей p1, p2, …, pn (Shannon, 1948).

Очевидно, что осуществление редкого события несет гораздо больше информации, чем заурядного. Однако большое количество информации при многократном повторении опыта мы будем получать редко. Поэтому в практических задачах оценивается среднее количество информации, тогда как представление о количестве информации, связанное с отдельными исходами опыта, почти никогда не употребляется (Яглом, Яглом, 1973). Применительно к рассматриваемой информационной модели этот вывод означает "статистическую бесперспективность" оценки ФА одной особи по многим признакам или у многих особей по одному признаку, т.е. ограничение вектор-строкой - или вектор-столбцом - . Для корректных популяционных оценок необходимы репрезентативные выборки, а при фиксированном наборе признаков, участвующих в анализе, объем выборки зависит от числа объектов (организмов). Кроме того, следует подчеркнуть, что максимально симметричный объект (), так же как и максимально асимметричный объект (), является "эволюционно не перспективным", поскольку не поставляет материал для естественного отбора. Информация как результат выбора порождается разнообразием: “Во вполне однородной популяции количество информации падает до нуля и регуляция ее состава становится невозможной” (Шмальгаузен, 1968).

Информативность оценки степени асимметрии биологических объектов

разными алгоритмами

Возможность применения разных алгоритмов (Захаров и др., 2000; Гелашвили и др., 2004б; Leary et al., 1983) для оценки степени асимметрии биообъектов приводит к закономерному вопросу об информативности этих подходов.

Рассмотрим этот вопрос на модельном примере. Пусть имеем таблицу значений n признаков на левой (L) и правой (R) сторонах у m объектов (табл. 2).

Таблица 2

Выраженность ("экспрессивность") асимметричных признаков в модельной выборке

m

n

n1

n2

L

R

L

R

m1

3

1

2

2

m2

3

3

1

1

Оценку степени асимметрии в модельной выборке проведем с помощью алгоритмов, основанных на использовании формул, учитывающих только частоту проявления асимметричных признаков

, (3)

их величину , (4)

а также свертки функций (2). Поскольку применение формулы (3) предусматривает учет асимметричных признаков в альтернативной форме, преобразуем данные табл. 2 и представим их в виде табл. 3.

Таблица 3

Частота проявления ("пенетрантность") асимметричных признаков в модельной выборке

m

n

n1

n2

m1

1

0

m2

0

0

Из четырех учитываемых признаков асимметричен только один (признак n1 у объекта m1), следовательно, величина асимметрии, вычисленная по формуле (3), составит . Для оценки степени асимметрии по формулам (2) и (4) необходимо воспользоваться данными табл. 2, так как алгоритмы этих формул предусматривают оперирование значениями величин признаков на L- и R-сторонах. Очевидно, что степень асимметрии, вычисленная по формуле (4), составит

,

а по формуле (2)

В рассматриваемом примере степень асимметрии системы из двух объектов, имеющих по два признака, определяется одним асимметричным признаком n1 у объекта m1. Легко показать, что степень асимметрии самого признака n1 (m1), вычисленная по формулам (2)-(4), при m = 1 и n = 1 составит, соответственно, ; и . Таким образом, формула (3), не учитывающая выраженность ("экспрессивность") асимметрии признака, как в случае оценки одного признака, так и набора признаков, дает наиболее грубую, приближенную оценку степени асимметрии. Интуитивно сделанный вывод понятен, поскольку сравниваемые алгоритмы с разной степенью подробности оценивают асимметрию. Следовательно, правомочен вопрос о количестве информации, получаемой при оценке степени асимметрии с помощью алгоритмов, учитывающих как частоту проявления асимметричного признака, так и его выраженность (величину). Очевидно, что чем более подробно мы оцениваем степень симметрии/асимметрии объекта, максимально полно используя исходные данные, тем большее количество информации об объекте можем получить.

Докажем это, основываясь на свойствах информационной энтропии (Фанстейн, 1960). Воспользуемся следующим условием: если pn = q1 + q2 > 0, то

.

Для данных, приведенных в табл. 2, очевидно, что энтропия признака n1, равновероятно встречающегося в асимметричном и симметричном состояниях (), равна H1 = 1 бит, тогда как для признака n2 H2 = 0. Таким образом, если ограничиться только оценкой частоты проявления ("пенетрантности") асимметричного признака, количество получаемой информации (I) в силу соотношения I = -H составит 1 бит. Однако единственный асимметричный признак n1(m1) определен значениями 3 (L) на левой стороне и 1 (R) – на правой. Другими словами, n1(m1) расщеплен на одно симметричное состояние и два асимметричных состояния (см. рисунок) в отношении 1/3 и 2/3.

L. .R

Расщепление признака n1(m1) на симметричные и асимметричные состояния:

– наличие, – отсутствие признака

Поскольку вероятность проявления признака n1(m1) равна 1/2, то и расщепление необходимо произвести в указанном соотношении (Shannon, 1948):

.

Тогда 1 бит + бит.

Таким образом, как следует из рассмотренного примера, количество информации о степени симметричности/асимметричности исследуемого объекта при учете выраженности ("экспрессивности") признака на ~ 0.5 бит больше, чем в случае учета только альтернативных состояний признака, т.е. "пенетрантности". При возможности выбора методологических концепций и методических приемов многое определяется "вкусом и пристрастиями" исследователя. Нам представляется, что привлечение в биоэкологические задачи теоретических положений и математического аппарата смежных естественно-научных дисциплин, в данном случае – теории информации, кристаллографии, физики, дало возможность существенно продвинуться в разработке методов оценки степени симметричности природных объектов.

Дальше К следующему разделу Назад К предыдующему разделу Конец К концу разделу Список К оглавлению На главную На главную страницу сайта