© 2004 Электронный журнал "Jahrbuch fur EcoAnalytic und EcoPatologic"
На главную страницу сайта

Сайт наш чаще посещай - будет выше урожай (Лозунг времен Н.С.Хрущева)

На главную страницу сайта

 

Опубликовано: Диссертация в форме научного доклада на соискание ученой степени доктора биологических наук по специальности 03.00.16 – экология, октябрь 2006 г.


 

ИНТЕЛЛЕКТУАЛЬНЫЕ ТЕХНОЛОГИИ СТРУКТУРНОГО АНАЛИЗА ЭКОЛОГИЧЕСКИХ СИСТЕМ

В.К. Шитиков

(Институт экологии Волжского бассейна РАН, г. Тольятти)

Научный консультант

чл.-корр. РАН, доктор биологических наук, профессор Розенберг Геннадий Самуилович

Официальные оппоненты:

чл.-корр. РАН, доктор физико-математических наук, профессор Дегерменджи Андрей Георгиевич

доктор биологических наук Левич Александр Петрович

доктор биологических наук, профессор Евланов Игорь Анатольевич

Ведущая организация

Казанский государственный университет им. В.И. Ульянова-Ленина

 

СОДЕРЖАНИЕ

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
1. Эпистемологическая сущность экологической системы как совокупности данных мониторинга. Состав и иерархия информационных компонент
2. Технология обработки индивидуальных показателей
3. Экологическое прогнозирование: анализ временных рядов
4. Комплексные критерии cостояния экосистемных объектов: экспертный и статистический подход
5. Классификация экосистемных объектов и оценка их пространственной неоднородности
6. Моделирование причинно-следственных связей в экосистеме
7. Методы анализа видовой структуры сообществ
ГЛАВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ
Список публикаций по теме диссертации

 

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Одной из важнейших задач экологии является биоиндикация качества окружающей среды, выявление необратимых изменений в экологических системах, сопровождающихся нарушением структурной и функциональной устойчивости биоценозов, и количественная оценка критических значений антропогенной нагрузки. Однако расширение программ мониторинговых исследований и естественное стремление к более детальному описанию сложного экосистемного объекта приводит к увеличению количества учитываемых параметров, что затрудняет анализ целостной картины взаимосвязи факторов, обуславливающих формирование негативных биосферных процессов. Углубляется значительный диссонанс между затратами труда учёных-экологов на получение исходных данных и потенциальным объемом знаний, которые могут быть выделены на их основе. Это объясняется, прежде всего, ограниченными психо-физиологическими возможностями человека при распознавании абстрактных образов (как отмечал С.Лем [1992], ни один специалист не может при моделировании явлений оценить совместное комбинаторное взаимодействие более чем 3-х показателей). Современное исследование механизмов структурных изменений, происходящих в экологических сообществах под воздействием природных и антропогенных факторов, невозможно без использования компьютерных технологий, методов многомерного математического анализа и доступа к ретроспективным базам данных.

В последнее десятилетие в странах ЕС и США реализуется планомерный переход от чисто химического контроля окружающей среды к биологическому, который претерпел значительный прогресс в плане стандартизации методик и понятий. Существенным толчком к развитию и совершенствованию методов биоиндикации в странах ЕС стала Европейская Рамочная директива (Water Framework Directive – WFD), в рамках которой вводится специальная процедура создания интеркалибровочной сети стран ЕС для оценки биологического состояния водных объектов разных типов. Ключевое место в WFD занимают автоматизированные системы анализа гидробиологических данных. На базе американской системы RPBs и британской RIVPACS созданы подробные протоколы описания условий среды обитания различных сообществ организмов (в частности, перифитона, макрозообентоса и рыб) и математические средства интеркалибровки метрик. Подобные исследования в России, несмотря на предпринимаемые усилия, пока фрагментарны и малоэффективны, что сдерживает интеграцию страны в мировое сообщество.

Цель и задачи исследования. В работе достигались следующие цели:

Для достижения указанной цели решались следующие основные задачи:

  1. Разработка принципов создания многоуровневых эколого-экономических информационных систем в виде "ансамбля" баз данных, содержащих большие массивы разнородных пространственно-распределенных показателей; проектирование структуры реляционной модели данных и технологий преобразования информационных потоков на каждом уровне детализации.
  2. Формирование библиотеки специализированных методов, алгоритмов и программных модулей для структурного математического моделирования сложных систем методами многомерного статистического анализа, распознавания образов и искусственного интеллекта.
  3. Отработка методов пространственной эколого-географической дифференциации и районирования территорий и водных объектов на основе многомерных массивов разнородных параметров. Создание алгоритмов свёртки векторов анализируемых показателей в обобщенный критерий, измеряемый в континуальных шкалах, на основе формальных методов и с использованием экспертных оценок.
  4. Разработка архитектуры программного комплекса, выполняющего построение и интерпретацию математических моделей прогнозирования экологических ситуаций территориально-распределенных комплексов. Создание объектно-информационного интерфейса экологических баз данных с типовыми ГИС-программами для реализации процедур изолинейного моделирования и пространственной многоуровневой визуализации сложных взаимосвязей параметров, описывающих экосистемы.
  5. Разработка комплекса программ, осуществляющих анализ многомерных временных рядов, моделирование тренда и прогноз динамики состояния экосистемы с помощью различных методов самоорганизации моделей, векторной авторегрессии, сингулярных преобразований, нейросетевого моделирования и проч.

Научная новизна. Впервые использован единый методологический подход к структурному анализу гидроэкологических систем различного уровня (от территории бассейна крупной реки до небольшого водотока), основанный на комплексном использовании трех компонент:

Выполнены оригинальные разработки программных модулей, реализующие описанные в литературе методы многомерной классификации, эволюционного моделирования и распознавания образов, а также новые авторские алгоритмы, связанные с анализом вероятностных распределений. Впервые для оценки качества вод и ландшафтно-экологической дифференциации территории использованы технологии искусственного интеллекта: нейросетевое моделирование, деревья решений, генетические алгоритмы, самоорганизующиеся карты Кохонена и т.д.

Теоретическое значение исследований. Работу можно рассматривать как дальнейшее расширение и практическую реализацию фундаментальных представлений об экологическом континууме. Закономерности размещения популяций в пространстве (наземной территории, акватории крупного водохранилища или по руслу водотока) в каждый момент времени обуславливаются особенностями внутри- или межвидовых взаимоотношений и реакцией сообществ на факторы внешней среды. Пространственное распределение каждой популяции аппроксимируется трехмерной поверхностью в пространственных координатах с использованием эмпирических данных об обилии особей рассматриваемого вида на станциях наблюдения по результатам гидробиологической съемки. Множество таксономических групп, образующих экологическое сообщество, моделируется с использованием методов мультикартирования гидробиологических данных и их пространственной визуализации с помощью многослойных трехмерных “гибких” карт, самоорганизующихся карт Кохонена и др. Степень неоднородности пространственной и временной структуры гидроэкосистемы, определяемая всей совокупностью эндо- и экзогенных факторов, оценивается с использованием специально сконструированных комплексных критериев. Реализованное с использованием современных математических методов выделение совокупностей качественно однородных местообитаний и их ранжирование по обобщенным индексам экологического состояния является дальнейшим развитием биотической концепции контроля качества природной среды [Левич, 1994].

Практическое значение и реализация результатов исследований. Создана экспертная система (ЭС) REGION и базы данных для территорий разного масштаба (Волжский бассейн - Самарская, Ульяновская, Нижегородская области - г. Тольятти - отдельные участки или водоемы и др.). Проведено эколого-экономическое районирование территории Волжского бассейна, выполнена оценка структуры и динамики природоохранных затрат, даны предложения по организации экологического мониторинга и управлению рациональным природопользованием, вошедшие в Федеральную целевую программу "Оздоровление экологической обстановки на реке Волге и ее притоках, восстановление и предотвращение деградации природных комплексов Волжского бассейна ("Возрождение Волги")". На основе оптимизации расчетов эмиссии СО2 и биопродукционных характеристик для модельных территорий (Самарская, Ульяновская и Нижегородская области) разработаны методы оценки нарушения глобального цикла углерода для территорий Среднего Поволжья. Выполнен расчет количественных оценок устойчивого состояния отдельных регионов и разработана методика ранжирования факторов воздействия по группам экологических, социальных и экономических параметров. Описанная совокупность исследований была отмечена первой премией Минэкологии СССР в 1991 г. ЭС REGION используется в учебном процессе Самарского государственного университета и Волжского университета им. В.Н.Татищева (г.Тольятти).

При непосредственном участии автора были разработаны информационные модели и программное обеспечение гидробиологических баз данных практически по всем направлениям деятельности профильных лабораторий ИЭВБ РАН. В первую очередь это относится к специализированной базе данных по макрозообентосу 40 малых рек бассейна Средней Волги, в которой представлены результаты гидробиологических проб и гидрохимического анализа за 1987-2005 гг. на 247 станциях наблюдений. На ряде модельных водотоков (рек Чапаевка, Сок и др.) отработаны методики оценки структурных изменений таксономической организации сообществ гидробионтов при природной и антропогенной трансформации водотоков; предложены критерии интегральной оценки экологического состояния речных систем и качества окружающей среды.

С использованием аналогичных принципов сформирована база данных, включающая результаты многолетних (1957-1992 гг) экспедиционных наблюдений в акватории Куйбышевского водохранилища. Рубрикатор базы включает данные ежемесячной гидробиологической съемки в более чем 60 точках наблюдений по различным сообществам водных организмов (численность и биомасса групп фито- и зоопланктона, бактериопланктона и макрозообентоса) в интегрированной пробе, охватывающей всю толщу воды. Параллельно регистрировались измерения 30 гидрохимических показателей и концентраций поллютантов в придонном и поверхностном водных слоях. База данных содержит также информацию Гидрометеослужбы, характеризующую региональные гидрологические условия в тот же период времени, температурный и радиационный режим, ветровую нагрузку и т.д.

Можно перечислить также следующие авторские разработки программных и информационных компонент:

Существенное значение для обеспечения фундаментальных и прикладных исследований фактическими и расчетными нормативами имела информационная система прогнозирования токсичности и опасности химических соединений ("ИПС-Токсикология"), обеспечивающая ведение регистра различных загрязняющих веществ-токсикантов, попадающих в природные экосистемы или находящихся в контакте с человеком. ИПС оснащена пакетом математических программ, обеспечивающих восстановление эмпирических зависимостей "Химическая структура - Свойство" с оценкой вероятности специфического вредного действия недостаточно изученных токсикантов на различные виды живых организмов. "ИПС-Токсикология" была удостоена серебряной медалью ВДНХ за 1986 г. и в настоящее время трансформировалась в "Российский регистр потенциально опасных химических и биологических веществ" Минздрава РФ.

Автором создан сайт "ЭкоСтат" (адрес http://www.ievbras.ru/ecostat/Kiril/), содержащий постоянно пополняемый сборник материалов по методам системной идентификации и математической статистики в экологии (свыше 40 книг и статей), а также многочисленные ссылки по этой тематике на другие ресурсы сети Интернет.

Связь работы с плановыми исследованиями. Исследования выполнялись в рамках тем НИР ИЭВБ РАН "Комплексный анализ экосистем разного масштаба с целью достижения устойчивого развития" (№ ГР 01.9.70001498), "Оптимизация системы эколого-экономических параметров устойчивого развития территорий Среднего Поволжья" (№ ГР 01.2.00104638), "Мониторинг, биоразнообразие и оценка состояния равнинных рек бассейна Средней и Нижней Волги" (№ ГР 01.2.00412471), " Изучение разнообразия и структурно-функциональной организации донных сообществ речных систем бассейна Средней и Нижней Волги, их природная и антропогенная динамика" (№ ГР 01.2.00104640), а также во исполнение ряда государственных и региональных научно-технических программ, в том числе РФФИ "Комплексная экологическая оценка состояния среды и здоровья населения в регионах различного масштаба (Волжский бассейн, Самарская область, город Тольятти)" (грант № 95-04-11785-а за 1995-96 гг.), КНТП "Экологическая безопасность России", ГНТП "Биологическое разнообразие" (грант 2.3.29), ФЦП "Возрождение Волги".

Основные положения, выносимые на защиту:

Апробация работы. Основные положения диссертационной работы докладывались и обсуждались на 12 международных, 6 всесоюзных и 5 всероссийских научных конференциях и семинарах (см. перечень публикаций автора).

Личный вклад автора в работу. Диссертационная работа является результатом многолетних (1979-2006 гг.) исследований в области рационального природопользования, биоиндикационного контроля качества природной среды и моделирования реакции на токсическую нагрузку биосферных компонент разного уровня (особь, популяция, сообщество). Автором лично выполнялась детальная проработка концепций математического анализа, практическое проектирование структур баз данных, алгоритмов и машинных программ. В то же время, он благодарен своим руководителям, определявшим общую постановку задач и оказавшим помощь в интерпретации результатов, а также персоналу лабораторий, выполнявшим заполнение баз данных. Доля участия автора в совместных публикациях пропорциональна числу авторов.

Публикации. Автором опубликовано в печати более 100 научных и научно-методических работ. 83 из них соответствуют теме данного автореферата, в том числе, 7 наименований составляют монографии и 20 - статьи в центральных изданиях.

Структура и объем работы. Структура соответствует требованиям, предъявляемым к расширенным авторефератам в форме научных докладов. Доклад включает в себя общую характеристику и основное содержание, которое состоит из 7 разделов и выводов. Общий объем работы составляет 51 страницу, иллюстрирован 4 таблицами и 28 рисунками. Приведен перечень публикаций автора, включающий 84 наименования.

 

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

1. Эпистемологическая сущность экологической системы как совокупности данных мониторинга. Состав и иерархия информационных компонент

В ходе многолетнего экологического мониторинга, проводившегося на территории Волжского бассейна, накоплен большой фактографический материал, охватывающий многолетние результаты гидробиологических измерений в сотнях естественных и антропогенно трансформированных водотоках разного масштаба (от небольших рек до каскада волжских водохранилищ). Аналогичные данные получены в результате региональных наземных флористических и фаунистических исследований. Этот территориально распределенный континуум структурно-функциональных показателей различных экологических сообществ формировался под влиянием сложного комплекса средообразующих факторов и представляет собой стохастическое поле событий, динамически изменяющихся во времени.

Перефразируя афоризм Л.А.Расстригина [1990] "Знание - это набор моделей окружающего нас мира", можно утверждать, что с эпистомологических позиций "Экосистема - это объективная реальность, отображаемая совокупностью таблиц данных мониторинга". В связи с этим, детальное изучение структурно-функциональной организации экосистем сводится к формализованной обработке массивов измерений, формированию продуктивных гипотез о взаимосвязи и взаимообусловленности анализируемых факторов и содержательной интерпретации абстрактных математических моделей.

Состав информационных компонент совокупностей таблиц данных в частных реализациях зависит от уровня и типа описываемой экосистемы. Разрабатываемый в ИЭВБ с 1989 г. пространственно-распределенный банк экологических и экономических данных включает в себя иерархию баз (рис. 1), образно интерпретируемую как "экологическая матрешка". Здесь можно выделить две классификационные линейки:

Рис.1. Иерархия разработанного пространственно-распределенного банка экологических и экономических данных

В общем виде моделирование отклика биологических систем на изменяющийся уровень многопараметрических воздействий и количественная оценка нормативных значений антропогенных факторов в общем виде можно представить [Алимов, 2001; Воробейчик, 2003] как идентификацию и анализ системы уравнений:

.

(1)

где Z(x,y,t) – некоторый критерий качества экосистемы в момент времени t, рассчитанный для точки пространства (x,y); Bi(x,y,t) и Aj(x,y,t) – наборы параметров, описывающих соответственно состояние экосистемы и факторы среды в тех же пространственно-временных координатах; Ф1 – функция, связывающая нагрузки и состояние экосистемы; Ф2 – функция, описывающая зависимость качества экосистемы от параметров ее состояния. Качество экосистемы Z – часто это одномерная величина с небольшим числом градаций (например, от трех до семи на шкале “хорошо–плохо”). Однако провести четкую грань между группами показателей Z и B достаточно трудно, поэтому любые критерии, оценивающие реакцию биоты на внешние возмущающие воздействия, будем называть функциями отклика (по [Федоров, Гильманов, 1980]) экосистемы.

Для решения задач биоиндикации водоемов в базы данных загружались и использовались в качестве отклика различные показатели, характеризующие:

Кроме показателей, непосредственно вычисляемых по гидробиологическим карточкам (число видов, численность и биомасса), в базы загружались или автоматически генерировались многочисленные индексы, традиционно используемые при биоиндикации. Например, в случае макрозообентоса к ним относились:

Факторы внешней среды A объединяет множество абиотических показателей (в том числе, предоставленных службами Госкомгидромета), сопряженных по точке и времени взятия гидробиологической пробы. К ним относятся: общие и суммарные гидрохимические показатели (минерализация, взвешенные вещества, растворенный кислород, ХПК, БПК5), концентрации неорганических и органических веществ, общие гидрологические и гидрофизические показатели (скорость течения, глубина водоема, температура и электропроводность воды, запах, мутность, цветность, прозрачность). В некоторых случаях моделирования использовались гидрометеорологические показатели: (испарение, сток и уровень воды в водоеме, температура атмосферного воздуха, суммарная радиация, количество осадков, направление ветра, его скорость и повторяемость), морфометрические показатели рельефа по данным NASA (высота, площадь водо- и солесбора), объем водопотребления-водоотведения и сброс загрязняющих веществ со сточными водами (форма 2ТП-водхоз), биогенная и пестицидная нагрузка со стоком, распределенным по поверхности водосбора, и проч.

Территориальные базы экологических и экономических данных типа ЭС "REGION-VOLGABAS" кроме уже упоминавшихся рубрик охватывали следующие ресурсно-тематические блоки:

Детальное описание территориального распределения техногенной нагрузки и антропогенных воздействий A включало в себя:

Состояние здоровья населения, как критерий оценки качества среды Z, в рамках ЭС "REGION-VOLGABAS" включало следующие параметры:

После проведенного заполнения описанных баз данных появилась возможность ответить на традиционно ключевые вопросы многомерного анализа экосистем:

Главными ограничениями практического использования таблиц перечисленных показателей для адекватного описания экологических систем является их недостаточная достоверность, связанная со стационарными ошибками измерений и влиянием субъективных факторов, неопределенность алгоритмов формирования, временная и пространственная неоднозначность. Показатели, загруженные в базы данных, имеют самые разнообразные единицы измерения, масштаб, точки отсчета и интервалы варьирования. Эмпирические ряды измерений подчиняются законам распределений, весьма далеким от теоретических нормального или равномерного, а графики зависимостей часто имеют вид стохастических флуктуаций, приближающихся к "белому шуму". Поэтому, для того, чтобы такие показатели стали не только важным, но и определяющим звеном информационной модели территории (водоема), необходима разработка эффективных процедур препроцессинга данных с целью нахождения робастных оценок анализируемых величин.

2. Технология обработки индивидуальных показателей

Одной из задач исследования явилось создание средств компьютерной реализации процедур статистического анализа гидробиологических данных. Разработан программный комплекс "Автоматизированное рабочее место гидроэколога" (АРМ ГЭ), реализующий следующие функции:

Первый этап математической обработки заключается в оценке степени пространственной и временной неоднородности абиотических факторов и количественных показателей состояния биоценозов, т.е. для каждого анализируемого показателя проверяется обоснованность статистической гипотезы о влиянии места измерений (координат x-y) или существовании временной динамики B = f(t). Проверка предположения об однородности вариационного ряда в комплексе АРМ ГЭ осуществляется в рамках однофакторного дисперсионного анализа с использованием критерия Фишера и непараметрических критериев Краскелла-Уоллиса, Джонкхиера, Фридмана и Пейджа.

Если показана пространственная неоднородность анализируемой совокупности абиотических факторов и экосистемных показателей, то в этом случае правомочно дальнейшее развитие задачи экологического районирования, выделение фоновых и импактных участков, построения зависимостей (1) отклика от значимых факторов. В противном случае экологический объект интерпретируется как цельный и однородный, а имеющиеся данные о нем используются на более высоком региональном уровне для построения территориально-бассейновых моделей. Если принята гипотеза о многолетней неоднородности, то решается стандартная задача анализа временных рядов, построения многофакторных зависимостей тренда и экологического прогнозирования.

Специальный набор сервисных процедур АРМ ГЭ предусматривает разведывательный анализ данных (data mining) – "просеивание" информации с целью нахождения в ней особенностей и артефактов, заданных описанием шаблонов или пороговых значений. Наряду с модулями идентификации "выбросов", фильтрации аномальных и восстановления пропущенных значений, которые реализованы традиционными методами, можно отметить авторские алгоритмы функционального преобразования, нормирования и перевода значений исходных показателей в интервальные шкалы.

Приближение распределения эмпирических выборок к нормальному закону путем функционального преобразования (техника описана Дж.Тьюки [1981]) является эффективной мерой повышения обоснованности стандартного статистического анализа. Для этого ряд значений B, сформированный средствами АРМ ГЭ, подвергается серии преобразований Bn (n = ± 3, ± 2, -1, ± 0.5, ± 0.33), ln(B), ekB , и для каждой из выборок-претендентов рассчитывается l -критерий Колмогорова-Смирнова, асимметрия и эксцесс. Из всех формул преобразования выбирается та, что доставляет минимум l -критерию, и, чаще всего, предположение о нормальности трансформированной выборки становится достоверным. Для аналогичных целей предусматривается также использование углового преобразования Фишера arcsin (2B - 1), бивес-оценок среднего и др.

Перевод континуальных показателей в нормированные и интервальные шкалы широко применялся нами для формирования единообразного пространства признаков и генерации комплексных критериев (см. далее раздел 4). Общий принцип такого преобразования - достижение максимума информации в закодированных данных, что имеет место в случае равномерного распределения варианс по выделенным интервалам (градациям баллов). При этом был использован следующий алгоритм сведения численной шкалы к порядковой: общий диапазон допустимых значений показателя разбивается по числу классов на n отрезков с длинами, пропорциональными числу измерений каждого класса в исходной выборке, т.е. , где - число измерений класса , а - общее число измерений. Также нами был реализован более общий алгоритм нахождения наилучшего разбиения [Вапник с соавторами, 1984], основанный на оптимизации шенноновской энтропии и определяющий как границы диапазонов, так и оптимальное число градаций n.

Полученные интервальные и бинарные структуры данных в меньшей мере, чем сами наблюдения, чувствительны к систематическим и случайным ошибкам, поскольку дальнейшей математической обработке подвергаются не вариансы, а их нормированные частоты попадания в ячейки интервалов. Это обстоятельство использовалось нами при реализации ряда следующих ординационных методов:

Суммарная численность хищных видов
Nh (F = 2.54, p = 0.028)

Доля видов хищников в биомассе Chironomidae
Bh/Bch (F = 1.83, p = 0.11)

 

Рис. 2. Изменение некоторых показателей макрозообентоса в малых реках Среднего Поволжья по градиенту содержания растворенного кислорода (по оси абцисс в %); пунктирная линия – до выравнивания, сплошная – после [Шитиков, Розенберг,Зинченко, 2005].

Представляет особый интерес выполненная нами реализация алгоритма нахождения оптимального разбиения d области существования признака xq на градации, которое наилучшим образом подчеркивает дискриминирующую сущность некоторой внешней априорной классификации измерений D1, D2, …, Dn (в приведенном ниже примере - по классам качества вод). Метод формализован А.А.Генкиным [1999] и является основой "Оболочки Медицинских Интеллектуальных систем".

Обозначим через pj(xq |Ds) частоту попадания значения показателя xq из подмножества { xq }Ds в j-й диапазон ( j = 1,2,…,k ). Тогда для двух классов Ds и Dl в качестве наилучшего разбиения диапазона на k отрезков выбирается такое, которое максимизирует информационную меру дивергенции Кульбака, имеющую смысл обобщенной оценки различия двух эмпирических распределений:

Граничные значения интервалов легко находятся как полусумма смежных отсортированных значений xqi обучающей выборки, принадлежащих разным диапазонам. В общем случае n классов максимизируется величина:

.

В качестве примера разделим множество значений численности хищников-хватателей Nh в пробах макрозообентоса из малых реках Среднего Поволжья на две выборки: измерения на "чистых" станциях с классом качества вод 3 и менее и измерения на "грязных" станциях (см. табл. 1).. Традиционное сравнение средних с использованием t-критерия Стьюдента не выявляет статистических различий между этими выборками (р = 0.45). Осуществим такое разбиение всей области варьирования значений численности на 5 интервалов, которое обеспечивало бы максимальную расщепляющую способность обоих подмножеств, т.е. наибольшую суммарную разность частот, пересчитанную в доли J, в ячейках таблицы сопряженности.

Таблица 1. Интервальные структуры численности хищников-хватателей при относительно низком (группа А – класс качества воды < 4) и высоком (группа В – класс качества воды ³ 4) уровнях гидрохимического загрязнения [Шитиков, Розенберг,Зинченко, 2005]

Градации численности Nh хищников, экз./м2

Группа A (класс < 4)
N1 = 186

Группа В (класс ³ 4)
N2 =142

Вклад в информа-тивность

Диверген-ция и статистика Кульбака

Средние значения численности в группах А и В и их отличие по t-критерию

0 - 3

28 (15.1%)

118 (33.3%)

0.263

J = 0.307

J'(4,1)=37.4

PJ <0.0001

Гр. А

Гр. В

5 - 10

9 (4.8%)

4 (1.1%)

0.030

406.1

390.3

11 - 120

62 (33.3%)

99 (28.0%)

-0.025

t = 0.129

tкр = 1.65

р = 0.45

121 - 140

7 (3.8%)

1 (0.3%)

0.068

³ 141

80 (43.0%)

132 (37.3%)

-0.029

В первом столбце табл. 1 – интервалы численности особей, наилучшим образом подчеркивающие различие обилия хищных бентонтов в рассматриваемых группах. Во втором и третьем столбцах – частота (в скобках – относительная частота) наблюдений из соответствующих интервалов. Справа приводятся средние арифметические, не различающиеся по t-критерию, тогда как мера Кульбака J' свидетельствует о значимом (PJ < 0.0001) изменении численности Nh в зависимости от уровня гидрохимического загрязнения на станциях наблюдения. Анализ соотношения составляющих дивергенции Кульбака (вклада в информативность) свидетельствует о том, что различия между группами на 85% обусловлены малыми значениями численности хищных видов зообентоса (диапазон от 0 до 3), которые в "грязных" условиях среды встречаются значительно чаще.

 

3. Экологическое прогнозирование: анализ временных рядов

Результаты экологических наблюдений, представленные в базах данных, как правило, отнесены к определенной дате, а совокупность значений анализируемого показателя за последовательные моменты времени образуют динамический ряд. Каждый уровень временного ряда формируется под воздействием большого числа явных или латентных факторов, которые условно можно разделить на три группы:

Реальный процесс формирования временного ряда может принимать различные формы при разных сочетаниях этих факторов, поэтому основная задача моделирования динамики - количественная оценка каждой из вышеперечисленных выше компонент с тем, чтобы использовать полученную информацию для прогнозирования будущих значений или при построении моделей взаимосвязи двух или более временных рядов.

Во многих практических приложениях работы, особенно при оценке сезонной составляющей, оказывалось достаточным использовать традиционные алгоритмы сглаживания, рассчитать автокорреляционную функцию или построить стохастическую модель, включающую в качестве независимых переменных лаговые значения результативного признака (в частности, авторегрессии или скользящего среднего). Например, график индексов сезонности вычисленных при экспоненциальном сглаживании по модели Тейла - Вейджа (рис. 3), отчетливо показывает двухвершинную активность популяции ротаторий в июне и сентябре, когда как численности каляноидов в тех же условиях имеет одновершинный пик, приходящийся на август. Последний вывод подтверждается моделью авторегрессии второго порядка, теоретический нормированный спектр которой показывает (рис. 4), что дисперсия ряда обусловлена в основном частотами, близкими к 1/6, что соответствует одному пику за вегетативный сезон. Такую же ярко выраженную годичную периодичность можно усмотреть на графике спектральной плотности, полученном сглаживанием периодограммы с помощью окна Парзена, для повторяемости северного ветра (рис.5).

Рис. 3. График индексов сезонности (ось ординат) по модели Тейла - Вейджа для численности Rotatoria (ст.34 Куйбышевского водохранилища, 1958-1984 гг)

Рис. 4. Теоретический нормированный спектр модели АЗ(2) для численности Calanoida (ст.34 Куйбышевского водохранилища, 1958-1984 гг)

Рис. 5. Диаграмма спектральной плотности для повторяемости северного ветра (метеопост в районе г. Тольятти, 1958-1984 гг)

В экологии при анализе трофических взаимодействий важно бывает оценить взаимное влияние популяций при условии сдвига временных серий наблюдений друг относительно друга на некоторый временной промежуток (лаг k), т.е. когда влияние одного явления на другое проявляется с некоторым запаздыванием или опережением. Для определения временного лага выполнялся анализ пар рядов динамики с использованием кросс-корреляционной функции (ККФ), оценивающей тесноту связи между этими рядами на различных частотах, и кросс-спектральных характеристик, определяющих наличие или отсутствие общих существенных гармонических составляющих в исследуемых временных рядах. При этом строятся диаграммы функции когерентности (рис. 6) и сдвига фаз, анализ закономерностей которых в различных частотных точках дает ценную дополнительную информацию о взаимодействии процессов.

Рис. 6. График функции когерентности по результатам кросс-спектрального анализа рядов численностей Calanoida и Rotatoria (ст.34 Куйбышевского водохранилища, 1958-1984 гг.)

Важное место в предлагаемой интеллектуальной технологии моделирования тенденции временных рядов является разработанный пакет методов структурной и параметрической идентификации аналитических функций (предикторов), характеризующих тренд. Выбор конкретной формы модели и алгоритма ее синтеза зависит от конкретной цели исследования. Если ставится задача объяснения, то разумно ограничиться компактной моделью: например, экспоненциальной функцией или сплайном с 2-3 узлами сопряжения. Если ищется модель для прогнозирования, то жестких ограничений на сложность функции нет и единственное требование - достоверность и устойчивость прогноза при экстраполяции данных. Однако во всех случаях нами был отработан единый принцип поиска наилучшей модели методами самоорганизации.

Сущность нахождения модели оптимальной сложности методами самоорганизации заключается в ее поэтапной структурной идентификации, т.е. одновременном определении оптимальной структуры и оценки параметров модели. Для этого генерируются определенные наборы моделей различной сложности и отбираются лучшие из них по целесообразно заданному критерию регуляризации. Нами в качестве конкретных критериев селекции моделей были использованы следующие:

Рис. 7. График полиномиальной модели тренда при к=9 для концентраций ионов аммония (ось ординат) на ст.34 Куйбышевского водохранилища, 1958-1988 гг.

Другим направлением, которое впервые было использовано при анализе динамики экосистемных объектов, явился метод коллективного прогнозирования. Идея комплексации решения заключается в объединении отдельных моделей в "коллектив", эффективность которого практически всегда оказывается значительно выше любого из его членов. Структурные связи в коллективе выбираются таким образом, чтобы положительные свойства той или иной модели дополняли друг друга, а отрицательные – компенсировались. Наилучший коллектив образуют разнотипные модели-индивидуумы, являющиеся носителями нетривиальных тенденций моделируемого ряда.

При формировании “коллективов” нами решались три взаимосвязанных задачи:

Из существующих методов комплексации нами использовались, в основном, четыре:

На рис. 8 приведен пример интерполяции гидробиологического показателя с помощью коллектива из 8 следующих индивидуальных предикторов, каждый из которых зависит только от параметра t : 1) модели авторегрессии 3 порядка; 2) полинома 9 порядка; 3) сплайна с тремя узлами сопряжения; 4) аддитивной регрессионной модели; 5) мультипликативной регрессионной модели; 6) полиномиальной модели МГУА с использованием внешнего критерия регулярности; 7) такой же модели, но с использованием внутреннего критерия cреднеквадратической ошибки; 8) модели полигармонического тренда по МГУА. Вид полученных трендов на рис. 7 и 8 является хорошей иллюстрацией различия моделей, предназначенных для объяснения и прогнозирования.

Рис. 8. График интерполяции коллективом предикторов ряда концентраций ионов аммония (ось ординат) на ст.34 Куйбышевского водохранилища, 1958-1988 гг.

Важным направлением изучения динамики рядов экологических данных является анализ их корреляции (коинтеграции) и оценка причинно-следственных связей между отдельными показателями. Регрессионные модели временных рядов имеют свою специфику, связанную с присутствием трендов и плохой обусловленностью вычислительных процедур, вызываемых мультиколлинеарностью. Нами показано, что эти проблемы в значительной мере могут быть разрешены в результате использования моделей самоорганизации: различных модификаций метода группового учета аргументов (МГУА), нейросетевых методов и робастных методов множественного регрессионного анализа с целенаправленной селекцией информативно значимых аргументов. Например, представленная ниже значимая модель регрессии, полученная в исходном пространстве 63 факторов и учитывающая нелинейные эффекты и парные взаимодействия, обеспечивает средний модуль ошибки не более 1.6 тыс.экз/м3 и хорошо подходит для объяснения:

NCAL = 2.618 + 15.6 (G)0.5 - 0.393 ln(Fe+) - 0.00546 t× V ;

где NCAL - численность Calanoida; G - суммарный расход воды на плотине Волжской ГЭС, км3/мес; Fe+ - концентрация ионов железа, V - скорость северного ветра, м/с.

Представленное уравнение, а также четыре другие модели (полная линейная и мультипликативная нелинейная модели множественной регрессии, модели МГУА полиномиального и многорядного вида), использовались для синтеза многомерных прогнозирующих коллективов по перечисленным выше алгоритмам. Коллектив предикторов, полученным в ходе "модельного штурма", представлен на рис. 9.

Рис. 9. График прогноза для численности Calanoida (ст.34 Куйбышевского водохранилища, 1958-1984 гг) коллективом предикторов, полученным в ходе "модельного штурма"

Универсальным способом построения прогнозов макросостояний системы в условиях, когда полностью отсутствует апостериорная информация, а априорные данные задают лишь предысторию этих состояний (что характерно для экосистемных объектов [Розенберг, 1984]) является эволюционное моделирование [Фогель и др., 1969].

Общая схема разработанного алгоритма получения прогноза методом эволюционного моделирования выглядит следующим образом:

На рис. 10 графически представлен один из возможных автоматов для прогнозирования макросостояний сообщества каляноидов.

Рис. 10. Структура предсказывающего автомата Мили для прогноза численности Calanoida (ст.34 Куйбышевского водохранилища, 1958-1984 гг) после пяти удачных мутаций

Подробное описание моделей прогнозирования и результаты, полученные с их помощью, представлены в монографии [Розенберг, Шитиков, Брусиловский, 1994].

 

4. Комплексные критерии cостояния экосистемных объектов: экспертный и статистический подход

Первым шагом к нормированию антропогенных нагрузок является комплексная количественная оценка уровней воздействия, вызывающих неблагополучное состояние экосистемы. В условиях резко возросшей многокомпонентности загрязнения окружающей среды однозначная диагностика, например, водных объектов, по всему комплексу из десятков и сотен гидрохимических показателей представляет собой нетривиальную проблему. Несмотря на разработку различных комбинированных систем классификации поверхностных водоемов и "интегральных" индексов оценки их загрязненности, нет как общепринятой методики оценки качества вод по абиотическим факторам, так и отчетливой концепции путей ее создания.

Не менее актуальна разработка научно-обоснованных комплексных критериев - биоиндикаторов состояния пресноводных водоемов. Мультиметрические индексы, являющиеся весьма произвольными комбинациями отдельных анализируемых факторов, за последние 100 лет (т.е. с появлением анализа сапробности) получили широкое распространение при исследовании экосистем. Поскольку до сих пор не существует (да и не может существовать) универсального метода оценки экологического состояния, число предлагаемых расчетных индексов постоянно растет и уже к 2000 г. более 60 методик реферировал В.И.Баканов. При всем различии способов количественного выражения обобщенных индексов, их объединяет общий принцип: в основе каждого лежит представленный в виде некоторого экспертного обобщения анализ распределения натуральных показателей обилия организмов по градиенту загрязнения (например, по градиенту органических веществ в воде).

Обобщенные индексы (или комплексные критерии качества) являются, как правило, результатом произвольной математической операции над группой из p исходных показателей bj , j = 1, 2, …, p, описывающих тестируемый объект или их совокупность. Повсеместное распространение в экологии получила процедура тривиального суммирования, основанная на гипотезе аддитивности индивидуальных вкладов bj в комплексный показатель Ip и проводящая вычисление по одной из следующих формул:

  • простая сумма

(2);

  • взвешенная сумма

(3);

  • простое среднее

(4);

  • взвешенное среднее

(5),

где aj – заранее заданные весовые коэффициенты, оценивающие относительную важность j-го показателя в конструкции обобщенного критерия. В литературе при формировании индексов встречаются также мультипликативные модели (которые легко сводятся к аддитивным путем логарифмирования переменных), различные формульные конструкции из теории информации и т.д.

Представим ниже описание общего алгоритма построения комплексных показателей, используемого как в ЭС REGION, так и в частных гидробиологических базах:

Комплексные показатели, полученные таким образом, могут быть использованы непосредственно для визуализации (см. рис. 11) или ландшафтно-экологического районирования территорий.

1 – лучшее состояние; 4 – худшее состояние

В центре - "наилучшее" состояние по выбранным показателям, внешняя граница – "наихудшее" состояние по выбранным показателям.

Рис. 11. Оценка экологического состояния субъектов РФ на территории Волжского бассейна [Шитиков, Розенберг, Костина, 2005]

В ЭС REGION в соответствии с задачами исследования предусматривается многоуровневая свертка информации: на 1-м уровне для комплексации используются только исходные показатели, на 2-м уровне используются, как правило, обобщенные критерии 1-го уровня и т.д. Например, комплексный критерий экологического состояния (см. рис. 11) рассчитан на основе 13 частных обобщенных показателей более низкого уровня, описывающих уровень заболеваемость населения, биоразнообразие различных фаунистических групп, сельскохозяйственную нагрузку, образование токсичных отходов, оценку метеофакторов, использование водных ресурсов и их загрязнение, выбросы в атмосферу от стационарных источников и автотранспорта, лесистость, наличие заповедных территорий, затраты на природоохранную деятельность и т.д.

Ключевым методическим моментом в конструировании комплексных критериев качества экосистем является ответ на достаточно традиционные вопросы:

Способы взвешивания информативности частных показателей и процедуры их селекции при построении комплексных критериев основывались в работе на двух подходах: неформальном – с учетом знаний и опыта квалифицированных экспертов и формальном – на основе методов прикладной математической статистики.

Процедура многокритериального экспертного оценивания (МЭО), основанная на методах Дельфы, используется для принятия решений в плохо формализованных ситуациях. Для количественного задания весов эксперт опирается на свои представления о приоритетности каждой индивидуальной метрики, а также на литературные и нормативные данные. Например, чем меньше значение ПДК, тем выше значимость данного компонента и тем больший вес ему может придаваться. С использованием расчетных схем МЭО, комбинируя составом частных показателей и значениями взвешивающих коэффициентов, можно сформировать сколь угодно большое семейство обобщенных индексов, оценивающих степень влияния антропогенных факторов на устойчивость и биоразнообразие экосистем (самая большая трудность при этом - придумать им солидное название и фонетически благозвучную сокращенную аббревиатуру).

Экспертный подход был детально проработан, в частности, на примере бентофауны 41 малых и средних рек – притоков Куйбышевского и Саратовского водохранилища. Индекс плотности бентоса (ИПБ) рассчитывали как обобщенную средневзвешенную статистическую оценку в соответствии с формулой (5):

,

где p = 6 – количество обобщаемых показателей макрозоообентоса, – значения суммируемых признаков в баллах, – экспертные оценки (веса), оценивающие относительную важность каждого показателя. Интенсивность воздействия абиотических факторов на макрозообентоценозы оценивали с помощью индекса качества воды (ИКВ), полученного как обобщенная средневзвешенная оценка класса качества воды по гидрохимическим и микробиологическим показателям (ГОСТ 17.1.3.07–82) и индекса загрязнения воды ИЗВ.

Статистическая взаимосвязь между рассчитанными обобщенными показателями, представленная графиком на рис. 12, имеет высокий уровень значимости (p @ 0 по критерию Фишера, коэффициент корреляции r = 0.54) и может интерпретироваться линейным уравнением регрессии:

ИПБ = 4,43 – (0,401 ± 0,097)× ИКВ .

 

Рис. 12. Зависимость индекса плотности бентоса ИПБ от индекса качества воды ИКВ [Шитиков, Зинченко, 2005]

Математико-статистические методы оценки весов aj частных показателей основываются на известных алгоритмах факторного и регрессионного анализа. С формальной точки зрения имеется, по крайней мере, три основных принципиальных предпосылки, обусловливающих возможность практически “безболезненного” перехода от большего числа исходных показателей состояния (признаков) анализируемого объекта к существенно меньшему числу наиболее информативных переменных. Это, во-первых, дублирование информации, доставляемой взаимосвязанными показателями; во-вторых, низкая информативность показателей, мало меняющихся при переходе от одного объекта к другому (малая вариабельность показателя), в-третьих, возможность агрегирования, т.е. простого или взвешенного суммирования некоторых физически или информационно однотипных показателей.

Традиционным средством редукции данных за счет снижения количества анализируемых переменных является метод главных компонент. М.А. Новиков [2004] считает, что первая главная компонента отражает основную часть качественной оценки объектов, и предлагает использовать в качестве весов информативности aj исходных переменных при конструировании комплексных показателей коэффициенты факторных нагрузок cj1 в уравнении первой главной компоненты. Нам представляется более точным вести расчет коэффициентов aj в выражении (5) по формуле взвешенной евклидовой дистанции

.

(6)

где m – число информационно значимых главных компонент по критерию Кэттела; dk и ck min – доля объясненной общей дисперсии и минимальное значение k-й главной компоненты.

На этих принципах основан и другой метод синтеза комплексных показателей по разработанному нами алгоритму оценки расстояния до критического звена. Пусть, например, установлено, что на всем множестве объектов (в случае ЭС REGION - пространственно ограниченных участков территории) имеется "наихудший эталон" – многомерная точка, для которой по анализируемому набору исходных показателей имеют место наихудшие значения (из всех встретившихся) с точки зрения благоприятности условий окружающей среды. Тогда значение комплексного показателя для всех остальных точек может быть интерпретировано как функция расстояния от данного объекта до выделенного "наихудшего эталона".

Поскольку поиск "крайних точек" в многомерном пространстве является нетривиальной оптимизационной задачей, нами использовались различные эвристические алгоритмы. Например, по алгоритму "Свертка" [Шитиков, Розенберг, Костина, 2005] все подмножество обобщаемых показателей преобразуется к двум главным компонентам и многомерное облако объектов проецируется на факторную плоскость. Значение комплексного показателя до каждой анализируемой точки определяется по формуле (6) как взвешенное расстояние от смещенного начала координат.

Как показали исследования, более эффективным формальным методом оценивания весов aj по сравнению с факторным анализом является использование внешних признаков-классификаторов. Например, при оценке информативности биотических индексов лучше исходить не из особенностей внутренней ассоциативности таблицы показателей B, а из уровня коррелированности каждого частного показателя bj с классом качества вод Z. В этом случае ранжируется не абстрактная ценность показателя вообще, а конкретная чувствительность отклика по отношению к уровню загрязнения. Нами была отработана методика нахождения весов aj, оценивающих информативность частных метрик bi относительно некоторого результирующего показателя z экосистемы путем нормирования значимых коэффициентов модели множественной линейной регрессии [Шитиков, Зинченко, 2005].

 

5. Классификация экосистемных объектов и оценка их пространственной неоднородности

Основной вопрос, которым задается пользователь информационной системы (эколог-исследователь или лицо, принимающее решение в области планирования природоохранных мероприятий), формулируется следующим образом: "Возможно ли построить на имеющемся множестве данных сколько-либо разумную (естественную, полезную) систему отношений?" Поэтому значительное большинство разработанных нами статистических моделей, так или иначе, связано с классификацией.

Программное обеспечение созданных баз данных (см. рис. 1) предусматривает расчет в интерактивном режиме матриц сходства D классифицируемых объектов по широкому набору традиционных индексов (коэффициенты сходства по Жаккару, Съеренсену, Чекановского, евклидово и манхэттенское расстояние и проч.). Для реализации иерархической классификации и построения дендрограмм (см. пример на рис. 13) использовались как собственные модули, так и средства ППП Statistica 6.0.

Рис. 13. Дендрограммы классификации административных территорий Волжского бассейна по 15 обобщенным показателям с использованием метода Уорда (ось Y – манхеттенское расстояние, условные обозначения территорий: Астраханская – AS; Башкирия – BA; Ивановская – IV; Ярославская – JR; Калужская – KA; Кировская – KI; Костромская – KO; Марийская – MA; Московская – MO; Мордовия – MR; Нижегородская – NN; Пензенская – PE; Пермская – PR; Рязанская – RJ; Самарская – SA; Саратовская – SR; Татарстан – TA; Чувашия – TH; Тульская – TU; Тверская – TV; Удмуртия – UD; Ульяновская – UL; Владимирская – WL; Волгоградская – WO)
[Шитиков, Розенберг, Костина, 2005]

Метод иерархической классификации дает взаимную предупорядоченность объектов в пространстве признаков, однако, не позволяет сделать содержательных объяснений специфических закономерностей формирования фаунистических сообществ. Кроме того, при расчете меры сходства по Съеренсену для особей каждого вида учитывается только их наличие или отсутствие в отобранных пробах, т.е. как виды, характерные для сообщества, так и случайные для него, получают одинаковый статус, что значительно обесценивает степень адекватности матрицы сходства и получаемых кластерограмм. Поэтому для анализа пространственной ординации экосистемных объектов нами широко использовались методы целенаправленного проецирования в пространство малой размерности (в зарубежной литературе – projecting pursuit). Такой подход обеспечивает наглядное представление геометрической метафоры данных и заключается в следующем: найти такое отображение U (способ проецирования) из исходного пространства на двумерную плоскость, которое бы оптимизировало заданный критерий качества Q – некоторый функционал от координат точек данных до и после процедуры проецирования: Q(U,B). Здесь под B понимается исходный набор многомерных данных, а Q зависит от параметров отображения U.

Если облако анализируемых объектов ″похоже″ на выборку из генеральной совокупности, подчиненной закону нормального распределения, то нами использовалась процедура ортогонального проецирования (метод главных компонент). В этом случае способ проецирования U известен заранее и является линейным отображением исходных данных на плоскость.

Для проецирования малых рек Самарской области методами факторного анализа при описании контрольных створов нами использовались показатели таксономического обилия отдельных групп сообществ макрозообентоса, индексы биоразнообразия и обобщенные показатели биоэнергетического баланса (траты на обмен, продукция, ассимиляция и рацион бентонтов, населяющих каждый биотоп). На рис. 14, полученном в результате преобразования всего комплекса измерений к двум главным факторам, наглядно видно, что, например, в верховье р.Чапаевка тяготеет к относительно чистым и биопродуктивным рекам области, таким, как Сок, Б.Кинель, в то время, как низовья отличаются сильным угнетением биомассы и видового разнообразия зообентоса, превзойдя в этом отношении такие грязные реки, как Уса, Черемшан, Маза.

Рис. 14. Отображение малых рек Самарской области в пространстве двух главных компонент по результатам отбора проб макрозообентоса [Шитиков, Зинченко, 1997]

Задача районирования гидроэкологических объектов (станций, створов, участков, рек и т.д.), выполняемая описанными методами иерархической кластеризации или факторного анализа, существенно ограничивается особенностями детерминационного подхода к интерпретации таблиц наблюдений, каждая строка которой принимается за самостоятельную классификационную единицу. Поскольку отсутствуют методики адекватного "усреднения" подмножества проб одной станции, то для проведения группировки объектов необходимо по каждому из них отобрать только одну пробу, которая, по субъективному мнению исследователя, наилучшим образом отражает гидробиологические особенности данного биоценоза. Если на станции было сделано более, чем одно измерение, то остальные пробы должны игнорироваться.

Для преодоления упомянутых ограничений нами были разработаны вероятностные методы оценки расстояний между объектами, которые, в отличие от детерминационных формул мер сходства (например, коэффициента Съеренсена), позволяют обрабатывать весь массив исходных данных, допускают наличие ошибок и неполноту знаний о сравниваемых объектах и оперируют с плотностью распределения вероятностей исходных переменных. При этом было показано, что наилучшей оценкой расстояния между центрами тяжести двух областей с векторами средних значений m(X1) и m(X2) соответственно является обобщенное расстояние Махалонобиса.

Для решения задачи целенаправленного проецирования нами на первом этапе на основе полного исходного множества показателей и объектов формировались матрицы D, составленные из значений обобщенного расстояния Махалонобиса или T-критерия Хоттелинга. На втором этапе для двухмерной визуализации объектов классификации использовался алгоритм многомерного шкалирования данных, основанный, как и факторный анализ, на редукции матриц расстояния D (см. пример на рис. 15). Существенным преимуществом многомерного шкалирования, который минимизирует меру искажения взаимных расстояний между точками в исходном и результирующем пространстве отображения, является независимость метода от особенностей статистического распределения исходных показателей и возможность работы с любыми матрицами оценок удаленности объектов друг от друга.

Рис. 15. Отображение станций р. Сок в пространстве двух шкал, полученных с использованием T-статистики Хотеллинга [Шитиков, Розенберг, Зинченко, 2005]

Эффективным способом глубокого анализа структуры исходных данных и редукции пространства с учетом неортогональных искажений осей максимальной вариации является нелинейный вариант метода главных компонент, основанный на применении автоассоциативных нейронных сетей. Для того чтобы осуществить нелинейное понижение размерности исходной матрицы из 15 обобщенных показателей по областям Волжского бассейна, использовали пятислойную сеть, средний (третий) слой, которой служит для уменьшения размерности, а соседние с ним слои, отделяющие его от входного и выходного слоев, выполняют нелинейные преобразования. Двухмерная визуализация классифицируемых объектов в осях полученных главных факторов, представленная на рис. 16, в целом сохраняет основную пространственную ординацию территориальных единиц Волжского бассейна, полученную в ходе кластерного анализа (см. рис. 13). Некоторую имеющую место модификацию пространственного расположения точек можно объяснить учетом нелинейных искажений исходного пространства переменных.

Рис. 16. Отображение территориальных единиц Волжского бассейна в пространстве двух главных факторов, полученное методом нейросетевого моделирования (обозначения - см. на рис. 13) [Шитиков, Розенберг, Костина, 2005]

Мощным инструментом ординации объектов являются также самоорганизующихся карты Т.Кохонена (SOM – Self-Organizing Maps), объединяющие в себе две основные парадигмы анализа – кластеризациию и проецирование, т.е. визуализацию многомерных данных на плоскости. В силу адаптивности и самоорганизации нейронной сети, не требующей предварительной калибровки данных, а также устойчивой к шумам и искажениям, SOM позволяют наиболее адекватно выявить структуру экосистем с учетом всей совокупности данных.

Рассмотрим технологию анализа самоорганизующихся карт на примере обработки выборки из 88 наблюдений, выполненных на 15 станциях р. Сок. В качестве конкретных признаков, описывающих эти измерения, использовали показатели обилия по 6 основным таксономическим группам хирономид, а также индексы Шеннона, Вудивисса и Пареле. На рис. 17 представлена серия карт Кохонена для рассматриваемого примера, сформированная в результате обучения самоорганизующейся сети с выходным топологическим слоем 10х10 ячеек. Каждая карта представляет собой отображение выходного слоя нейронов, расположенных в узлах двумерной координатной сетки с шестиугольными ячейками.

Карта а). Области кластеров

Карта б). Частоты выигрышей

Карта в). По станциям

Карта г). Индекс Вудивисса

Карта д). Обилие Prodiamesinae

Карта е). Обилие Tanypodinae

 

Рис. 17. Топологические карты Кохонена для комплекса проб макрозообентоса, сделанных на р. Сок [Шитиков, Розенберг, Зинченко, 2005]

Для визуализации карт применяли градации серого цвета, т.е. чем больше значение отображаемого показателя, тем темнее прорисовывается связанный с ним узел. Полученный набор раскрасок может использоваться для анализа закономерностей, имеющихся между компонентами набора данных. Представленные на рис. 17 карты Кохонена могут быть интерпретированы следующим образом.

  1. Карта а) описывает унифицированную матрицу расстояний между каждым нейроном и его ближайшими соседями. Узлам, резко контрастирующим со своей окрестностью, соответствует черный цвет, а участкам, носящих характер "сглаженного плато", – белый. Группу ячеек, расстояние между которыми внутри этой группы меньше, чем расстояние до соседних групп, определим как кластер. В данном случае было задано разбиение топологической карты на 5 кластеров.
  2. С каждым произвольным измерением обучающей или контрольной выборок связывается "нейрон-победитель", т.е. нейрон выходного слоя, имеющий максимальную близость в смысле некоторой функции расстояния. На карте б) представлена матрица частот выигрышей, которая показывает, сколько раз каждый элемент выиграл (т.е. оказывался ближайшим к обрабатываемому наблюдению) после тестирования всех 88 примеров обучающей выборки. Если узел выигрывал два раза, то он окрашен в черный цвет. Ввиду того, что количество измерений меньше числа элементов решетки сети, то некоторые узлы оказались незадействованными и окрашены в белый цвет. Большие значения частот выигрышей указывают на центры кластеров топологической карты.
  3. Карты в)-е) представляют собой проекции матрицы расстояний на ту или иную переменную исходной таблицы. На карте в) более темным цветом окрашены узлы, связанные с наблюдениями на станциях, расположенных ближе к устью. Можно отчетливо увидеть, что измерения, сделанные в верховьях, попали в кластеры 3 и 5, в то время, как станции, расположенные ниже по течению, сконцентрировались в кластерах 1 и 4.
  4. Темным цветом на карте г) представлены измерения с наибольшим значением индекса Вудивисса. Хотя распределение этого показателя существенно размыто, определенное его превышение можно усмотреть в кластерах 4 и 5.
  5. На картах д) и е) можно ясно оценить, как изменяется видовой состав индикаторной части хирономидного комплекса: если в кластере 3, который мы связываем с верхним течением, сравнительно велико обилие реофильных представителей подсемейства Prodiamesina, то для 4-го кластера, где больше устьевых измерений, отчетливо увеличивается удельный вес пелофильных видов подсемейства Tanypodinae.

В положениях, описанных выше, мы использовали понятие карта в широком смысле, определив его, как ограниченное двумерное многообразие, вложенное в многомерную область данных таким образом, чтобы минимизировать меру искажения взаимных расстояний между точками в исходном и результирующем состоянии. Т.е. нас интересовала только информационная предупорядоченность экосистемных объектов без привязки их к географическим координатам. Развитие ГИС-технологий и возможность открытого интерфейса с модулями распространенных ГИС-программ (Surfer, MapInfo) создали предпосылки широкого использования алгоритмов моделирования пространственного распределения произвольного показателя в точных координатах x-y.

Задача моделирования территориально распределенного показателя формулируется как переход от исходного набора Z данных в хаотически расположенных экспериментальных точках наблюдений к значениям аппроксимирующей функции Zp для любого узла некоторой регулярной сетки заданной разрешающей способности (т.е. фактически к непрерывной поверхности). Координата z этой моделируемой поверхности, например, для экологических объектов соответствует математическому ожиданию популяционной плотности в точке x-y. Формирование сеточной поверхности реализуется сглаживающими интерполяционными программами, которые, как правило, определяют оптимальную сеть весов, с помощью которых взвешиваются значения функции в точках наблюдений при построении моделируемой поверхности.

Одной из задач настоящей работы явилась разработка гибкого информационного интерфейса баз данных с модулями типовых ГИС-программ для создания автоматизированного комплекса, выполняющего построение и численный анализ математической модели для визуализации экологических ситуаций территориально-распределенных объектов с помощью процедур изолинейного моделирования. В качестве примера на рис. 18 представлено пространственное распределение численности Cyclopodia (среднее за 1957-1984 гг) на фрагменте территории Куйбышевского водохранилища, а на рис. 19 - распределение индекса загрязнения вод (ИЗВ) по профилю оз. Чистое в районе Васильевских озер г.Тольятти.

Рис. 18. Пространственное распределение численности Cyclopodia на фрагменте территории Куйбышевского водохранилища по результатам наблюдений 1957-1984 гг.

Рис. 19. Распределение химического загрязнения воды оз. Чистое по горизонтам в летний период 2002 г., оцениваемое по индексу загрязнения воды

При эколого-географическом районировании выделение однородных участков территорий требует учета большого числа параметров, характеризующих все природные компоненты. Поэтому фундаментальной проблемой картографического моделирования и геоинформатики является формирование комплексных (синтетических - synthetic map) карт, которые создаются обычно путем обобщения достаточно большого числа исходных показателей, численно распределенных по координатной сети анализируемой территории. Выделяются [Jenks, Caspall, 1971], как минимум, три цели, для которых может использоваться синтетическая карта:

Этими авторами был разработан алгоритм районирования территории методом естественных границ, позволяющий минимизировать дисперсию признаков в пределах каждого региона. На рис. 20 представлен пример пространственного районирования территории Куйбышевского водохранилища по совокупности 11 показателей качества воды.

Рис. 20. Схема комплексного районирования акватории Куйбышевского водохранилища по 10 гидрохимическим и гидрофизическим показателям (средне-многолетние наблюдения 1957-1986 гг.) [Шитиков, Выхристюк, Паутова, Зинченко, 2006].

Несмотря на широкий набор используемых интерполяционных методов (линейной триангуляции, радиальных базисных функций, вариограмм Криге, обратного расстояния Шепарда, минимальной кривизны, полиномиальной регрессии и др.), выбор конкретного алгоритма, обеспечивающего наилучшую пространственную аппроксимацию, представляет собой трудно формализуемую процедуру. Поэтому дополнительным аргументом, позволяющим уточнить границы районов загрязнений, является подтверждение результатов изолинейного моделирования закономерностями, полученными при точечном проецировании станций. Например, ординация станций (рис.21), полученная методом главных компонент по данным измерений до 1981 г., легко аппроксимируется прямой, на которой точки соединены в том порядке, в котором они следуют друг за другом на акватории водохранилища сверху вниз. После 1981 г. конфигурация таксономической структуры станций Волжского плеса несколько изменилась в результате ввода в строй Новочебоксарской ГЭС.

Рис. 21. Проекция таксономической структуры точек наблюдения Куйбышевского водохранилища на плоскость двух главных компонент (- по гидробиологическим и гидрохимическим данным за 1958-1981 гг., - по тем же показателям за последующий период); стрелки графа соответствуют направлению движения водных масс; местоположение и обозначение станций представлено на рис. 20 [Шитиков, Выхристюк, Паутова, Зинченко, 2006].

 

6. Моделирование причинно-следственных связей в экосистеме

Любая экологическая система представляет собой большой, сложный, слабо детерминированный и эволюционирующий объект исследования. Поэтому важной составной частью интеллектуальных технологий для построения прогнозов изменения состояния экосистемы или "качества" окружающей среды является анализ причинно-следственных связей между эмпирическими индивидуальными и комплексными показателями. Традиционно для решения этой задачи используется аппарат корреляционного и регрессионного анализа (пример графа минимального дендрита, описывающего тесноту корреляционных связей между абиотическими и гидробиологическими факторами, представлен на рис. 22).

Рис. 22. Граф максимальных корреляционных связей между гидробиологическими и абиотическими факторами на Приплотинном плесе Куйбышевского водохранилища по наблюдениям численности и биомассы простейших (Nпр и Bпр), водорослей (Nвод и Bвод), бактерий (Nбак и Bбак), зоопланктона (Nбесп и Bбесп), почвенных микромицетов (Nгр), температуры (t), электропроводности (Элп), pH и Eh воды, растворенного кислорода (О2), общей взвеси (Взв), азота (Nобщ) и фосфора (Робщ), ионов PO4, NO3, NO2, NH4 в августе 1991 г. [Терехова, Семенова, Шитиков, 1998]

Как отмечалось В.Н.Максимовым с соавторами [1999], специфика экологических показателей связана с большой "зашумленностью" эмпирических рядов и сильной ассиметрией законов их распределения. Это делает не всегда адекватным применение модулей регрессионного анализа, предлагаемых стандартными пакетами прикладных программ. Нами в течение длительного времени проводилась отработка робастных методов построения моделей регрессии, мало чувствительных к статистическим выбросам и учитывающих нелинейный характер связей путем предварительного функционального расширения исходного пространства переменных.

Исходные показатели вносят различный вклад в объяснение и прогнозирование анализируемого отклика и могут быть разбиты на две категории: информативные переменные, существенные для решения поставленной задачи, и незначимые переменные, несущие мало дополнительной информации для нахождения искомой зависимости. Поэтому основной проблемой регрессионного анализа является включение в модель (1) минимального подмножества переменных, без существенных потерь объясняющих имеющийся статистический разброс. Отбор таких переменных осуществляли с использованием различных секвенциальных (последовательных) процедур [Эфроимсон, 1960; Лиепа, 1978], осуществляющих "отбраковку" признаков с использованием различных статистических критериев. В итоге с заданной надежностью из полной матрицы стандартизированных нормальных уравнений выбирается наилучшая невырожденная подматрица, т.е. формируется модель наиболее оптимальной структуры.

В ходе исследования проведено построение большого количества регрессионных моделей, прогнозирующих обилие биотических компонент в зависимости от факторов окружающей среды, например, численности микромицетов на Приплотинном плесе Куйбышевского водохранилища (обозначения см. на рис 21):

Nгр = 34.4 + 12.9 Робщ + 43.4 NO3 - 76.9(NO3)0.5 + 1.13 Взв - 5.86 (Взв)0.5 - 10.3/ О2 + 0.0041 Nбак - 0.181(Nбак)0.5 + 0.296 Nбесп - 0.072(Nбесп)0.5 + 5.92 ln(Nбесп) - 0.072 (Bбесп)0.5 + 24.31/( Bпр)0.5 - 15.5/ Bвод ;

характеристики модели - коэффициент корреляции Rмнож = 0.95, критерий Фишера для оценки уровня значимости F = 40.4, p @ 0.

Возможно и решение обратной задачи, если в качестве отклика использовать тот или иной параметр среды. Тогда, например, легко провести отбор групп гидробионтов, чувствительных к тому или иному гидрохимическому показателю (см. табл. 2 - пример для численности групп макрозообентоса малых рек Самарской области).

Таблица 2. Коэффициенты регрессионных моделей, связывающих гидрохимические показатели и относительную численность групп макрозообентоса при n измерений и m – количестве проанализированных таксономических групп [Шитиков, Розенберг, Зинченко, 2005]

Гидрохимические показатели

Коэффици-енты уравнения

Наименования таксономических групп зообентоса, относительные численности которых включены в модель

Частный F- критерий селекции

Фосфор минеральный

(n = 126,

m = 66)

0.143

Свободный член

-

0.7

Сестоно-детритофаги фильтраторы / Unionidae

21.39

- 0.434

Хищники хвататели / Tanypodinae

17.66

- 0.599

Хищники хвататели / Limoniidae

6.66

- 0.3

Всеядные собиратели+хвататели / Chironomini

8.24

- 0.233

Сестоно-детритофаги фильтраторы / Bivalvia

6.71

- 0.846

Сестоно-детритофаги фильтраторы / Gastropoda

2.92

-1.38

Сестоно-детритофаги фильтраторы / Simuliidae

3.67

- 0.77

Фитодетритофаги собиратели / Psychodidae

2.93

Азот аммоний-ный

(n = 90,

m = 61)

0.276

Свободный член

 

11.422

Хищники хвататели / Megaloptera

31.63

0.362

Детритофаги собиратели / Chironomini

5.21

- 0. 974

Всеядные собиратели+хвататели / Nematoda

6.56

0.461

Детрито-фитофаги / Tanytarsini

4.68

0. 445

Детрито-фитофаги / Chironomini

3.85

- 0. 797

Хищники хвататели / Tanypodinae

6.28

-1. 277

Фитодетритофаги собиратели / Ephydridae

5.84

- 0.251

Детритофаги собиратели / Oligochaeta

4.72

- 0.445

Хищники хвататели / Prodiamesinae

2.54

Теория самоорганизации моделей показывает, что экологические объекты, как и огромное большинство других объектов и процессов природы, могут быть описаны, например, в виде полиномов высокой степени, являющихся частным случаем обобщенного полинома Колмогорова – Габора:

.

(7)

Основная задача моделирования сложных систем на основе структурных уравнений причинно-следственной связи заключается в том, чтобы вычеркнуть в полиноме (7) подмножество ″лишних″ неинформативных коэффициентов и сохранить необходимое и достаточное сочетание объясняющих членов. Сложность синтезированной модели будет оптимальной, если необходимая адекватность обеспечивается при минимальном количестве составляющих ее элементов [Эшби, 1959].

Интеллектуальным обобщением регрессионного анализа является метод группового учёта аргументов – МГУА (Group Method of Data Handling, GMDH), который можно рассматривать как своеобразное связующее звено, объединяющее различные методологические концепции, представленные как классической параметрической статистикой, так и современными методами искусственного интеллекта. В работе нами использовался авторский программный модуль, реализующий общую схему многорядного алгоритма МГУА с частными описаниями в виде нелинейной функции двух переменных и осуществляющий оптимизацию длины частного описания на каждом шагу селекции.

Рассмотрим в качестве примера самоорганизацию по МГУА зависимости между комплексным показателем заболеваемости населения (отклик) и 11 индивидуальными показателями из базы REGION-VOLGABAS. Наилучшая модель (М6) была получена на 6-м ряду селекции по максимуму коэффициента корреляции на примерах проверочной последовательности и имела вид:

Y = -0.00352 + 0.702 u1 + 0.304 u2,

где промежуточные переменные u1 и u2 могут быть вычислены по частным описаниям 5-го ряда селекции:

u1 = 0.0517 - 0.663 v1 + 1.567 v7 ,
u2 = 0.0304 - 0.639 v2 + 1.589 v7 .

Частные описания на остальных промежуточных рядах селекции имеют вид:

4-м ряду:

v1 = - 0.00579 + 0.037 z1 +0.974 z2;

v2 = 0.144 - 0.0768 z2 - 0.057 z4 + 1.485 z2Ч z4;

v7 = 0.184 + 1.256 z7 - 1.5 z8 - 0.489 z7Ч z8 + 1.97 z82;

3-м ряду:

z1 = - 0.027 + 0.546 y1 + 0.505 y7;

z2 = 0.0726 + 0.02 y2 + 0.161 y8 + 1.187 y2Ч y7;

z4 = - 0.047 + 0.56 y4 + 0.523 y2 ;

z7 = - 0.048 + 0.304 y7 + 0.786 y2 ;

z8 = 0.204 - 0.186 y8 - 0. 49 y4 + 2.275 y8Ч y4 ;

2-м ряду:

y1 = - 0.0526 + 0. 195 x1 + 0. 903 x5 ;

y2 = - 0.0297 + 0. 215 x2 + 0.41 x5 + 0.775 x2 Ч x5 ;

y4 = - 0. 303 + 0. 761 x4 + 10.804 x7 ;

y7 = x6 ;

y8 = 0.00185 + 0.299 x8 + 0. 108 x5 + 1.046 x8 Ч x5 .

И, наконец, на 1-м ряду селекции появляются исходные переменные:

x1 = 0.596 + 0.00561 (E_VP) - 2.589 (Z_AA) ;
x2 = 0.797 - 21.03 (E_PE) - 2.23 (Z_AA);
x4 = - 0.145 + 0.0726 (C_MU) + 0.00945 (Z_SV) - 0.00276 (C_MU) (Z_SV) ;
x5 = 0.696 - 0.00595 (Z_SV) + 0.453 (Z_AA) + 0.191 (Z_SV) (Z_AA) - 41.35 (Z_AA)2 ;
x6 = 0.397 - 0.00063 (Z_KP) + 4.1 (Z_AA) + 0.373 (Z_KP) (Z_AA) - 39.54 (Z_AA)2 ;
x7 = 0.3012 + 17.9 (Z_AA) - 371.92 (Z_AA)2 ;
x8 =.0.479 + 0.983 (Z_TO) + 0.905 (Z_AA) - 41.29 (Z_TO) (Z_AA) + 0.074 (Z_TO).

По 6-рядной модели самоорганизации трудно судить, какой конкретно вклад вносит каждая из исходных переменных. Можно лишь констатировать их наличие (или встречаемость) в частных описаниях с помощью следующей структурной таблицы, обозначившей приоритетное влияние на здоровье населения выбросов от автомобильного транспорта:

Наименование

Шифр

Встреча-емость

Валовый региональный продукт, млн.руб./чел.

E_VP

1

Производство электроэнергии, млн.кВт в час/чел.

E_PE

1

Внесение минеральных удобрений, кг/га

C_MU

1

Сброс загрязненных сточных вод, куб.м/чел.

Z_SV

2

Удельный вес проб, не отвечающих гигиеническим нормативам по санитарно-токсикологическим показателям

Z_KP

1

Суммарные выбросы в атмосферу загрязняющих веществ, т/чел.

Z_VA

1

Выбросы в атмосферу от автомобильного транспорта, т/чел.

Z_AA

6

Образование токсичных отходов, т/чел.

Z_TO

1

Интеллектуальным расширением разработанных баз данных в области использования эволюционных алгоритмов и методов нейросетевого моделирования является информационный интерфейс с универсальной программой нейросетевого анализа Statistica Neural Networks. Это дало возможность эффективно решать задачи регрессии с помощью сетей различных типов: многослойного персептрона, линейной сети, радиальной базисной функции и обобщенной регрессионной сети. Детальный обзор полученных результатов представлен в публикациях [Шитиков, Зинченко, Головатюк, 2002; Шитиков, Розенберг, Зинченко, 2005]. Как показал эксперимент [Шитиков, Розенберг, Костина, 2005], точность аппроксимации и способность к экстраполяции данных с помощью нейронной сети существенно превосходят результаты, полученные регрессионными моделями (модели МГУА при этом занимают промежуточное положение).

Представляет значительные методологические сложности анализ причинно-следственной связи двух пространственно распределенных показателей, которая выражается в совпадении или противоположной направленности тенденций их изменений и одинаковом характере стохастической составляющей e xy. Если такая идентичность имеет устойчивый характер и наблюдается на значительном участке водоема (или площади территории), то показатели считаются коинтегрированными, а это подтверждается высоким значением коэффициента парной корреляции между ними. Однако, во-первых, оценка корреляции может быть занижена вследствие "фазового сдвига воздействия фактора": например, прирост площади водосбора может оказать влияние на гидробиологическую ситуацию не на текущей станции, а на следующей станции ниже по течению (здесь тенденция одинакова, но корреляция мала). Во вторых, на различных участках анализируемой территории совместная динамика двух показателей может коренным образом меняться: быть однонаправленной, нейтральной и разнонаправленной, что не может быть учтено обычным корреляционным анализом. Дополнительные возможности для анализа коинтеграции предоставляет топографическое моделирование, основанное на анализе геометрических поверхностей в координатах xyz (см. раздел 5).

Для каждого узла на этой поверхности можно провести касательную плоскость и определить различные топографические составляющие: наибольший наклон по отношению к оси z нормали к касательной плоскости, градиентное направление по осям x и y, кривизну профиля в этой точке и т.д. Если рассматривать цифровые модели двух пронормированных (от 0 до 1) показателей, то представляет значительный интерес функция косинуса угла между нормалями к обеим поверхностям cos(zp1, zp2), который изменяется от 1, когда поверхности одинаково ориентированы в пространстве, до 0, когда топографические уклоны перпендикулярны. Геометрические интерпретации позволяют рассматривать cos(zp1, zp2) как пространственно-распределенный коэффициент корреляции между показателями zp1 и zp2 [Яцишин, 2005].

На рис. 23 легко проследить сходство и различие совместной пространственной динамики изменения площади сбора и индекса Вудивисса по профилю течения р.Чапаевка: наиболее тесная корреляция между ними наблюдается в верхнем и среднем течении (ст. 3-12) и в устье (ст. 22-23), когда как на других участках гидробиологическую ситуацию определяют уже не геоморфологические параметры поверхностного стока, а, например, интенсивное точечное техногенное загрязнение сточными водами в районе ст. 16-20.

Рис. 23. Тенденции изменения геоморфометрических и гидробиологических показателей по станциям р.Чапаевка от истоков к устью и значения косинуса угла (график вверху) между нормалями к кривым, аппроксимирующим эти тенденции

Важнейшей прикладной задачей количественной гидроэкологии является прогнозирование класса качества вод (например, по ГОСТ 17.1.3.07–82), который является порядковой переменной от 1 до 6. Другой формой этой задачи является оценка значения альтернативной переменной 0 или 1 ("чисто" или "грязно"). Регрессионный анализ, выполняющий прогноз непрерывного значения отклика, дает в этом случае неадекватные результаты.

Нами для построения подобных моделей классификации "с учителем" использовались как достаточно известные стандартные методы логистической регрессии и дискриминантного анализа, так и инструментарий искусственного интеллекта, разработанный в последние десятилетия.

Формирование моделей логистической регрессии с альтернативным откликом дали возможность выделить таксономические группы сообществ макрозообентоса, являющиеся лучшими биоиндикаторами. Расчеты показали, что приоритетными индикаторами "чистой воды" с классом качества менее 3 являются Ephemeroptera, Amphipoda, Coleoptera, Crustacea и триба Tanytarsini семейства Chironomidae. Достоверная связь обратного характера (индикация "грязной воды") определена для организмов Oligochaeta и Odonata. Рассчитанные коэффициенты уравнения логита дают возможность оценить альтернативу "чисто/грязно" для качества вод по обилию групп макрозообентоса в пробе с точностью 80.5% (правильно опознано 418 проб из 520).

Эффективный автоматизированный подход к выбору значимых входных переменных реализуется с использованием позаимствованного у природных аналогов генетического алгоритма [Goldberg, 1989], который является ярким представителем методов искусственного интеллекта и представляет собой мощное поисковое средство, основанное на трех компонентах:

Нами была проведена реализация генетического алгоритма для выбора наиболее информативных биоиндикационных групп макрозообентоса в тех же условиях, что и логит-анализ. Процесс эволюции продолжали на протяжении 100 поколений, при этом в поисках оптимального набора "генов" было построено и оценено 10000 версий нейросетевых моделей, и, в соответствии с найденным субоптимальным решением, 22 семейства организмов зообентоса из 49 было отнесено к малоинформативной категории. Наилучшими таксонами-биоиндикаторами были признаны Ephemeroptera, Oligochaeta, трибы Tanytarsini и Orthocladiinae семейства Chironomidae.

За последние 20 лет бурное развитие при моделировании сложных процессов и систем получили нейросетевые методы, использующие идеи искусственного интеллекта. В основе нейросетевого подхода [Горбань, 1990] лежит идея построения вычислительного устройства из большого числа параллельно работающих простых элементов (формальных нейронов), которые функционируют независимо друг от друга и связаны между собой каналами передачи информации. Каждый отдельный нейрон моделируется простой функцией (обычно - логистической), но совокупная высокая сложность модели, гибкость ее функционирования и другие важнейшие качества определяются структурой связей и многоуровневой иерархией всей сети.

На вход нейронной сети, сформированной нами для прогнозирования категории качества воды (в тех же условиях, что и логит-анализ), подавались значения обилия 27 таксономических групп макрозообентоса, отобранных генетическим алгоритмом. Наилучшая сеть, конфигурация которой представлена на рис. 24, была настроена методом оптимизации Левенберга-Маркара с оценкой качества по информационному критерию (оценка энтропии). Взвешенные линейные комбинации функций преобразования элементов промежуточного слоя, состоящего из 14 ассоциативных нейронов, определяют сложность сети и формируют логическое высказывание в виде некоторого значения апостериорной вероятности на интервале от 0 до 1.

Рис. 24. Схема многослойного персептрона для оценки категории качества воды по обилию групп зообентоса [Шитиков, Зинченко, Головатюк, 2002]

Полученная искусственная нейронная сеть обладает отменными интерполяционными и экстраполяционными свойствами: вероятность правильного прогноза на обучающей выборке (400 проб зообентоса) составила 99.3%, на контрольной выборке (120 проб, не участвовавшей в построении сети) - 92%, что существенно превышает результаты пробит-анализа.

Решение задачи классификации с порядковым значением отклика (класс качества вод от 2 до 6) также осуществлялось нами как традиционными статистическими методами, так и с использованием концепций искусственного интеллекта. Обучающая выборка состояла из 520 измерений проб зообентоса, а в качестве девяти варьируемых переменных использовались различные обобщенные гидробиологические показатели и традиционные "интегральные" индексы (см. рис. 25)

Рис. 25. Нейронная сеть для прогнозирования пяти классов качества воды по макрозообентосу [Шитиков, Зинченко, Головатюк, 2002]

При использовании упорядоченного множественного пробит-анализа оценка уровня значимости коэффициентов модели показала, что достоверно связаны с классом качества лишь число видов в пробе, биотический индекс Вудивисса (обратная зависимость) и олигохетный индекс (прямая зависимость). Достоверность оценки выделенных классов при использовании пробит-уравнения оказалась не вполне адекватной: правильный прогноз составил 43.65%, а ошибка на два и более класса имела место в 14.6% случаев (для сравнения упомянем, что вероятность правильного случайного угадывания из 5 альтернатив составляет 20%). Немного лучше оказались результаты использования на той же выборке методов стандартного дискриминантного анализа (ППП Statistica 6.0): правильный прогноз класса качества составил 51.5%, а ошибка на два и более класса зафиксирована в 14.0% случаев.

Для непосредственной оценки класса качества водоемов в виде числа от 2 до 6 была построена искусственная нейронная сеть - персептрон с одним промежуточным слоем, архитектура которого представлена на рис. 25. Впрочем, несмотря на всю мощь нейросетевого моделирования, существенного увеличения эффективности прогнозирования достичь не удалось: правильная оценка прогноза класса качества была 53.3%, а ошибка на два и более класса составила 12.6%. Это подтверждает распространенное мнение о неполной адекватности использования "интегральных индексов" для целей биоиндикации.

Представляют также интерес предпринятые нами попытки классификации наблюдений с использованием иерархических деревьев решений (Tree Analyzer), которые позволяют свести исходную матрицу данных к набору простых правил, представленных в виде иерархической структуры – дерева. Этот метод моделирования сочетает мощный аналитический аппарат генерации решений с простотой использования технологии и интуитивно понятными конечными результатами.

По более сокращенной выборке (167 проб), включающей индексы, представленные на рис. 25, а также концентрацию минерального фосфора и тип водоема (значения от 1 до 5 в зависимости от ширины русла и скорости течения) было построено два варианта деревьев решений. "Компактное" дерево, представленное на рис. 26, состоящее только из 8 узлов, в основе логических правил которых лежит всего 3 исходных признака, предназначалось для "объяснения и показало посредственные результаты в прогнозировании (38.4% ошибок).

Рис. 26. Дерево решений, построенное для классификации качества вод с использованием процедур отсечения ветвей и упрощения [Шитиков, Розенберг, Зинченко, 2005]

Полное дерево, построенное без применения излишне жестких мер по обрезанию ветвей, использовало все предикторные переменные и гораздо сложнее в интерпретации. Однако громоздкость сформированных правил компенсировалось великолепными интерполяционными свойствами дерева: на обучающей выборке зафиксировано только 9 ошибок классификации, что составляет 7.6%.

 

7. Методы анализа видовой структуры сообществ

Специалистами-экологами [Алимов, 2000; Шуйский с соавт., 2004] постоянно подчеркивается, что видовой состав является наиболее важной биоиндикационной характеристикой, поскольку непосредственно определяется условиями окружающей среды и существенно влияет на все остальные количественные ценотические показатели. Сохранение видового состава гарантирует обратимость любых экзогенных изменений в экосистеме, а исчезновение комплекса характерных видов, наоборот, свидетельствует о том, что возникла угроза необратимых изменений в сообществе и утраты его способности к саморегуляции. В таком неустойчивом состоянии может быть запущен опасный процесс антропогенной сукцессии, способный в итоге полностью разрушить экосистему и вызвать резкое ухудшение качества среды.

В рамках настоящей работы решались следующие фундаментальные проблемы:

Общий подход к решению первой проблемы концептуально мало отличается от методологии классификации "с учителем", подробно представленной в разделе 6. Однако признаковое пространство видов имеет ряд особенностей: таблицы данных представляют собой обширные, сильно разреженные матрицы большой размерности, заполненные в основном нулями. В этих условиях применение для оценки причинно-следственных связей методов математической статистики, основанных на стандартном анализе дисперсий и ковариаций, часто оказывалось малоэффективным. Представляет значительный интерес использование для этой цели методов распознавания образов, которые предоставляют исследователям разнообразные методы восстановления неизвестной зависимости по многомерным эмпирическим данным. К таковым относится, в частности, алгоритм обобщенного портрета [Вапник, Червоненкис, 1974].

Исходными данными явилась обучающая выборка, состоящая из двух конечных множеств наблюдений, для которых заранее установлена принадлежность к одному из двух классов "Чрезвычайная экологическая ситуация [ЧЭС] или грязно" (90 строк) и "Относительно удовлетворительная ситуация [ОЭС] или чисто" (70 строк). Список признаков (или спецификацию столбцов таблицы данных) составили 166 видов хирономид из проб макрозообентоса на малых реках Самарской области.

Расчеты по алгоритму обобщенного портрета выполнялись следующим образом. Методами нелинейного программирования искалась оптимальная разделяющая гиперплоскость, которая ориентируется в пространстве признаков таким образом, чтобы проекции выпуклых оболочек точек классов "чисто-грязно" были максимально удалены друг от друга. Параллельно запускалась специальная селективная процедура последовательных включений с исключениями, в результате чего из всего видового списка было оставлено только 68 видов, обладающих наилучшей классификационной значимостью. Уравнению найденной гиперплоскости соответствуют значения вектора коэффициентов j , которые могут быть использованы для прогноза класса качества или соответствующим образом интерпретированы. Например, величина и знак коэффициента j i для каждого вида определяют его биоиндикационную ценность на множестве наблюдений, полученных непосредственно в изучаемом регионе (см. табл. 3).

Таблица 3. Коэффициенты гиперплоскости для распознавания состояния экосистемы по составу хирономид (приведен фрагмент из работы [Шитиков, Зинченко, Головатюк, 2004])

№ пп

Наименование видов

Встречаемость в обучающей выборке

Коэффициенты j i обобщенного портрета

1

Microtendipes pedellus (De Geer)

10

129.98

2

Cladotanytarsus mancus (Walk.)

26

114.88

3

Ablabesmyia monilis (L.)

8

105.06

4

Paracladopelma camptolabis K.

10

99.7

5

Cricotopus bicinctus (Mg.)

35

99.32

6

Brillia gr. modesta (Mg.)

5

99.18

7

Corynoneura sp.

4

97.76

8

Clinotanypus nervosus (Mg.)

6

93.06

.

63

Stictochironomus crassiforceps (K.)

5

-40.22

64

Tanytarsus pallidicornis Walk.

6

-45.54

65

Eukiefferiella similis Goetgh.

1

-65.7

66

Glyptotendipes glaucus ( Mg.)

3

-95.44

67

Cryptochironomus gr. defectus (K.)

29

-106.42

68

Procladius ferrugineus (K.) choreus

1

-133.82

Метод обобщенного портрета показал неплохие результаты для прогнозирования качества воды водоемов по видовому составу хирономид: примеры обучающей выборки разделились безошибочно, а на контрольных примерах, не участвовавших в построении модели, вероятность правильного распознавания составила 81.5%.

С использованием алгоритма обобщенного портрета для любой произвольной гидробиологической пробы можно оценить уровень "экологического благополучия" как расстояние h от анализируемой точки до разделяющей плоскости в многомерном пространстве признаков. Чем это расстояние больше, тем больше благополучие экосистемы (при h > 0) или глубже ее кризисность (при h < 0), что дает нам основания интерпретировать h как некоторый индекс на шкале нормирования качества вод. Нулевому значению соответствует пограничное состояние, которое классифицируется как “Напряженное или критическое”. Диаграмма изменения этого индекса для проб макрозообентоса на 23 станциях р. Чапаевка от истока до устья, из которых только 5 были использованы в обучающей выборке, приведена на рис. 27.

Рис. 27. Диаграмма распределения индекса экологического благополучия h (ось ординат), полученного методом обобщенного портрета,по руслу р. Чапаевка h[Шитиков, Зинченко, Головатюк, 2004]

Нами также представилось целесообразным использовать в работе идеи сапробного анализа, который в широком смысле представляет собой классический метод распознавания образов и его несомненная заслуга состоит в том, что он актуализировал в гидробиологии следующие понятия, оказавшиеся базовыми:

Пути развития сапробного анализа состоят в том, чтобы, сохранив концептуальную основу, абстрагироваться от некоторых отживших представлений и переосмыслить технику расчетов, ориентируясь на современные методы переработки информации. Во-первых, содержательный смысл задаваемой системы классификации водных объектов выбирается не по уровню органического загрязнения, а в зависимости от конкретной цели исследований: с учетом различного характера загрязнений, типов водоемов или водотоков, по их размерам, гидродинамическому режиму, степени эвтрофирования, природно-климатических зонам, сапробности и т.д. Во-вторых, таблица индикаторных видов (т.е. матрица индикаторных валентностей A) заполняется не по известным литературным источникам, а рассчитывается самостоятельно по обучающей выборке измерений, учитывающей региональные особенности гидрофауны, характер загрязнений и заданную типологию изучаемых водоемов. И, наконец, набор формальных решающих правил, позволяющих по серии тестовых гидробиологических проб оценить класс качества водоема, основывается не на математически несостоятельных формулах Пантле-Букка или Ротшайна, а на оптимальных процедурах, обеспечивающих минимальную ошибку прогноза.

Нами [Шитиков, Зинченко, Головатюк, 2004] были подробно протестированы существующие алгоритмы сапробного анализа, в том числе, 4 возможных метода вычисления индикаторных валентностей и 3 способа распознавания принадлежности к классам. В серии расчетов показано, что минимум ошибки прогнозирования имеет место, если значения обобщенных индикаторных валентностей rik, оценивающих экологическую значимость i-го вида гидробионтов в k-м классе качества вод, находятся как математическая функция F , зависящая от следующих факторов:

rik = F ( ni , pk, k, aik, Ji ),

(8)

где: ni - частота встречаемости i-го вида, на основе которых вычислена rik; pk - относительная вероятность оцениваемого класса, pk = mk / m; k - порядковый номер класса (т.к. общее разнообразие видов зависит от класса k); aik - собственно индикаторные валентности, рассчитанные по модифицированной формуле П.А.Цимдиня [1981]; Ji - индикаторный вес вида i, вычисляемый как функция от энтропии К.Шеннона.

Предложенная методика была отработана на массиве из 542 проб макрозообентоса, взятых на 247 станциях 34 малых рек Самарской области разного типа и уровня антропогенной нагрузки. При этом нами были выполнены расчеты оптимальных обобщенных индикаторных валентностей rik для 505 видов, принадлежащих к различным таксономическим группам бентоса. Параметрическая идентификация модели (8) была проведена методом нелинейной оптимизации по симплекс-процедуре Нелдера-Мида из условия минимума ошибок классификации:

rik = aik (m/mk)0.41 Ji1.21 k0.68 / mi0.52 .

Проверка работоспособности рассчитанных видовых биоиндикационных коэффициентов на всей выборке дала неплохие результаты: правильный прогноз класса качества вод составил 74.9%, а ошибка на два и более класса зафиксирована только в 7.9% случаев. Это существенно лучше, чем с использованием моделей дискриминантного анализа и нейронных сетей (см. раздел 6) на основе обобщающих биоиндикационных показателей, что лишний раз подтверждает приоритет "видовой" концепции анализа экосистем перед "индексологической".

Важнейшим биоиндикационным показателем для выяснения последствий антропогенного воздействия является количественная мера изменения исходного видового состава сообщества, служащего биоиндикатором. При этом сравнивают список всех видов, особи которых были обнаружены в сообществе фонового биотопа и в идентичных биотопах в условиях антропогенного воздействия. Существует много способов оценки “похожести” биотопов в пространстве видов, однако меры, подобные коэффициенту сходства Съеренсена, нельзя воспринимать как серьезный способ идентификации видовых различий между фоновым и контрольным биотопами.

При сравнении списков видов значимость логического события “вид присутствует в фоновых условиях, но отсутствует в импактных” математически и экологически неравнозначна событию “вид присутствует в импактных условиях, но отсутствует в фоновых”, что не может учитываться симметричными мерами сходства. Пусть U – перечень из n видов, зарегистрированных в фоновых условиях, который мы будем полагать за эталон “биоценозной емкости”. Аналогично V – перечни видового богатства для каждого из местообитаний, предположительно находящихся в импактных условиях, по которым проверяется гипотеза о снижении биоразнообразия. В системном анализе и математической лингвистике наиболее известной метрикой сходства словарей является функция Левенштайна L ( http://itman.narod.ru/faq), которая оценивает минимальное количество операций (удаления, добавления и замены), которые преобразуют один список U в другой V, причем стоимости различных типов ошибок не совпадают. Выровняем исходные списки добавлением пустых строк q таким образом, чтобы длина l новых списков и была бы одинаковой: l = max(m,n). Тогда мерой Левенштайна различия этих списков будем называть минимальную общую стоимость операций по их выравниванию с учетом частной стоимости операции d над каждой парой строк:

L = - min{ d (, )} = -.

Для каждого j-го вида, выделенного в фоновых условиях, определим индекс его “доминирования в биоценозе”:

IPj = bj ln(nj + 1), (предложен В.А. Бродской и Л.А. Зенкевичем [1939]),

где bj – встречаемость; bj = mj / m , mj – число проб, в которых был найден вид j, m – общее число проб, из которых формируется перечень видов U, ln(nj + 1) – средняя из логарифмов численностей особей j-го вида. Тогда стоимости d операций выравнивания для подсчета функции Левенштайна можно определить следующим образом:

График изменения функции Левенштайна, показывающей отличие видового состава макрозообентоса для каждой из 14 станций р. Сок от фоновых условий в р. Байтуган, представлен на рис. 28.

Рис. 28. График отличий видового состава по станциям р. Сок от фоновых условий [Шитиков, Розенберг, 2005]

Чем больше кривая L приближается к оси абсцисс, тем ближе видовое разнообразие тестируемого местообитания к “биоценозной емкости”. На построенном графике показано относительное снижение биоразнообразия в районе станций 7-9 и 11, обусловленное воздействием антропогенных факторов.

Важным направлением анализа видовой структуры биоценозов и диагностики является оценка ассоциативности видов (ассоциация - экологическое сообщество определенного видового состава с единообразными условиями местообитания и единообразной "физиономией"). Критерии отбора "верных" видов и "эталонных ассоциаций" в фитоценологии были сформулированы в рамках общей концепции Браун-Бланке – Тюксена [Миркин, Розенберг, 1978]. Представляет интерес распространить этот опыт на широкий круг биотопов, в частности, на гидробиологические сообщества.

Основная идея метода Браун-Бланке чрезвычайно проста – необходимо целенаправленно переставлять строки и столбцы матрицы наблюдений до тех пор, пока таблица не приобретет, насколько это возможно, отчетливую блочную структуру. Процесс такой RQ-диагонализации первоначальной таблицы приводит к тому, что по ее главной диагонали начинают просматриваться прямоугольные блоки клеток, соответствующие выделению ассоциаций близких по экологии видов в группах биоценозов сходных местообитаний. Алгоритмическая завершенность аналитической части метода Браун-Бланке была достигнута в компьютерной программе TWINSPAN [Hill, 1979], дающей хорошие результаты обработки с возможностью гибкой настройки процесса классификации со стороны пользователя.

Исходную таблицу для обработки по программе TWINSPAN формировали, используя обилие 44 видов хирономид, встретившиеся на каждой из 22 станций наблюдений р.Чапаевка. Результаты синтетической обработки представлены в табл. 4, визуальный анализ которой позволяет сделать, например, следующие выводы:

Таблица 4. Результаты обработки по методу Браун-Бланке матрицы видового состава хирономид по станциям наблюдений на р. Чапаевка [Шитиков, Розенберг, Зинченко, 2005]

№№

пп

Названия видов хирономид

A

B

C

D

E

F

G

H

I

J

K

L

M

N

O

P

Q

R

S

T

U

V

Уровни разбиения видов

Номера станций наблюдений

2

3

16

13

15

11

20

21

8

10

23

14

17

1

4

9

18

5

6

12

7

19

1

Cladotanytarsus mancus

2

2

-

-

-

-

-

-

2

3

-

-

-

-

2

-

-

2

-

-

2

-

000

2

M.pedellus

-

-

-

-

-

-

-

-

2

-

-

-

-

-

-

-

-

-

-

-

2

-

000

3

Paratanytarsus confusus

-

-

2

-

-

-

-

-

2

2

-

-

-

1

2

-

-

3

-

-

2

-

000

4

Stictochironomus crassifor

-

-

-

-

-

-

-

-

2

3

-

-

-

-

-

2

-

-

-

2

2

-

000

5

P.nubeculosum

1

-

-

-

-

-

2

-

3

2

2

2

-

-

3

2

-

2

-

3

2

-

001

6

Ablabesmyia sp.

1

-

-

-

-

-

-

-

-

2

-

-

-

-

-

-

-

-

-

-

-

-

01000

7

Dicrotendipes notatus

-

-

-

-

-

-

-

-

2

3

-

2

-

-

-

-

-

-

-

-

-

-

01000

8

G.glaucus

-

-

-

-

-

-

-

-

2

2

-

2

-

-

-

-

-

-

-

-

-

-

01000

9

Ablabesmyia mallochi

1

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

01001

10

Endochironomus albipennis

-

-

2

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

01001

11

Orthocladius annectens

-

2

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

01001

12

Psectrocladius fabricus

2

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

01001

13

Chironomus plumosus

1

3

3

3

3

3

3

3

3

3

3

3

-

2

2

3

-

2

2

2

-

-

01010

14

Cryptochironomus gr. defectus

-

-

-

-

-

-

-

-

2

3

2

2

2

-

3

2

-

-

-

2

-

-

01010

15

P.ferrugineus

2

-

-

-

-

3

2

2

2

2

3

2

2

1

2

2

-

2

3

2

-

-

01010

16

Tanypus vilipennis

1

3

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

2

-

-

-

01010

17

P.arcuatus

-

-

-

-

3

-

-

-

-

-

-

2

-

-

2

-

2

-

-

-

-

-

01011

18

Microchironomus tener

1

-

-

-

-

-

-

-

2

2

2

-

-

-

-

2

2

2

-

2

-

-

0110

19

Parachironomus varus

-

-

2

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

2

-

-

0110

20

Ablabesmyia monilis

1

-

-

-

-

-

-

-

-

-

-

2

-

-

-

2

-

3

2

2

-

-

011100

21

Cladopelma gr. lateralis

-

-

-

-

-

-

-

-

2

-

2

-

-

-

2

2

-

2

3

2

-

-

011100

22

C.sylvestris

2

-

2

-

-

-

-

-

-

-

-

-

-

2

2

2

2

-

-

2

-

-

011100

23

Hydrobaenus distylus

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

2

-

-

-

-

011101

24

Nanocladius bicolor

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

2

-

-

-

-

011101

25

Parakiefferiella bathophila

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

2

-

-

-

-

011101

26

Paracladius conversus

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

2

2

-

-

-

011101

27

Paratanytarsus lauterborni

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

2

2

-

-

011101

28

Trissocladius sp.

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

2

-

-

-

011101

29

P.bicrenatum

-

-

-

-

-

-

-

-

-

-

-

-

-

1

-

2

-

3

-

-

-

-

011110

30

Corynoneura scutellata

-

-

-

-

-

-

-

-

-

-

-

-

-

1

-

-

-

-

-

-

-

-

011111

31

Cricotopus algarum

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

2

-

-

-

-

-

011111

32

Harnischia fuscimana

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

2

-

-

-

-

-

-

011111

33

Paratendipes albimanus

-

-

-

-

-

-

-

-

-

-

-

-

-

1

-

-

-

-

-

-

-

-

011111

34

Polypedilum sp.

-

-

-

-

-

-

-

-

-

-

-

-

-

-

2

-

-

-

-

-

-

-

011111

35

Procladius choreus

-

-

-

-

-

-

-

-

-

-

-

-

-

2

2

2

3

-

2

2

-

-

011111

36

Stictochironomus histrio

-

-

-

-

-

-

-

-

-

-

-

-

-

-

2

-

-

-

-

-

-

-

011111

37

T.punctipennis

-

-

-

-

-

-

-

-

-

-

-

-

-

2

2

-

-

-

-

-

-

-

011111

38

Tanytarsus sp.

1

-

-

-

-

-

-

-

2

-

-

-

-

-

2

-

-

2

-

-

2

-

100

39

Dicrotendipes nervosus

-

-

-

-

-

-

2

-

-

-

-

-

-

-

-

-

2

2

3

2

2

3

1010

40

Stictochironomus rosenscholdi

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

2

2

-

1010

41

Thienemannimyia sp.

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

2

-

-

2

-

1010

42

Cricotopus sp.

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

2

-

1011

43

Endochironomus impar

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

2

-

1011

44

Cricotopus bicinctus

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

-

2

2

2

2

-

11

Уровни разбиений станций наблюдений

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

1

1

0

0

0

0

0

0

0

0

0

0

0

0

0

1

1

1

1

1

1

1

0

0

0

1

1

1

1

1

1

1

1

1

1

0

0

0

0

1

1

1

0

0

0

0

0

1

1

1

1

1

0

0

1

1

1

0

0

0

1

1

Дополнительная полуавтоматическая синтаксономическая обработка позволяет наполнить формально найденную ассоциативность содержательным экологическим смыслом и существенно улучшить познавательную ценность итоговой таблицы.

Представляет интерес использование другого логико-структурного метода распознавания “Кора”, который широко используется в геологической разведке и скриннинге лекарственных препаратов [Вайнцвайг, 1973]. Этот алгоритм использует обучающую выборку в пространстве бинарных признаков, предварительно разделенную на два класса (например “Чисто”/“Грязно”) и, на основе операций алгебры логики, генерирует для каждого класса непротиворечивые логические высказывания, представляющие собой значения переменных, связанные между собой коньюнкцей.

Мы использовали алгоритм “Кора” для ранее описанной матрицы наблюдений по видовому составу хирономид на малых реках Самарской области, в результате чего получили множество логических высказываний, имеющих определенный гносеологический интерес. Например, комбинация видов Cladotanytarsus mancus и Cricotopus bicinctus при непременном отсутствии Cryptochironomus gr. Defectus встретилась в 8 наблюдениях класса “Чисто” и ни в одном наблюдении класса “Грязно”. Набор всех отобранных логических высказываний представляет собой своеобразную мозаично-фрагментарную разделяющую поверхность специального типа и существует возможность использовать сгенерированные конъюнкции для экзамена тестируемых примеров по принципу голосования. Однако, мы полагаем, что ценность использования алгоритма “Кора” - в извлечении из моря исходных данных нетрадиционных гипотез об экологии видов – феноменах их взаимной обусловленности или конкурентности.

 

ГЛАВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ

На основе методов многомерного статистического анализа, распознавания образов и математико-картографического моделирования разработана интеллектуальная технология структурного анализа сложных экосистемных объектов различного уровня (от территории бассейна крупной реки до небольшого водотока). В рамках предложенной методики на примере Волжского бассейна получены следующие результаты:

  1. Разработаны принципы создания многоуровневых эколого-экономических информационных систем в виде "ансамбля" баз данных, содержащих большие массивы разнородных пространственно-распределенных показателей. Выполнено проектирование структуры реляционных моделей данных, схем преобразования информационных потоков на каждом уровне детализации и осуществлено наполнение баз данными.
  2. Выполнено формирование библиотеки специализированных методов, алгоритмов и оригинальных программных модулей, реализующих описанные в литературе методы многомерной классификации, анализа временных рядов, эволюционного моделирования и распознавания образов. Впервые для оценки качества вод и ландшафтно-экологической дифференциации территории использованы технологии искусственного интеллекта: коллективное прогнозирование, нейросетевое моделирование, деревья решений, генетические алгоритмы, самоорганизующиеся карты Кохонена и т.д.
  3. Осуществлена пространственная эколого-географическая дифференциация и районирование территорий и модельных водных объектов Волжского бассейна на основе многомерных массивов разнородных параметров. Разработана архитектура программного комплекса, выполняющего построение и интерпретацию математических моделей прогнозирования экологических ситуаций территориально-распределенных комплексов. Создан объектно-информационный интерфейс экологических баз данных с типовыми ГИС-программами для реализации процедур изолинейного моделирования и пространственной многоуровневой визуализации сложных взаимосвязей параметров, описывающих экосистемы.
  4. На основе формальных методов и с использованием экспертных оценок разработаны алгоритмы свёртки векторов анализируемых показателей в обобщенные критерии, измеряемые в континуальных шкалах. Выполнена оценка структурных изменений таксономической организации сообществ гидробионтов при природной и антропогенной трансформации водотоков с использованием метрики Левенштайна, по методу Браун-Бланке и др.
  5. Разработаны алгоритмы расчета индикаторных валентностей видов гидробионтов с использованием нелинейной оптимизации и метода обобщенного портрета. Вычислены и проанализированы оптимальные значения индикаторных валентностей и весов для 505 видов макрозообентоса из рек бассейна Средней и Нижней Волги, обеспечивающие минимум ошибки классификации водоемов по качеству вод.

 

Список публикаций по теме диссертации

Монографии и брошюры

  1. Розенберг Г.С., Беспалый В.Г., Гайворон Т.Д., Шитиков В.К. и др. (26 авторов). База эколого-экономических данных крупного региона (методическое пособие). – Тольятти: ИЭВБ АН СССР, 1991. – 62 с.
  2. Розенберг Г.С., Шитиков В.К., Мозговой Д.П. Экологическая информатика. Учебное пособие. – Самара: СамГУ, 1993. – 151 с.
  3. Розенберг Г.С., Шитиков В.К., Брусиловский П.М. Экологическое прогнозирование (Функциональные предикторы временных рядов). – Тольятти: ИЭВБ РАН, 1994. – 185 c.
  4. Розенберг Г.С., Вязилов Е.Д., Егоров В.М., Полищук А.И., Проняев А.В., Сушков Б.Г., Шапиро Д.И., Шитиков В.К. К разработке автоматизированной системы принятия решений в области охраны окружающей среды и природопользования на региональном уровне. – Тольятти: ИЭВБ РАН, 1995. – 67 с.
  5. Розенберг Г.С., Голуб В.Б., Шитиков В.К. и др. (22 автора). Экологические проблемы Среднего и Нижнего Поволжья на рубеже тысячелетий. Стратегия контроля и управления (Аналитический доклад для Ассоциации “Большая Волга”). – Тольятти: ИЭВБ РАН, 2000. – 48 с.
  6. Шитиков В.К., Розенберг Г.С., Зинченко Т.Д. Количественная гидроэкология: методы системной идентификации. – Тольятти: ИЭВБ РАН, 2003. – 463 с.
  7. Шитиков В.К., Розенберг Г.С., Зинченко Т.Д. Количественная гидроэкология: методы, критерии, решения: в 2-х кн. – М.: Наука, 2005. – Кн. 1. – 281 с.; Кн. 2. – 337 с.

Статьи в изданиях, рецензируемых ВАК

  1. Тихонов В.Н., Шитиков В.К. Анализ вариабельности признаков и биологическая норма // Гигиена и санитария. – 1984. – № 7. – С. 63-64.
  2. Тихонов В.Н., Шитиков В.К. К вопросу прогнозирования кумулятивных свойств веществ в токсикологических исследованиях // Гигиена и санитария. - 1984. - № 4. - С. 79-80.
  3. Шитиков В.К., Тихонов В.Н., Быков С.Т., Ковалев А.Ф. Статистический анализ и нормальность распределения выборок в токсиколого-гигиенических исследованиях // Гигиена и санитария - 1985. - № 3. - С. 61-62.
  4. Курляндский Б.А., Шитиков В.К., Тихонов В.Н. Об опыте использования специализированной информационно-поисковой системы "ИПС-Токсикология" // Гигиена и санитария. - 1986. - № 1. - С. 53-55.
  5. Курляндский Б.А., Шитиков В.К., Тихонов В.Н. Прогнозирование значений ПДК и других нормативов методом регрессионного анализа с использованием информационно-поисковой системы // Гигиена и санитария. - 1986. - № 8. - С. 63-66.
  6. Шитиков В.К., Коппа Ю.В., Курляндский Б.А., Тихонов В.Н. Прогнозирование токсикологических показателей химических веществ методом самоорганизации моделей // Автоматика. -1986. № 4. - С. 85-87.
  7. Шитиков В.К., Тихонов В.Н. Метод оценки сходства химических соединений // Журнал структурной химии. - 1986.- № 5. - С.166-169.
  8. Тихонов В.Н., Шитиков В.К., Кондратов С.А. О математическом моделировании интоксикации при повторяющихся воздействиях // Гигиена и санитария. - 1987. - № 7. - С. 62-65.
  9. Моисеенкова Т.А., Шитиков В.К. Оценка антропогенной нагрузки на водоемы с использованием потоковых моделей водоотведения // Водные ресурсы. - 1990. - № 4. - С. 97-101.
  10. Моисеенкова Т.А., Шитиков В.К. Методические проблемы обоснования размеров экономических санкций за загрязнение окружающей среды химическими предприятиями // Химическая промышленность. - 1990. - № 7. - С. 444-447.
  11. Меншуткин В.В., Паутова В.Н., Номоконова В.Н., Селезнев В.А., Попченко И.И., Зинченко Т.Д., Иватин А.В., Выхристюк Л.А., Выхристюк М.М., Шитиков В.К., Казанцева Т.И. Статистические связи в экосистеме Куйбышевского водохранилища // Гидробиологический журнал. 1998. - Т.34, № 5. - С.94-103.
  12. Терехова В.А., Семенова Т.А., Шитиков В.К. Микромицеты Куйбышевского водохранилища. IV. Взаимодействие с абиотическими и биотическими факторами // Микология и фитопатология. - 1998. - Т. 32. Вып. 1. - С. 44-48.
  13. Зинченко Т.Д. , Шитиков В.К. Гидробиологический мониторинг как основа типологии малых рек Самарской области // Известия Самарского НЦ РАН. - 1999. - № 1. - С.118-127.
  14. Зинченко Т.Д., Выхристюк Л.А., Шитиков В.К. Методологический подход к оценке экологического состояния речных систем по гидрохимическим и гидробиологическим показателям // Известия Самарского НЦ РАН. – 2000. – Т. 2, № 2. – С. 233-243.
  15. Шитиков В.К., Зинченко Т.Д., Головатюк Л.В. Нейросетевые методы оценки качества поверхностных вод по гидробиологическим показателям // Изв. СамНЦ РАН. – 2002. – Т. 4, № 2. – С. 280-289.
  16. Костина Н.В., Розенберг Г.С., Шитиков В.К. Экспертная система экологического состояния бассейна крупной реки // Известия Самарского НЦ РАН. – 2003. – Т.5, №2. – С. 287-294.
  17. Шитиков В.К., Зинченко Т.Д., Головатюк Л.В. Оценка экологического состояния пресноводных водоемов по зообентосу методом построения обобщенного портрета // Биология внутренних вод. – 2004. – № 1. – С. 67-74.
  18. Шитиков В. К., Зинченко Т.Д., Головатюк Л.В. Оценка качества поверхностных вод по индикаторным видам макрозообентоса // Водные ресурсы. – 2004. – Т. 31, № 3. – С. 354-364.
  19. Шитиков В.К., Костина Н.В., Кузнецова Р.С. Методы построения синтетических показателей для экологического картографирования территории // Известия Самарского НЦ РАН. Спец.вып. "Актуальные проблемы экологии". - 2005. - № 4. - С. 74-83.
  20. Шитиков В.К., Розенберг Г.С. О книге В. Ф. Шуйского, Т. В. Максимовой, Д. С. Петрова " Изоболический метод оценки и нормирования многофакторных антропогенных воздействий на пресноводные экосистемы по состоянию макрозообентоса" // Биология внутренних вод. – 2006. – № 1. – С. 120-122.
  21. Шитиков В.К., Выхристюк Л.А., Паутова В.Н., Зинченко Т.Д. Многофакторное экологическое районирование Куйбышевского водохранилища // Водные ресурсы. – 2006 (в печати).

Другие статьи в журналах, в коллективных монографиях и региональных изданиях

  1. Резниченко В.В., Шитиков В.К., Гребенюк В.И. Система автоматизированного расчета состава сточных вод предприятия // Охрана окружающей среды и очистка промышленных выбросов. НИИТЭХИМ, 1982. - №11.- С.4-7.
  2. Тихонов В.Н., Шитиков В.К., Мирошниченко И.А.,Ковалев А.Ф. Анализ изменений массы внутренних органов в токсикологическом эксперименте // Фармакология и токсикология. - 1984. - № 5. - С. 113-116.
  3. Курляндский Б.А., Шитиков В.К., Кабаченко В.А., Тихонов В.Н. Использование фрагментарного анализа ароматических соединений для прогнозирования токсико-гигиенических параметров // Гигиена труда и профзаболевания. - 1986. - № 3. - С. 37-40.
  4. Шитиков В.К. Банк данных по токсичности и опасности химических соединений. - Сер."Охрана труда и техника безопасности", ЦНТИ, № 018-86, 1986. - 4 с.
  5. Курляндский Б.А., Шитиков В.К., Тихонов В.Н., Ковалев А.Ф. Прогнозирование гигиенических нормативов методом построения “обобщенного портрета” // Гигиена труда и профессиональных заболеваний. – 1988. – № 6. – С. 33-37.
  6. Моисеенкова Т.А., Халеев А.Е., Шитиков В.К. Анализ структуры, состояния и функций городских лесов Тольятти. - Тольятти, 1988. - 22 стр. - Деп. в ВИНИТИ 15.09.1988, № 6991 - В 88.
  7. Моисеенкова Т.А., Шитиков В.К. Методические указания к разработке экологического паспорта промышленного предприятия. Брошюра ЦСООП и ИЭВБ АН СССР. Куйбышев-Тольятти, 1988. - 14 с.
  8. Моисеенкова Т.А., Шитиков В.К. Принципы организации регионального банка эколого- экономической информации // Моделирование процессов экологического развития. – М.: ВНИИСИ АН СССР. - 1989. – № 7. – С. 110-117.
  9. Шитиков В.К. Банк данных для прогнозирования токсичности и опасности химических соединений // Автоматизация научных исследований. - Горький, ИПФ АН СССР,1989. - С. 169-171.
  10. Розенберг Г.С., Беспалый В.Г., Брусиловский П.М., Шитиков В.К. Прогнозирование состояния пространственно-распределенной эколого-экономической системы крупного региона // Доклад на конкурсе Госкомприроды СССР по прогнозированию природных процессов. - М.; Тольятти, 1990. - 19 с.
  11. Розенберг Г.С., Беспалый В.Г., Голуб В.Б., Шитиков В.К. и др. (15 авторов). Экспертная система для оценки экологического состояния крупного региона (на примере Куйбышевской области) // Теоретические проблемы эволюции и экологии. – Тольятти: ИЭВБ АН СССР, 1991. – С. 183-192.
  12. Розенберг Г.С., Шитиков В.К., Костина Н.В. Методика проведения исследований // Экологическая ситуация в Самарской области: состояние и прогноз. - Тольятти: ИЭВБ РАН, 1994. - С. 20-32.
  13. Розенберг Г.С., Шитиков В.К., Феоктистов В.Ф. Загрязнение атмосферного воздуха // Там же. - С. 193-199.
  14. Розенберг Г.С., Шитиков В.К. Общая промышленная нагрузка // Там же. - С. 214.
  15. Розенберг Г.С., Шитиков В.К., Костина Н.В. " Сценарии" различных вариантов развития экологической ситуации в области (экологический прогноз) // Там же. - С.. 294-300.
  16. Розенберг Г.С., Краснощеков Г.П., Шитиков В.К. К созданию пространственно-распределенной базы эколого-экономических данных бассейна крупной реки (на примере Волжского бассейна) // Вопросы экологии и охраны природы в лесостепной и степной зонах: Межвед. сб. науч. тр. - Самара: Изд-во " Самарский университет" , 1995. - С. 8-15.
  17. Зинченко Т.Д., Шитиков В.К. Разнообразие хирономид в равнинных реках Самарской области // В кн.: Проблемы биологического разнообразия водных организмов Поволжья. - Тольятти: ИЭВБ РАН, 1997. - С. 87-97.
  18. Розенберг Г.С., Беспалый В.Г., Попченко В.И., Крылов Ю.М., Дембицкий В.М., Шитиков В.К., Феоктистов В.Ф., Шустов М.В., Хазиев Ф.Х., Усманов И.Ю., Эткин А.Е., Николаев С.В. Сводное экспертное заключение по проекту Крапивинского гидроузла на р. Томи Кемеровской области // Павловский В.А., Сафронов В.В., Розенберг Г.С., Краснощеков Г.П. Экологическая экспертиза: теория и практика (Опыт применения в Самарской области). Экологическая безопасность и устойчивое развитие Самарской области. Вып. 5. – Самара: Госкомитет по охр. окр. среды Самар. обл., 1997. – С. 107-141.
  19. Марченко Н.А.,Зинченко Т.Д., Шитиков В.К. Значение зообентоса в самоочищении р.Чапаевка // Экологическое состояние бассейна реки Чапаевка в условиях антропогенного воздействия (Биологическая индикация). - Тольятти: ИЭВБ РАН, 1997. - С. 145-152.
  20. Шитиков В.К., Зинченко Т.Д. Создание базы данных и алгоритм обработки информации. // Там же – С. 40-55.
  21. Розенберг Г.С., Дунин Д.П., Костина Н.В., Морозов В.Г., Погодин И.В., Шитиков В.К. Информационные технологии для оценки экологического состояния крупного региона (на примере Волжского бассейна и Самарской области) // Проблемы региональной экологии. Вып. 8. - Томск: СО РАН, 2000. - С. 213-216.
  22. Выхристюк Л.А., Зинченко Т.Д., Шитиков В.К. Комплексная оценка экологического состояния равнинных рек в условиях антропогенных воздействий / Научные аспекты экологических проблем России. – СПб.: Гидрометеоиздат, 2001. – С.370-375.
  23. Зинченко Т.Д., Шитиков В.К., Выхристюк Л.А., Варламова О.Е., Головатюк Л.В.. Разнообразие и структурно-функциональная организация донных сообществ гидросистем бассейна Средней и Нижней Волги, их природная и антропогенная динамика // Институту экологии Волжского бассейна РАН 20 лет: основные итоги и перспективы научных исследований. – Тольятти: ИЭВБ РАН, 2003. – С. 42-50.
  24. Розенберг Г.С., Гелашвили Д.Б., Костина Н.В., Шитиков В.К., Краснощеков Г.П. О путях достижения устойчивого развития на территории Волжского бассейна // Возрождение Волги: Материалы конференции и круглых столов (16 сентября 2004 г., Тольятти). – Тольятти: ИЭВБ РАН, 2004. – С. 4-11.
  25. Шитиков В.К., Розенберг Г.С., Костина Н.В. Методы синтетического картографирования территории (на примере эколого-информационной системы "REGION-VOLGABAS") // Количественные методы экологии и гидробиологии (Сборник научных трудов, посвященный памяти А.И. Баканова). Отв. ред. чл.-корр. РАН Г.С. Розенберг. – Тольятти: СамНЦ РАН, 2005. – С. 167-227.
  26. Шитиков В.К., Розенберг Г.С. Оценка биоразнообразия: попытка формального обобщения // Там же. - С. 91-129.
  27. Шитиков В.К., Зинченко Т.Д. Комплексные критерии экологического состояния водных объектов: экспертный и статистический подход // Там же. С. 134-148
  28. Розенберг Г.С., Шитиков В.К. О соотношении математики и биологии в экологии (вместо заключения) Там же. - С. 228-233.
  29. Шитиков В.К., Розенберг Г.С., Костина Н.В. Методы синтетического картографирования территории (на примере эколого-информационной системы "REGION-VOLGABAS")// Экологический мониторинг. Ч. VI: Методы биологического и физико-химического мониторинга. – Н. Новгород: ННГУ, 2006. – С. 147-250.

Тезисы докладов и материалы конференций

  1. Моисеенкова Т.А., Шитиков В.К. Принципы организации регионального банка эколого-экономической информации // III Всесоюзная конф."Проблемы экологии Прибайкалья". - Иркутск, 1988. - Ч.II. - С.25.
  2. Шитиков В.К. Экспертная система для прогнозирования токсичности и опасности химических веществ // VI Всесоюзная конференция по использованию ЭВМ в спектроскопии молекул и химических исследованиях. - Новосибирск, 1989. - С. 235-236
  3. Розенберг Г.С., Шитиков В.К., Костина Н.В., Юрицына Н.А. Разработка концепции размещения производительных сил Куйбышевской области с использованием регионального банка эколого-экономических данных // Всесоюзная конф. "Оценка воздействия хозяйственной деятельности на окружающую среду". - М., ВДНХ СССР, 1990. - С. 23-24.
  4. Розенберг Г.С., Беспалый В.Г., Шитиков В.К., Костина Н.В. База эколого-экономических данных "Регион" для управления природопользованием и охраны окружающей среды // Проблемы и перспективы развития Поволжья в условиях перехода к рыночной экономике: Тез. докл. Всесоюз. науч.-практ. конф. - Самара: ВЭО, 1991. - С. 69-72.
  5. Розенберг Г.С., Шитиков В.К., Костина Н.В., Юрицына Н.А. Эколого-кономическое районирование Куйбышевской области с использованием региональной базы пространственно-распределенных данных // Экологическое районирование территории: методы и разработки: Материалы науч. семинара по экологическому районированию "Экорайон-90". - Иркутск: СО АН СССР, 1991. - С. 158-160.
  6. Шитиков В.К., Костина Н.В. Пространственно распределенная база данных для оптимизации и охраны природной среды в регионах с интенсивным антропогенным воздействием // Всесоюзный симпозиум "Комплексный мониторинг, оптимизация и прогноз состояния природной среды". - Тверь,1991. - С. 20-22
  7. Шитиков В.К., Костина Н.В. Программное обеспечение пространственно распределенной базы данных для оценки антропогенной динамики биологических систем // Международный форум “Информатика на службе экологии и здоровья” – Тольятти, 1991. – С.25-27
  8. Розенберг Г.С., Шитиков В.К. Экологическая информационная система Волжского бассейна "VOLGABAS" // Теоретические и прикладные проблемы экологии: Тез. докл. Всерос. конф. - Чита: СО РАН, 1992. - С. 111-112.
  9. Розенберг Г.С., Шитиков В.К. Учебное пособие "Экоинформатика" для студентов биологического профиля // Материалы международного симпозиума "Проблемы экоинформатики", Звенигород, 14-18 дек., 1992 г. - М.: ИРЭ РАН, 1992. - С. 201.
  10. Шитиков В.К., Костина Н.В. Информационная система для экологической экспертизы урбанизированных и рекреационных территорий // Экологические основы оптимизации урбанизированной и рекреационной среды. - Тольятти, 1992. -Т.1- С.178-181.
  11. Розенберг Г.С., Исакова Г.В., Калинин О.В., Шитиков В.К. Экологическая информационная система "REGION": блок "Лесные ресурсы" // Охрана лесных экосистем и рациональное использование лесных ресурсов: Тез. докл. Всерос. науч.-техн. конф. Т. 2. - М.: МГУЛ, 1994. - С. 35-37.
  12. Розенберг Г.С., Паутова В.Н., Шитиков В.К. Система баз данных "RESERVOIR" для волжских водохранилищ. Многолетние гидробиологические наблюдения на внутренних водах: современное состояние и перспективы // Тез. докл. Междунар. совещ. - СПб.: ЗИН РАН, 1994. - С. 30-31.
  13. Марченко Н.А., Зинченко Т.Д., Шитиков В.К. , Выхристюк Л.А. Структурно-функциональные показатели зообентоса и его роль в процессах самоочищения некоторых равнинных рек Волжского бассейна // Современные проблемы гидроэкологии (СПб, 9-13 октября 1995г). - 1995. С. 38.
  14. Марченко Н.А., Зинченко Т.Д., Шитиков В.К. Реакция хирономид на антропогенное воздействие в равнинных реках (на примере р.Чапаевка) // Тез. VII съезда Гидроб. об-ва Казань ( 14-20 октября 1996). Материалы съезда. - С. 140-141.
  15. Rozenberg G.S., Shitikov V.K., Morozov V.G. Expert systems "RE-SERVOIR": methodology, methods and results // Programme and Abstracts. 3rd International Conference on Reservoir Limnology and Water Quality. – Ceske Budejovice (Czech Republic), 1997. Р. 152.
  16. Зинченко Т.Д., Выхристюк Л.А., Варламова О.Е. , Шитиков В.К. Реакция зообентоса на состояние донных отложений равнинного водохранилища // В кн.: Экологические проблемы бассейнов крупных рек-2. Тез. докл. междунар. конф. - Тольятти.1998. - С.200.
  17. Zinchenko T.D., Vikhristyuk L.A., Shitikov V.K. F methodological appoach to the assessment of the ecological state of river systems // Abstr. the trird Vereshchagin Baical Conf. - Irkutsk, 2000. P. 92.
  18. Выхристюк Л.А., Зинченко Т.Д. ., Шитиков В.К. Метод интегральной оценки экологического состояния речных систем (на примере равнинных рек Среднего Поволжья) // Малые реки. Современное экологическое состояние, актуальные проблемы. Тез. докл. Междунар. конф. – Тольятти: ИЭВБ РАН, 2001. - С.49.
  19. Головатюк Л.В., Зинченко Т.Д., Насыров Г.А., Шитиков В.К. Изменение структурной организации макрозообентоса при природной и антропогенной трансформации водотоков // Там же. - С.58.
  20. Шитиков В.К., Зинченко Т.Д., Головатюк Л.В. Математические аспекты оценки патологии экосистем на примере зообентоса малых рек Самарской области // Там же. – С. 230.
  21. Зинченко Т.Д., Выхристюк Л.А., Шитиков В.К., Гелашвили Д.Б., Розенберг Г.С. Экологическая паспортизация городских озер: методологический подход // Озерные экосистемы: биологические процессы, антропогенная трансформация, качество воды. – Минск: АН РБ, 2003. – С. 23-27.
  22. Шитиков В.К., Зинченко Т.Д., Головатюк Л.В. Метод оценки качества поверхностных вод на основе индикаторных валентностей организмов макрозообентоса // Там же. – С. 537-540.
  23. Шитиков В.К., Зинченко Т.Д., Головатюк Л.В. Развитие концепции сапробности для оценки качества поверхностных вод по индикаторным видам макробентоса // Экологические проблемы бассейнов крупных рек-3. Тез. докл. Междунар. конф. – Тольятти: ИЭВБ РАН, 2003. – С. 324.
  24. Розенберг Г.С., Гелашвили Д.Б., Костина Н.В., Шитиков В.К. О путях достижения устойчивого развития на территории Волжского бассейна // Материалы шестого международного симпозиума "Проблемы экоинформатики". – М.: РАН; РАЕН, 2004. – С. 59-68.
  25. Шитиков В.К., Розенберг Г.С., Костина Н.В. Методы синтетического картографирования территории в эколого-информационной системе "Volgоbas" // Там же. - С. 42-46.
  26. Rozenberg G.S., Shitikov V.K., Kostina N.V. The principle of ecological matreshka (a set of nesting doll) in the system of the analysis of multivariate ecological data // V Winter Symposium on Chemometrics, February 18-23, 2006, Samara, Russia.- Samara, 2006.
  27. Шитиков В.К., Зинченко Т.Д., Шарый П.А., Абросимова Э.А. Анализ пространственной неоднородности гидробиологических и абиотических факторов Куйбышевского водохранилища с использованием ГИС-технологий // Тез. докл. IX Съезда Гидробиол. о-ва. - Тольятти, 2006. Том 2 - С. 287.