Дальше К следующему разделу Назад К предыдующему разделу Конец К концу разделу Список К оглавлению

2. Представление пространственной информации в эколого-информационных системах

Актуальность проблемы и некоторые банальности

Природные экологические системы в настоящее время испытывают на себе постоянно возрастающие антропогенные воздействия, вызванные активной хозяйственной деятельности человека с одновременным ростом его популяции. Увеличение земельно-эксплуатируемых территорий ведет к разрушению природных структур. В результате постоянного развития производства десятки и сотни тысяч химических соединений создаются и используются человечеством, многие из которых (в том числе токсичные и радиационные) попадают в биосферу, загрязняя ее. В связи с этим, экологическая оценка состояния окружающей среды, изучение механизма деятельности, структурных особенностей, анализ целостности и устойчивости природных систем, прогнозирование их динамического развития, определение возможной деградации экосистем и степени ухудшения качества жизни человека - являются в настоящее время важнейшими задачами современной экологии.

Оценка экологической обстановки и степени "уязвимости" биосферы является непростой задачей, не имеющей принципиально однозначного решения. Термин качество окружающей среды на практике имеет множество значений и трактуется специалистами в различных областях по-разному и "трудно заставить политиков, чиновников, ученых или простых людей прийти к единому мнению о том, что он означает и как его измерить" (Элер, 1976).

Окружающая среда человека состоит из четырех неразрывно взаимосвязанных компонентов-подсистем:
1) собственно природная среда, имеющая свойство самоподдержания и саморегуляции без корректирующего воздействия человека;
2) квазиприрода - модификации природной среды, в которых отсутствует внутреннее самоподержание и которые требуют все больших энергетических затрат извне;
3) артеприрода - искусственная среда, созданная человеком и не имеющая аналогов в естественной природе;
4) социальная среда.
Как считает Н.Ф.Реймерс [1], все факторы из рассматриваемых сред тесно связаны между собой и составляют объективные и субъективные стороны качества среды жизни, которые должны быть учтены при экологической оценке состояния изучаемой территории. В связи с этим, число показателей, которые могут быть использованы для оценки экологического состояния, измеряется сотнями. Обработка такого массива данных, его анализ, выявление "значимых" или "несущественных" показателей весьма затруднительны без использования совокупности компьютерных и телекоммуникационных технологий.

В территориальных органах природоохранного мониторинга, учебных заведениях, отраслевых институтах и специализированных краеведческих организациях в течение ряда десятилетий накопился богатый фактографический материал по различным аспектам исследований в области экономики, естествознания и медицины региона. В подавляющем большинстве случаев этот материал никак серьезно не обрабатывается и хранится в виде полузабытой "бумажной субстанции". Не исключено, что собранная статистическими методами (в период обязательной отчетности Госкомстату СССР), эта информация оказывается зашумлена и даже тенденциозна, а ее пространственная привязка нередко оказывается весьма размытой. Тем не менее, при разумном подходе к ее обработке и интерпретации, эти данные становятся не только важным, но и определяющим звеном информационной модели территории. Во всяком случае, вывод о необходимости проведения комплекса дорогостоящих дистанционных исследований разумно сделать лишь после обобщения всего комплекса уже имеющейся эколого-экономической информации.

Будем понимать под региональной эколого-информационной системой реализованную с помощью технических средств динамическую информационную модель территории, отражающую пространственно-временную структуру, состояние и взаимосвязи между отдельными элементами моделируемой экосистемы. Объектом анализа экологического состояния может быть как отдельная административно-территориальная единица (город, область, край, республика), так и любая выделенная формальным или неформальным путем часть земной поверхности (бассейн реки, природно-климатическая зона и т.д.). Необходимыми является два условия:

Концептуальные "кирпичики" ЭИС и способы их реализации

Чтобы не прибегать к надоевшим абстракциям, рассмотрим конкретную реализацию территориальной базы экологических и экономических данных, разрабатываемой на протяжении последних десятилетий в Институте экологии Волжского бассейна РАН [2-5]. Описываемая ЭИС явилась одним из первых опытов комплексного анализа пространственно распределенной информации и объединяет в себе следующую иерархию баз, образно интерпретируемую как "экологическая матрешка":

Естественно, что при создании такого ансамбля баз данных ключевое место было уделено процессам агрегирования информации в ходе ее прохождения от максимально детализованных баз нижнего уровня к комплексным базам высшего уровня.

На сегодняшний день одной из самых трудно решаемых проблем при разработке интеллектуальных приложений, подобных ЭИС, является формализация предметной области в виде N-мерной информационной модели. По определению, любая модель ограничена, т.к. отбрасываются незначительные детали и выделяется суть. Именно тут и проявляется первая из проблем – оценить, что важно для решения поставленной задачи, а что нет? Выражаясь казенным языком, необходимо разработать рубрикатор (список, тезаурус) тех данных, которые подлежат загрузке в базу. Для решения этой проблемы мы не прибегали к длительным раздумьям и воспользовались приведенной выше щедрой рекомендацией Н.Ф.Реймерса "использовать все, что хоть сколько-нибудь похоже на информацию".

Пространственно распределенная информация ЭИС "REGION-VOLGABAS" охватывала следующий рубрикатор природных компонент:

Обширные рубрики накопленных данных детально описывали распределение по территории техногенной нагрузки и антропогенных воздействий, в том числе:

Состояние здоровья населения, как критерий оценки качества среды, в рамках ЭИС "REGION-VOLGABAS" включало следующие параметры:

Организация данных в ЭИС пространственной ориентации в целом опирается не те же принципы, что и в любой другой информационной системе, в первую очередь на некоторую модель данных, в рамках которой представляется вся имеющаяся информация, как пространственная, так и атрибутивная (описательная). Поэтому вторая из проблем – понять, какова будет структура (состав полей) таблиц с данными и как эти таблицы будут между собой взаимодействовать? Следует признать, что при разработки схемы базы данных мы также не прибегали к мучительным мозговым атакам, поскольку структурно-логические взаимодействия между информационными атрибутами подобных систем до неприличия просты и не идут ни в какое сравнение, скажем, с тарифными планами небольшой сотовой компании..

Модель базы данных, представленная на рис. 4, состоит из двух типов таблиц: условно-постоянного назначения (рубрикаторы показателей и списки операционно-территориальных единиц - участков, районов, городов, областей и т.д.) и информационных таблиц (показатели в натуральных значениях, в баллах, комплексные показатели), характеризующие каждую операционно-территориальную единицу.

Рис. 4 Модель базы данных ЭИС типа "REGION"

Всего ЭИС "REGION-VOLGABAS" содержала 509 предметных слоев карты, из которых 85 составили обобщенные показатели. Для удобства пользовательского интерфейса таблицы условно-постоянного назначения имели иерархический характер: например, все показатели относились к одному из блоков, тем и подтем.

Развитие визуальной интерпретации многомерных данных и ГИС-технологий связано, в частности, с тем, что человеку с его ограниченным трехмерным пространственным воображением сложно, а в большинстве случаев невозможно, анализировать и давать обобщенные оценки многомерным объектам. Для реализации специфической проблемы моделирования и прогноза пространственной структуры необходимо решение третьей проблемы: выделение в рамках анализируемой картосхемы дискретных операционно-территориальных единиц (ОТЕ) и геокодирование пространственных данных [6].

Каждая ОТЕ является пространственным объектом, для которого предполагается однородность имеющейся о нем атрибутивной информации с точки зрения изучаемого явления. В традиционной растровой модели данных ГИС каждой ОТЕ соответствует ячейка регулярной или нерегулярной сетки, которые покрывают полностью всю территорию исследования; при этом размеры ячеек выбираются, исходя из характера отображаемой информации и особенностей поставленной задачи. Теория и практика геоинформатики предполагает также возможность реализации векторной модели данных, когда цифровое представление данных связано с различными геометрическими объектами (точкой, линией, дугой, замкнутым контуром и т.д.). Однако, задавшись необходимой разрешающей способностью растровой сетки и используя векторно-растровое преобразование, обе модели оказываются информационно совместимыми.

На основе выбранной ОТЕ происходит калибровка и настройка имеющейся атрибутивной информации и приведение ее к единому образцу. В нашем случае на карте территории выбирается пространственно-координатная сетка регулярного типа с такой степенью масштабной детализации, которая удовлетворяет двум конкурирующим условиям: минимальные потери информации и целостность зрительной интерпретации. Для этого проводят на карте (n-1) горизонтальных и (m-1) вертикальных параллельных линий, которые разделяют карту на m·n прямоугольников или квадратов, именуемых в дальнейшем "участками". Участок - это элементарный, далее не дробящийся объект привязки пространственно-распределенной информации, т.е. постулируется: каждый показатель в любой точке участка имеет одинаковое численное значение.

При построении регулярной сетки учитываются следующие обстоятельства:

При создании пространственно-координатной сетки территория Волжского бассейна была разбита на 210 участков единичной площадью 6,5 тыс. км2, территория Самарской области - на 287 участков единичной площадью 193 км2 и т.д.

Поскольку настоящая методика создавалась в первую очередь для административно-территориальных единиц, на карте изучаемой территории выделяются районы и города.

Район в общем смысле - связанное подмножество выделенных участков, количество которых может быть произвольным (от 1 до m·n). Однако не должно быть ни одного участка территории, не отнесенного ни к одному из районов, как не должно быть участка, отнесенного к нескольким районам одновременно. Выделение района как объекта информации определяется лишь традицией представления статистической информации (например, заболеваемость населения, отстрел животных, водоиспользование и т.д.). Для Волжского Бассейна районами являются входящие в него области, автономные республики и прочие административные единицы.

Город в общем смысле - специальным образом интерпретируемый участок картосхемы, по которому имеются самостоятельные значения показателей. Каждый город должен находится на территории какого-либо района. Выделение городов связано с теми же обстоятельствами, что и выделение районов.

Наконец, четвертой проблемой является геокодирование и пространственная унификация данных.

Как уже отмечалось, задача построения модели пространственной структуры экосистемы является весьма сложной и требует совместного учета большого числа весьма разнородных факторов. Сама эта разнородность имеет как тематическую, так и пространственную природу. Пространственная разнородность информации выражается в том, что статистические и описательные данные часто соотносятся с различными пространственными объектами, отличающимся и по своей природе, и по масштабу, что создает дополнительные трудности при совместной обработке и анализе информации (Савельев, 2004).

Например, численность популяции какого-либо вида в одних случаях может быть представлена одним числом, отнесенным к искусственной пространственной единице (в частности, административному району), что не позволяет делать достоверных выводов о ее пространственной структуре. В других исходных материалах та же численность может быть отнесена к выделенным на территории отдельным местообитаниям, в которых вид встречается. Кроме того, информация о природных или народно-хозяйственных объектах, как правило, известна не для всей территории, а только для отдельных ее точек. Так, содержание загрязняющих веществ в почве известно только в местах отбора проб; интенсивность движения транспорта известна только на самих дорогах, хотя косвенно влияет (за счет передвижения населения) на значительные территории.

Другая проблема - различный масштаб представления информации. Так, при комплексном региональном анализе приходится сопоставлять данные различного территориального уровня - относящиеся ко всему региону в целом, к отдельным районам, к отдельным водосборным бассейнам, к отдельным точечным описаниям. Размерность объектов, которым соответствуют описательные данные, также может различаться - это могут быть площадные, линейные или точечные объекты, или различные ячеистые структуры. В тоже время, многие биосферные и диффузионные явления зависят не только от состояния в данном конкретном месте, но и от значений этого показателя на соседних (в широком смысле) участках территории. Для учета такого влияния необходимо использование геостатистических методов, как правило, не представленных в стандартных ГИС.

Очевидно, что прежде чем проводить анализ или моделирование описанных выше пространственно распределенных сущностей, вся разнородная информация, как о зависимых, так и о независимых переменных должна быть тщательно оцифрована и унифицирована по отношению к одним и тем же географическим координатам. Для выполнения этой процедуры был разработан комплекс алгоритмов и программных модулей эвристической, линейной и нелинейной интерполяции атрибутивных данных по пространственным участкам (ОТЕ). После их реализации пространственно-распределенные данные становятся активизированными. Поскольку в рассматриваемой ЭИС была принята единая растровая модель данных, где ОТЕ соответствуют ячейкам регулярной прямоугольной сетки, каждый показатель экосистемы Х (или фактор среды), в унифицированном виде представлял собой переменную, определенную для каждого участка области исследования:

,

причем в представленной матрице активными являются только N значений внутри контура территории, а (n× m - N) остаются неопределенными, т.е. на картограммах не отображаются и в математическом моделировании не участвуют.

Для текущей работы с базами данных разработано программное обеспечение, реализующее традиционные в таких случаях функции:

Последние пункты представленного перечня свидетельствуют о том, что основная задача эколого-информационных систем - не только накапливать текущую или ретроспективную информацию, но и формулировать стратегии управления "качеством" окружающей среды. Для этого в составе программного обеспечения "RЕGION-VOLGAВАS" была разработана процедура генерации обобщенных критериев в виде линейной комбинации исходных показателей, предварительно преобразованных в дискретную форму. С целью математической обработки данных, хранящихся в ЭИС, кроме общепринятых методов многомерного статистического анализа (регрессионный анализ, различные алгоритмы обработки временных рядов, кластерный анализ и т.д.), использовались алгоритмы построения прогнозирующих моделей методами самоорганизации (эволюционное и нейросетевое моделирование, метод группового учета аргументов, карты Кохонена). В качестве надстройки к библиотеке ("коллективу") методов была разработана эвристическая процедура "модельного штурма", реализующая синтез модели-гибрида из частных моделей-предикторов. Частичному описанию концепций и компонентов программного обеспечения посвящены последующие разделы.

Литература

  1. Реймерс Н.Ф. Экология (теории, законы, правила, принципы и гипотезы) - М.: Журнал "Россия Молодая", 1994 - 367 с.
  2. Розенберг Г.С., Беспалый В.Г., Гайворон Т.Д. и др. База эколого-экономических данных крупного региона (методическое пособие). – Тольятти: ИЭВБ АН СССР, 1991.
  3. Розенберг Г.С., Краснощеков Г.П., Шитиков В.К. К созданию пространственно-распределенной базы эколого-экономических данных бассейна крупной реки (на примере Волжского бассейна) // Вопросы экологии и охраны природы в лесостепной и степной зонах: Межвед. сб. науч. тр. – Самара: Изд-во " Самарский университет" , 1995. С. 8-15.
  4. Моисеенкова Т.А., Шитиков В.К. Принципы организации регионального банка эколого-экономической информации // Моделирование процессов экологического развития (М., ВНИИСИ АН СССР). 1989. № 7. С. 110-117.
  5. Розенберг Г.С., Дунин Д.П. Базы экологических знаний: технология создания и предварительные результаты // Изв. СамНЦ РАН. 1999. Т. 1. № 2. С. 186-192.

Дальше К следующему разделу Назад К предыдующему разделу Начало К началу разделу Список К оглавлению