БИОМЕТРИКА: БИОМЕТРИКА-2000 
 

 Математизация естествознания 
и "кризис" теоретической биологии


 Дромашко С.Е. -  ученый секретарь 
Института генетики и цитологии 
НАН Беларуси, канд.биол.наук, 
D.Sc. in Infrom. Technol., проф., 
действительный член Международной 
академии информационных технологий, 
Минск
       На протяжении многих лет идет дискуссия о путях и перспективах математизации биологии. Существует точка зрения, что прогресс невозможен без новых, биологических глав математики, полностью адекватных сущности моделируемых явлений. Противоположное мнение гласит, что современный математический аппарат достаточно развит и следует ограничиться поисками общих утверждений, объединяющих самые различные математические представления жизненных процессов. Попытки реализовать последний подход привели многих ученых в 90-е годы к выводу, что к биологическим законам плохо применимы методы физики и математики, так как до сих пор не удалось создать общую теорию живой материи, из которой следовали бы все специфические законы биологии. Именно в этом видят причину кризиса теоретической биологии, забывая о том, что естественнонаучная традиция связана с восхождением от частного к общему, от простейших моделей к крупным теоретическим обобщениям. В статье рассматривается концепция повышения эффективности применения математического моделирования в биологии и предлагается схема спецкурса для студентов биологических специальностей "Математическое моделирование в биологии и основы биометрии". 

МАТЕМАТИЗАЦИЯ БИОЛОГИИ 

     Как и в других науках, в биологии все шире используются математические и кибернетические методы исследований. Возникают новые направления научных исследований, такие как синергетика [1], биологическая кинетика [2], математическая популяционная генетика [3], компьютерная биометрия [4] и др. Однако вопрос о перспективах дальнейшей математизации биологии остается по-прежнему дискуссионным, причем существенного продвижения в их понимании по сравнению с 50-60-ми годами не произошло. 

     Как и раньше, преобладают две точки зрения. Согласно одной из них [5], "на путях математизации биологических наук речь должна идти не о каком-то приживлении или подсадке математики к биологии извне (именно такие попытки делались и, несомненно, еще будут делаться и впредь), а о выращивании новых, биологических глав математики изнутри, из самого существа тех вопросов, которые ставятся перед науками о жизнедеятельности. Оснащенные (может быть, уже в недалеком будущем) настоящим, адекватным математическим аппаратом, биология и биокибернетика сольются тогда, как думается, в синтетическую науку, которая станет для них новой и высшей ступенью". Другая точка зрения сводится к тому, что математическая наука достаточно развита, и ее аппарат можно с успехом применять в биологических исследованиях в том виде, какой он принял в настоящее время. Поэтому, как считает Н.Рашевский [6], следует ограничиться поисками общих утверждений, которые сумели бы объединить собой самые различные математические представления жизненных процессов. 

     Вне зависимости от того, какая точка зрения более близка к истине, основной формой существования математики и кибернетики в биологии является математическая модель. Перебросив построенные по аналогии с известным явлением уравнения на новую область изучаемой действительности, ищут затем интерпретацию этих уравнений, устанавливая связи между величинами и объектами этой новой области [7]. Поэтому с особой остротой встает вопрос о корректном использовании математических моделей и, главное, о роли правильной интерпретации привносимых в биологию математических идей. 

     В частности, П.П.Маслов [8], касаясь знаменитой "эргодической теоремы" Маркова, отмечает: "Эту формулу следует интерпретировать как отражение закона, в силу которого случайность подчиняется закономерности. Изменение явления связано с сущностью самого явления, однако, случайности, не вытекающие из внутренней закономерности развития явления, также могут играть роль в ходе развития этого явления. С течением времени эта роль может усиливаться, а внутренняя закономерность ослабляться (наследственность и освобождение от прародителей в животном мире, переход условных рефлексов в безусловные)". Возможность такой интерпретации формального аппарата теории марковских цепей обеспечила этому методу широкое распространение в разных отраслях биологии, прежде всего в теории популяций (см., например [9]). 

     Иногда формальный перенос математического аппарата, сформулированного для одного класса задач, на новую область применения приводит к искажению полученного результата. Примером здесь может послужить модель "разорения игрока", которая используется в радиобиологии для описания процесса гибели клеток [10]. Как отмечает Ю.Г.Капульцевич [11], данный подход не учитывает того обстоятельства, что погибшая в результате облучения клетка остается в колонии. Она не может дать потомства, но вносит вклад в общее число клеток в колонии, что "искажает" исходную математическую задачу. 

     Чрезвычайная сложность биологических объектов часто заставляет исследователя пользоваться кибернетическим принципом "черного ящика". Между тем живые системы относятся к разряду так называемых эквифинальных [12], т.е. у них последнее звено причинно-следственной связи не выводится однозначно из первого. Это заставляет с осторожностью относиться к данным, полученным при исследовании модели какой-либо биологической системы, особенно если она относится к качественно иному уровню организации материи (как это имеет место при физико-химическом или кибернетическом моделировании живых объектов). Поэтому перенесение результатов моделирования на исследуемый объект должно сопровождаться тщательным сопоставлением с экспериментом, проведенным на самом оригинале. Это позволяет не только выявить те звенья причинно-следственной цепи, которые ускользают от исследователя при изучении модели, но и органически включить свойства, моделируемые на неживом субстрате, в целостное функционирование живых систем. 

     В современном естествознании вообще, и в биологии в частности, широко используются не только теоретические представления кибернетики. Сложность математических моделей с неизбежностью ведет к широкому использованию компьютерной техники как для обработки данных и уточнения параметров моделей, так и для постановки машинного эксперимента, во многих случаях призванного заменить дорогостоящий натурный эксперимент.Поэтому математизация естествознания тесно связана с его информатизацией, и дальнейшее развитие математического моделирования в биологии видится на пути создания новых информационных технологий как инструмента построения содержательных моделей и накопления и хранения информации, полученной в результате исследования этих моделей. Биология уже созрела для такого качественного перехода. Готовы ли к нему биологи? 

ПРИМЕНЕНИЕ МАТЕМАТИЧЕСКИХ МЕТОДОВ В ТЕОРЕТИЧЕСКОЙ БИОЛОГИИ: БИОЛОГИЧЕСКИЕ ДИСКУССИИ И ОПЫТ ТЕОРЕТИЧЕСКОЙ ФИЗИКИ 

    Дискуссии между сторонниками разного взгляда на взаимоотношения биологии и математики продолжаются и в настоящее время (см., например, симпозиум по переписке "Теоретическая биология - настоящее и будущее", проходивший на страницах журнала "Известия РАН. Серия биологическая" в 1993 г.). Многие из участников этого симпозиума причину неудач теоретической биологии видят в том, что к биологическим законам плохо применимы методы физики и математики и, главное, не создана общая теория живой материи [13-15]. При этом в качестве положительного примера приводится физика, в которой якобы удалось с помощью единой методологии создать общую концепцию и открыть специфические законы развития неживой материи. 

     Однако опыт теоретической физики показывает прямо противоположное, а именно, что построение общей концепции жизни дедуктивным путем на основе одного или нескольких фундаментальных принципов [16] вряд ли возможно. В целом ссылки на теоретическую физику как пример для подражания несостоятельны. В теоретической физике нет единой методологии, объединяющей все и вся - от механики до физики элементарных частиц. Более того, именно при построении единой теории поля не добились успеха такие гениальные физики-теоретики, как А.Эйнштейн и В.Гейзенберг. Такой дедуктивный подход не реализован даже в теоретической механике, описывающей самую простую форму движения материи. Да и в целом создание единой теории жизни выходит за пределы биологии, являясь скорее задачей философии. 

     Еще одним коренным отличием развития биологических систем, затрудняющим построения единой теории жизни, часто называют их телеологичность [17]. Однако телеологичность присуща не одной биологии. Аналогичные проблемы характерны и для физики. Достаточно вспомнить о парадоксе, связанном с устойчивым существованием Вселенной и теоретическим выводом о ее неизбежной "тепловой смерти", разрешенном в конце XIX в. В наши дни - это рассуждения о том, что Homo sapiens мог появиться только при тех значениях мировых физических констант, какие реально наблюдаются в опыте. Это также проблема скорее философски-методологическая, являющаяся следствием применения теории вероятностей там, где этого делать нельзя. Феномен телеологичности, по-видимому, есть результат некритического взгляда из конечной точки на начало, в котором были возможны разные пути развития. Реализовался только один из них, вероятность осуществления которого была столь же мала, как и у остальных, нереализованных. Но современный наблюдатель находится именно в этой конечной точке уже осуществившегося варианта. Если бы реализовался любой другой вариант, то либо не было проблемы вообще, либо какой-нибудь разумный ящер задавался вопросом, почему природа устроила так, что именно он является "венцом творения". 

     Если посмотреть на историю развития физики, то станет видно, что теоретическая физика строилась постепенно в итоге решения отдельных частных задач, и только после накопления теоретических обобщений 1-го уровня строились общие теории, т.е. обобщения 2-го уровня (причем, только в пределах конкретных разделов физики). Если бы здесь шел спор, как в биологии, о предмете теоретической физики и фундаментальных принципах ее построения, - этой науки не было бы до сих пор. История науки показывает нам, что индуктивный путь накопления теоретических обобщений характерен для всего естествознания в целом. Корень заблуждения биологов, их преклонения перед дедуктивным способом выведения новых знаний, кроется, скорее всего, в том, что при преподавании тех или иных предметов в дидактических целях изложение строят, как правило, от общего к частному, т.е. дедуктивно. 

     В общетеоретическом плане единые теории не всегда нужны. Так, например, ускоренное падение камня можно, в принципе, описать на квантово-механическом языке, но надо ли делать такие усложнения, если хорошо работает формула, предложенная еще Галилеем? Трудности квантовой химии в том, по-видимому, и заключаются, что стараются применить законы квантовой механики там, где решение можно найти чисто химическими методами. Даже в теоретической оптике применяются прежде всего собственные законы, а не лежащая в их основе электродинамика Максвелла. 

     В этом смысле показательна ситуация в математической генетике [18], которую вполне можно рассматривать, по аналогии с физикой, в качестве примера удачно развившейся теоретической дисциплины. В ней широко используется аппарат классической математики и математической кибернетики, на основе которых строятся содержательные генетические теории, создаются такие прикладные направления исследований как компьютерная генетика или компьютерная биометрия. 

     Во многих дискуссиях по теоретической биологии абсолютизируется различие между законами (в физике) и моделями (в биологии). Однако это, в значительной мере, дань моде в терминологии. С конца XIX в. и в физике больше говорят о моделях, особенно в постклассических квантовой механике и релятивистской физике. 

     Очень часто теоретическую биологию противопоставляют математической биологии, забывая (или не замечая), что аналог математической биологии в физике - это теоретическая физика. Характерной чертой обеих этих дисциплин является абстрагирование от всего многообразия окружающей действительности, построение упрощенных математических моделей, обладающих в то же время достаточно богатым содержанием [19]. Современная математическая физика - специфическая дисциплина, занимающаяся разработкой математических методов исследования физических процессов. Аналогичной дисциплины в биологии пока нет. Следует отметить, что на Западе придерживаются такой же, как в физике, трактовки этих дисциплин: Journal of the Teoretical Biology рассматривает теоретические (т.е. математизированные и кибернетизированные) работы, а Journal of Mathematical Biology - работы, посвященные разработке новых математических методов

     Видимо, наблюдается не кризис теоретической (или системной) биологии [15] - скорее проявляется ограниченность возможностей применявшихся до сих пор в биологических исследованиях математических методов. Специфичность биологических систем требует применения нового, адекватного им математического аппарата. Однако это вовсе не значит, что необходимо ждать появления новой биологической математики. Надо просто смелее вводить в обиход биологии уже созданные математические методы и модели, которые по тем или иным причинам пока не используются вообще или используются недостаточно. 
 


НЕСКОЛЬКО ПРИМЕРОВ 

     Как только появилась теория информации [20], начались попытки ее широкого использования в биологии, психологии и других дисциплинах, не имеющих прямого отношения к теории связи. В биологии первым пропагандистом теоретико-информационного подхода был Г. Кастлер [21]. Свыше 20 лет этот подход используется в медицинской географии и биосистематике [22, 23]. Расширение сферы применения методов теории информации для решения задач эколого-генетического характера, когда налицо уникальные данные или небольшие выборки, подробно описывается нами [24]. 

     В последнее время все чаще говорят о сходстве некоторых биологических и гуманитарных закономерностей [17], а также о контекстной зависимости биологических систем от их структуры [15]. В связи с этим следует вспомнить о биологическом приложении теории нечетких множеств [25], нашедшей широкое применение в кибернетике, прикладной электронике, гуманитарных науках. Достаточно упомянуть, что даже издается специализированный журнал Journal of Fuzzy Sets and Systems, посвященный теоретическим и прикладным аспектам этой теории. В дисциплинах медико-биологического профиля она используется пока в прикладных разработках, опирающихся на нечеткую кластеризацию, - для распознавания образов биообъектов и в таксономии, а также как теоретическая основа для принятия решений в нечетких, размытых условиях (см. список литературы в [26]). Неоднозначность и контекстная зависимость биологических систем хорошо вписывается в логику теории нечетких множеств. Наличие малого (недостаточного или уникального) количества экспериментальной информации и неконтролируемых (нечеткие) условий по мнению Р.Беллмана [27] является критерием для применения этой теории в медицине. Именно такое сочетание условий и данных характерно для пост-чернобыльского эколого-генетического мониторинга. Поэтому теория нечетких множеств представляется перспективной для описания фундаментальных закономерностей живой природы, в том числе генетических и эколого-генетических. 

     Теория конечных автоматов и теория фракталов относятся к одним из самых молодых биологических приложений современной математики. Сфера их распространения расширяется с каждым днем, В частности, они уже нашли применение в молекулярной генетике [28,29], физиологии [30], теории эволюции [31]. Наблюдается и обратное движение - от биологии к математике, где благодаря взаимопроникновению математических и генетических идей появился такой прикладной раздел как эволюционные вычисления и генетические алгоритмы [32]. 
 
 

КАК УВЕЛИЧИТЬ ЭФФЕКТИВНОСТЬ ИСПОЛЬЗОВАНИЯ МАТЕМАТИКИ ПРИ МОДЕЛИРОВАНИИ БИОЛОГИЧЕСКИХ ПРОЦЕССОВ 

     На современном этапе развития теоретической биологии нам представляется целесообразным к принципу аналогии, лежащему в основе всякого моделирования, добавить два других принципа, которые наиболее характерны для естественнонаучного подхода. Это, во-первых, принцип индуктивности, согласно которому целесообразно строить модели от частных к более общим. Следованием этому принципу естествознание всегда отличалось от математики, в которой нередким было дедуктивное построение математических теорий. 
     Во-вторых, это принцип достаточности, понимаемый в том смысле, что не следует "изобретать" новую, биологическую математику - достаточно привлекать в биологию вообще, и в генетику в частности, уже существующие математические методы. Таковы, например, теория информации, теория нечетких множеств или современные статистические методы, не нашедшие пока в силу своей сложности применения в биологии. Только на этом пути можно ожидать создания новых информационных технологий, нацеленных на решение фундаментальных биологических проблем. 

     Однако для успешной реализации такого подхода необходимо выполнение двух условий. Во-первых, математики должны "повернуться лицом" к биологическим проблемам, которые могут оказаться плодотворным полем деятельности для них. Это может быть реализовано, в частности, за счет введения на механико-математических факультетах и факультетах прикладной математики университетов спецкурса "Математические проблемы современной биологии". Во-вторых, необходимо подтянуть математическую подготовку биологов, дав им хотя бы общее представление о принципах и методах моделирования и возможностях современной математики. Опыт моего четырехлетнего участия в приемных экзаменах в аспирантуру по генетике показывает, что выпускники вузов (в том числе и БГУ) не всегда ориентируются даже в классических примерах генетического применения математических и кибернетических принципов (математическая формулировка законов Менделя и закона Харди-Вайнберга, кибернетические принципы организации оперона и генетического триггера, генетический код и дешифровка криптограмм, кибернетико-эволюционные предпосылки возникновения полового диморфизма и т.д.). Эта задача может быть решена путем введения на биологических факультетах спецкурсов "Математическое моделирование в биологии" и "Естественнонаучные возможности современной математики". Разработкой таких спецкурсов должны заняться математики и биологи, уже имеющие опыт взаимных контактов и хорошо понимающие особенности мышления друг друга, а также действующие "модельеры", объединяющие в своем лице эти две профессии. 

     В качестве первого шага на пути создания такого спецкурса, можно предложить модифицировать уже вошедший в настоящее время в программы многих университетов спецкурс "Биометрия", расширив его за счет информации об основах методологии моделирования и возможностях современных математических теорий. Такой спецкурс, назвать который можно "Математическое моделирование в биологии и основы биометрии", мог бы включать следующие разделы: 

1. Введение в моделирование биологических систем 

Аналогия в научных исследованиях. Понятие модели. Аналогия и моделирование. Типы моделирования. Специфика моделирования в биологии. Модельные объекты и системы. Математизация биологии. 

2. Кибернетика, теория информации и биология 

Понятие сложной системы. Принцип черного ящика и кибернетический подход. Статистический подход и биометрия. Теоретико-информационная мера оценки неопределенности. Сложные системы и формализация их теоретико-информационного описания. Кибернетические идеи в молекулярной генетике. Теория эволюции, кибернетика и ЭВМ. 

3. Введение в биометрию 

Измерение и обработка данных. Наблюдение и эксперимент. Биометрия как биологическое приложение теории планирования эксперимента. Факторный анализ и полиномиальные модели. Основные понятия биометрии. Отдельные наблюдения и массовые явления. Статистическая совокупность. Статистический комплекс. Признаки и их свойства. Классификация признаков. 

4. Основные характеристики варьирующих объектов 

Случайные события. Законы распределения. Основные типы распределений. 

5. Выборочный метод и оценка генеральных параметров

Модель генеральной совокупности. Генеральная совокупность и выборка. Точечные оценки. Интервальные оценки. 

6. Проверка гипотез о законах распределения 

Статистические гипотезы и их проверка. Критерии достоверности и уровни значимости. Параметрические и непараметрические критерии достоверности оценок. 

7. Дисперсионный анализ

Сущность метода и основные понятия. Анализ однофакторных комплексов. Анализ двухфакторных комплексов. Анализ трехфакторных комплексов. Анализ иерархических комплексов 

8. Корреляционный анализ

Параметрические показатели связи. Функциональная зависимость и корреляция. Коэффициент корреляции. Корреляционное отношение. Непараметрические показатели связи. Множественная и частная корреляция. 

9. Регрессионный анализ

Понятие о регрессии. Линейная регрессия. Ряды динамики. Нелинейная регрессия. Уравнение регрессии и прогноз. 

10. Методы многомерной статистики

Векторы. Матричная алгебра. Корреляционная матрица. Ковариационная матрица. Многомерные методы - аналоги одномерных. Компонентный или факторный анализ. Дискриминантный, кластерный и канонический анализ. 

11. Компьютерная биометрия и обработка данных на ЭВМ

Пакеты прикладных биометрических программ. Возможности стандартных пакетов. Особенности специализированных пакетов прикладных программ. Понятие об эволюционных вычислениях и генетических алгоритмах. 

12. Применение в биологии современных математических теорий

Теория нечетких множеств. Теория конечных автоматов. Теория фракталов. Математическая логика. 

     Из представленного перечня рассматриваемых тем видно, что основой остается курс биометрии. С ней связаны 7 разделов из 12. В то же время в двух первых разделах даются основные сведения по теории моделирования, без которых невозможно сознательное использование любого математического аппарата, в том числе и биометрического. Здесь также предполагается привести некоторые примеры использования математических подходов для решения биологических задач. Если биометрический блок уже достаточно отработан, и рассматриваемые в нем вопросы можно с полным правом отнести к каноническим, то блок основ математического моделирования может быть довольно мобильным, и в зависимости от специализации студентов-биологов дополняться сведениями по математическим методам и пакетам программ, наиболее адекватным задачам, решаемым в конкретной области биологии (разделы 11-12 и дополнительные разделы). 

ЛИТЕРАТУРА 

1. Хакен Г. Синергетика: Иерархии неустойчивостей в самоорганизующихся системах и устройствах. - М.: Мир, 1985. - 419 с. 

2. Рубин А.Б., Пытьева Н.Ф., Ризниченко Г.Ю. Кинетика биологических процессов. - М.: Изд-во МГУ, 1987. - 299 с. 

3. Свирежев Ю.М., Пасеков В.П. Основы математической генетики. - М.: Наука, 1982. -512 с. 

4. Компьютерная биометрика. / Ю.М. Барабашева, Г.Н. Девяткова, 
Н.Г. Микешина и др. - М.: Изд-во МГУ, 1990. - 232 с. 

5. Бернштейн Н.А. На путях к биологии активности // Вопросы философии. - 1965. - N 10. - С. 78 

6. Рашевский Н. Модели и математические принципы в биологии // Теоретическая и математическая биология. - М.: Наука, 1968. - С. 48-66 

7. Мандельштамм Л.И. Лекции по оптике, теории относительности и квантовой механике. - М.: Наука, 1972. - С. 329 

8. Маслов П.П. Моделирование в социологических исследованиях // Вопросы философии. - 1962. - N 3. - С. 67 

9. Баруча-Рид А.Т. Элементы теории марковских процессов и их приложение. - М.: Наука, 1969. - 511 с. 

10. Хуг О., Келлерер А. Стохастическая радиобиология. - М.: Атомиздат, 1969. - 183 с. 

11. Капульцевич Ю.Г. Количественные закономерности лучевого поражения клетки. - М.: Атомиздат, 1978. - 231 с. 

12. Фролов И.Т. Очерки методологии биологического исследования.- М.: Мысль, 1965. - С. 185 

13. Заренков Н.А. Что такое жизнь и биология с точки зрения биолога // Изв. РАН. Сер. биол.- 1993.- N 2.- С. 305-307 

14. Мирзоян Э.Н. Пути развития теоретической биологии // Изв. РАН. Сер. биол. - 1993. - N 5. - С. 774-777 

15. Михайловский Г.Е. Перед закатом системной биологии // Изв. РАН. Сер. биол. - 1993. - N 2. - С. 310-312 

16. Зотина Р.С., Зотин А.И. Взгляды Э.С.Бауэра и теоретическая биология // Изв. РАН. Сер. биол.- 1993.- N 5.- С. 784-785 

17. Титов С.А. На пути к биологической герменевтике // Изв. РАН. Сер. биол.- 1993.- N 2. - С. 307-310 

18. Ратнер В.А. Математическая генетика как наука // Изв. РАН. Сер. биол. - 1993. - N 2. - С. 323-327 

19. Сендов Бл. Математическа биология // Списане Бълг. АН. - 1976. - Т. 21, N 5. - С. 26-32 

20. Шеннон К. Математическая теория связи // Работы по теории информации. - М.: ИЛ, 1963. - С. 243-332 

21. Кастлер Г. Азбука теории информации // Теория информации в биологии. - М.: ИЛ, 1960. - С. 9-53 

22. Пузаченко Ю.Г., Мошкин А.В. Информационно-логический анализ в медико-географических исследованиях // Итоги науки: Медицинская география. - М.: Наука, 1969. - Вып. 3.- С. 5-74 

23. Пузаченко Ю.Г., Скулкин В.С. Структура растительности лесной зоны СССР. Системный анализ. - М.: Наука, 1981. - 276 с. 

24. Дромашко С.Е. Информационные проблемы моделирования биологических процессов (на примере генетики). - Минск: Право и экономика, 1996. - С. 27-31 

25. Zadeh L.A. Fuzzy sets // Inform. and Contr.- 1965.- Vol. 8, N 3. - P. 338-353 

26. Кофман А. Введение в теорию нечетких множеств. - М.: Радио и связь, 1982. - 428 с. 

27. Беллман Р. Математические методы в медицине. - М.: Мир, 1987. - 200 с. 

28. Kauffman S.A. Methabolic stability and epigenesis in randomly constructed genetic nets // J. Theoret. Biol.- 1969.- Vol. 22, N 3.- P. 437-467 

29. Borovk A.S., Frankkamenetskii M.D., Grosberg A.Y. Fractality of DNA texts // J. Biomolec. Struct. and Dynam.- 1994.- Vol. 12, N 3.- P. 655-669 

30. Ragazzi E. Hidden fractals in pharmacodynamics // Pharmazie.- 1995.- Vol. 50, N 1.- P. 66-68 

31. Moulin J.-P. Modifiable automata. Self-modifying automata // Acta Biotheor.- 1992.- Vol. 40, N 2-3.- P. 195-204 

32. Букатова И.Л. Обучающиеся, адаптивные и самоорганизующиеся эволюционные вычисления // Обзор прикладной и промышленной математики. - 1996. - Т. 3, вып. 5. - С. 706-724