Шитиков В.К., Розенберг Г.С. РАНДОМИЗАЦИЯ И БУТСТРЕП: статистический анализ в биологии и экологии с использованием R. - Тольятти: Кассандра, 2014. 314 с. |
Скачать: а)
файл "Рандомизация, бутстреп и все, все, все..." в формате Acrobat Reader (10.3 Мб);
б) "архив с текстовой версией скриптов R" и комплект исходных данных для их выполнения.
Внимание!!! Сейчас актуальным является существенно исправленная и дополненная версия файла книги от 15.11.2013 г.
Отличается от опубликованной версии цветными иллюстрациями.
Краткая аннотация и содержание:
Техника скоро дойдет до такого совершенства, что человек сможет обойтись без себя самого.
С.Е. Лец
В книге представлено широкое описание статистических методов, как
повсеместно используемых, так и не нашедших пока должного применения в обработке
данных экологического мониторинга. Сюда вошли элементарная статистика, проверка
гипотез, различные подходы к оценке биоразнообразия, дисперсионный анализ,
специальные формы регрессии и оценки информативного набора предикторов моделей,
многомерные методы классификации, редукции и распознавания данных, процедуры,
использующие байесовский подход, анализ временной или пространственной динамики и
т.д. Методика их применения широко иллюстрирована на примерах биологического характера.
Совокупность представленных методов связывается двумя основополагающими
идеями. Во-первых, в каждом примере мы пытались найти "изюминку" в виде
использования нового класса компьютерно-интенсивных (computer-intensive) методов, в
широком смысле относящихся к семейству различных процедур Монте-Карло. Наиболее
детально представлен численный ресамплинг, который заключается в различных
технологиях генерации повторных выборок, включающих рандомизацию, или
перестановочный тест (permutation), бутстреп (bootstrap), метод "складного ножа"
(jackknife) и кросс-проверку (cross-validation). Показано, как с их помощью можно
корректно проверить статистическую гипотезу или получить несмещенные
характеристики искомого параметра: оценки математического ожидания, дисперсии,
доверительного интервала, коэффициентов модели. Где это возможно, мы сравниваем
полученные результаты с классическими асимптотическими методами, использующими
то или иное стандартное предельное распределение выборочных статистик.
Вторая "красная нить" - возможность для читателей легко воспроизвести самим технику
выполнения расчетов. Мы ориентировались на статистическую среду R, которая
постепенно становится общепризнанным мировым стандартом при проведении научно-
технических расчетов. В конце каждого раздела представлены тексты несложных
скриптов в кодах R, позволяющих выполнить самостоятельно статистический анализ
рассматриваемых примеров. В этой связи, представляемая монография может
рассматриваться также как справочник по реализации различных алгоритмов обработки
данных для исследователей, которых привлекла эта инструментальная среда.
Книга может быть использована в качестве учебного пособия по статистическим методам
для студентов и аспирантов высших учебных заведений биологического профиля.
Показать содержание книги.