© 2004 Электронный журнал "Jahrbuch fur EcoAnalytic und EcoPatologic"
На главную страницу сайта

Сайт наш чаще посещай - будет выше урожай (Лозунг времен Н.С.Хрущева)

На главную страницу сайта

 

РАНДОМИЗАЦИЯ И БУТСТРЕП:
статистический анализ данных по биологии и экологии с использованием R.

В.К. Шитиков, Г.С. Розенберг

Институт экологии Волжского бассейна РАН , 445003, Тольятти, ул. Комзина, 10.
Интернет-версия, 306 с.

 

Библиографическая ссылка:
Шитиков В. К., Розенберг Г. С. Рандомизация и бутстреп: статистический анализ в биологии и экологии с использованием R. Тольятти: Кассандра, 2014. 314 с.

Скачать: а) файл "Рандомизация, бутстреп и все, все, все..." в формате Acrobat Reader (9.5 Мб);
б) архив с текстовой версией скриптов R и комплект исходных данных для их выполнения: Data.zip

Внимание!!! Сейчас актуальным является существенно исправленная и дополненная версия файла книги от 15.11.2013 г.
Отличается от опубликованной версии цветными иллюстрациями.

 

Краткая аннотация и содержание:

Техника скоро дойдет до такого совершенства, что человек сможет обойтись без себя самого.

С.Е. Лец

Эта книга - альманах статистических методов, иллюстрированый примерами биологического характера. Она охватывает оценку статистических параметров, проверку гипотез, дисперсионный анализ, специальные формы регрессии и оценки информативного набора предикторов моделей, многомерные методы классификации, редукции данных и распознавания образов, процедуры, использующие байесовскую парадигму, анализ временной или пространственной динамики, различные подходы к оценке биоразнообразия и т.д.
В каждом представленном методе подчеркивается возможность использования методов генерации повторных выборок, включающих рандомизацию, или перестановочный тест (permutation), бутстреп (bootstrap), метод "складного ножа" (jackknife) и кросс-проверку (cross-validation). Показывается, как с их помощью можно корректно проверить статистическую гипотезу или получить несмещенные характеристики искомого параметра. Где это возможно, полученные результаты сравниваются с классическими асимптотическими методами, использующими то или иное стандартное предельное распределение выборочных статистик.
Книга ориентирована на статистическую среду R, которая постепенно становится общепризнанным мировым стандартом при проведении научно- технических расчетов. В конце каждого раздела представлены тексты несложных скриптов в кодах R, позволяющих выполнить самостоятельно статистический анализ рассматриваемых примеров. По сути, эта книга - также справочник по реализации различных алгоритмов обработки данных для исследователей, которых привлекла эта инструментальная среда.

ПРЕДИСЛОВИЕ 1. БУТСТРЕП И СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ ВЫБОРОЧНЫХ ХАРАКТЕРИСТИК 1.1. Точечные и интервальные характеристики
1.2. Непараметрические методы статистики и ресамплинг
1.3. Складной нож и бутстреп - механизмы генерации случайных псевдовыборок
1.4. Оценка среднего и доверительных интервалов бутстреп-методом
1.5. Примеры бутстрепа: медиана и оценка параметров распределения Парето
1.6. Бутстрепирование индексов, характеризующих многовидовые композиции
2. ИСПОЛЬЗОВАНИЕ РАНДОМИЗАЦИИ ДЛЯ СРАВНЕНИЯ ВЫБОРОК 2.1. Проверка статистических гипотез
2.2. Использование метода рандомизации для проверки гипотез
2.3. Сравнение статистических характеристик двух независимых выборок
2.4. Рандомизационный тест для связанных выборок
2.5. Проблема множественных сравнений
2.6. Сравнение трех или более независимых выборок
2.7. Преобразование данных
2.8. Сравнение разнообразия систем и ограничения на рандомизацию
3. СТАТИСТИЧЕСКИЕ ЗАВИСИМОСТИ И СВЯЗИ МЕЖДУ ПЕРЕМЕННЫМИ 3.1. Оценка парной корреляции с использованием рандомизации
3.2. Анализ связи между признаками в таблицах сопряженности
3.3. Статистическая значимость регрессии двух переменных
3.4. Нелинейная регрессия и скользящий контроль
3.5. Сравнение двух линий тренда и робастная регрессия
3.6. Модели распределения популяционной плотности по градиенту
4. МНОГОМЕРНЫЕ МОДЕЛИ ДИСПЕРСИОННОГО И РЕГРЕССИОННОГО АНАЛИЗА 4.1 Основные модели ANOVA, их ограничения и особенности реализации
4.2. Селекция модели дисперсионного анализа с фиксированными факторами
4.3. Смешанная модель эффектов и проблема "мнимых повторностей"
4.4. Иерархический (гнездовой) дисперсионный анализ
4.5. Модель множественной линейной регрессии
4.6. Селекция моделей: генетический алгоритм и случайный поиск с адаптацией
4.7. Процедуры сглаживания и генеральные аддитивные модели
4.8. Многомерный анализ MANOVA и метод случайного зондирования
5. МЕТОДЫ, ИСПОЛЬЗУЮЩИЕ МАТРИЦЫ ДИСТАНЦИЙ 5.1. Меры сходства/расстояния в многомерном пространстве
5.2. Непараметрический дисперсионный анализ матриц дистанции
5.3. Тест Мантеля для оценки связи между многомерными структурами
5.4. Иерархический кластерный анализ и бутстрепинг деревьев
5.5. Алгоритмы оценки оптимальности разбиения на классы
5.6. Использование нечетких множеств для классификации и оценки силы связи
5.7. Дендрограммы и оценка функционального разнообразия
6. КЛАССИФИКАЦИЯ, ОРДИНАЦИЯ И СНИЖЕНИЕ РАЗМЕРНОСТИ 6.1. Методы многомерной классификации и ординации
6.2. Проецирование данных в пространства малой размерности методом PCA
6.3. Сравнение результатов различных моделей ординации
6.4. Деревья классификации и регрессии
6.5. Деревья классификации с многомерным откликом
6.6. Преобразование координат в геометрической морфометрии
6.7. Дискриминантный анализ, логистическая регрессия и метод опорных векторов
6.8. Метод k ближайших соседей и использование нейронных сетей
6.9. Самоорганизующиеся карты Кохонена
7. АНАЛИЗ ПРОСТРАНСТВЕННО-ВРЕМЕННОЙ ДИНАМИКИ И БАЙЕСОВСКИЕ МЕТОДЫ 7.1. Декомпозиция временных рядов и выделение тренда
7.2. Автокорреляция, стационарность и оценка периодичности
7.3 Модели временных рядов: бутстреп и прогнозирование
7.4. Анализ главных компонент и многомерные временные ряды
7.5. Анализ пространственных структур
7.6. Автоковариация и пространственно обусловленная зависимость отклика
7.7. Байесовский подход и марковские цепи Монте-Карло
СПИСОК ЛИТЕРАТУРНЫХ ИСТОЧНИКОВ
ПРИЛОЖЕНИЕ 1. Указатель использованных примеров и их краткое описание
ПРИЛОЖЕНИЕ 2. Статистическая среда R и ее использование для обработки данных