Дальше К следующему разделу Назад К предыдующему разделу Начало К началу разделу Конец К концу разделу Список К оглавлению

3.3.2. Классификация алгоритмов комплексации

Коллектив предикторов g чаще всего представляют в виде линейной комбинации из базового или суженного (наиболее информативного) множества исходных предикторов:

где yk - вектор расчетных значений, полученных по k-му индивидуальному алгоритму для каждого момента времени, k=(1, 2, ..., m), w k - вектор неизвестных коэффициентов.

Задача комплексации эквивалентна определению совокупности векторов w k, удовлетворяющих заданным ограничениям и минимизирующим некоторый критерий качества.

Число различных алгоритмов синтеза непрерывных коллективных предикторов постоянно возрастает, а их классификация может быть весьма условной. Тем не менее выделим алгоритмы комплексации без адаптации, в которых предполагается, что компоненты вектора весовых коэффициентов w k неизменны для всех моментов времени (вектор превращается в скалярную величину), и алгоритмы с адаптацией, если элементы вектора w k пересчитываются (адаптируются) при переходе от точки t к точке t+1.

К группе алгоритмов без адаптации могут быть отнесены следующие:

g = F( y1, y2, ..., ym; t)

использует многорядный алгоритм МГУА (Брусиловский, Розенберг, 1983);

где ps - задаваемые исследователем неотрицательные весовые коэффициенты (приоритеты) отдельных критериев Cs;

К адаптивным алгоритмам относятся алгоритмы Бейтса-Гренджера (Bates, Grander, 1965), Ньюболда-Гренджера (Newbald, Grander, 1974), Лукашина (1979) и др.

Очевидно, что подавляющее большинство неадаптивных алгоритмов комплексации основано на тривиальных методах обработки многомерных наблюдений.

Обозначим как G1 коллективный прогноз временного ряда NH4+ , полученный как среднее арифметическое сопряженных значений по 8 описанным выше индивидуальным моделям.

Использование описанного выше шагового метода получения регрессионной модели дает следующее линейное уравнение:

G2 = -44.5 + 0.832 R2 + 0.48 R8 + 0.779 R7 - 0.748 R5.

Если в регрессионном уравнении учесть также все парные взаимодействия индивидуальных прогнозов, то коллективный предиктор будет иметь вид:

G3 = 59.6 - 0.203 R1 - 0.6 R8 + 0.00973 R2 R8 + 0.0138 R7 R8 -

- 0.0079 R5 R8 - 0.0024 R6 R8 - 0.0033 R4 R8.

Аналогичная модель, полученная по комбинаторному алгоритму МГУА (см. описание в разд. 3.2.3) с использованием внутреннего критерия - среднеквадратической ошибки на всей выборке, выражается следующим полиномиальным уравнением

G4 = 0.5805 R7 - 0.1864 R8 + 0.0098 R2 R8 - 0.002 R6 R8 - 0.0024 R1 R5.

Более строгий подход к специфике и исходным предпосылкам синтеза коллектива предикторов демонстрирует алгоритм Дикинсона-Ершова, общее описание которого приводится ниже.

Пусть исходные предикторы, входящие в базовый набор, удовлетворяют следующим условиям:

На компоненты вектора w k налагаются ограничения нормировки:

, w k > 0 , k = 1, 2, ..., m ,

С учетом сделанных допущений, дисперсия ошибки коллективного предиктора вычисляется по формуле

Минимизируя d m методом неопределенных множителей Лагранжа:

легко получить искомый вектор весовых коэффициентов w opt.

На практике дисперсии ошибок d ij оказываются неизвестными, поэтому Дж.Дикинсон (Dikinsen, 1975) предлагает использовать их оценки Sij. Э.Б.Ершов (1975) для определения w opt применял метод максимального правдоподобия и постулировал нормальность совместного распределения ошибок индивидуальных предикторов, входящих в базовый набор.

Kоллектив предикторов Дикинсона-Ершова для набора исходных моделей R1-R8 ряда NH4+ имеет вид:

G5 = -20.088 - 0.144 R1 + 0.9597 R2 + 0.0746 R3 - 0.359 R4 - 1.153 R5 + 0.045 R6 + 1.247 R7 + 0.331 R8

Интересно отметить, что во всех синтезированных коллективах G2-G5, если ориентироваться на коэффициенты уравнений, достаточно скромный вклад вносит наилучшая исходная модель R2 (и уж совсем незаметна индивидуально сильная модель сплайновой интерполяции R3). В то же время неожиданную "популярность" приобрела весьма специфическая модель полигармоничного тренда R8, совсем не блиставшая в рейтинге индивидуалов. Этот факт служит подтверждением высказанного выше тезиса о ценности для коллектива "зерен нетривиальности", рассыпанных в исходных моделях.

Алгоритм Бейтса-Гренджера, в его каноническом описании, предназначен для синтеза коллектива, имеющего минимальную возможную дисперсию ошибки по двум исходным моделям y1 и y2:

gi = w i Ri1 + (1 - w i) Ri2, i = 1,2,...,n.

При этом постулируются все исходные допущения, декларированные в методе Дикинсона-Ершова, а вектор w i можно рассматривать как оценку вектора w opt, вычисленную в точке i в условиях отсутствия достоверной информации об элементах ковариационной матрицы ошибок. Для расчета вектора весовых коэффициентов используют различные адаптационные процедуры, обладающие необходимыми свойствами сходимости и эффективности.

Для того, чтобы алгоритм Бейтса-Гренджера мог быть использован в случае произвольного числа исходных предикторов, применяют специально разработанные многошаговые и комбинированные процедуры.

Сравнительный анализ эффективности каждого из рассмотренных методов комплексации проведем с использованием знакомого нам по предыдущему разделу набора критериев:

№ модели

Средне-квадра-тич. ошибка

Cредний модуль ошибки

Макси-мальный модуль ошибки

Критерий регуляр- ности

Коэффи-циент корре-ляции

Критерий Дарбина-Уотсона

G1

58.4

38

277

0.739

0.711

1.49

G2

47.8

34

218

0.605

0.797

1.93

G3

42.8

30.7

178

0.541

0.841

1.93

G4

43.9

31

210

0.556

0.831

1.91

G5

47.9

34.2

197

0.607

0.796

1.87

G6

54.2

36.9

276

0.686

0.727

1.71

Использованные в таблице номера соответствуют следующим коллективам предикторов:

Нетрудно заметить, что безусловным аутсайдером по всем критериям оценки является простое усреднение частных прогнозов (G1). Это естественно, поскольку составить работоспособный коллектив без учета уровня компетентности его членов - невыполнимая задача в любой сфере деятельности. Не претендуя в настоящей работе на глобальные обобщения, следует отметить явное преимущество нелинейных регрессионных методов (G3) и алгоритмов МГУА (G4) над другими процедурами. Они позволяют расширить класс функций, в котором ищется предиктор-коллектив, до класса полиномов произвольной степени от многих аргументов и использовать в качестве целевой функции не только дисперсию ошибок, но и любой другой критерий. Кроме того, для их применения не требуется выполнения условия нормировки весовых коэффициентов.

График интерполяции ряда NH4+ коллективом предикторов, полученный с помощью нелинейной регрессионной модели (G3), представлен на рис. 3.9.

 

Дальше К следующему разделу Назад К предыдующему разделу Начало К началу разделу Конец К концу разделу Список К оглавлению