Дальше К следующему разделу Назад К предыдующему разделу Начало К началу разделу Конец К концу разделу Список К оглавлению

3.1.4. Интерполяция временных рядов сплайнами

Свое происхождение термин "сплайн" ведет от длинных гибких линеек, используемых чертежниками в качестве лекал для проведения плавных кривых через заданные точки. Еще в 1905 г. академик С.Н.Бернштейн в качестве альтернативы "капризным" многочленам предложил пользоваться для приближенного представления функций ломаными линиями с вершинами в экспериментально определенных точках. Кусочно-линейная аппроксимация - частный случай сплайнов первой степени.

Поскольку из физических соображений моделируемая функция очень часто не должна иметь изломов, вместо отрезков прямых стали использовать функции более высокой степени. При этом композиция из "кусочков" многочленов данной степени состыковывается так, чтобы получившаяся функция была бы максимально гладкой.

Пусть отрезок [a,b] разбит на (k + 1) части точками a1 < ...< ak. Сплайном или кусочно-полиномиальной функцией степени m с k cопряжениями в точках a1, ..., ak называется функция j (t), которая на каждом интервале (aj, aj+1), j = 0, ..., k, описывается алгебраическим полиномом Pj(t) степени m. Коэффициенты полиномов Pj(t) согласованы между собой так, чтобы выполнялись условия непрерывности функции j (t) и ее (m - 1) производных в узлах сопряжений.

Наилучший способ приближения сплайнами (Алберг и др., 1977; Носинова, 1977; Рвачев, Рвачев, 1978; Стечкин, Субботин, 1978) - интерполяция в равноотстоящих узлах, причем наиболее употребительны сплайны третей степени (кубические сплайны). Среди всех функций j (t), имеющих непрерывную вторую производную j '(t), кубический сплайн имеет j ''(a) = j ''(b) = 0 и минимизирует интеграл

т.е. обладает свойством минимальной кривизны.

Определим фундаментальные сплайны Pj(t), j = 1, 2, ..., k + 4, как линейно независимые кубические сплайны, обладающие следующими свойствами:

Значения фундаментальных сплайнов находятся решением линейной алгебраической системы с трехдиагональной матрицей.

Тогда любой сплайн на заданной сетке можно представить как

,

где aj - коэффициенты разложения, Pj(t) - набор фундаментальных сплайнов.

Аналогично полиномиальному приближению, функционал cреднеквадратичной ошибки в случае кубического сплайн-приближения регрессии имеет вид:

.

Вектор коэффициентов кубического сплайн-приближения a* = (a0, a1, ..., ak), соответствующий минимуму D (a), находится путем решения нормальной системы линейных алгебраических уравнений

a* = ( Sт S )-1 Sт Y ,

где y - вектор экспериментальных значений исследуемой зависимости; S = | Pj (ti)/s i2 | - матрица размера n(k+4) значений фундаментальных сплайнов в моменты времени ti.

Оценка качества приближения функции регрессии, зависящая от числа узлов сопряжения k и справедливая для любой случайной выборки, вычисляется по формуле

где (1 - h ) - вероятность, с которой справедлива эта оценка (Алгоритмы и программы ..., 1982) .

Cтруктурная идентификация наилучшей модели заключается в построении сплайнов с различным числом узлов сопряжения в процессе их последовательного перебора, нахождении для каждого уровня k минимума функционала среднеквадратичной ошибки и в выборе из них сплайна, для которого критерий I(k) принимает наименьшее значение, что соответствует гарантированному минимуму функционала среднего риска.

Многими авторами акцентируется несомненное преимущество приближения сплайнами по сравнению с теми же полиномами. Так, теоретически доказано (Тихомиров, 1976), что равноточечные кубические сплайны - чуть ли не единственный способ, обеспечивающий равномерное и эффективное приближение любой непрерывной функции при отсутствии достаточно полной априорной информации о ее структуре. К сожалению, в случае с нашими временными рядами эти выводы не нашли подтверждения. Сплайны оказывались хуже, или, по крайней мере, не лучше полиномов.

Например, при сплайн-интерполяции ряда NH4+ , приняв значения ошибки измерения во всех точках = 1, а h = 0.95, были получены следующие значения минимизируемых функционалов:

Число узлов сопряжения k

Ошибка D (a*)

Средний риск I(k)

1

4220.3

7214.3

2

3248.4

5816.3

3

2967.5

5549.2

4

3050.2

5943.5

5

3085.1

6252.5

6

2766.9

5823.7

Модель сплайна с 3-мя узлами сопряжения (модель R3), соответствующая минимуму среднего риска, описывается следующими уравнениями:

График полученной модели представлен на рис. 3.4.

Аналогичная модель временного ряда Fe при количестве узлов сопряжения k = 5, полученная при экстремальных значениях ошибки D (a*) = 8657.3 и критерия I(5) = 17545, представлена на графике рис. 3.5.

Остается отметить совершенно подозрительное поведение полученных сплайнов на концах временных рядов, что делает их непригодными для надежной экстраполяции.

 

Дальше К следующему разделу Назад К предыдующему разделу Начало К началу разделу Конец К концу разделу Список К оглавлению