Дальше К следующему разделу Назад К предыдующему разделу Начало К началу разделу Конец К концу разделу Список К оглавлению

2.1.4. Выборочные статистические характеристики ряда

В общем случае определение статистических характеристик случайной функции по экспериментальным данным представляет собой весьма сложную процедуру, состоящую из трех этапов: оценки стационарности функции, оценки характеристик ординат случайной функции и осреднения этих оценок. На практике при анализе временных рядов им приписывают свойство эргодичности, основанное на предположении о том, что единственная реализация случайной функции репрезентативной продолжительности является достаточным опытным материалом для получения ее статистических характеристик.

Другим свойством, которым должна обладать итоговая статистика, является устойчивость. Если при резком изменении малой доли количества данных (вследствие выбросов или других случайных искажений) значение статистической характеристики претерпевает существенные изменения, то такая статистика неустойчива.

Среднее значение для стационарного временного ряда определяется как математическое ожидание любого индивидуального значения (ввиду стационарности это математическое ожидание не зависит от момента наблюдения). В качестве оценки среднего используют обычно выборочное среднее значений ряда - сумму значений ряда, деленную на их общее число. При предположениях эргодичности эта оценка состоятельна, хотя при наличии сильной автокорреляции она теряет свою эффективность. Арифметическое среднее - прототип неустойчивого итога.

Медиана временного ряда определяется как медиана распределения реализаций случайной функции в момент времени t, т.е. такое действительное число, вероятность превышения которого для произвольного измерения равна 0.5 (для стационарного временного ряда эта величина не зависит от момента наблюдения). Для оценки медианы используют выборочную медиану ряда, т.е. центральный член (либо полусумму центральных членов) последовательности измерений, упорядоченной по возрастанию. В случае симметричного, например гауссовского распределения, теоретическое значение медианы совпадает со средним значением ряда, а выборочная медиана является альтернативной оценкой среднего значения. Медиана служит прототипом простого устойчивого итога.

Если при исследовании временных рядов требуется робастность эффективности (т.е. гарантированное качество оценки при широком варьировании ситуаций) то рекомендуется использовать более сложные устойчивые статистики, как, например, бивес-оценку (Мостеллер, Тьюки, 1982):

, где

m s - медиана абсолютных отклонений |xib|, с - константа, которая берется равной 9 или 6. Поскольку m s есть оценка для примерно 2/3 s , то при расчете бивес-оценки не учитываются "хвосты" нормального распределения, т.е. измерения, превышающие 4s (при с = 6) или 6s (при с = 9). Так как мы не можем непосредственно вычислить b, не зная вектора весовых коэффициентов w , и, в то же время, не можем найти веса, пока не знаем b, бивес-оценка рассчитывается по приведенным формулам с использованием итеративной процедуры.

Дисперсия динамического ряда определяется как дисперсия любого индивидуального значения (для стационарных рядов эта величина не зависит от момента наблюдения). Для его оценки используют обычно выборочную дисперсию ряда - сумму квадратов отклонений от среднего значения ряда, деленную на (n-1), где n - число значений ряда. При предположениях эргодичности эта оценка состоятельна, хотя при наличии сильной автокорреляции она теряет эффективность.

Выборочные оценки среднего, медианы и дисперсии могут быть вычислены и для нестационарного ряда, но в этом случае они не имеют вероятностной интерпретации.

Таблица 2.1

Выборочные статистические характеристики исследуемых временных рядов

Ряд

Среднее Медиана

Бивес- оценка

Дисперсия

Стандарт-ная ошибка

РАСХОД

СКОРОСТЬ

ПОВТОР

NH4+

Fe

NCAL

NROT

20.1873

4.92077

12.1056

89.9827

129.369

2.10397

64.5805

16.595

4.3

11

60

100

1.01

48.5

16.373

4.685

11.637

70.16

116.67

1.51

56.266

153.134

4.51953

54.0767

6242.46

11867.4

8.34914

4573.81

12.3747

2.12592

7.35368

79.0092

108.938

2.88949

67.6299

В табл. 2.1 видно cущественное различие между средним и медианой для ряда NCAL, которое объясняется существенной ассиметрией распределения данных этого показателя (см. гистограмму на рис. 2.2). Значения бивес-оценки занимают, как правило, промежуточное место между средним и медианой.

 

Дальше К следующему разделу Назад К предыдующему разделу Начало К началу разделу Конец К концу разделу Список К оглавлению