Главные компоненты временных рядов: метод 'Гусеница'

Главные компоненты временных рядов:
 
метод "Гусеница"

Под редакцией Д.Л.Данилова и А.А.Жиглявского
Санкт-Петербургский университет
1997

Введение

Метод анализа временных рядов "Гусеница", рассматриваемый в книге, помогает увидеть и выделить разного рода закономерности в поведении временных рядов, зачастую априори не очевидные. В книге приводится большое количество примеров. Наряду с примерами использования "Гусеницы" и подробным описанием методологии, авторы уделяют большое внимание также теоретическому исследованию метода.

Отметим, что под временным рядом мы понимаем набор {f(iD)}Ni=1 значений, вообще говоря, произвольной функции одной переменной f(t),t>0, в равноотстоящих точках iD (i=1,...,N). При этом переменная t не обязательно имеет смысл времени.

Во многих естественных науках сложилось представление о возможности описания природных процессов с помощью функций, состоящих из нескольких слагаемых

f(t) = fT(t) + fn(t) + fr(t) + e(t),    t Î [0,T],

где fT(t) - медленная нерегулярная составляющая, обычно называемая трендом, часто ее пытаются описывать алгебраическими полиномами невысоких порядков;
   fn(t) - периодическая или сумма периодических составляющих; в зависимости от области приложений они называются сезонными, суточными и т.п. вариациями;
   fr(t) - быстрые нерегулярные малые вариации, в которые обычно включают все, что не укладывается в формальную модель, иногда сюда включают и случайные шумы;
   e(t) - чисто случайная составляющая, описываемая случайным процессом определенного типа.

Во многих частных случаях к настоящему времени созданы мощные теории с развитым аппаратом приложений и компьютерными реализациями в виде библиотек и пакетов программ. Так, для функций вида f(t) = fT(t) + e(t) такой теорией является теория аппроксимации (при малых e(t)) или метод наименьших квадратов математической статистики (при больших e(t)), для функций вида f(t) = fn(t) хорошо работает теория гармонических рядов Фурье.

Однако, во многих ситуациях возникают достаточно большие сложности эффективного исследования функций. Примером может быть случай f(t) = fT(t) + fn(t), где при отсутствии априорной информации о частотах компонент периодической составляющей не работают ни теория аппроксимации, ни теория рядов Фурье. В различных конкретных приложениях придумано много эвристических приемов, но они, как правило, плохо теоретически обоснованы. В настоящей книге делается попытка показать, что при использовании метода "Гусеница" часто оказывается возможным (приближенно) выделить отдельные составляющие исходного ряда.

В книге подробно описаны:
- методология (главы I,II,III)
- теоретическое обоснование (главы III,V)
- применения (главы I,IV,VII)
- программное обеспечение (глава VI)

Глава I является вводной. Она посвящена описанию базового алгоритма анализа одномерных временных рядов, реализующего метод "Гусеница", а также его возможностей с демонстрацией примеров применения. В этой главе формальное описание алгоритма сочетается с неформальным, включающим в себя очень важное для методов такого рода рассмотрение визуальных представлений результатов метода. Обсуждается выбор параметров, при этом учитывается практический опыт применения метода авторами. Примеры подобраны так, чтобы, с одной стороны, наглядно проиллюстрировать возможности "Гусеницы" и продемонстрировать как можно больше способов разглядывания результатов, которые могут помочь при использовании метода, а с другой стороны, обсудить возникающие при применении метода проблемы.

В Главе II описаны основные идеи, приводящие к методам типа "Гусеница", а также сами эти методы. Материал главы в значительной степени является обзорным, хотя, в силу обширности затрагиваемых тем, не претендует на полноту. Разделы данной главы описывают стандартную процедуру анализа главных компонент (АГК), использование АГК для анализа стационарных временных рядов и в теории динамических систем, динамический анализ Фурье, вейвлет-анализ, а также два метода, по сути совпадающие с некоторыми вариантами "Гусеницы" - анализ сингулярного спектра (Broomhead и др.) и метод развертки (Бухштабер), см. точные ссылки в конце главы II.

В Главе III базовый алгоритм, подробно описанный в Главе I, распространен для решения задач обработки многомерных рядов и полей, а также прогнозирования одномерных и многомерных рядов. Развитие идеи метода "Гусеница", проведенное в данной главе, показывает богатое и до конца не использованное содержание этого метода. Изложение иллюстрируется большим количеством примеров.

В Главе IV описаны результаты подробного сравнительного анализа метода "Гусеница" и классических методов анализа одномерных временных рядов на трех стандартных наборах данных: объем пассажироперевозок на международных авиалиниях, заболеваемость СПИДом в США и среднемесячное число яиц на несушку в США. Результаты сравнительного анализа показывают, что на хороших данных метод "Гусеница" по крайней мере так же хорош, как и испытанные классические средства. В ряде же случаев он позволяет достичь того же результата более естественным путем или обнаружить эффект, который не проявляют стандартные методы.

Глава V посвящена теории метода "Гусеница". Ключевым разделом данной главы является первый, в котором метод исследован на языке функционального анализа, точнее -- теории операторов Гильберта-Шмидта. Показано, что на этом языке оказывается возможным не только описать единым образом сам метод, его различные модификации и обобщения, но и объяснить некоторые наблюдаемые на практике явления, возникающие при обработке реальных временных рядов. В частности, исследованы асимптотические свойства метода, существенно отличающиеся от его "допредельных" свойств.

В Главе VI описана реализующая базовый вариант метода "Гусеница" программа, которая находится на прилагаемой к книге дискете.

Глава VII содержит примеры, в которых метод "Гусеница" позволил получить содержательные с практической точки зрения результаты. Разделы этой главы включают в себя интерпретацию результатов, данную специалистами в соответствующих областях науки.

В заключении сделаем несколько замечаний, относящихся к отечественной теории метода "Гусеница" (обзор зарубежных аналогов метода см. в Главе II).

Разработка метода явилась результатом стажировки по математической биологии в МГУ в 1961 г. под руководством А.Н.Колмогорова выпускника математико-механического факультета ЛГУ О.М.Калинина. В это время А.Н.Колмогоров проявил активный интерес к задаче выделения периодичностей в природных процессах. Отметим, в частности, работу 1962 г. Арато, Колмогорова и Синая, посвященную Эйлеровскому (10 месяцев) и Чандлеровскому (14 месяцев) периодам в движении полюсов Земли. Метод был сфрмулирован О.М.Калининым в 1969 г. и впервые изложен в дипломной работе М.Д.Белонина, а затем опубликован в 1971 г. в обзоре "Факторный анализ в нефтяной геологии", М., "Недра". В дальнейшем этот метод подвергался анализу и развитию в самых различных направлениях. Первым опубликованным практическим променением метода можно считать диссертацию М.М.Кислицина, выполненную под руководством О.М.Калинина и В.М.Ахутина в 1977 г. (см. также статью М.М.Кислицина в настоящем сборнике).

Метод многократно реализовывался на разных типах ЭВМ (начиная с M-20, необходимо отметить значительную роль Т.П.Кистер, которая во многом способствовала пониманию особенностей программной реализации метода), однако не нашел широкого применения до появления ЭВМ серии СМ, допускающих диалог с пользователем. Особенностью метода (как это видно из других статей этого сборника) является существенное использование диалога и визуализации результатов вычислений. Первой интерактивной реализацией метода была программа на СМ-4, реализованная в 1989 г. О.В.Богдановой и В.Н.Солнцевым. В этой же программе впервые "Гусеница" была дополнена весьма существенным блоком восстановления. В 1991–1992 гг. она была перенесена на ПК студентами математико-механического факультета В.Б.Мартыновой и Л.Ю.Котовой под руководством Н.Ю.Баланиной. Появление этой программы послужило толчком к началу целого ряда теоретических, программистских и прикладных исследований, промежуточный итог которых представлен в настоящем сборнике. Отметим также статью В.М.Бухштабера, 1994 г., идеи которой оказали серьезное влияние на ряд ниже публикуемых исследований.

Авторы будут благодарны всем читателям, которые пришлют нам свои впечатления, замечания и пожелания по адресу gus@gistatgroup.com

Вернуться на главную страницу

Copyright © 1996-2004 GistaT Group. All rights reserved.