jueves, 19 de julio de 2007

SERIES DE TIEMPO

SERIES DE TIEMPO

Principales aspectos conceptuales de series de tiempo.

1.CLASIFICACIÓN DE LOS MODELOS CUANTITATIVOS

Los modelos cuantitativos se pueden clasificar, de acuerdo con la información que
utilizan en multivariantes o econométricos, y en univariantes o de series de tiempo.

1.1.Modelos Multivariantes o Econométricos

Los modelos econométricos tratan de explicar el comportamiento de una o más
variables en función de la evolución de otras variables que se consideran explicativas. Las variables explicadas por el modelo se denominan endógenas, mientras que las variables explicativas del modelo, pero no explicadas por él, se denominan predeterminadas. Entre las variables predeterminadas se distinguen dos grupos: exógenas y endógenas retardadas, estas últimas no son explicadas por el modelo en el momento t, pero han sido explicadas por él en un momento anterior, por su parte, las exógenas son variables que no son explicadas por el modelo en ningún momento1.
Los modelos multivariantes contemplan de forma explícita la información que aportan
las variables causales del fenómeno de interés de acuerdo con una determinada teoría económica. Una ventaja de este modelo consiste en que los resultados que se generan son más eficientes y poseen mayor poder explicativo que los modelos univariantes. Sin embargo, en estos modelos, cuando se desea realizar predicciones, el desconocimiento de los valores de las variables explicativas en el futuro determina la necesidad de utilizar predicciones para éstas, lo cual incrementa el nivel de incertidumbre con que se realiza la predicción econométrica. Por otro parte, cuando el futuro puede suponer una alteración de tendencias de comportamiento respecto al pasado reciente, es recomendable utilizar estos modelos causales para predecir a mediano plazo (1 a 5 años).
1
Véase, Guisán, María del Carmen. Econometría (1997).

Los modelos más sencillos se le denominan uniecuacionales, pues solo tienen una
variable endógena corriente en el lado izquierdo de la relación (variable endógena o
regresando), en el otro lado, puede haber una o varias variables explicativas exógenas y endógenas retardadas). Además de las variables mencionadas, en cada ecuación interviene generalmente una variable no observable (la perturbación aleatoria), la cual recoge los efectos de diversos factores que desvían ligeramente el valor de la variable explicada respecto al valor esperado de acuerdo al modelo.
Por ejemplo:
t t t t Y X Y e b b b + + + = -1 2 1 0

en donde; t Y es la variable endógena, t X es exógena, 1 - t Y es una variable endógena retardada y e es la perturbación aleatoria. En el caso que exista interdependencia entre la variable explicada por la ecuación y alguna de las variables explicativas, u otras variables endógenas de otras ecuaciones, se debe formular un sistema de ecuaciones en el que tenga en cuenta las diversas relaciones existentes entre esas variables, utilizando métodos de estimación diseñados especialmente para modelos multiecuacionales. Cuando el objetivo del estudio econométrico es exclusivamente la predicción no siempre es necesario que se especifique un modelo causal en el que la variable explicada se exprese en función de un conjunto de variables explicativas, ya que en muchos casos se pueden obtener predicciones satisfactorias mediante modelos de predicción univariantes.


1.2.Modelos Univariantes

En este enfoque no se necesita conocer ninguna relación de causalidad, explicativa del comportamiento de la variable endógena, ni en su defecto, ninguna información relativa al comportamiento de otras variable explicativas, ya que en este caso no existe este tipo de variables. Es suficiente con conocer una serie temporal de la variable en estudio, para estimar el modelo que se utilizará para predecir.

La predicción univariante se utiliza, en problemas económicos, principalmente con dos
objetivos:
· La predicción de algunas variables explicativas de un modelo causal, cuando se
espera que en el futuro conserven algunas de las características de su evolución en
el pasado.
· La predicción a corto plazo (de 1 a 4 trimestres), debido a su gran capacidad para
recoger la dinámica en el comportamiento de la variable estudiada. Además, en
condiciones normales, cuando no existen bruscas alteraciones respecto a la
experiencia reciente de la variable, estos métodos pueden proporcionar buenas
predicciones.
Entre las técnicas univariantes existen algunas muy sencillas, tales como el modelo
autorregresivo de primer orden, el modelo de tendencia lineal o exponencial, entre otros.
Las técnicas más rigurosas para la predicción univariante son las denominadas técnicas o modelos Box-Jenkins, o más concretamente modelos ARIMA, pues las técnicas Box-Jenkins constituyen un conjunto más amplio, dentro del cual los modelos ARIMA univariantes son sólo una parte.
Por último, se encuentran los modelos de función de transferencia que reúnen
características de los modelos univariantes y multivariantes.
CLASIFICACIÓN DE LOS MODELOS CUANTITATIVOS


2.MODELOS ARIMA

La metodología de los modelos ARIMA fue formalizada por Box y Jenkins en 1976, por eso también se les denomina modelos Box-Jenkins. Los modelos ARIMA forman parte de la rama de la Estadística que se denomina “Análisis de series de tiempo”. Se fundamentan en la teoría de los procesos estocásticos. El nombre de estos modelos ARIMA procede de las siglas en inglés de Autorregresive, integrated and moving average. Su significado es Modelos integrados (I) autorregresivos (AR) y de medias móviles (MA).
Este enfoque parte del hecho que la serie temporal que se trata de predecir es
generada por un proceso estocástico o aleatorio cuya naturaleza puede ser caracterizada mediante un modelo.

Univariantes Multivariantes
o de series o econométricos
de tiempo
Ej. ARIMA univariantes Uniecuacionales Multiecuacionales
ARIMA estacionales
ARIMA + Análisis de
intervención
Predicción Predicción Simulación
1-4 trimestres 1-5 años (Análisis causal)
Modelos de función de transferencia

Para efectuar la estimación de un modelo ARIMA se requiere de una serie temporal
mensual o trimestral de tamaño grande para la variable yt. Por ejemplo, en el paquete
TRAMO/SEATS se requieren 36 observaciones (3 años) en el caso de datos mensuales y 16 (4años) en el caso de datos trimestrales.


2.1.Notación Box-Jenkins

La notación compacta de los modelos ARIMA es la siguiente:

ARIMA (p,d,q)
donde:
p: Número de parámetros autorregresivos.
d: Número de diferenciaciones para que la serie sea estacionaria.
q: Número de parámetros de medias móviles.

La notación con operador de rezagos es (1-B) o D.
Es decir,
(1-B) zt = D zt = zt – zt-1

Por otra parte, la notación extendida de un modelo ARMA(p,q) es la siguiente:

(1- f1*B - f2*B2 - ... - fp*Bp ) zt = (1- q1*B - q2*B2 - ... - qq*Bq ) at

Entonces, la notación de un modelo MA(1) y de un modelo MA(2) es:
MA(1) à zt = at - q1* at-1
MA(2) à zt = at - q1* at-1 - q2* at-2

La notación de modelos autorregresivos de orden 1 y orden 2 es:
AR(1) à (1- f1*B) z t = at
zt - f1* zt-1 = at
zt = f1* zt-1 + at

AR(2) à zt = f1* zt-1 + f2* zt-2 + at

Por ultimo, la notación de un modelo mixto es
:
ARMA(1,1) à zt = f1* zt-1 + at - q1* at-1


2.2.Proceso Arima

Las etapas que se siguen en la elaboración de un modelo ARIMA con fines predictivos
son las siguientes: identificación, estimación, verificación y pronóstico.
Lo que se trata es de identificar el proceso estocástico que ha generado los datos,
estimar los parámetros que caracterizan dicho proceso, verificar que se cumplan las hipótesis que han permitido la estimación de dichos parámetros. Si dichos supuestos no se cumplieran, la fase de verificación sirve como retroalimentación para una nueva fase de identificación. Cuando se satisfagan las condiciones de partida, se puede utilizar el modelo para pronosticar.

2.2.1.Identificación

Como primer paso se requiere que la serie de interés sea estacionaria. Una serie
estacionaria es aquella que posee una media y una variancia constante.
El orden de integración (o grado de diferenciación), denotado por I(d), se refiere al
número de veces que una serie debe ser diferenciada para obtener una serie estacionaria. El orden de integración define el parámetro d del modelo ARIMA.
Para la mayoría de las series económicas, la experiencia muestra que la
estacionariedad se logra después:
üde una diferencia(xt – xt-1) o
üde una diferencia de logaritmos (log xt - log xt-1).
En este caso, la variable xt es I(1), esto es, tiene una raíz unitaria.
A continuación se presentan los gráficos de una serie estacionaria y una no
estacionaria:

Identificación
Estimación
Verificación
Pronóstico


Para determinar los parámetros p y q se utilizan los gráficos de la función de
autocorrelación simple y parcial (correlogramas).

La autocorrelación simple muestral en el rezago k (rk) es igual a:

rk = S (yt-y) (yt+k-y ) / S (yt-y)2

La autocorrelación parcial muestral en el rezago k (rkk) es igual a:

rkk = r1 si k = 1
rkk = (rk - S rk-1,jrk-j / (1-Srk-1,jrj)
Si k = 2, 3, ...
donde rkj = rk-1,j-rkkrk-1,k-j
para j=1, 2, ..., k-1













V A R I A B L E I ( 0 )
- 4 0
- 3 0
- 2 0
- 1 0
0
10
2 0
3 0
4 0
5 0
S E R I E
P R O M E D I O
V A R I A B L E I ( 1 )
4 2 5
4 7 5
5 2 5
5 7 5
6 2 5
6 7 5
7 2 5
S E R I E
PROMEDIO

A continuación se presenta la forma general de los correlogramas simple y parcial para diferentes modelos autorregresivos y de medias móviles:

2.2.2.Estimación

Para estimar los parámetros del modelo se utiliza un algoritmo de mínimos cuadrados
de Gauss Marquatt para minimizar la suma de cuadrados de los residuos. Este algoritmo trata de minimizar la suma de cuadrados de los residuos, comenzando con algún valor de los parámetros del modelo. El algoritmo busca si otro vector de parámetros mejora el valor de la función objetivo y se produce un proceso de iteración hasta que se alcanza la convergencia.
Los programas de computador, como TRAMO/SEATS tienen definidos por defecto el valor de los parámetros iniciales del modelo, así como los criterios de convergencia.
rk rkk
AR(1)
1 2 3 4 5 k 1 2 3 4 5 k
rk rkk
MA(1)
1 2 3 4 5 k 1 2 3 4 5 k
rk rkk
ARMA(1,1)
1 2 3 4 5 k 1 2 3 4 5 k
Simple Parcial

2.2.3.Verificación

Una vez estimado el modelo ARIMA y dado que el modelo va a ser utilizado para
predecir, se debe verificar que se cumplen las hipótesis de partida. El análisis principal se centra en los residuos, pero tampoco se debe descuidar el análisis de la bondad del ajuste del modelo estimado y el análisis de los parámetros del modelo. A continuación se citan algunos de los indicadores que se deben analizar:

1) Análisis de los parámetros

ü Valores de los parámetros
i. çqç< 1 condición de invertivilidad
ii. çfç< 1 condición de estacionariedad
ü Significancia de los parámetros (t-Student)


2) Bondad del ajuste

ü Error estándar de los residuos
ü Estadístico BIC

3) Análisis de los residuos (ruido blanco)

ü Análisis gráfico
ü Histograma
ü Correlograma de los residuos
ü Estadístico Q de Box-Pierce: Q = TSr2k

Este valor se compara con el valor tabular de la c2 con k grados de libertad. Si el
valor calculado es mayor que el valor tabular se rechaza la hipótesis de
estacionariedad.

2.2.4.Pronóstico

Una vez identificado el proceso ARIMA que genera la serie temporal de interés,
estimados los parámetros del modelo ARIMA correspondiente y haber pasado la etapa de verificación, se utiliza el modelo para realizar pronósticos, con el menor error de predicción posible.

2.3.Análisis de Intervención

Existen los modelos ARIMA con variables de intervención, en los cuales las series
económicas son afectadas por fenómenos externos, tales como cambios tecnológicos, huelgas, cambios en medidas de política o económicas, cambios en la legislación o escala de algún impuesto, cambios metodológicos en la medición de las estadísticas, etc. Estos fenómenos son llamados intervenciones ya que interfieren en el comportamiento original de la serie, por lo
tanto se debe evaluar su efecto e incorporarlo al modelo ARIMA a través de variables
artificiales binarias (análisis de intervención).
Se recurre a variables que explican la presencia de fenómenos exógenos en la serie de tiempo. Se incorporan como variables dummy en la forma de impulsos y escalones que se utilizan para representar cambios temporales o permanentes en el nivel de las series debidos a eventos especiales. La no-incorporación de variables artificiales conduce a sesgos en las
estimaciones de los parámetros, a elevar el error estándar residual y en ocasiones a errores en la especificación del modelo ARIMA.
La mayoría de veces a priori no se conoce los fenómenos exógenos que afectan la serie de tiempo y más bien se utiliza una primera aproximación del modelo ARIMA para determinar la presencia de valores anómalos que son posteriormente incorporados al modelo.
A continuación se describen las principales variables de intervención:
Variables Impulso: Recoge el efecto de fenómenos que intervienen en la serie en un
único momento T0. Esto se traduce en una variable que contiene un uno en T0 y ceros en el resto. Afecta el componente irregular de la serie.
Variable escalón: Recoge el efecto de un cambio en el nivel en la serie, es decir, que
contienen ceros hasta el momento T0 y unos en adelante. Afecta el componente
tendencia de la serie.
Variable tendencia o rampa: Estas contienen ceros en un tramo de la serie hasta un
momento T0, a partir del cual empieza a crecer en forma ascendente. Afecta la
tendencia de la serie.
Efecto calendario: Este efecto se refiere al hecho de que cabe esperar un mayor nivel
de actividad en aquellos meses con mayor número de días laborales, por lo cual hay
que tomar en cuenta no solo el número de días de cada mes, sino también su diferente composición porcentual en términos de lunes, martes, etc., en cada mes.
Efecto de la semana santa o pascua (Easter effect): Con este efecto se intenta
representar la influencia de la festividad móvil de semana santa ejerce sobre la actividad económica en los meses de marzo y abril.
Días de comercio (Trading-Days): Consiste en el ciclo semanal que se presenta cuando los días de la semana tienen un nivel de actividad distinto, unido a la distinta longitud de los meses; de tal modo que por ejemplo, un mes en particular podría tener un nivel de ventas superior a otro, debido únicamente a que posee un mayor número de días.
En el siguiente diagrama se hace una representación de las variables de intervención
más importantes:
Las intervenciones se incluyen en la parte determinística de la serie y el modelo ARIMA en la parte estocástica.

2.4.Modelos Estacionales

Hasta el momento solamente se ha analizado la parte regular del modelo ARIMA. Sin
embargo, muchas series económicas presentan un elevado componente estacional, por lo que esta parte estacional también tendrá un modelo ARIMA. En este caso también se sigue el proceso descrito antes, con la diferencia de que los rezagos que se deben analizar son el rezago 12, 24 y 36 en el caso de series mensuales y los rezagos 4, 8 y 12 para las series trimestrales.


0 1 0 0 ... 0 1 1 1 ...
0 11...1 00...
Días de comercio
Efecto Pascua
Incorporación al modelo
parte parte
determinística estocástica
Impulso Escalón
Rampa
t t t N w f y + = ) , , ( e d



La notación del modelo ARIMA con parte estacional es la siguiente:

ARIMA (p,d,q)(P,D,Q)s

donde:
p: Número de parámetros autorregresivos.
d: Número de diferenciaciones para que la serie sea estacionaria.
q: Número de parámetros de medias móviles.
P: Número de parámetros autorregresivos en la parte estacional.
D: Número de diferenciaciones para que la serie sea estacionaria, en la parte
estacional.
Q: Número de parámetros de medias móviles en la parte estacional.
s: Periodicidad de serie (s=12 serie mensual, s=4 serie trimestral)


3.COMPONENTES DE UNA SERIE DE TIEMPO

Se dice que una serie de tiempo puede descomponerse en cuatro componentes que no son directamente observables, de los cuales únicamente se pueden obtener estimaciones.
Estos cuatro componentes son:

· Tendencia (T) que representa los movimientos de larga duración, también se le
conoce como evolución subyacente de una serie.
· Ciclo (C) caracterizado por oscilaciones alrededor de la tendencia con una duración
aproximada de dos a ocho años.
· Estacionalidad (S) es un movimiento periódico que se producen dentro del año y que
se repiten de un año a otro. Este componente está determinado por factores
institucionales y climáticos.
· Irregularidad (I) son movimientos erráticos que no siguen un patrón específico y que
obedecen a causas diversas. Este componente es prácticamente impredecible.
En este punto debe hacerse la aclaración de que las herramientas de descomposición
de series de tiempo disponibles hasta este momento realizan una estimación de la tendencia y el ciclo en forma conjunta, es decir se obtiene una descomposición de las series en componente estacional, componente irregular y componente tendencia-ciclo.
Para separar la tendencia del ciclo, se recurre a otros procedimientos como por ejemplo el filtro de Baxter-King1 o bien el Filtro de Hodrick-Prescott2. Estos filtros pueden aplicarse utilizando los paquetes econométricos WINRATS y EVIEWS, respectivamente.

1 Véase, Flores, Melania (1999)
2 Véase, Kikut, A y Muñoz, E. (199?)


Gráficamente, la serie original y cada uno de estos componentes para el caso del PIB
de Estados Unidos se aprecian de la siguiente forma:

PIB E.U.: Serie desestacionalizada
160 140 120 100 80 60 40 20 0
3,800
3,600
3,400
3,200
3,000
2,800
2,600
2,400
2,200
2,000
1,800
1,600
1,400
1,200
PIB E.U.: Componente estacional
160 140 120 100 80 60 40 20 0
0.001
0.001
0.000
0.000
0.000
0.000
0
0
0.000
0.000
0.000
0.000
-0.001
-0.001
-0.001
-0.001 -0.001
-0.001
-0.001
-0.001
-0.001
-0.001
PIB E.U.: Componente irregular
160 140 120 100 80 60 40 20 0
0.005
0.004
0.003
0.002
0.001
0
-0.001
-0.002
-0.003
-0.004
-0.005
-0.006
-0.007
PIB ESTADOS UNIDOS SERIE ORIGINAL
160 140 120 100 80 60 40 20 0
3,800
3,600
3,400
3,200
3,000
2,800
2,600
2,400
2,200
2,000
1,800
1,600
1,400
1,200
13
PIB E.U: Tendencia-ciclo
160 140 120 100 80 60 40 20 0
3,800
3,600
3,400
3,200
3,000
2,800
2,600
2,400
2,200
2,000
1,800
1,600
1,400
1,200

Ahora bien, existen dos modelos básicos que muestran de manera explícita la relación
que guardan los componentes de una serie:
Modelo Aditivo: se utiliza cuando los com ponentes son independientes entre si o se
presentan valores negativos o ceros.
I C E T Yt + + + =
Modelo Multiplicativo: se utiliza cuando los componentes son dependientes entre sí, o
cuando el nivel de las series es muy cambiante.
I C E T Yt ´ ´ ´ =
Si la amplitud del componente estacional varía en forma proporcional a la tendencia
media anual, el modelo apropiado será el multiplicativo; por otro lado, si el componente
estacional permanece constante ante variaciones en la tendencia, el modelo más adecuado es
el aditivo, es decir la estacionalidad de la serie es independiente de su tendencia.

4.DESCOMPOSICIÓN DE LAS SERIES DE TIEMPO

Para efectos del análisis económico, la estimación de los componentes no observables de una serie de tiempo cobra relevancia. Por ejemplo, el conocimiento de los movimientos estacionales contribuye a explicar si los cambios que se están observando en una variable, en determinado momento, obedecen efectivamente a aumentos o disminuciones en su nivel medio o bien a fenómenos estacionales.
Adicionalmente, la posibilidad de aislar los factores estacionales permite el estudio de
su comportamiento e identificar si son o no estables a lo largo del tiempo.
Por otro lado, contar con una estimación de la tendencia de la serie permite efectuar
consideraciones acerca del crecimiento subyacente de la misma

5.MÉTODOS DE EXTRACCIÓN DE SEÑALES

El proceso de descomposición de series de tiempo en sus cuatro componentes se
conoce también como extracción de señales, para ello se cuenta con al menos dos grupos de métodos:

· Métodos empíricos
o X11-ARIMA
o Census X11

· Métodos basados en modelos
o X12-ARIMA
o TRAMO-SEATS3

Los métodos empíricos se basan en promedios móviles, si bien son capaces de extraer características comunes de una gran cantidad de series, no tienen un modelo definido y por tanto se limita la capacidad de análisis y del diagnóstico de los resultados.
Los métodos basados en modelos utilizan estimadores que son variables aleatorias con todas sus propiedades y bandas de confianza. La principal ventaja radica en que procuran adaptarse a las características estocásticas de la serie evitando el riesgo de imprimir a las estimaciones propiedades espúreas debido a uso de filtros inapropiados.
Estos métodos permiten efectuar un diagnóstico amplio de las estimaciones, esta
características es precisamente la que los hace superiores. Entre otras cosas permite
responder a las preguntas: ¿Con qué error se estima la estacionalidad y la tendencia-ciclo?; ¿cuáles son los intervalos de confianza de los factores estacionales?.
Finalmente, debe llamarse la atención en el hecho de que el paquete integrado
TRAMO/SEATS, desarrollado por el Banco de España, se clasifica dentro de los métodos basados en modelos. Este software es bastante amigable, en especial su versión para ambiente Windows, por lo cual este tipo de talleres buscan generalizar su aplicación dentro y fuera del Banco Central de Costa Rica.4

3 Las siglas TRAMO hacen referencia a los terminos:Time Series Regression with ARIMA Noise, Missing
Observations and Outliers y las de SEATS Signal Extraction in ARIMA Time Series.
4 Véase, Kikut, Muñoz y Rodríguez (2001).
C:\Documents and Settings\bogantesvk\Local Settings\Temporary Internet Files\OLKA\DIE-02-2002-NT-NOTA TÉCNICAASPECTOS
CONCEPTUALES SOBRE SERIES DE TIEMPO.doc
27/06/2002/10:18 a.m.