Friday, November 18, 2016

Arma Mover Ejemplo Promedio

ARMA y ARIMA (Box-Jenkins) modelos ARMA y ARIMA (Box-Jenkins) modelos En las secciones anteriores hemos visto cómo el valor de una serie de tiempo univariante en el tiempo t. x t. puede ser modelado utilizando una variedad de expresiones en movimiento promedio. También hemos demostrado que los componentes tales como las tendencias y la periodicidad de la serie temporal se pueden modelar de forma explícita y / o separan, con los datos que se descomponen en tendencia, estacionales y componentes residuales. También puso de manifiesto, en las discusiones anteriores sobre la autocorrelación. que los coeficientes de autocorrelación completas y parciales son extremadamente útiles en la identificación y el modelado de patrones en series de tiempo. Estos dos aspectos de análisis de series de tiempo y el modelado se pueden combinar en un marco más general, y, a menudo muy eficaz de modelado en general. En su forma más básica de este enfoque es conocido como el modelado ARMA (autorregresivo de media móvil), o cuando la diferenciación se incluye en el procedimiento, la modelización ARIMA o Box-Jenkins, después de que los dos autores que eran fundamentales para su desarrollo (véase el recuadro amp Jenkins, 1968 box1, y la caja, Jenkins amp Reinsel de 1994 BOX2). No hay una regla fija en cuanto al número de periodos de tiempo necesarios para la elaboración de modelos de éxito, pero para los modelos más complejos, y para una mayor confianza en los procedimientos de ajuste y validación, serie con 50 pasos de tiempo se recomienda a menudo. modelos ARMA combinan métodos de autocorrelación (AR) y las medias móviles (MA) en un modelo compuesto de la serie temporal. Antes de considerar cómo estos modelos pueden ser combinados, examinamos cada uno por separado. Ya hemos visto que los modelos de medias (MA) en movimiento puede ser utilizado para proporcionar un buen ajuste a algunos conjuntos de datos, y las variaciones en estos modelos que implican suavizado exponencial doble o triple puede manejar componentes de tendencia y periódicos en los datos. Además, estos modelos se pueden utilizar para crear previsiones que imitan el comportamiento de los períodos anteriores. Una forma simple de tales modelos, basados ​​en los datos anteriores, se puede escribir como: donde i términos de la beta son las ponderaciones aplicadas a los valores anteriores de la serie histórica, y es habitual para definir beta i 1, sin pérdida de generalidad. Así que para un proceso de primer orden, q 1 y tenemos el modelo: es decir, el valor de la media móvil se calcula como la media ponderada de los valores actuales y pasados ​​inmediatos. Este proceso de promedio es, en cierto sentido, un mecanismo regulador pragmática, sin un enlace directo a un modelo estadístico. Sin embargo, podemos especificar un modelo estadístico (o estocástico) que abarca los procedimientos de medias móviles en conjunción con los procesos aleatorios. Si dejamos que sea un conjunto de variables aleatorias independientes e idénticamente distribuidos (un proceso aleatorio) con media cero y varianza conocida fijo, entonces podemos escribir el proceso como un promedio móvil de orden q en términos de: Es evidente que el valor esperado de xt bajo este modelo es 0, por lo que el modelo sólo es válido si el xt ya han sido ajustados para tener significa un cero o si se añade una constante fija (la media de la xt) a la suma. También es evidente que la varianza de xt es simplemente: El análisis anterior se puede ampliar para evaluar la covarianza, cov (x t XTK.), Lo que nos encontramos con rendimientos: Tenga en cuenta que ni el valor medio, ni la covarianza (o autocovariancia) en el retardo k es una función del tiempo, t. por lo que el proceso es estacionario segundo orden. La expresión anterior nos permite obtener una expresión para la función de autocorrelación (ACF): Si k 0 rho k 1, y para k gt q rho k 0. Además, el ACF es simétrica y - k rho k rho. El ACF se puede calcular para un proceso de primer orden MA: El componente autorregresivo AR o de un modelo ARMA se puede escribir en la forma: donde los términos son de coeficientes de autocorrelación en los retardos 1,2. p y z t es un término de error residual. Tenga en cuenta que este término de error se relaciona específicamente con el actual período de tiempo, t. Así que para un proceso de primer orden, p 1 y que tiene el modelo: Estas expresiones indican que el valor estimado de x en el tiempo t se determina por el valor inmediatamente anterior de x (es decir, en el tiempo t -1) multiplicado por una medida, alfa . de la medida en que los valores para todos los pares de valores en los períodos de tiempo de espera 1 aparte están correlacionados (es decir, su autocorrelación), más un término de error residual, z. en el tiempo t. Pero esto es precisamente la definición de un proceso de Markov. por lo que un proceso de Markov es un primer proceso autorregresivo de orden. Si alfa 1 el modelo establece que el siguiente valor de x es simplemente el valor anterior más un término de error aleatorio, y por lo tanto es un simple paseo aleatorio 1D. Si se incluyen varios términos del modelo estima el valor de x en el tiempo t mediante una suma ponderada de estos términos, además de un componente de error aleatorio. Si sustituimos la segunda expresión anterior a la primera, tenemos: y la aplicación repetida de esta rendimientos de sustitución: Ahora bien, si LT1 alfa y k es grande, esta expresión se puede escribir en el orden inverso, con términos decrecientes y con la contribución de la expresión en x en el lado derecho de la expresión convirtiéndose prácticamente nula, por lo que tenemos: Desde el lado derecho de esta xt modelos de expresión como la suma de una serie ponderada de los valores anteriores, en este caso los términos de error aleatorio, es evidente que este modelo AR es, de hecho, una forma de modelo de MA. Y si asumimos que los términos de error tienen media cero y varianza constante, como en el modelo MA tenemos el valor esperado del modelo como también 0, suponiendo que el xt se han ajustado para proporcionar una media cero, con una variación: Ahora, como siempre que LT1 alfa esta suma es finito y es simplemente 1 / (1- alpha), por lo que tenemos: (. x t x tk) al igual que con el modelo MA anteriormente, este análisis se puede extender a evaluar la covarianza, cov de una proceso de primer orden AR, que nos encontramos con rendimientos: para LT1 alfa esta suma es finita y es simplemente alfa k / (1- alfa 2), por lo que tenemos: esto demuestra que para un modelo de primer orden autorregresivo de la función de autocorrelación (ACF) es simplemente definido por sucesivas potencias de la autocorrelación de primer orden, con la condición de LT1 alfa. Para Gt0 alfa esto es simplemente una curva de potencia o exponencial similar rápidamente decreciente, tendiendo a cero, o para LT0 es una curva oscilatoria de amortiguación, de nuevo tiende a cero. Si se hace una suposición de que la serie de tiempo es estacionaria del análisis anterior se puede extender a autocorrelaciones segundo y de orden superior. Con el fin de adaptarse a un modelo AR a un conjunto de datos observados, se busca minimizar la suma de los errores al cuadrado (un ajuste por mínimos cuadrados), utilizando el menor número de términos que proporcionan un ajuste adecuado a los datos. Los modelos de este tipo se describen como autorregresivo. y puede ser aplicado a ambas series de tiempo y los conjuntos de datos espaciales (véase más adelante, los modelos autorregresivos espaciales). Aunque, en teoría, un modelo autorregresivo podría proporcionar un buen ajuste a un conjunto de datos observados, por lo general, requeriría la eliminación previa de y componentes de tendencia y periódicos, e incluso entonces puede ser que necesite un gran número de términos con el fin de proporcionar un buen ajuste a los datos. Sin embargo, mediante la combinación de los modelos AR con modelos MA, podemos producir una familia de modelos mixtos que se pueden aplicar en una amplia gama de situaciones. Estos modelos se conocen como modelos ARMA y ARIMA, y se describen en las siguientes subsecciones. En los dos apartados anteriores hemos introducido el modo de MA de orden q: y el modelo AR de orden p: Podemos combinar estos dos modelos, simplemente añadiendo juntos como un modelo de orden (p q.), Donde tenemos términos AR p y términos q MA: En general, esta forma de modelo ARMA combinado se pueden utilizar para modelar una serie de tiempo con menos términos general que cualquiera de una MA o un modelo AR por sí mismos. Expresa el valor estimado en el tiempo t como la suma de los términos q que representan la variación promedio de la variación aleatoria sobre Q períodos anteriores (el componente MA), más la suma de los términos P AR que calculan el valor actual de x como la suma ponderada p de los valores más recientes. Sin embargo, esta forma de modelo supone que la serie de tiempo es estacionaria, que es raramente el caso. En la práctica, las tendencias y la periodicidad existe en muchas bases de datos, por lo que hay una necesidad de eliminar estos efectos antes de usar estos modelos. La eliminación se lleva a cabo típicamente mediante la inclusión en el modelo de una etapa inicial de diferenciación, por lo general, una vez, dos veces o tres veces, hasta que la serie es al menos aproximadamente estacionaria - no presente las tendencias o periodicidades obvias. Al igual que con los procesos de MA y AR, el proceso de diferenciación es descrito por el orden de diferenciación, por ejemplo 1, 2, 3. En conjunto, estos tres elementos forman una triple: (.. P d q) que define el tipo de modelo aplicado. De esta forma, el modelo se describe como un modelo ARIMA. La letra I en Arima se refiere al hecho de que el conjunto de datos ha sido inicialmente diferenciados (cf. diferenciación) y cuando el modelado es completa a continuación, los resultados tienen que ser sumadas o integradas para producir las estimaciones finales y pronósticos. modelización ARIMA se discute a continuación. Como se ha señalado en el apartado anterior, la combinación de diferenciación de una serie de tiempo no estacionarias con el modelo ARMA proporciona una poderosa familia de modelos que se pueden aplicar en una amplia gama de situaciones. El desarrollo de esta forma extendida de modelo es en gran parte debido a G E P G M Box y Jenkins, y como resultado de los modelos ARIMA son conocidos también como modelos Box-Jenkins. El primer paso en el procedimiento de Box-Jenkins es a diferencia de la serie de tiempo hasta que es estacionario, lo que garantiza que la tendencia y se eliminan los componentes de temporada. En muchos casos, uno o dos de diferenciación etapa es suficiente. La serie diferenciada será más corto que la serie fuente de C pasos de tiempo, donde C es el rango de la diferenciación. Un modelo ARMA se ajusta entonces a la serie de tiempo resultante. Dado que los modelos ARIMA tienen tres parámetros que hay muchas variaciones a los posibles modelos que puedan estar equipados. Sin embargo, la decisión sobre lo que estos parámetros deben ser pueden ser guiados por una serie de principios básicos: (i) el modelo debe ser lo más simple posible, es decir, contienen el menor número de términos como sea posible, que a su vez significa que los valores de p y q debe ser pequeña (ii) el ajuste a los datos históricos debe ser tan buena como sea posible, es decir, el tamaño de las diferencias al cuadrado entre el valor estimado en cualquier período de tiempo pasado y el valor real, debe reducirse al mínimo (principio de mínimos cuadrados) - los residuos del modelo seleccionado puede entonces ser examinado para ver si los residuos restantes son significativamente diferentes de 0 (véase más adelante) (iii) la correlación parcial medido en los retardos 1,2,3. debe proporcionar una indicación de la orden del componente de AR, es decir, el valor elegido para q (iv) la forma de la función de autocorrelación parcela (acf) puede sugerir el tipo de modelo ARIMA necesario - la tabla de abajo (del NIST) proporciona orientación sobre la interpretación de la forma de la ACF en cuanto a la selección del modelo. Modelo ARIMA selección del tipo de uso de la Serie ACF forma no es estacionaria. Los modelos estándar ARIMA se describen a menudo por la triple: (.. p q d) como se señaló anteriormente. Estos definen la estructura del modelo en términos de la orden de los modelos AR, de diferenciación y MA para ser utilizados. También es posible incluir parámetros similares para la estacionalidad en los datos, aunque estos modelos son más complejos de instalar y de interpretar - los callos (P. D. Q) se utiliza generalmente para identificar dichos componentes del modelo. En la captura de pantalla de SPSS se muestra a continuación, se muestra el diálogo para seleccionar manualmente los elementos estructurales no estacionales y de temporada (instalaciones similares están disponibles en otros paquetes integrados, tales como SAS / ETS). Como puede verse, el cuadro de diálogo también permite que los datos se transforman (típicamente para ayudar en la estabilización de la varianza) y para permitir a los usuarios incluir una constante en el modelo (el valor predeterminado). Esta herramienta de software en particular permite valores atípicos para ser detectados si es necesario, de acuerdo con una variedad de procedimientos de detección, pero en muchos casos se han investigado los valores atípicos y ajustado o eliminado y los valores de sustitución estimada, antes de cualquier análisis. SPSS modelizador de series temporales: la modelización ARIMA, el modo experto Una serie de modelos ARIMA puede ser ajustado a los datos, de forma manual o por medio de un proceso automatizado (por ejemplo, un proceso por etapas), y una o más medidas utiliza para juzgar cuál es el mejor en términos de la medida y la parsimonia. comparación de modelos normalmente hace uso de uno o más de los informativos medidas teóricas descritas anteriormente en este manual - AIC, MDL (la función de BIC y / o R, Arima (), proporciona la medida de la AIC, mientras que SPSS proporciona una serie de medidas de ajuste, incluida una versión de la estadística BIC otras herramientas varían en las medidas a -. Minitab, que ofrece una amplia gama de métodos de TSA, no incluye estadísticas AIC / tipo BIC). En la práctica de una amplia gama de medidas (es decir, distinto de / además de las medidas de mínimos cuadrados basado, se puede utilizar para evaluar la calidad del modelo. Por ejemplo, el error absoluto medio y el error máximo absoluto pueden ser medidas útiles, ya que incluso una buenas ajuste de mínimos cuadrados todavía puede ser deficiente en algunos lugares. una serie de paquetes de software también puede proporcionar una medida global de la autocorrelación que pueda permanecer en los residuos después de ajustar el modelo. una estadística aplicada con frecuencia se debe a Ljung y Box (1978 LJU1) y es de la forma: donde n es el número de muestras (valores de datos), ri es la autocorrelación de la muestra en el retardo i y k es el número total de retardos sobre el que el cálculo se lleva a cabo Q k se distribuye aproximadamente como.. una distribución chi-cuadrado con k -. m grados de libertad, donde m es el número de parámetros utilizados en el ajuste del modelo, excluir las variables constantes plazo o de predicción (es decir, justo incluyendo los pd q triples) Si la medida es estadísticamente significativa se indica que los residuos contienen todavía autocorrelación significativa después de que el modelo ha sido equipado, lo que sugiere que un modelo mejorado debe ser buscada. Ejemplo: Modelación del crecimiento del número de pasajeros de aerolíneas El siguiente es un ejemplo de montaje automatizada, utilizando SPSS para los datos de prueba de Box-Jenkins-Reinsel de aerolínea número de pasajeros REI1 han proporcionado anteriormente en este manual. Inicialmente se especifica ninguna especificación de las fechas que son meses dentro de unos años. El modelo seleccionado por el proceso automatizado era un modelo ARIMA (0,1,12), es decir, el proceso identificó correctamente que la serie requiere un nivel de diferenciación y se aplica un modelo de media móvil con una periodicidad de 12 y ningún componente de autocorrelación para adaptarse a la datos. El ajuste del modelo produjo un valor de R2 de 0,966, que es muy alto, y un error máximo absoluto (MAE) de 75. El ajuste visual del modelo a los datos parece excelente, pero la trama de la autocorrelación residual después del montaje y Ljung - Box prueba demuestra que sigue siendo autocorrelación significativa, lo que indica que un modelo mejorado es posible. Automatizado ARIMA ajuste a los pasajeros de avión Internacional: Los totales mensuales, 1949-1960 Para investigar más a fondo se ajustó un modelo revisado, basado en la discusión de este conjunto de datos por Box y Jenkins (1968) y la edición actualizada de Chatfields (1975 CHA1) libro en que utiliza Minitab para ilustrar su análisis (6ª edición, 2003). Las series de tiempo se define como tener una periodicidad de 12 meses y un modelo ARIMA con componentes (0,1,1), (0,1,1). Gráficamente los resultados son muy similares a la tabla de arriba, pero con este modelo, el R cuadrado es 0.991, el MAE41 y el estadístico de Ljung-Box ya no es significativa (12,6, con 16 grados de libertad). El modelo es así una mejora en la versión original (generado automáticamente), se compone de una MA no estacional y un componente MA estacional, ningún componente autorregresivo, y un nivel de diferenciación para las estructuras estacionales y no estacionales. Ya sea apropiado es manual o automatizado, un modelo ARIMA puede proporcionar un buen marco para el modelado de una serie de tiempo, o puede ser que los modelos o enfoques alternativos proporcionan un resultado más satisfactorio. A menudo es difícil saber de antemano qué bueno es probable que sea ningún modelo de pronóstico dada, ya que es sólo a la luz de su capacidad para predecir valores futuros de la serie de datos que pueda ser verdaderamente juzgado. A menudo, este proceso se aproxima por el ajuste del modelo a los datos del pasado con exclusión de períodos de tiempo recientes (también conocidos como muestras de retención fuera) y, a continuación, utilizando el modelo para predecir estos eventos futuros conocidos, pero incluso esto sólo ofrece confianza limitada en su validez futuro. el pronóstico a largo plazo puede ser extremadamente fiable utilización de dichos métodos. Es evidente que el modelo de las estadísticas de tráfico aéreo internacional se ha descrito anteriormente no es capaz de predecir correctamente los números de los pasajeros a través en la década de 1990 y más allá, ni la caída de 5 años en los Estados Unidos números internacionales de pasajeros de aerolíneas publicar 9/11/2001. Del mismo modo, un modelo ARIMA puede ser instalado en valores históricos de las cotizaciones bursátiles o valores de índice (por ejemplo, la Bolsa de Nueva York o de índices FTSE) y proporcionará típicamente un excelente ajuste a los datos (lo que da un valor de R cuadrado superior a 0,99), pero son a menudo de poca utilidad para la predicción de valores futuros de estos precios o índices. Típicamente, los modelos ARIMA se utilizan para la predicción, en particular en el campo de la modelización macro y micro económico. Sin embargo, pueden ser aplicados en una amplia gama de disciplinas, ya sea en la forma descrita aquí, o aumentada con variables de predicción adicionales que se cree que mejora la fiabilidad de las previsiones realizadas. Estos últimos son importantes porque toda la estructura de los modelos ARMA discutidos anteriormente depende de los valores anteriores y eventos aleatorios independientes en el tiempo, no en cualquier factores explicativos o causales. De ahí que los modelos ARIMA solamente reflejarán y extender los patrones del pasado, lo que podría ser necesario modificar las previsiones por factores tales como el entorno macroeconómico, los cambios tecnológicos, o de recursos a largo plazo y / o cambios ambientales. Box1 Box G E P, G Jenkins M (1968). Algunos avances recientes en la predicción y el control. Estadística Aplicada, 17 (2), 91-109 BOX2 caja, G E P, Jenkins, G M, G Reinsel C (1994) Análisis de series de tiempo, predicción y control. 3ª ed. Prentice Hall, Englewood Cliffs, NJ CHA1 Chatfield C (1975) El análisis de los tiempos de la serie: Teoría y Práctica. Chapman y Hall, Londres (véase también, 6ª ed., 2003) LJU1 Ljung G M, G E P Box (1978) sobre una medida de una falta de ajuste en modelos de series temporales. Biométrika, 65, 297303 NIST / SEMATECH e-Manual de Métodos Estadísticos, www. itl. nist. gov/div898/handbook/ Sección 6.4: Introducción a las series temporales. 2010 SPSS / PASW 17 (2008) (AnalyzeForecasting modelos de series temporales) REI1 Reinsel GC conjuntos de datos para los modelos Box-Jenkins: www. stat. wisc. edu/2.1 Moving Modelos Promedio (modelos MA) modelos de series temporales conocidos como modelos ARIMA puede incluir autorregresivo términos y / o términos de medias móviles. En la Semana 1, aprendimos un término autorregresivo en un modelo de series de tiempo para la variable x t es un valor rezagado de x t. Por ejemplo, un retraso de 1 x término autorregresivo es t-1 (multiplicado por un coeficiente). Esta lección define términos de medias móviles. Un término promedio móvil en un modelo de series de tiempo es un error pasado (multiplicado por un coeficiente). Sea (en peso desbordado N (0, sigma2w)), lo que significa que el w t son de forma idéntica, distribuido de forma independiente, cada uno con una distribución normal con media 0 y la misma varianza. El 1º orden moviendo modelo de media, denotado por MA (1) es (xt theta1w mu peso) El orden 2º movimiento modelo de media, denotado por MA (2) es (mu xt peso theta1w theta2w) El q º orden moviendo modelo de media , denotado por MA (q) es (mu xt wt theta1w theta2w puntos thetaqw) Nota. Muchos libros de texto y programas de software definen el modelo con signos negativos antes de los términos. Esto no cambia las propiedades teóricas generales del modelo, aunque no voltear los signos algebraicos de valores de los coeficientes estimados y los términos (unsquared) en las fórmulas para FCA y varianzas. Es necesario comprobar su software para verificar si los signos negativos o positivos se han utilizado con el fin de escribir correctamente el modelo estimado. R utiliza señales positivas en su modelo subyacente, como lo hacemos aquí. Propiedades teóricas de una serie de tiempo con un MA (1) Nota Modelo que el único valor distinto de cero en el ACF teórico es de retardo 1. Todos los demás autocorrelaciones son 0. Así, un ACF muestra con una autocorrelación significativa sólo en el retardo 1 es un indicador de un posible MA (1) modelo. Para los estudiantes interesados, pruebas de estas propiedades son un apéndice de este folleto. Ejemplo 1 Supongamos que un MA (1) modelo es x t 10 w w t 0,7 t-1. donde (en peso desbordado N (0,1)). Por lo tanto el coeficiente 1 0.7. El ACF teórico está dado por una trama de esta sigue ACF. La trama se acaba de mostrar es la ACF teórico para un MA (1) con 1 0.7. En la práctica, una muestra de costumbre suelen proporcionar un patrón tan claro. El uso de R, simulamos n 100 valores de las muestras utilizando el modelo x 10 w t t t 0,7 W-1 donde w t iid N (0,1). Para esta simulación, un gráfico de series temporales de datos de la muestra de la siguiente manera. No podemos decir mucho de esta trama. El ACF de la muestra para la simulación de datos sigue. Vemos un aumento en el retardo 1 seguido por valores generalmente no significativos para retardos pasado 1. Tenga en cuenta que la muestra ACF no coincide con el patrón teórico de la MA subyacente (1), que es que todas las autocorrelaciones para los retrasos del pasado 1 estarán 0 . una muestra tendría un ACF muestra ligeramente diferente se muestra a continuación, pero probablemente tendría las mismas características generales. Theroretical Propiedades de una serie temporal con un modelo MA (2) Para el (2) Modelo MA, propiedades teóricas son las siguientes: Tenga en cuenta que los únicos valores no nulos en la ACF teórica son los GAL 1 y 2. Autocorrelaciones para retardos más altos son 0 . por lo tanto, una muestra con ACF autocorrelaciones significativas en los retardos 1 y 2, pero autocorrelaciones no significativos para retardos más alto indica una posible MA (2) del modelo. iid N (0,1). Los coeficientes son 1 0,5 y 2 0.3. Debido a que este es un MA (2), el ACF teórica tendrá valores distintos de cero solamente en los retardos 1 y 2. Los valores de los dos autocorrelaciones son distintos de cero Una trama de la ACF teórico sigue. Como casi siempre es el caso, datos de la muestra suele comportarse tan perfectamente como teoría. Hemos simulado n 150 valores de la muestra para el modelo x 10 w t t t-0,5 W 0,3 W 1 T-2. donde w t iid N (0,1). El gráfico de series temporales de datos de la siguiente manera. Al igual que con el gráfico de series temporales de los (1) datos de las muestras MA, usted no puede decir mucho de ella. El ACF de la muestra para la simulación de datos sigue. El patrón es típico para situaciones en las que una (2) modelo de MA puede ser útil. Hay dos picos estadísticamente significativas en los retardos 1 y 2, seguido por los valores no significativos para otros retardos. Tenga en cuenta que debido a un error de muestreo, el ACF muestra no coincide con el patrón teórico exactamente. ACF para el general MA (q) Modelos Una característica de los modelos MA (q), en general, es que hay autocorrelaciones distintos de cero para los primeros retardos q autocorrelaciones y 0 para todos los GAL gt q. No unicidad de la conexión entre los valores de 1 y (Rho1) en MA (1) Modelo. En el MA (1) modelo, para cualquier valor de 1. el recíproco 1/1 da el mismo valor para A modo de ejemplo, utilizar 0,5 por 1. y luego usar 1 / (0,5) 2 por 1. Usted conseguirá (Rho1) 0,4 en ambos casos. Para satisfacer una restricción teórica llamada invertibilidad. que restringir MA (1) modelos de tener valores con valor absoluto menor que 1. En el ejemplo dado, 1 0,5 habrá un valor de parámetro permisible, mientras que 1 1 / 0.5 2 no lo hará. Invertibilidad de modelos Un modelo MA MA se dice que es invertible si es algebraicamente equivalente a un modelo AR orden infinito convergentes. Al converger, nos referimos a que los coeficientes AR disminuyen a 0 a medida que avanzamos en el tiempo. Invertibilidad es una restricción de software programado en series de tiempo utilizado para estimar los coeficientes de los modelos con los términos MA. No es algo que comprobamos en el análisis de datos. Información adicional acerca de la restricción invertibilidad de MA (1) modelos se da en el apéndice. Teoría avanzada Nota. Para un modelo MA (q) con un ACF especificado, sólo hay un modelo invertible. La condición necesaria para invertibilidad es que los coeficientes tienen valores tales que la ecuación 1- 1 y-. - Q y q 0 tiene soluciones para y que están fuera del círculo unitario. R Código de los ejemplos en el Ejemplo 1, que representa el ACF teórica del modelo x 10 w t t. 7w t-1. y luego simulado n 150 valores de este modelo y se representó la serie temporal de la muestra y la ACF muestra para los datos simulados. Los comandos R utilizan para trazar el ACF teórico fueron: acfma1ARMAacf (mac (0,7), lag. max10) 10 rezagos de ACF para MA (1) con 0,7 theta1 lags0: 10 crea una variable llamada desfases que va de 0 a 10. parcela (retardos, acfma1, xlimc (1,10), ylabr, Type H, principal ACF para MA (1) con theta1 0,7) abline (H0) agrega un eje horizontal de la gráfica el primer comando determina la ACF y lo almacena en un objeto acfma1 llamado (nuestra elección del nombre). El comando plot (los comandos 3º) parcelas se retrasa en comparación con los valores de ACF para desfases del 1 al 10. Cuando las etiquetas El parámetro ylab el eje Y y el parámetro principal pone un título en la parcela. Para ver los valores numéricos de la ACF sólo tiene que utilizar el comando acfma1. La simulación y las parcelas se realizaron con los siguientes comandos. xcarima. sim (n150, lista (mac (0,7))) Simula n 150 valores de MA (1) xxc10 añade 10 para hacer medias por defecto 10. Simulación en el sentido de 0. plot (x, TypeB, mainSimulated MA (1) datos) ACF (x, xlimc (1,10), mainACF para datos de muestras simuladas) En el Ejemplo 2, se representa gráficamente la ACF teórica del modelo XT 10 en peso de 0,5 w t-1 0,3 w T-2. y luego simulado n 150 valores de este modelo y se representó la serie temporal de la muestra y la ACF muestra para los datos simulados. Los comandos R utilizados fueron acfma2ARMAacf (mac (0.5,0.3), lag. max10) acfma2 lags0: 10 parcela (GAL, acfma2, xlimc (1,10), ylabr, Type H, principal ACF para MA (2) con theta1 0,5, theta20.3) abline (H0) xcarima. sim (n150, lista (mac (0,5, 0,3))) xxc10 plot (x, TypeB, principal simulada MA (2) Serie) ACF (x, xlimc (1,10), mainACF para MA simulada (2) datos) Apéndice: Prueba de propiedades de MA (1) para los estudiantes interesados, aquí están las pruebas de las propiedades teóricas de la (1) modelo MA. Diferencia: (texto (xt) w texto (mu theta1 en peso) 0 texto (en peso) de texto (theta1w) sigma2w theta21sigma2w (1theta21) sigma2w) Cuando h 1, la expresión anterior 1 w 2. Para cualquier h 2, la expresión anterior 0 . la razón es que, por definición de independencia del peso. E (k w w j) 0 para cualquier k j. Además, como la w t tiene media 0, E (w w j j) E (w j 2) w 2. Por una serie de tiempo, aplicar este resultado para obtener el ACF dado anteriormente. Un modelo MA invertible es uno que puede ser escrito como un modelo AR orden infinito que converge de manera que los coeficientes AR convergen a 0 a medida que avanzamos infinitamente en el tiempo. Bien demostrar invertibilidad para el (1) modelo de MA. Tenemos entonces sustituto de la relación (2) A la hora de w t-1 en la ecuación (1) (3) (ZT en peso theta1 (z - theta1w) en peso theta1z - theta2w) t-2. la ecuación (2) se convierte en A continuación, sustituir relación (4) para W t-2 en la ecuación (3) (ZT en peso theta1 z - theta21w peso theta1z - theta21 (z - theta1w) en peso theta1z - theta12z theta31w) Si tuviéramos que continuar ( infinitamente), obtendríamos el modelo AR orden infinito (ZT en peso theta1 z - theta21z theta31z - theta41z puntos) Obsérvese, sin embargo, que si 1 1, los coeficientes multiplicadores de los retardos z aumentará (infinitamente) de tamaño a medida que avanzamos en la espalda hora. Para evitar esto, necesitamos 1 LT1. Esta es la condición para un MA (1) modelo invertible. Modelo de la orden infinito MA En la semana 3, así que ver un AR (1) modelo puede ser convertido en un modelo de orden infinito MA: (xt - mu peso phi1w phi21w puntos phik1 w puntos resumen phij1w) Esta suma de términos de ruido blanco es conocido últimos como la representación causal de un AR (1). En otras palabras, x t es un tipo especial de MA con un número infinito de términos que se remontan en el tiempo. Esto se llama una orden infinito MA o MA (). Una orden MA finito es un AR orden infinito y cualquier orden de AR finito es un MA orden infinito. Recordemos en la semana 1, se observó que la exigencia de un AR estacionario (1) es que 1 LT1. Permite calcular el Var (x t) utilizando la representación causal. Este último paso se utiliza un hecho básico acerca serie geométrica que requiere (phi1lt1) diverge de lo contrario las series. NavigationDocumentation es la media incondicional del proceso, y x03C8 (L) es un, infinito-grado del polinomio operador de retardos racional, (1 x03C8 1 L x03C8 2 L 2 x2026). Nota: la propiedad constante de un objeto modelo Arima corresponde a c. y no la media incondicional 956. Por Wolds descomposición 1. La ecuación 5-12 corresponde a un proceso estocástico estacionario proporciona los coeficientes x03C8 i son absolutamente sumable. Este es el caso cuando el polinomio AR, x03D5 (L). es estable . decir, considerando todas sus raíces se encuentran fuera del círculo unitario. Además, el proceso es causal proporcionan el polinomio MA es invertible. decir, considerando todas sus raíces se encuentran fuera del círculo unitario. Caja de herramientas de la econometría hace cumplir la estabilidad y invertibilidad de los procesos ARMA. Cuando se especifica el uso de un modelo ARMA Arima. se produce un error si se introduce coeficientes que no corresponden a un polinomio AR MA polinómica o invertible estable. Del mismo modo, la estimación de estacionariedad impone restricciones y invertibilidad durante la estimación. Referencias 1 Wold, H. Un estudio en el análisis de estacionario de series temporales. Uppsala, Suecia: Almqvist amp Wiksell, 1938. Seleccione su modelos ARIMA (Box-Jenkins) modelos ARMA y ARIMA (Box-Jenkins) y CountryARMA En las secciones anteriores hemos visto cómo el valor de una serie de tiempo univariante en el tiempo t. x t. puede ser modelado utilizando una variedad de expresiones en movimiento promedio. También hemos demostrado que los componentes tales como las tendencias y la periodicidad de la serie temporal se pueden modelar de forma explícita y / o separan, con los datos que se descomponen en tendencia, estacionales y componentes residuales. También puso de manifiesto, en las discusiones anteriores sobre la autocorrelación. que los coeficientes de autocorrelación completas y parciales son extremadamente útiles en la identificación y el modelado de patrones en series de tiempo. Estos dos aspectos de análisis de series de tiempo y el modelado se pueden combinar en un marco más general, y, a menudo muy eficaz de modelado en general. En su forma más básica de este enfoque es conocido como el modelado ARMA (autorregresivo de media móvil), o cuando la diferenciación se incluye en el procedimiento, la modelización ARIMA o Box-Jenkins, después de que los dos autores que eran fundamentales para su desarrollo (véase el recuadro amp Jenkins, 1968 box1, y la caja, Jenkins amp Reinsel de 1994 BOX2). No hay una regla fija en cuanto al número de periodos de tiempo necesarios para la elaboración de modelos de éxito, pero para los modelos más complejos, y para una mayor confianza en los procedimientos de ajuste y validación, serie con 50 pasos de tiempo se recomienda a menudo. modelos ARMA combinan métodos de autocorrelación (AR) y las medias móviles (MA) en un modelo compuesto de la serie temporal. Antes de considerar cómo estos modelos pueden ser combinados, examinamos cada uno por separado. Ya hemos visto que los modelos de medias (MA) en movimiento puede ser utilizado para proporcionar un buen ajuste a algunos conjuntos de datos, y las variaciones en estos modelos que implican suavizado exponencial doble o triple puede manejar componentes de tendencia y periódicos en los datos. Además, estos modelos se pueden utilizar para crear previsiones que imitan el comportamiento de los períodos anteriores. Una forma simple de tales modelos, basados ​​en los datos anteriores, se puede escribir como: donde i términos de la beta son las ponderaciones aplicadas a los valores anteriores de la serie histórica, y es habitual para definir beta i 1, sin pérdida de generalidad. Así que para un proceso de primer orden, q 1 y tenemos el modelo: es decir, el valor de la media móvil se calcula como la media ponderada de los valores actuales y pasados ​​inmediatos. Este proceso de promedio es, en cierto sentido, un mecanismo regulador pragmática, sin un enlace directo a un modelo estadístico. Sin embargo, podemos especificar un modelo estadístico (o estocástico) que abarca los procedimientos de medias móviles en conjunción con los procesos aleatorios. Si dejamos que sea un conjunto de variables aleatorias independientes e idénticamente distribuidos (un proceso aleatorio) con media cero y varianza conocida fijo, entonces podemos escribir el proceso como un promedio móvil de orden q en términos de: Es evidente que el valor esperado de xt bajo este modelo es 0, por lo que el modelo sólo es válido si el xt ya han sido ajustados para tener significa un cero o si se añade una constante fija (la media de la xt) a la suma. También es evidente que la varianza de xt es simplemente: El análisis anterior se puede ampliar para evaluar la covarianza, cov (x t XTK.), Lo que nos encontramos con rendimientos: Tenga en cuenta que ni el valor medio, ni la covarianza (o autocovariancia) en el retardo k es una función del tiempo, t. por lo que el proceso es estacionario segundo orden. La expresión anterior nos permite obtener una expresión para la función de autocorrelación (ACF): Si k 0 rho k 1, y para k gt q rho k 0. Además, el ACF es simétrica y - k rho k rho. El ACF se puede calcular para un proceso de primer orden MA: El componente autorregresivo AR o de un modelo ARMA se puede escribir en la forma: donde los términos son de coeficientes de autocorrelación en los retardos 1,2. p y z t es un término de error residual. Tenga en cuenta que este término de error se relaciona específicamente con el actual período de tiempo, t. Así que para un proceso de primer orden, p 1 y que tiene el modelo: Estas expresiones indican que el valor estimado de x en el tiempo t se determina por el valor inmediatamente anterior de x (es decir, en el tiempo t -1) multiplicado por una medida, alfa . de la medida en que los valores para todos los pares de valores en los períodos de tiempo de espera 1 aparte están correlacionados (es decir, su autocorrelación), más un término de error residual, z. en el tiempo t. Pero esto es precisamente la definición de un proceso de Markov. por lo que un proceso de Markov es un primer proceso autorregresivo de orden. Si alfa 1 el modelo establece que el siguiente valor de x es simplemente el valor anterior más un término de error aleatorio, y por lo tanto es un simple paseo aleatorio 1D. Si se incluyen varios términos del modelo estima el valor de x en el tiempo t mediante una suma ponderada de estos términos, además de un componente de error aleatorio. Si sustituimos la segunda expresión anterior a la primera, tenemos: y la aplicación repetida de esta rendimientos de sustitución: Ahora bien, si LT1 alfa y k es grande, esta expresión se puede escribir en el orden inverso, con términos decrecientes y con la contribución de la expresión en x en el lado derecho de la expresión convirtiéndose prácticamente nula, por lo que tenemos: Desde el lado derecho de esta xt modelos de expresión como la suma de una serie ponderada de los valores anteriores, en este caso los términos de error aleatorio, es evidente que este modelo AR es, de hecho, una forma de modelo de MA. Y si asumimos que los términos de error tienen media cero y varianza constante, como en el modelo MA tenemos el valor esperado del modelo como también 0, suponiendo que el xt se han ajustado para proporcionar una media cero, con una variación: Ahora, como siempre que LT1 alfa esta suma es finito y es simplemente 1 / (1- alpha), por lo que tenemos: (. x t x tk) al igual que con el modelo MA anteriormente, este análisis se puede extender a evaluar la covarianza, cov de una proceso de primer orden AR, que nos encontramos con rendimientos: para LT1 alfa esta suma es finita y es simplemente alfa k / (1- alfa 2), por lo que tenemos: esto demuestra que para un modelo de primer orden autorregresivo de la función de autocorrelación (ACF) es simplemente definido por sucesivas potencias de la autocorrelación de primer orden, con la condición de LT1 alfa. Para Gt0 alfa esto es simplemente una curva de potencia o exponencial similar rápidamente decreciente, tendiendo a cero, o para LT0 es una curva oscilatoria de amortiguación, de nuevo tiende a cero. Si se hace una suposición de que la serie de tiempo es estacionaria del análisis anterior se puede extender a autocorrelaciones segundo y de orden superior. Con el fin de adaptarse a un modelo AR a un conjunto de datos observados, se busca minimizar la suma de los errores al cuadrado (un ajuste por mínimos cuadrados), utilizando el menor número de términos que proporcionan un ajuste adecuado a los datos. Los modelos de este tipo se describen como autorregresivo. y puede ser aplicado a ambas series de tiempo y los conjuntos de datos espaciales (véase más adelante, los modelos autorregresivos espaciales). Aunque, en teoría, un modelo autorregresivo podría proporcionar un buen ajuste a un conjunto de datos observados, por lo general, requeriría la eliminación previa de y componentes de tendencia y periódicos, e incluso entonces puede ser que necesite un gran número de términos con el fin de proporcionar un buen ajuste a los datos. Sin embargo, mediante la combinación de los modelos AR con modelos MA, podemos producir una familia de modelos mixtos que se pueden aplicar en una amplia gama de situaciones. Estos modelos se conocen como modelos ARMA y ARIMA, y se describen en las siguientes subsecciones. En los dos apartados anteriores hemos introducido el modo de MA de orden q: y el modelo AR de orden p: Podemos combinar estos dos modelos, simplemente añadiendo juntos como un modelo de orden (p q.), Donde tenemos términos AR p y términos q MA: En general, esta forma de modelo ARMA combinado se pueden utilizar para modelar una serie de tiempo con menos términos general que cualquiera de una MA o un modelo AR por sí mismos. Expresa el valor estimado en el tiempo t como la suma de los términos q que representan la variación promedio de la variación aleatoria sobre Q períodos anteriores (el componente MA), más la suma de los términos P AR que calculan el valor actual de x como la suma ponderada p de los valores más recientes. Sin embargo, esta forma de modelo supone que la serie de tiempo es estacionaria, que es raramente el caso. En la práctica, las tendencias y la periodicidad existe en muchas bases de datos, por lo que hay una necesidad de eliminar estos efectos antes de usar estos modelos. La eliminación se lleva a cabo típicamente mediante la inclusión en el modelo de una etapa inicial de diferenciación, por lo general, una vez, dos veces o tres veces, hasta que la serie es al menos aproximadamente estacionaria - no presente las tendencias o periodicidades obvias. Al igual que con los procesos de MA y AR, el proceso de diferenciación es descrito por el orden de diferenciación, por ejemplo 1, 2, 3. En conjunto, estos tres elementos forman una triple: (.. P d q) que define el tipo de modelo aplicado. De esta forma, el modelo se describe como un modelo ARIMA. La letra I en Arima se refiere al hecho de que el conjunto de datos ha sido inicialmente diferenciados (cf. diferenciación) y cuando el modelado es completa a continuación, los resultados tienen que ser sumadas o integradas para producir las estimaciones finales y pronósticos. modelización ARIMA se discute a continuación. Como se ha señalado en el apartado anterior, la combinación de diferenciación de una serie de tiempo no estacionarias con el modelo ARMA proporciona una poderosa familia de modelos que se pueden aplicar en una amplia gama de situaciones. El desarrollo de esta forma extendida de modelo es en gran parte debido a G E P G M Box y Jenkins, y como resultado de los modelos ARIMA son conocidos también como modelos Box-Jenkins. El primer paso en el procedimiento de Box-Jenkins es a diferencia de la serie de tiempo hasta que es estacionario, lo que garantiza que la tendencia y se eliminan los componentes de temporada. En muchos casos, uno o dos de diferenciación etapa es suficiente. La serie diferenciada será más corto que la serie fuente de C pasos de tiempo, donde C es el rango de la diferenciación. Un modelo ARMA se ajusta entonces a la serie de tiempo resultante. Dado que los modelos ARIMA tienen tres parámetros que hay muchas variaciones a los posibles modelos que puedan estar equipados. Sin embargo, la decisión sobre lo que estos parámetros deben ser pueden ser guiados por una serie de principios básicos: (i) el modelo debe ser lo más simple posible, es decir, contienen el menor número de términos como sea posible, que a su vez significa que los valores de p y q debe ser pequeña (ii) el ajuste a los datos históricos debe ser tan buena como sea posible, es decir, el tamaño de las diferencias al cuadrado entre el valor estimado en cualquier período de tiempo pasado y el valor real, debe reducirse al mínimo (principio de mínimos cuadrados) - los residuos del modelo seleccionado puede entonces ser examinado para ver si los residuos restantes son significativamente diferentes de 0 (véase más adelante) (iii) la correlación parcial medido en los retardos 1,2,3. debe proporcionar una indicación de la orden del componente de AR, es decir, el valor elegido para q (iv) la forma de la función de autocorrelación parcela (acf) puede sugerir el tipo de modelo ARIMA necesario - la tabla de abajo (del NIST) proporciona orientación sobre la interpretación de la forma de la ACF en cuanto a la selección del modelo. Modelo ARIMA selección del tipo de uso de la Serie ACF forma no es estacionaria. Los modelos estándar ARIMA se describen a menudo por la triple: (.. p q d) como se señaló anteriormente. Estos definen la estructura del modelo en términos de la orden de los modelos AR, de diferenciación y MA para ser utilizados. También es posible incluir parámetros similares para la estacionalidad en los datos, aunque estos modelos son más complejos de instalar y de interpretar - los callos (P. D. Q) se utiliza generalmente para identificar dichos componentes del modelo. En la captura de pantalla de SPSS se muestra a continuación, se muestra el diálogo para seleccionar manualmente los elementos estructurales no estacionales y de temporada (instalaciones similares están disponibles en otros paquetes integrados, tales como SAS / ETS). Como puede verse, el cuadro de diálogo también permite que los datos se transforman (típicamente para ayudar en la estabilización de la varianza) y para permitir a los usuarios incluir una constante en el modelo (el valor predeterminado). Esta herramienta de software en particular permite valores atípicos para ser detectados si es necesario, de acuerdo con una variedad de procedimientos de detección, pero en muchos casos se han investigado los valores atípicos y ajustado o eliminado y los valores de sustitución estimada, antes de cualquier análisis. SPSS modelizador de series temporales: la modelización ARIMA, el modo experto Una serie de modelos ARIMA puede ser ajustado a los datos, de forma manual o por medio de un proceso automatizado (por ejemplo, un proceso por etapas), y una o más medidas utiliza para juzgar cuál es el mejor en términos de la medida y la parsimonia. comparación de modelos normalmente hace uso de uno o más de los informativos medidas teóricas descritas anteriormente en este manual - AIC, MDL (la función de BIC y / o R, Arima (), proporciona la medida de la AIC, mientras que SPSS proporciona una serie de medidas de ajuste, incluida una versión de la estadística BIC otras herramientas varían en las medidas a -. Minitab, que ofrece una amplia gama de métodos de TSA, no incluye estadísticas AIC / tipo BIC). 3ª ed.


No comments:

Post a Comment