Sunday 22 October 2017

Sazonal ajuste centrado móvel média


Média móvel A média móvel é um método para suavizar séries temporais, calculando a média (com ou sem pesos) de um número fixo de termos consecutivos. A média ldquomovesrdquo ao longo do tempo, em que cada ponto de dados da série é incluída sequencialmente na média, enquanto o mais antigo ponto de dados no intervalo da média é removido. Em geral, quanto maior a extensão da média, mais lisa é a série resultante. As médias móveis são usadas para suavizar flutuações em séries temporais ou para identificar componentes de séries temporais, tais como a tendência, o ciclo, o sazonal, etc. Uma média móvel substitui cada valor de uma série temporal por uma média (ponderada) de p valores precedentes , O valor dado, e f valores seguintes de uma série. Se p f a média móvel é dito ser centrada. A média móvel é dita ser simétrica se é centrada, e se para cada k 1, 2, hellip. Pf. O peso do k - ésimo valor precedente é igual ao peso do k - ésimo seguinte. A média móvel não está definida para o primeiro p eo último f valores de séries temporais. A fim de calcular a média móvel para esses valores, a série deve ser backcasted e previsto. Fonte: Grupo de trabalho sobre dados e apresentação de metadados para o Grupo de Trabalho de Estatísticas Económicas de Curto Prazo da OCDE (STESWP), Paris, 2004 Conceito de estacionaridade Hipoteticamente, a observação actual pode depender de todas as observações passadas. Esse modelo autorregressivo é impossível de estimar, pois contém muitos parâmetros. No entanto, se x t como uma função linear de todos os atrasos passados, pode-se mostrar que o modelo autorregressivo é equivalente a x t como uma função linear de apenas alguns choques passados. Em um modelo de média móvel, o valor atual de x t é descrito como uma função linear de choque concomitante (erro) e choques passados ​​(erros). Introdução Os resultados do ajuste sazonal são considerados estáveis ​​se forem relativamente resistentes à remoção ou adição de pontos de dados em qualquer uma das extremidades da série. A estabilidade é uma das principais propriedades dos resultados da SA. Se a adição ou o atraso de algumas observações alterarem substancialmente a série com ajuste sazonal ou o ciclo tendencial estimado, a interpretação da série com ajuste sazonal não seria confiável. Quais são os índices SI Os índices SI são valores da componente sazonal-irregular (SI), calculada como a razão entre a série original e a tendência estimada. Em outras palavras, as proporções SI são estimativas da série detrended. Os gráficos SI são úteis para investigar se os movimentos de curto prazo são causados ​​por flutuações sazonais ou irregulares. Este gráfico é uma ferramenta de diagnóstico usada para analisar o comportamento sazonal, padrões de férias em movimento, outliers e identificar as quebras sazonais na série. O software de ajuste sazonal normalmente exibe as seguintes informações sobre o modelo RegARIMA: Os critérios de seleção do modelo (critérios de informação) são medidas da bondade relativa do ajuste de um modelo estatístico. Em programas de ajuste sazonal são utilizados para selecionar a ordem ótima do modelo RegARMIA. Para os critérios de informação fornecidos, o modelo preferido é aquele com o valor mínimo de critérios de informação. Introdução Na iteração B (Tabela B7), iteração C (Tabela C7) e iteração D (Tabela D7 e Tabela D12), o componente de ciclo de tendência é extraído de uma estimativa da série ajustada sazonalmente usando as médias móveis de Henderson. O comprimento do filtro de Henderson é escolhido automaticamente por X-12-ARIMA em um procedimento de duas etapas. Médias de movimento O deslocamento de fase é a diferença na detecção de pontos de viragem entre dados originais e suavizados. Este efeito é um inconveniente, uma vez que provoca um atraso na detecção dos pontos de viragem da série temporal, especialmente no período mais recente. As médias móveis simétricas centradas são resistentes a este efeito. No entanto, no final (e no início) de séries temporais série simétrica série não pode ser usado. A fim de calcular os valores suavizados nas duas extremidades da série de tempo o filtro assimétrico são utilizados, no entanto, eles causam o efeito de fase. Palavras-chave Palavras-chave: Pode clicar e arrastar na área de traçado para aumentar o zoom Pode passar o mouse sobre os pontos de dados para ver o valor real que é representado graficamente Se houver uma caixa de legenda, clique no nome da série para exibi-los Introdução As médias móveis são médias aritméticas aplicadas A intervalos de tempo sucessivos de comprimento fixo da série. Quando aplicados à série temporal original, eles produzem uma série de valores médios. A fórmula geral para a média móvel M de coeficientes é: Os coeficientes das médias móveis são chamados de pesos. A quantidade p f 1 é a ordem média móvel. A média móvel é chamada centrada se o número de observações no passado é igual ao número de observação no futuro (isto é, se p é igual a f). As médias móveis substituem a série temporal original por médias ponderadas dos valores correntes, p observações anteriores à observação corrente e f observações após a observação corrente. Eles são usados ​​para suavizar a série de tempo original. A tabela apresenta o número de passageiros transportados por via aérea reportados pela Finlândia em 2001. Os mesmos dados são apresentados no gráfico: Tipos de médias móveis Com base nos padrões de ponderação, as médias móveis podem ser: Simétrico o padrão de pesagem utilizado para calcular médias móveis É simétrica em relação ao ponto de dados de destino. Por meio de médias móveis simétricas não é possível obter os valores suavizados para as primeiras p e últimas p observações (para médias móveis simétricas pf). Assimétrico, o padrão de pesagem utilizado para calcular as médias móveis não é simétrico em relação ao ponto de destino. As médias móveis também podem ser classificadas de acordo com a sua contribuição para o valor final como: médias móveis simples, isto é, médias móveis para as quais todos os pesos são os mesmos. Todas as observações contribuem igualmente para o valor final. Escusado será dizer que todas as médias móveis simples são simétricas. Formalmente, para a média móvel simétrica de ordem P 2p 1 todos os pesos são iguais a 1P. A figura abaixo compara o grau de suavização obtido aplicando médias móveis simples de 3 e 7 termos. As observações extremas (por exemplo, abril de 2010 ou junho de 2017) têm menor impacto sobre a média móvel mais longa do que sobre a mais curta. As médias móveis não simples, isto é, as médias móveis para as quais todos os pesos não são iguais. Os casos especiais de médias móveis não-simples são: Médias móveis compostas, que é obtido compondo uma média móvel simples de ordem P, cujos coeficientes são todos iguais a 1 P e uma média móvel simples de ordem Q, cujos coeficientes são todos iguais A 1 Q. Médias móveis assimétricas. Propriedades das médias móveis As médias móveis suavizam a série temporal. Quando aplicados a uma série de tempo, eles reduzem a amplitude das flutuações observadas e atuam como um filtro que remove movimentos irregulares a partir dele. As médias móveis com o padrão de ponderação apropriado podem ser usadas para eliminar ciclos de um certo comprimento na série temporal. No método de ajuste sazonal X-12-ARIMA, são utilizados diferentes tipos de médias móveis para estimar o ciclo de tendência e a componente sazonal. Se a soma dos coeficientes é igual a 1, então a média móvel preserva a tendência. As médias móveis têm dois padrões importantes: Eles não são robustos e podem ser profundamente afetados por outliers A suavização nas extremidades da série não pode ser feito, mas com médias móveis assimétricas que introduzem mudanças de fase e atrasos na detecção de pontos de viragem No método X11 , As médias móveis simétricas desempenham um papel importante, uma vez que não introduzem qualquer desvio de fase na série suavizada. Mas, para evitar a perda de informações no final da série, eles são ou complementados por ad hoc medições móveis assimétricas ou aplicadas sobre a série concluída por forecast. Spreadsheet implementação de ajuste sazonal e suavização exponencial É simples de executar ajuste sazonal e ajuste exponencial modelos de suavização Usando o Excel. As imagens e gráficos de tela a seguir são extraídos de uma planilha que foi configurada para ilustrar o ajuste sazonal multiplicativo e a suavização linear exponencial nos seguintes dados de vendas trimestrais do Outboard Marine: Para obter uma cópia do próprio arquivo de planilha, clique aqui. A versão de suavização exponencial linear que será usada aqui para fins de demonstração é a versão de Brown8217s, simplesmente porque ela pode ser implementada com uma única coluna de fórmulas e há apenas uma constante de suavização para otimizar. Normalmente, é melhor usar a versão Holt8217s que tem constantes de suavização separadas para nível e tendência. O processo de previsão prossegue da seguinte forma: (i) primeiro os dados são ajustados sazonalmente (ii) então as previsões são geradas para os dados ajustados sazonalmente através de suavização exponencial linear e (iii) finalmente as previsões sazonalmente ajustadas são quasi mensuradas para obter previsões para a série original . O processo de ajuste sazonal é realizado nas colunas D a G. O primeiro passo no ajuste sazonal é calcular uma média móvel centrada (realizada aqui na coluna D). Isto pode ser feito tomando a média de duas médias anuais que são compensadas por um período em relação um ao outro. (Uma combinação de duas médias de compensação em vez de uma única média é necessária para fins de centralização quando o número de estações é par.) O próximo passo é calcular a relação com a média móvel - ie. Os dados originais divididos pela média móvel em cada período - o que é realizado aqui na coluna E. (Isso também é chamado de componente quottrend-cyclequot do padrão, na medida em que os efeitos da tendência e do ciclo de negócios podem ser considerados como sendo tudo o que Permanece após a média de dados de um ano inteiro. Naturalmente, as mudanças mês a mês que não são devido à sazonalidade poderia ser determinada por muitos outros fatores, mas a média de 12 meses suaviza sobre eles em grande medida. O índice sazonal estimado para cada estação é calculado pela primeira média de todas as razões para essa estação particular, que é feita nas células G3-G6 usando uma fórmula AVERAGEIF. As razões médias são então redimensionadas de modo que somam exatamente 100 vezes o número de períodos em uma estação, ou 400, neste caso, o que é feito nas células H3-H6. Abaixo na coluna F, as fórmulas VLOOKUP são usadas para inserir o valor do índice sazonal apropriado em cada linha da tabela de dados, de acordo com o trimestre do ano que ele representa. A média móvel centrada e os dados ajustados sazonalmente acabam parecidos com isto: Note que a média móvel normalmente se parece com uma versão mais lisa da série ajustada sazonalmente, e é mais curta em ambas as extremidades. Uma outra planilha no mesmo arquivo do Excel mostra a aplicação do modelo de suavização exponencial linear aos dados ajustados sazonalmente, começando na coluna G. Um valor para a constante de alisamento (alfa) é inserido acima da coluna de previsão (aqui, na célula H9) e Por conveniência, é atribuído o nome de intervalo quotAlpha. quot (O nome é atribuído usando o comando quotInsertNameCreatequot). O modelo LES é inicializado ao definir as duas primeiras previsões iguais ao primeiro valor real da série ajustada sazonalmente. A fórmula usada aqui para a previsão LES é a forma recursiva de equação única do modelo Brown8217s: Esta fórmula é inserida na célula correspondente ao terceiro período (aqui, célula H15) e copiada para baixo a partir daí. Observe que a previsão do LES para o período atual se refere às duas observações precedentes e aos dois erros de previsão anteriores, bem como ao valor de alfa. Assim, a fórmula de previsão na linha 15 refere-se apenas a dados que estavam disponíveis na linha 14 e anteriores. (É claro que, se desejássemos usar a suavização linear simples em vez de linear, poderíamos substituir a fórmula SES aqui. Podemos também usar Holt8217s ao invés de Brown8217s modelo LES, o que exigiria mais duas colunas de fórmulas para calcular o nível ea tendência Que são utilizados na previsão.) Os erros são calculados na próxima coluna (aqui, coluna J) subtraindo as previsões dos valores reais. O erro quadrático médio é calculado como a raiz quadrada da variância dos erros mais o quadrado da média. (Isto decorre da identidade matemática: VARIANCE MSE (erros) (AVERAGE (erros)) 2.) No cálculo da média e variância dos erros nesta fórmula, os dois primeiros períodos são excluídos porque o modelo não começa realmente a prever até O terceiro período (linha 15 na folha de cálculo). O valor ótimo de alfa pode ser encontrado alterando manualmente alfa até que o mínimo RMSE seja encontrado, ou então você pode usar o quotSolverquot para executar uma minimização exata. O valor de alpha que o Solver encontrado é mostrado aqui (alpha0.471). Geralmente é uma boa idéia traçar os erros do modelo (em unidades transformadas) e também calcular e traçar suas autocorrelações em defasagens de até uma estação. Aqui está um gráfico de séries temporais dos erros (ajustados sazonalmente): As autocorrelações de erro são calculadas usando a função CORREL () para calcular as correlações dos erros com elas mesmas atrasadas por um ou mais períodos - detalhes são mostrados no modelo de planilha . Aqui está um gráfico das autocorrelações dos erros nos primeiros cinco lags: As autocorrelações nos intervalos 1 a 3 são muito próximas de zero, mas a espiga no intervalo 4 (cujo valor é 0,35) é ligeiramente problemática - sugere que a Processo de ajuste sazonal não foi completamente bem sucedido. No entanto, é apenas marginalmente significativo. 95 bandas de significância para testar se as autocorrelações são significativamente diferentes de zero são mais ou menos 2SQRT (n-k), onde n é o tamanho da amostra e k é o atraso. Aqui n é 38 e k varia de 1 a 5, então a raiz quadrada de - n-menos-k é de cerca de 6 para todos eles e, portanto, os limites para testar a significância estatística de desvios de zero são aproximadamente mais - Ou-menos 26, ou 0,33. Se você variar o valor de alfa com a mão neste modelo do Excel, você pode observar o efeito sobre as parcelas de tempo de série e autocorrelação dos erros, bem como sobre o erro quadrático médio, que será ilustrado abaixo. Na parte inferior da planilha, a fórmula de previsão é quotbootstrappedquot para o futuro, simplesmente substituindo as previsões de valores reais no ponto onde os dados reais se esgotou - i. e. Onde o futuro começa. (Em outras palavras, em cada célula onde um valor de dados futuro ocorreria, uma referência de célula é inserida que aponta para a previsão feita para esse período.) Todas as outras fórmulas são simplesmente copiadas para baixo de cima: Observe que os erros para previsões de O futuro são todos computados como sendo zero. Isso não significa que os erros reais serão zero, mas sim apenas reflete o fato de que, para fins de previsão, estamos assumindo que os dados futuros serão iguais às previsões em média. As previsões de LES resultantes para os dados ajustados sazonalmente são as seguintes: Com este valor específico de alfa, que é ideal para as previsões de um período antecipado, a tendência projetada é ligeiramente alta, refletindo a tendência local observada nos últimos 2 anos ou então. Para outros valores de alfa, uma projeção de tendência muito diferente pode ser obtida. Geralmente é uma boa idéia ver o que acontece com a projeção de tendência de longo prazo quando o alfa é variado, porque o valor que é melhor para a previsão de curto prazo não será necessariamente o melhor valor para prever o futuro mais distante. Por exemplo, aqui está o resultado que é obtido se o valor de alfa é manualmente definido como 0.25: A tendência de longo prazo projetada é agora negativa em vez de positiva Com um menor valor de alfa, o modelo está colocando mais peso em dados mais antigos em A sua estimativa do nível e da tendência actuais e as suas previsões a longo prazo reflectem a tendência descendente observada nos últimos 5 anos, em vez da tendência ascendente mais recente. Este gráfico também ilustra claramente como o modelo com um valor menor de alfa é mais lento para responder a pontos de quotreação nos dados e, portanto, tende a fazer um erro do mesmo sinal para muitos períodos em uma linha. Seus erros de previsão de 1 passo são maiores em média do que aqueles obtidos antes (RMSE de 34,4 em vez de 27,4) e fortemente positivamente autocorrelacionados. A autocorrelação lag-1 de 0,56 excede largamente o valor de 0,33 calculado acima para um desvio estatisticamente significativo de zero. Como uma alternativa ao avanço do valor de alfa para introduzir mais conservadorismo em previsões de longo prazo, um fator quottrend de amortecimento é às vezes adicionado ao modelo para fazer a tendência projetada aplanar após alguns períodos. A etapa final na construção do modelo de previsão é a de igualar as previsões de LES, multiplicando-as pelos índices sazonais apropriados. Assim, as projeções reseasonalized na coluna I são simplesmente o produto dos índices sazonais na coluna F e as previsões de LES estacionalmente ajustadas na coluna H. É relativamente fácil calcular intervalos de confiança para previsões de um passo à frente feitas por este modelo: primeiro Calcular o RMSE (erro quadrático médio, que é apenas a raiz quadrada do MSE) e, em seguida, calcular um intervalo de confiança para a previsão ajustada sazonalmente adicionando e subtraindo duas vezes o RMSE. (Em geral, um intervalo de confiança de 95 para uma previsão de um período antecipado é aproximadamente igual à previsão de pontos mais ou menos duas vezes o desvio padrão estimado dos erros de previsão, assumindo que a distribuição de erro é aproximadamente normal eo tamanho da amostra É grande o suficiente, digamos, 20 ou mais. Aqui, o RMSE em vez do desvio padrão da amostra dos erros é a melhor estimativa do desvio padrão de futuros erros de previsão, porque leva bias, bem como variações aleatórias em conta.) Os limites de confiança Para a previsão ajustada sazonalmente são então reseasonalized. Juntamente com a previsão, multiplicando-os pelos índices sazonais apropriados. Neste caso o RMSE é igual a 27,4 e a previsão ajustada sazonalmente para o primeiro período futuro (Dec-93) é 273,2. De modo que o intervalo de confiança ajustado sazonalmente é de 273,2-227,4 218,4 para 273,2227,4 328,0. Multiplicando esses limites por Decembers índice sazonal de 68,61. Obtemos limites de confiança inferior e superior de 149,8 e 225,0 em torno da previsão de ponto Dec-93 de 187,4. Os limites de confiança para as previsões de mais de um período de tempo em geral aumentarão à medida que o horizonte de previsão aumentar, devido à incerteza quanto ao nível e à tendência, bem como aos fatores sazonais, mas é difícil computá-los em geral por métodos analíticos. (A maneira apropriada de calcular os limites de confiança para a previsão do LES é usando a teoria ARIMA, mas a incerteza nos índices sazonais é outra questão.) Se você quer um intervalo de confiança realista para uma previsão mais do que um período à frente, A sua melhor aposta é usar métodos empíricos: por exemplo, para obter um intervalo de confiança para uma previsão de duas etapas à frente, você poderia criar outra coluna na planilha para calcular uma previsão de duas etapas para cada período ( Por bootstrapping a previsão one-step-ahead). Em seguida, calcule o RMSE dos erros de previsão em duas etapas e use isso como a base para um intervalo de confiança de 2 passos. Análise da série temporal: O processo de ajuste sazonal Quais são as duas principais filosofias do ajuste sazonal O que é um Filtro Qual é o problema do ponto final Como decidimos qual filtro usar O que é uma função de ganho O que é um deslocamento de fase Quais são as médias móveis de Henderson Como lidamos com o problema do ponto final Quais são as médias móveis sazonais Muitos dados são necessários para obter estimativas ajustadas sazonalmente aceitáveis ​​AVANÇADO Como as duas filosofias de ajuste sazonal comparam QUAIS SÃO AS DOIS PRINCIPAIS FILOSOFIAS DE AJUSTE ESTACIONAL As duas principais filosofias para o ajuste sazonal são o método baseado em modelo eo método baseado em filtros. Métodos baseados em filtros Este método aplica um conjunto de filtros fixos (médias móveis) para decompor as séries temporais em uma componente tendencial, sazonal e irregular. A noção subjacente é que os dados econômicos são compostos por uma série de ciclos, incluindo ciclos econômicos (a tendência), ciclos sazonais (sazonalidade) e ruído (componente irregular). Um filtro essencialmente remove ou reduz a resistência de certos ciclos a partir dos dados de entrada. Para produzir uma série ajustada sazonalmente a partir dos dados coletados mensalmente, os eventos que ocorrem a cada 12, 6, 4, 3, 2,4 e 2 meses precisam ser removidos. Estes correspondem a frequências sazonais de 1, 2, 3, 4, 5 e 6 ciclos por ano. Os ciclos não sazonais mais longos são considerados parte da tendência e os ciclos não sazonais mais curtos formam o irregular. No entanto, o limite entre a tendência e ciclos irregulares pode variar com o comprimento do filtro utilizado para obter a tendência. No ABS ajuste sazonal, ciclos que contribuem significativamente para a tendência são tipicamente maiores do que cerca de 8 meses para séries mensais e 4 trimestres para séries trimestrais. A tendência, os componentes sazonais e irregulares não precisam de modelos individuais explícitos. O componente irregular é definido como o que permanece após a tendência e os componentes sazonais foram removidos por filtros. Irregulares não apresentam características de ruído branco. Métodos baseados em filtros são freqüentemente conhecidos como métodos de estilo X11. Estes incluem X11 (desenvolvido pela U. S. Census Bureau), X11ARIMA (desenvolvido pela Estatística Canadá), X12ARIMA (desenvolvido pelo U. S. Census Bureau), STL, SABL e SEASABS (o pacote utilizado pelo ABS). As diferenças computacionais entre vários métodos na família X11 são principalmente o resultado de diferentes técnicas usadas nas extremidades da série temporal. Por exemplo, alguns métodos usam filtros assimétricos nas extremidades, enquanto outros métodos extrapolam as séries temporais e aplicam filtros simétricos à série estendida. Métodos baseados em modelos Esta abordagem requer que a tendência, os componentes sazonais e irregulares das séries temporais sejam modeladas separadamente. Assume-se que a componente irregular é 8220 ruído branco 8221 - que é todos os comprimentos de ciclo são igualmente representados. Os irregulares têm média zero e uma variância constante. A componente sazonal tem o seu próprio elemento de ruído. Dois pacotes de software amplamente utilizados que aplicam métodos baseados em modelos são STAMP e SEATSTRAMO (desenvolvido pelo Banco de Espanha.) As principais diferenças computacionais entre os vários métodos baseados em modelos são geralmente devido a especificações do modelo, em alguns casos os componentes são modelados diretamente. Exigem que as séries temporais originais sejam modeladas primeiro e os modelos componentes sejam decompostos a partir dele Para uma comparação das duas filosofias a um nível mais avançado, veja Como as duas filosofias de ajuste sazonal se comparam O QUE É UM FILTRO Os filtros podem ser usados ​​para decompor Uma série de tempo em uma tendência, componente sazonal e irregular. Moedas médias são um tipo de filtro que sucessivamente média um período de tempo de mudança de dados, a fim de produzir uma estimativa suavizada de uma série temporal. Esta série suavizada pode ser considerada como tendo sido derivado Através da execução de uma série de entradas através de um processo que filtra certos ciclos. Portanto, uma média móvel é muitas vezes referida como um filtro. O processo básico envolve a definição de um conjunto de pesos de comprimento m 1 m 2 1 como: Nota: um conjunto simétrico de pesos tem m 1 m 2 e wjw - j Um valor filtrado no tempo t pode ser calculado por onde Y t descreve o valor Da série temporal no instante t. Por exemplo, considere a seguinte série: Usando um filtro simétrico simples de 3 termos (ou seja, m 1 m 2 1 e todos os pesos são 13), o primeiro termo da série suavizada é obtido aplicando os pesos aos três primeiros termos do original Série: O segundo valor suavizado é produzido aplicando os pesos ao segundo, terceiro e quarto termos da série original: O QUE É O PROBLEMA DO PONTO FINAL Reconsiderar a série: Esta série contém 8 termos. No entanto, a série suavizada obtida aplicando filtro simétrico aos dados originais contém apenas 6 termos: Isto é porque há dados insuficientes nas extremidades da série para aplicar um filtro simétrico. O primeiro termo da série suavizada é uma média ponderada de três termos, centrada no segundo termo da série original. Uma média ponderada centrada no primeiro termo da série original não pode ser obtida como dados antes que este ponto não esteja disponível. Da mesma forma, não é possível calcular uma média ponderada centrada no último termo da série, pois não há dados após este ponto. Por esta razão, os filtros simétricos não podem ser usados ​​em nenhuma das extremidades de uma série. Isso é conhecido como o problema do ponto final. Analistas de séries temporais podem usar filtros assimétricos para produzir estimativas suavizadas nessas regiões. Neste caso, o valor suavizado é calculado 8216 fora do centro 8217, sendo a média determinada usando mais dados de um lado do ponto do que o outro de acordo com o que está disponível. Alternativamente, as técnicas de modelagem podem ser usadas para extrapolar as séries temporais e, em seguida, aplicar filtros simétricos para a série estendida. COMO DECIDEMOS O FILTRO A UTILIZAR O analista de séries temporais escolhe um filtro apropriado com base nas suas propriedades, como os ciclos que o filtro remove quando aplicado. As propriedades de um filtro podem ser investigadas usando uma função de ganho. As funções de ganho são usadas para examinar o efeito de um filtro em uma determinada freqüência na amplitude de um ciclo para uma série de tempo particular. Para obter mais detalhes sobre a matemática associada às funções de ganho, você pode baixar as Notas do Curso da Série de Tempo, um guia introdutório para a análise de séries temporais publicada pela Seção de Análise de Séries Temporais do ABS (consulte a seção 4.4). O diagrama a seguir é a função de ganho para o filtro de 3 terminais simétricos que estudamos anteriormente. Figura 1: Função de ganho para o filtro simétrico de 3 períodos O eixo horizontal representa o comprimento de um ciclo de entrada em relação ao período entre os pontos de observação da série temporal original. Assim, um ciclo de entrada de comprimento 2 é completado em 2 períodos, o que representa 2 meses para uma série mensal e 2 trimestres para uma série trimestral. O eixo vertical mostra a amplitude do ciclo de saída em relação a um ciclo de entrada. Este filtro reduz a intensidade de 3 ciclos de período para zero. Ou seja, remove completamente ciclos de aproximadamente este comprimento. Isto significa que para uma série de tempo onde os dados são coletados mensalmente, quaisquer efeitos sazonais que ocorrem trimestralmente serão eliminados aplicando este filtro à série original. Um desvio de fase é o deslocamento de tempo entre o ciclo filtrado e o ciclo não filtrado. Um deslocamento de fase positivo significa que o ciclo filtrado é deslocado para trás e um desvio de fase negativo é deslocado para a frente no tempo. O deslocamento de fase ocorre quando a temporização dos pontos de viragem é distorcida, por exemplo quando a média móvel é colocada fora do centro pelos filtros assimétricos. Isso é que eles ocorrerão mais cedo ou mais tarde na série filtrada, do que no original. As médias móveis simétricas de comprimento ímpar (usadas pelo ABS), onde o resultado é colocado centralmente, não causam deslocamento de fase do tempo. É importante que os filtros usados ​​para derivar a tendência para manter a fase de tempo e, portanto, o tempo de quaisquer pontos de viragem. As Figuras 2 e 3 mostram os efeitos da aplicação de uma média móvel simétrica 2x12 que é descentrada. As curvas contínuas representam os ciclos iniciais e as curvas quebradas representam os ciclos de saída após a aplicação do filtro de média móvel. Figura 2: Ciclo de 24 meses, Fase -5,5 meses Amplitude 63 Figura 3: Ciclo de 8 meses, Fase -1,5 meses Amplitude 22 QUAIS SÃO MÉDIOS MOVENTES DE HENDERSON As médias móveis de Henderson são filtros que foram derivados por Robert Henderson em 1916 para uso em aplicações atuariais. Eles são filtros de tendência, comumente usados ​​em análise de séries temporais para suavizar estimativas ajustadas sazonalmente, a fim de gerar uma estimativa de tendência. Eles são usados ​​em preferência a médias móveis mais simples, porque eles podem reproduzir polinômios de até grau 3, capturando assim pontos de viragem de tendência. O ABS usa médias móveis Henderson para produzir estimativas de tendência de uma série ajustada sazonalmente. As estimativas de tendência publicadas pelo ABS são tipicamente derivadas usando um filtro de Henderson de 13 termos para séries mensais e um filtro de Henderson de 7 termos para séries trimestrais. Os filtros de Henderson podem ser simétricos ou assimétricos. As médias móveis simétricas podem ser aplicadas em pontos suficientemente afastados das extremidades de uma série temporal. Neste caso, o valor suavizado para um dado ponto na série temporal é calculado a partir de um número igual de valores em ambos os lados do ponto de dados. Para obter os pesos, é alcançado um compromisso entre as duas características geralmente esperadas de uma série de tendências. Estes são que a tendência deve ser capaz de representar uma ampla gama de curvaturas e que ele também deve ser tão suave quanto possível. Para a derivação matemática dos pesos, consulte a seção 5.3 das Notas do Curso da Série de Tempo. Que pode ser baixado gratuitamente no site da ABS. Os padrões de ponderação para uma faixa de médias móveis de Henderson simétricas são apresentados na tabela a seguir: Padrão de ponderação simétrica para Henderson Moving Average Em geral, quanto maior o filtro de tendência, mais suave a tendência resultante, como é evidente a partir de uma comparação das funções de ganho acima. Um Henderson de 5 termos reduz ciclos de aproximadamente 2,4 períodos ou menos em pelo menos 80, enquanto que um termo de 23 Henderson reduz ciclos de cerca de 8 períodos ou menos em pelo menos 90. De fato, um termo de 23 Henderson filtro remove completamente ciclos de menos de 4 períodos . Henderson médias móveis também moderar os ciclos sazonais em graus variados. No entanto, as funções de ganho nas Figuras 4-8 mostram que os ciclos anuais nas séries mensal e trimestral não são suficientemente amortecidos para justificar a aplicação de um filtro de Henderson diretamente às estimativas originais. É por isso que eles são aplicados apenas a uma série ajustada sazonalmente, onde os efeitos relacionados calendário já foram removidos com filtros projetados especificamente. A Figura 9 mostra os efeitos de alisamento da aplicação de um filtro de Henderson a uma série: Figura 9: Filtro de Henderson de 23 Dias - Valor de Aprovações de Edifícios Não Residenciais COMO NÓS LIDAMOS COM O PROBLEMA DE PONTO FINAL O filtro de Henderson simétrico só pode ser aplicado a regiões De dados que estão suficientemente longe dos extremos da série. Por exemplo, o termo padrão 13 Henderson só pode ser aplicado a dados mensais que é pelo menos 6 observações a partir do início ou final dos dados. Isso ocorre porque a suavidade do filtro da série, tendo uma média ponderada dos 6 termos de cada lado do ponto de dados, bem como o ponto em si. Se tentarmos aplicá-lo a um ponto que é inferior a 6 observações a partir do final dos dados, então não há dados suficientes disponíveis em um lado do ponto para calcular a média. Para fornecer estimativas de tendência destes pontos de dados, utiliza-se uma média móvel modificada ou assimétrica. O cálculo de filtros Henderson assimétricos pode ser gerado por uma série de métodos diferentes que produzem resultados semelhantes, mas não idênticos. Os quatro métodos principais são o método de Musgrave, o método de Minimização do Quadrado Médio, o método Best Linear Unbiased Estimates (AZUL) eo método de Kenny e Durbin. Shiskin et. Al (1967) derivaram os pesos assimétricos originais para a média móvel de Henderson que são usados ​​dentro dos pacotes X11. Para obter informações sobre a derivação dos pesos assimétricos, consulte a seção 5.3 das notas do curso da série temporal. Considere uma série de tempo onde o último ponto de dados observado ocorre no tempo N. Então um filtro de Henderson de 13 termos simétricos não pode ser aplicado a pontos de dados que são medidos a qualquer momento após e incluindo o tempo N-5. Para todos esses pontos, um conjunto de pesos assimétrico deve ser usado. A tabela a seguir apresenta o padrão de ponderação assimétrica para uma média móvel de Henderson de 13 termos. Os filtros de Henderson de 13 termos assimétricos não removem nem amortecem os mesmos ciclos que o filtro de Henderson de 13 termos simétrico. De fato, o padrão de ponderação assimétrica usado para estimar a tendência na última observação amplifica a força de 12 ciclos de período. Também filtros assimétricos produzem algum deslocamento de fase de tempo. QUAIS SÃO AS MÉDIA MOVIMENTO SAZONÁRIO Quase todos os dados investigados pelo ABS têm características sazonais. Como as médias móveis de Henderson usadas para estimar a série de tendências não eliminam a sazonalidade, os dados devem ser ajustados sazonalmente primeiro usando filtros sazonais. Um filtro sazonal tem pesos que são aplicados ao mesmo período ao longo do tempo. Um exemplo do padrão de ponderação para um filtro sazonal seria: (13, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 13, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 13) onde, por exemplo, um peso de um terço é aplicado a três janeiro consecutivos. Dentro de X11, uma série de filtros sazonais estão disponíveis para escolher. Estas são uma média móvel ponderada de três períodos (ma) S 3x1. Ponderado 5-term ma S 3x3. Ponderada 7-termo ma S 3x5. E uma ponderada 11-termo ma S 3x9. A estrutura de ponderação das médias móveis ponderadas da forma, S nxm. É que uma média simples de m termos calculados e, em seguida, uma média móvel de n dessas médias é determinada. Isto significa que os termos nm-1 são usados ​​para calcular cada valor suavizado final. Por exemplo, para calcular um 11-termo S 3x9. Um peso de 19 é aplicado ao mesmo período em 9 anos consecutivos. Em seguida, é aplicada uma média móvel de 3 termos simples através dos valores médios: Isto dá um padrão de ponderação final de (127, 227, 19, 19, 19, 19, 19, 19, 19, 227, 127). A função de ganho para um filtro sazonal de 11 períodos, S 3x9. Se como: Figura 10: Função de ganho para 11 Term (S 3x9) Filtro sazonal Aplicando um filtro sazonal aos dados irá gerar uma estimativa da componente sazonal da série temporal, uma vez que preserva a força dos harmônicos sazonais e amortece os ciclos de não - Sazonais. Filtros sazonais assimétricos são usados ​​nas extremidades da série. Os pesos assimétricos para cada um dos filtros sazonais usados ​​em X11 podem ser encontrados na seção 5.4 das Notas do Curso da Série de Tempo. Por que as estimativas de tendências são revisadas No final atual de uma série de tempo, não é possível usar filtros simétricos para estimar a tendência por causa do problema do ponto final. Em vez disso, filtros assimétricos são usados ​​para produzir estimativas de tendência provisórias. No entanto, à medida que mais dados se tornam disponíveis, é possível recalcular a tendência usando filtros simétricos e melhorar as estimativas iniciais. Isso é conhecido como uma revisão de tendência. QUANTIDADE DE DADOS É OBRIGADA A OBTER ESTIMATIVAS ACEITÁVEIS AJUSTADAS SAZONALMENTE Se uma série temporal exibir sazonalidade relativamente estável e não for dominada pela componente irregular, então 5 anos de dados podem ser considerados um comprimento aceitável para derivar estimativas ajustadas sazonalmente de. Para uma série que mostra uma sazonalidade particularmente forte e estável, um ajuste bruto pode ser feito com 3 anos de dados. É geralmente preferível ter pelo menos 7 anos de dados para uma série de tempo normal, para identificar precisamente padrões sazonais, dia de negociação e efeitos de férias em movimento, tendência e quebras sazonais, bem como outliers. As abordagens baseadas em modelos permitem as propriedades estocásticas (aleatoriedade) da série em análise, no sentido de que elas adaptam os pesos dos filtros com base na natureza da série. A capacidade do modelo 8217s para descrever com precisão o comportamento da série pode ser avaliada, e inferências estatísticas para as estimativas estão disponíveis com base no pressuposto de que o componente irregular é o ruído branco. Os métodos baseados em filtros são menos dependentes das propriedades estocásticas das séries temporais. É responsabilidade do analista de séries temporais escolher o filtro mais apropriado de uma coleção limitada para uma série particular. Não é possível realizar verificações rigorosas sobre a adequação do modelo implícito e medidas exatas de precisão e inferência estatística não estão disponíveis. Portanto, um intervalo de confiança não pode ser construído em torno da estimativa. Os diagramas a seguir comparam a presença de cada um dos componentes do modelo nas freqüências sazonais para as duas filosofias de ajuste sazonal. O eixo x é o comprimento do período do ciclo eo eixo y representa a força dos ciclos que compreendem cada componente: Figura 11: Comparação das duas filosofias de ajuste sazonal Os métodos baseados em filtros pressupõem que cada componente existe apenas um certo comprimento de ciclo. Os ciclos mais longos formam a tendência, a componente sazonal está presente nas frequências sazonais ea componente irregular é definida como ciclos de qualquer outro comprimento. Sob uma filosofia baseada em modelo, a tendência, componente sazonal e irregular estão presentes em todos os comprimentos de ciclo. O componente irregular é de força constante, os picos de componente sazonal em frequências sazonais ea componente de tendência é mais forte nos ciclos mais longos. Esta página foi publicada pela primeira vez em 14 de Novembro de 2005, actualizada pela última vez em 25 de Julho de 2008

No comments:

Post a Comment