Thursday 6 July 2017

Diferença Entre Regressão Média E Linear


Mike, primeiro instale R (se você ainda não), execute R e instale o pacote TeachingDemos (exatamente como depende do seu sistema), carregue o pacote com a biblioteca (TeachingDemos) e digite loess. demo para abrir a página de ajuda para ver Como executá-lo, você pode rolar para o fundo onde o exemplo é e copiar e colar esse código na linha de comando R39s para ver os exemplos e, em seguida, executar com seus próprios dados para explorar ainda mais. Ndash Greg Snow 23 de março 12 às 17:15 Aqui está uma resposta simples, mas detalhada. Um modelo linear se adapta a um relacionamento através de todos os pontos de dados. Este modelo pode ser de primeira ordem (outro significado de linear) ou polinômio para explicar a curvatura, ou com splines para explicar diferentes regiões com um modelo de governo diferente. Um ajuste LOESS é uma regressão ponderada localmente baseada nos pontos de dados originais. O que significa que A LOESS se ajusta aos valores X e Y originais, além de um conjunto de valores de saída X para os quais calcular novos valores de Y (geralmente os mesmos valores de X são usados ​​para ambos, mas geralmente são usados ​​menos valores X para pares XY ajustados Devido ao aumento da computação necessária). Para cada valor de saída X, uma porção dos dados de entrada é usada para calcular um ajuste. A porção dos dados, geralmente de 25 a 100, mas tipicamente 33 ou 50, é local, o que significa que é a porção dos dados originais mais próximos de cada valor de saída X específico. É um ajuste em movimento, porque cada valor de saída X requer um subconjunto diferente dos dados originais, com pesos diferentes (veja o próximo parágrafo). Este subconjunto de pontos de dados de entrada é usado para executar uma regressão ponderada, com os pontos mais próximos do valor de saída X dado maior peso. Essa regressão geralmente é de segunda ordem ou superior é possível, mas requer maior poder de computação. O valor Y dessa regressão ponderada calculada na saída X é usado como o valor dos modelos Y para este valor X. A regressão é recalculada em cada valor de saída X para produzir um conjunto completo de valores de saída Y. Respondeu 21 de fevereiro 15 às 21: 08quais são relação e diferença entre séries temporais e regressão para modelos e premissas. É correto que os modelos de regressão assumam a independência entre as variáveis ​​de saída para diferentes valores da variável de entrada, enquanto o modelo da série temporal não é o que são algumas outras diferenças Existem várias abordagens para a análise de séries temporais, mas as duas mais conhecidas são as Método de regressão e Método Box-Jenkins (1976) ou ARIMA (AutoRegressive Integrated Moving Average). Este documento apresenta o método de regressão. Eu considero o método de regressão muito superior ao ARIMA por três razões principais, não entendendo muito o que o método de regressão para séries temporais está no site e como é diferente do método Box-Jenkins ou ARIMA. Agradeço se alguém pode dar algumas informações sobre essas questões. Obrigado e considero que realmente acho que esta é uma boa pergunta e merece uma resposta. O link fornecido é escrito por um psicólogo que afirma que algum método de preparação para o lar é uma maneira melhor de fazer análises de séries temporais do que a Box-Jenkins. Espero que a minha tentativa de resposta incentive outros, que são mais experientes em séries temporais, para contribuir. A partir de sua introdução, parece que Darlington está defendendo a abordagem de apenas montar um modelo AR por mínimos quadrados. Ou seja, se você quiser ajustar o modelo zt alpha1 z cdots alphak z varepsilont para a série temporizada zt, você pode apenas regredir a série zt na série com o atraso 1, o atraso 2 e assim por diante até o atraso k, usando um Regressão múltipla comum. Isso certamente é permitido em R, é até uma opção na função ar. Eu testei isso e tende a dar respostas semelhantes ao método padrão para montar um modelo AR em R. Ele também defende regredir zt em coisas como t ou poderes de t para encontrar tendências. Novamente, isso é absolutamente bom. Muitos livros da série de tempo discutem isso, por exemplo Shumway-Stoffer e Cowpertwait-Metcalfe. Normalmente, uma análise de séries de tempo pode prosseguir nas seguintes linhas: você encontra uma tendência, remova-a e ajuste um modelo para os resíduos. Mas parece que ele também está defendendo o excesso de ajuste e, em seguida, usando a redução no erro de quadrado médio entre a série ajustada e os dados como evidência de que seu método é melhor. Por exemplo: sinto que os correlogramas agora são obsolescentes. O objetivo principal era permitir que os trabalhadores adivinissem quais os modelos que melhor se adequariam aos dados, mas a velocidade dos computadores modernos (pelo menos em regressão, se não em modelos temporais), permite que um trabalhador se encaixe em vários modelos e veja exatamente como Cada um se ajusta conforme medido pelo erro quadrático médio. A questão da capitalização sobre o acaso não é relevante para essa escolha, uma vez que os dois métodos são igualmente suscetíveis a esse problema. Esta não é uma boa idéia porque o teste de um modelo deve ser o quão bem ele pode prever, e não o quão bem se ajusta aos dados existentes. Em seus três exemplos, ele usa erro ajustado do quadrado-quadrado como seu critério para a qualidade do ajuste. Claro, um modelo excessivo irá fazer uma estimativa na amostra de erro menor, então sua afirmação de que seus modelos são melhores porque eles têm RMSE menor está errado. Em poucas palavras, uma vez que ele está usando o critério errado para avaliar o quão bom é um modelo, ele alcança as conclusões erradas sobre a regressão versus ARIMA. Devo apostar que, se ele tivesse testado a habilidade preditiva dos modelos, o ARIMA teria saído no topo. Talvez alguém possa tentar se tiverem acesso aos livros que ele menciona aqui. Suplementar: para mais informações sobre a ideia de regressão, você pode querer verificar livros da série de tempos mais antigos que foram escritos antes de o ARIMA se tornar o mais popular. Por exemplo, Kendall, Time-Series. 1973, o Capítulo 11 possui um capítulo inteiro sobre esse método e comparações com o ARIMA. Tanto quanto posso dizer, o autor nunca descreveu seu método de criação em casa em uma publicação revisada por pares e as referências para e da literatura estatística parecem mínimas e suas principais publicações sobre temas metodológicos remontam aos anos 70. Em termos estritos, nada disso prova nada além de tempo ou experiência suficiente para avaliar as reivindicações, seria extremamente relutante em usar qualquer uma delas. Ndash Gala 18 de julho 13 às 11:31

No comments:

Post a Comment