Correlação espúria

O número de cegonhas e a taxa de natalidade humana em um país: um exemplo de uma correlação espúria

Correlação espúria ou ( Engl. ) Relação espúria indica uma correlação ( correspondência ou correspondência ) entre duas variáveis, que nenhuma relação causal , mas apenas uma relação aleatória ou indireta é baseada.

O termo alemão é enganoso porque na verdade significa pseudo causalidade. Porque não existe apenas uma correlação aparente, mas sim uma correlação (mas nenhuma causalidade; para a delimitação dos conceitos ver: Correlação e conexão causal ). Em qualquer caso, uma correlação é um termo estatístico que não implica nem é implicado por causalidade.

Correlação espúria é a correlação estatística do assunto na falácia de filosofia. A correlação não implica causalidade (a ocorrência comum não implica qualquer causalidade ou engl. Correlação, não causação ).

Uma correlação espúria vem, e. Por exemplo, se variáveis ​​de confusão ( variáveis ​​de interferência) ou outras variáveis ​​de intervenção têm uma influência. O fenômeno é conhecido desde o início das estatísticas; o termo correlação espúria foi cunhado em 1954 por Herbert A. Simon .

exemplo

Um exemplo bem conhecido é a correlação entre a taxa de natalidade humana e o número de pares de cegonhas em diferentes regiões europeias. Embora haja uma correlação entre o número de nascimentos e o número de pares de cegonhas (ou seja, mais nascimentos e, ao mesmo tempo, mais pares de cegonhas), não há relação causal (conclusão errada de que os filhos são trazidos pela cegonha ) A correlação entre nascimentos e pares de cegonhas resulta do facto de mais cegonhas nidificarem nas zonas rurais e de tenderem a nascer mais crianças por par.

Regressão fictícia

A regressão simulada é um caso especial de regressão , no qual uma conexão estatisticamente significativa entre uma variável e uma variável pode ser determinada, o que não pode ser comprovado logicamente. As regressões simuladas são devidas a uma tendência comum nas variáveis envolvidas . Uma indicação de regressão simulada é um alto coeficiente de determinação e um coeficiente de Durbin-Watson de quase zero (alta autocorrelação positiva de primeira ordem). Além disso, se o teste Dickey-Fuller identificar uma série temporal como não estacionária , ele fornecerá uma indicação de uma regressão simulada.

Linha de regressão entre dois processos AR (1) independentes com raiz unitária incluindo estatísticas.

Um exemplo nas aplicações é o problema de regressão espúrio da econometria , que Clive WJ Granger e Paul Newbold apontaram em 1974, segundo o qual duas caminhadas aleatórias independentes sem um componente de tendência determinística (ou outras formas de processos estocásticos com raízes de unidade ) também correlacionar, embora até mesmo a independência estocástica exista. Mais precisamente, tais violações dos pré-requisitos de um modelo de regressão causadas por autocorrelação levam, por exemplo, ao fato de que as estatísticas de teste para a hipótese de que o parâmetro de inclinação da linha de regressão é igual a zero ( estatística t ) divergem com o aumento volume de dados, ou seja, se apenas dados suficientes forem coletados, uma conexão será sempre estabelecida.

Veja também

literatura

Literatura geral

  • Günter Bamberg, Franz Baur, Michael Krapp: Estatísticas. 13ª edição. Oldenbourg Wissenschaftsverlag, 2007, ISBN 978-3-486-58188-1 .
  • Udo Kelle: A integração dos métodos qualitativos e quantitativos na pesquisa social empírica: fundamentos teóricos e conceitos metodológicos. VS Verlag, 2007, ISBN 978-3-531-15312-4 , página 203.

Trabalho original

Links da web

Evidência individual

  1. ^ R. Matthews: Cegonhas fazem partos de bebês (p = 0,008). In: Ensino de Estatística. 22 (2), 2000, pp. 36-38, doi: 10.1111 / 1467-9639.00013 .
  2. ^ Christopher Dougherty: Introdução à Econometria. 3. Edição. Oxford University Press, 2007, ISBN 978-0-19-928096-4 , p. 388. (Google Books Link)