Variância empírica

A variância empírica e a variância da amostra (obsoleto: quadrado de espalhamento empírico ) ou quase sem variância ( latim variantia = "diversidade" ou variare chamada = "(ver) mudar, ser diferente"), uma indicação estatística da propagação dos valores uma amostra e, em estatísticas descritivas, um índice de uma amostra. É uma das medidas de dispersão e descreve o desvio médio quadrático dos valores medidos individuais da média empírica . Representa, portanto, uma espécie de desvio quadrático médio, cuja raiz positiva da variância empírica é o desvio padrão empírico . O desvio padrão empírico é a medida mais comum de dispersão.

Os termos "variância", "variância da amostra" e "variância empírica" ​​não são usados ​​de forma consistente na literatura. Em geral, uma distinção deve ser feita entre os

Uma delimitação e conexões precisas podem ser encontradas na seção Relacionamento dos Termos de Variância .

definição

motivação

A variância de uma população finita em tamanho é uma medida da dispersão dos valores individuais em torno da média da população e é definida como

com a média da população .

Como é desconhecida em situações práticas e ainda precisa ser calculada, a variância empírica é freqüentemente usada. Isso é especialmente necessário quando em grandes populações não é possível contar todos os indivíduos da população.

definição

Dada uma amostra de elementos . Denota

a média empírica da amostra. Essa média empírica é uma estimativa da média da população . A variância empírica pode ser definida de duas maneiras. Ou a variância empírica da amostra é definida como a soma dos desvios quadrados dividida pelo número de valores medidos:

,

ou é definido como uma forma ligeiramente modificada como a soma dos desvios quadrados dividida pelo número de graus de liberdade

.

Explicação

A variância empírica representa, portanto, uma espécie de “desvio médio quadrático”, sendo um estimador da variância populacional . As representações decorrem diretamente da definição

respectivamente .

Esta forma ligeiramente modificada é muitas vezes referida como variação de amostra e é usada por pacotes de programas como B. SPSS , R etc. são os preferidos. Se a amostra não apresentar variabilidade, i. H. , então há uma variação de . A média pode ser explicada intuitivamente em vez de pela forma modificada da variância empírica como segue: Devido à propriedade de foco da média empírica , o último desvio já é determinado pelo primeiro . Conseqüentemente, apenas os desvios variam livremente e, portanto, a média é dividida pelo número de graus de liberdade .

Se apenas “a” variação empírica é falada, deve-se prestar atenção a qual convenção ou definição se aplica no contexto correspondente. Nem a nomenclatura das definições nem a notação correspondente são uniformes na literatura, mas o termo variância empírica é freqüentemente usado para a forma não modificada e o termo variância da amostra para a forma modificada . Também existe a notação , mas também é conhecida como ou . Alguns autores referem-se a desvio médio quadrado da média empírica e a variância teórica ou variância indutiva em oposição a variância empírica.

é tão imparcial e variância de amostra (e como uma variância de amostra distorcida chamada) porque um estimador imparcial para a variância é.

Variância empírica para dados de frequência

O desvio padrão empírico também é uma medida de até que ponto a amostra se espalha, em média, em torno da média empírica. Seja a frequência absoluta de ocorrências e o número de valores para o verdadeiro, isto é . Deixe ainda ser a frequência relativa de , i. H. a proporção de valores aos quais se aplica. A distribuição de frequência absoluta e a distribuição de frequência relativa são freqüentemente resumidas em uma tabela de frequência . As características junto com as frequências ou também são chamadas de dados de frequência . Para dados de frequência com as características e frequências relativas , a variância empírica é calculada da seguinte forma

,

com .

Regras de cálculo

Comportamento nas transformações

A variância não muda quando os dados são deslocados por um valor constante c, assim e assim é

também .

Se eles forem dimensionados por um fator , o seguinte se aplica

também .

Representações alternativas

Como o quadrado médio do desvio

A variância na análise de variância, muitas vezes como desvio "médio" ou "médio" ao quadrado referido

.

Os quadrados médios dos desvios das respectivas variáveis ​​são resumidos em uma chamada tabela de análise de variância.

Representação por meio de bloco de deslocamento

Outra representação pode ser obtida a partir do teorema do deslocamento , segundo o qual

se aplica. A multiplicação com dá a você

,

de que

segue.

Representação sem meios empíricos

Outra representação que administra sem o uso do meio empírico é

ou.

.

Se você colocar a média aritmética dos valores observados na soma e na soma dupla

adiciona e subtrai (ou seja, insere zero) e, em seguida, aplica

.

Isso é equivalente a

.

Termos derivados

Desvio padrão empírico

O desvio padrão empírico, também conhecido como variância da amostra ou desvio padrão da amostra , é a raiz quadrada positiva da variância empírica, ou seja,

ou

.

Em contraste com a variância empírica, o desvio padrão empírico tem as mesmas unidades que a média empírica ou a própria amostra.Como com a variância empírica, a nomenclatura e designação do desvio padrão empírico não é uniforme. O desvio padrão empírico deve ser distinguido do desvio padrão em termos de teoria de probabilidade . Este é um indicador de uma distribuição de probabilidade ou a distribuição de uma variável aleatória , enquanto o desvio padrão empírico é um indicador de uma amostra.

Coeficiente de variação empírico

O coeficiente de variação empírico é uma medida adimensional de dispersão e é definido como o desvio padrão empírico dividido pela média empírica, ou seja,

Em contraste com o desvio padrão, há uma variância adimensional e, portanto, não sujeita a unidades. Sua vantagem é que é expressa como uma porcentagem da média empírica .

exemplo

A amostra é dada

,

assim é . Para os resultados do valor médio empírico

.

No caso de um cálculo por partes, o resultado

.

A primeira definição dá a você

Considerando que a segunda definição

,

suprimentos. O desvio padrão também pode ser calculado usando o exemplo de variação acima. Isso é feito simplesmente arrancando raízes. Se for determinado a variância da amostra não corrigida, então (de acordo com a 1ª definição)

.

No entanto, se o desvio padrão empírico for determinado por meio da variância da amostra corrigida, então (de acordo com a 2ª definição)

.

Origem das várias definições

A definição de corresponde à definição da variância empírica como a raiz do desvio quadrático médio da média empírica. Isso se baseia na ideia de definir um grau de dispersão em torno da média empírica. Seja isso . Uma primeira abordagem é somar a diferença entre os valores medidos e a média empírica. isto leva a

No entanto, isso sempre resulta em 0, porque somas positivas e negativas se cancelam ( propriedade do centro de gravidade ), portanto, não é adequado para quantificar a variância. Para obter um valor para a variância maior ou igual a 0, pode-se, por exemplo, calcular com os valores das diferenças, ou seja, a soma dos desvios absolutos

considere, ou quadrado, ou seja, a soma dos quadrados

Formato. No entanto, isso tem o efeito colateral de que desvios maiores da média empírica são mais pesados. Como resultado, os valores discrepantes individuais também têm um impacto mais forte. Para tornar o grau de dispersão independente do número de valores medidos na amostra, ele é dividido por este número. O resultado desta medida de dispersão derivada pragmaticamente é o desvio quadrático médio da média empírica ou a variância definida acima .

A definição de tem suas raízes na teoria da estimativa . Haverá

usado como um estimador imparcial para a variância desconhecida de uma distribuição de probabilidade . Isso é verdade devido ao seguinte teorema: Se houver variáveis ​​aleatórias independentes e distribuídas de forma idêntica com e , então se aplica . Portanto, há um estimador para a variância desconhecida da população .

Se passarmos agora das variáveis ​​aleatórias às realizações , o valor estimado é obtido a partir da função de estimativa abstrata . A proporção de a , assim, corresponde à relação de uma função para o seu valor da função em um ponto .

Assim, pode ser visto como uma medida de dispersão praticamente motivada na estatística descritiva, enquanto uma estimativa para uma variância desconhecida é na estatística indutiva. Essas origens diferentes justificam a maneira acima mencionada de falar por variância empírica e por variância indutiva ou variância teórica. Deve-se notar que também pode ser interpretado como uma estimativa de uma função de estimativa. Ao usar o método do momento , obtém-se como uma função de estimativa para a variância

.

Sua realização corresponde . No entanto, geralmente não é usado porque não atende aos critérios de qualidade comuns . Este estimador não é justo com as expectativas , por causa de

.

Relação dos conceitos de variância

Conforme já mencionado na introdução, existem diferentes termos de variância, alguns dos quais têm o mesmo nome. A relação entre eles torna-se clara quando se considera seu papel na modelagem de estatísticas indutivas:

A chave é a diferença entre o método de estimação (variância da amostra no sentido de estatísticas indutivas) e sua estimativa concreta (variância empírica). Corresponde à diferença entre uma função e seu valor de função.

Variância anualizada

Na teoria do mercado financeiro , as variações ou volatilidades dos retornos são frequentemente calculadas. Essas variações, se baseadas em dados diários, precisam ser anualizadas; H. pode ser extrapolado para um ano. Isso é feito usando um fator de anualização (existem cerca de dias de negociação por ano ). A volatilidade pode, portanto, ser estimada como a raiz da variância anualizada

.

Evidência individual

  1. Norbert Henze: Estocástica para iniciantes . Uma introdução ao fascinante mundo do acaso. 10ª edição. Springer Spectrum, Wiesbaden 2013, ISBN 978-3-658-03076-6 , p. 31 , doi : 10.1007 / 978-3-658-03077-3 .
  2. a b Ehrhard Behrends: Estocástica elementar . Um livro de aprendizagem - co-desenvolvido pelos alunos. Springer Spectrum, Wiesbaden 2013, ISBN 978-3-8348-1939-0 , p. 274 , doi : 10.1007 / 978-3-8348-2331-1 .
  3. Thomas Cleff: Estatística Descritiva e Análise Exploratória de Dados . Uma introdução informatizada com Excel, SPSS e STATA. 3ª edição revisada e ampliada. Springer Gabler, Wiesbaden 2015, ISBN 978-3-8349-4747-5 , p. 56 , doi : 10.1007 / 978-3-8349-4748-2 .
  4. ^ Ludwig Fahrmeir, artista de Rita, Iris Pigeot, Gerhard Tutz: Estatísticas. O caminho para a análise de dados. 8., revisado. e edição adicional. Springer Spectrum, Berlin / Heidelberg 2016, ISBN 978-3-662-50371-3 , p. 65
  5. a b Helge Toutenburg, Christian Heumann: Estatísticas descritivas . 6ª edição. Springer-Verlag, Berlin / Heidelberg 2008, ISBN 978-3-540-77787-8 , pp. 75 , doi : 10.1007 / 978-3-540-77788-5 .
  6. Thomas Cleff: Estatística Descritiva e Análise Exploratória de Dados . Uma introdução informatizada com Excel, SPSS e STATA. 3ª edição revisada e ampliada. Springer Gabler, Wiesbaden 2015, ISBN 978-3-8349-4747-5 , p. 255 , doi : 10.1007 / 978-3-8349-4748-2 .
  7. Capítulo 10: Estimadores inesperados (arquivo PDF), www.alt.mathematik.uni-mainz.de, acessado em 31 de dezembro de 2018
  8. ^ Ludwig Fahrmeir , artista de Rita, Iris Pigeot , Gerhard Tutz : Estatísticas. O caminho para a análise de dados. 8., revisado. e edição adicional. Springer Spectrum, Berlin / Heidelberg 2016, ISBN 978-3-662-50371-3 , p. 65.
  9. É e assim
    a partir do qual a reivindicação segue.
  10. Isso segue como acima através de um recálculo direto.
  11. Werner Timischl : Estatísticas Aplicadas. Uma introdução para biólogos e profissionais médicos. 2013, 3ª edição, p. 109.
  12. Lothar Sachs : Métodos de Avaliação Estatística , página 400.
  13. ^ Reinhold Kosfeld, Hans Friedrich Eckey, Matthias Türck: Estatísticas descritivas . Noções básicas - métodos - exemplos - tarefas. 6ª edição. Springer Gabler, Wiesbaden 2016, ISBN 978-3-658-13639-0 , pp. 122 , doi : 10.1007 / 978-3-658-13640-6 .
  14. a b Norbert Henze: Estocástica para iniciantes . Uma introdução ao fascinante mundo do acaso. 10ª edição. Springer Spectrum, Wiesbaden 2013, ISBN 978-3-658-03076-6 , p. 31-32 , doi : 10.1007 / 978-3-658-03077-3 .
  15. a b Ehrhard Behrends: Estocástica elementar . Um livro de aprendizagem - co-desenvolvido pelos alunos. Springer Spectrum, Wiesbaden 2013, ISBN 978-3-8348-1939-0 , p. 274-275 , doi : 10.1007 / 978-3-8348-2331-1 .
  16. Werner Timischl: Estatísticas Aplicadas. Uma introdução para biólogos e profissionais médicos. 2013, 3ª edição, p. 109.
  17. Norbert Henze: Estocástica para iniciantes . Uma introdução ao fascinante mundo do acaso. 10ª edição. Springer Spectrum, Wiesbaden 2013, ISBN 978-3-658-03076-6 , p. 33 , doi : 10.1007 / 978-3-658-03077-3 .
  18. ^ Otfried Beyer, Horst Hackel: Cálculo de probabilidade e estatísticas matemáticas. 1976, p. 123.