Variância empírica
A variância empírica e a variância da amostra (obsoleto: quadrado de espalhamento empírico ) ou quase sem variância ( latim variantia = "diversidade" ou variare chamada = "(ver) mudar, ser diferente"), uma indicação estatística da propagação dos valores uma amostra e, em estatísticas descritivas, um índice de uma amostra. É uma das medidas de dispersão e descreve o desvio médio quadrático dos valores medidos individuais da média empírica . Representa, portanto, uma espécie de desvio quadrático médio, cuja raiz positiva da variância empírica é o desvio padrão empírico . O desvio padrão empírico é a medida mais comum de dispersão.
Os termos "variância", "variância da amostra" e "variância empírica" não são usados de forma consistente na literatura. Em geral, uma distinção deve ser feita entre os
- Variância (no sentido de teoria da probabilidade) como uma figura-chave de uma distribuição de probabilidade ou a distribuição de uma variável aleatória
- Variância da amostra (em termos de estatísticas indutivas) como uma função de estimativa para a variância (em termos de teoria da probabilidade)
- a variação empírica discutida aqui como uma figura-chave de uma amostra específica, ou seja, vários números.
Uma delimitação e conexões precisas podem ser encontradas na seção Relacionamento dos Termos de Variância .
definição
motivação
A variância de uma população finita em tamanho é uma medida da dispersão dos valores individuais em torno da média da população e é definida como
- com a média da população .
Como é desconhecida em situações práticas e ainda precisa ser calculada, a variância empírica é freqüentemente usada. Isso é especialmente necessário quando em grandes populações não é possível contar todos os indivíduos da população.
definição
Dada uma amostra de elementos . Denota
a média empírica da amostra. Essa média empírica é uma estimativa da média da população . A variância empírica pode ser definida de duas maneiras. Ou a variância empírica da amostra é definida como a soma dos desvios quadrados dividida pelo número de valores medidos:
- ,
ou é definido como uma forma ligeiramente modificada como a soma dos desvios quadrados dividida pelo número de graus de liberdade
- .
Explicação
A variância empírica representa, portanto, uma espécie de “desvio médio quadrático”, sendo um estimador da variância populacional . As representações decorrem diretamente da definição
- respectivamente .
Esta forma ligeiramente modificada é muitas vezes referida como variação de amostra e é usada por pacotes de programas como B. SPSS , R etc. são os preferidos. Se a amostra não apresentar variabilidade, i. H. , então há uma variação de . A média pode ser explicada intuitivamente em vez de pela forma modificada da variância empírica como segue: Devido à propriedade de foco da média empírica , o último desvio já é determinado pelo primeiro . Conseqüentemente, apenas os desvios variam livremente e, portanto, a média é dividida pelo número de graus de liberdade .
Se apenas “a” variação empírica é falada, deve-se prestar atenção a qual convenção ou definição se aplica no contexto correspondente. Nem a nomenclatura das definições nem a notação correspondente são uniformes na literatura, mas o termo variância empírica é freqüentemente usado para a forma não modificada e o termo variância da amostra para a forma modificada . Também existe a notação , mas também é conhecida como ou . Alguns autores referem-se a desvio médio quadrado da média empírica e a variância teórica ou variância indutiva em oposição a variância empírica.
é tão imparcial e variância de amostra (e como uma variância de amostra distorcida chamada) porque um estimador imparcial para a variância é.
Variância empírica para dados de frequência
O desvio padrão empírico também é uma medida de até que ponto a amostra se espalha, em média, em torno da média empírica. Seja a frequência absoluta de ocorrências e o número de valores para o verdadeiro, isto é . Deixe ainda ser a frequência relativa de , i. H. a proporção de valores aos quais se aplica. A distribuição de frequência absoluta e a distribuição de frequência relativa são freqüentemente resumidas em uma tabela de frequência . As características junto com as frequências ou também são chamadas de dados de frequência . Para dados de frequência com as características e frequências relativas , a variância empírica é calculada da seguinte forma
- ,
com .
Regras de cálculo
Comportamento nas transformações
A variância não muda quando os dados são deslocados por um valor constante c, assim e assim é
- também .
Se eles forem dimensionados por um fator , o seguinte se aplica
- também .
Representações alternativas
Como o quadrado médio do desvio
A variância na análise de variância, muitas vezes como desvio "médio" ou "médio" ao quadrado referido
- .
Os quadrados médios dos desvios das respectivas variáveis são resumidos em uma chamada tabela de análise de variância.
Representação por meio de bloco de deslocamento
Outra representação pode ser obtida a partir do teorema do deslocamento , segundo o qual
se aplica. A multiplicação com dá a você
- ,
de que
segue.
Representação sem meios empíricos
Outra representação que administra sem o uso do meio empírico é
ou.
- .
Se você colocar a média aritmética dos valores observados na soma e na soma dupla
adiciona e subtrai (ou seja, insere zero) e, em seguida, aplica
- .
Isso é equivalente a
- .
Termos derivados
Desvio padrão empírico
O desvio padrão empírico, também conhecido como variância da amostra ou desvio padrão da amostra , é a raiz quadrada positiva da variância empírica, ou seja,
ou
- .
Em contraste com a variância empírica, o desvio padrão empírico tem as mesmas unidades que a média empírica ou a própria amostra.Como com a variância empírica, a nomenclatura e designação do desvio padrão empírico não é uniforme. O desvio padrão empírico deve ser distinguido do desvio padrão em termos de teoria de probabilidade . Este é um indicador de uma distribuição de probabilidade ou a distribuição de uma variável aleatória , enquanto o desvio padrão empírico é um indicador de uma amostra.
Coeficiente de variação empírico
O coeficiente de variação empírico é uma medida adimensional de dispersão e é definido como o desvio padrão empírico dividido pela média empírica, ou seja,
Em contraste com o desvio padrão, há uma variância adimensional e, portanto, não sujeita a unidades. Sua vantagem é que é expressa como uma porcentagem da média empírica .
exemplo
A amostra é dada
- ,
assim é . Para os resultados do valor médio empírico
- .
No caso de um cálculo por partes, o resultado
- .
A primeira definição dá a você
Considerando que a segunda definição
- ,
suprimentos. O desvio padrão também pode ser calculado usando o exemplo de variação acima. Isso é feito simplesmente arrancando raízes. Se for determinado a variância da amostra não corrigida, então (de acordo com a 1ª definição)
- .
No entanto, se o desvio padrão empírico for determinado por meio da variância da amostra corrigida, então (de acordo com a 2ª definição)
- .
Origem das várias definições
A definição de corresponde à definição da variância empírica como a raiz do desvio quadrático médio da média empírica. Isso se baseia na ideia de definir um grau de dispersão em torno da média empírica. Seja isso . Uma primeira abordagem é somar a diferença entre os valores medidos e a média empírica. isto leva a
No entanto, isso sempre resulta em 0, porque somas positivas e negativas se cancelam ( propriedade do centro de gravidade ), portanto, não é adequado para quantificar a variância. Para obter um valor para a variância maior ou igual a 0, pode-se, por exemplo, calcular com os valores das diferenças, ou seja, a soma dos desvios absolutos
considere, ou quadrado, ou seja, a soma dos quadrados
Formato. No entanto, isso tem o efeito colateral de que desvios maiores da média empírica são mais pesados. Como resultado, os valores discrepantes individuais também têm um impacto mais forte. Para tornar o grau de dispersão independente do número de valores medidos na amostra, ele é dividido por este número. O resultado desta medida de dispersão derivada pragmaticamente é o desvio quadrático médio da média empírica ou a variância definida acima .
A definição de tem suas raízes na teoria da estimativa . Haverá
usado como um estimador imparcial para a variância desconhecida de uma distribuição de probabilidade . Isso é verdade devido ao seguinte teorema: Se houver variáveis aleatórias independentes e distribuídas de forma idêntica com e , então se aplica . Portanto, há um estimador para a variância desconhecida da população .
Se passarmos agora das variáveis aleatórias às realizações , o valor estimado é obtido a partir da função de estimativa abstrata . A proporção de a , assim, corresponde à relação de uma função para o seu valor da função em um ponto .
Assim, pode ser visto como uma medida de dispersão praticamente motivada na estatística descritiva, enquanto uma estimativa para uma variância desconhecida é na estatística indutiva. Essas origens diferentes justificam a maneira acima mencionada de falar por variância empírica e por variância indutiva ou variância teórica. Deve-se notar que também pode ser interpretado como uma estimativa de uma função de estimativa. Ao usar o método do momento , obtém-se como uma função de estimativa para a variância
- .
Sua realização corresponde . No entanto, geralmente não é usado porque não atende aos critérios de qualidade comuns . Este estimador não é justo com as expectativas , por causa de
- .
Relação dos conceitos de variância
Conforme já mencionado na introdução, existem diferentes termos de variância, alguns dos quais têm o mesmo nome. A relação entre eles torna-se clara quando se considera seu papel na modelagem de estatísticas indutivas:
- A variância (no sentido de teoria da probabilidade) é uma medida de dispersão de uma distribuição de probabilidade abstrata ou a distribuição de uma variável aleatória em estocástica.
- A variância da amostra (no sentido de estatística indutiva) é uma função de estimativa para estimar a variância (no sentido da teoria da probabilidade) de uma distribuição de probabilidade desconhecida. Portanto, não é um índice, mas um método de estimativa para adivinhar a variância de uma distribuição de probabilidade desconhecida da melhor maneira possível.
- A variância empírica aqui discutida é, além de seu papel na estatística descritiva, uma estimativa concreta da variância subjacente de acordo com o método de estimação, que é dada pela variância da amostra (no sentido de estatística indutiva).
A chave é a diferença entre o método de estimação (variância da amostra no sentido de estatísticas indutivas) e sua estimativa concreta (variância empírica). Corresponde à diferença entre uma função e seu valor de função.
Variância anualizada
Na teoria do mercado financeiro , as variações ou volatilidades dos retornos são frequentemente calculadas. Essas variações, se baseadas em dados diários, precisam ser anualizadas; H. pode ser extrapolado para um ano. Isso é feito usando um fator de anualização (existem cerca de dias de negociação por ano ). A volatilidade pode, portanto, ser estimada como a raiz da variância anualizada
- .
Evidência individual
- ↑ Norbert Henze: Estocástica para iniciantes . Uma introdução ao fascinante mundo do acaso. 10ª edição. Springer Spectrum, Wiesbaden 2013, ISBN 978-3-658-03076-6 , p. 31 , doi : 10.1007 / 978-3-658-03077-3 .
- ↑ a b Ehrhard Behrends: Estocástica elementar . Um livro de aprendizagem - co-desenvolvido pelos alunos. Springer Spectrum, Wiesbaden 2013, ISBN 978-3-8348-1939-0 , p. 274 , doi : 10.1007 / 978-3-8348-2331-1 .
- ↑ Thomas Cleff: Estatística Descritiva e Análise Exploratória de Dados . Uma introdução informatizada com Excel, SPSS e STATA. 3ª edição revisada e ampliada. Springer Gabler, Wiesbaden 2015, ISBN 978-3-8349-4747-5 , p. 56 , doi : 10.1007 / 978-3-8349-4748-2 .
- ^ Ludwig Fahrmeir, artista de Rita, Iris Pigeot, Gerhard Tutz: Estatísticas. O caminho para a análise de dados. 8., revisado. e edição adicional. Springer Spectrum, Berlin / Heidelberg 2016, ISBN 978-3-662-50371-3 , p. 65
- ↑ a b Helge Toutenburg, Christian Heumann: Estatísticas descritivas . 6ª edição. Springer-Verlag, Berlin / Heidelberg 2008, ISBN 978-3-540-77787-8 , pp. 75 , doi : 10.1007 / 978-3-540-77788-5 .
- ↑ Thomas Cleff: Estatística Descritiva e Análise Exploratória de Dados . Uma introdução informatizada com Excel, SPSS e STATA. 3ª edição revisada e ampliada. Springer Gabler, Wiesbaden 2015, ISBN 978-3-8349-4747-5 , p. 255 , doi : 10.1007 / 978-3-8349-4748-2 .
- ↑ Capítulo 10: Estimadores inesperados (arquivo PDF), www.alt.mathematik.uni-mainz.de, acessado em 31 de dezembro de 2018
- ^ Ludwig Fahrmeir , artista de Rita, Iris Pigeot , Gerhard Tutz : Estatísticas. O caminho para a análise de dados. 8., revisado. e edição adicional. Springer Spectrum, Berlin / Heidelberg 2016, ISBN 978-3-662-50371-3 , p. 65.
-
↑ É e assim
- a partir do qual a reivindicação segue.
- ↑ Isso segue como acima através de um recálculo direto.
- ↑ Werner Timischl : Estatísticas Aplicadas. Uma introdução para biólogos e profissionais médicos. 2013, 3ª edição, p. 109.
- ↑ Lothar Sachs : Métodos de Avaliação Estatística , página 400.
- ^ Reinhold Kosfeld, Hans Friedrich Eckey, Matthias Türck: Estatísticas descritivas . Noções básicas - métodos - exemplos - tarefas. 6ª edição. Springer Gabler, Wiesbaden 2016, ISBN 978-3-658-13639-0 , pp. 122 , doi : 10.1007 / 978-3-658-13640-6 .
- ↑ a b Norbert Henze: Estocástica para iniciantes . Uma introdução ao fascinante mundo do acaso. 10ª edição. Springer Spectrum, Wiesbaden 2013, ISBN 978-3-658-03076-6 , p. 31-32 , doi : 10.1007 / 978-3-658-03077-3 .
- ↑ a b Ehrhard Behrends: Estocástica elementar . Um livro de aprendizagem - co-desenvolvido pelos alunos. Springer Spectrum, Wiesbaden 2013, ISBN 978-3-8348-1939-0 , p. 274-275 , doi : 10.1007 / 978-3-8348-2331-1 .
- ↑ Werner Timischl: Estatísticas Aplicadas. Uma introdução para biólogos e profissionais médicos. 2013, 3ª edição, p. 109.
- ↑ Norbert Henze: Estocástica para iniciantes . Uma introdução ao fascinante mundo do acaso. 10ª edição. Springer Spectrum, Wiesbaden 2013, ISBN 978-3-658-03076-6 , p. 33 , doi : 10.1007 / 978-3-658-03077-3 .
- ^ Otfried Beyer, Horst Hackel: Cálculo de probabilidade e estatísticas matemáticas. 1976, p. 123.