Variância e Desvio Padrão

Variância e Desvio Padrão


Um aspecto importante no estudo descritivo de um conjunto de dados é o da determinação da variabilidade ou dispersão desses dados, relativamente à medida de localização do centro da amostra.

Define-se a variância, e representa-se por s2, como sendo a medida que se obtém somando os quadrados dos desvios das observações da amostra, relativamente à sua média, e dividindo pelo número de observações da amostra menos um:



Uma vez que a variância envolve a soma de quadrados, a unidade em que se exprime não é a mesma que a dos dados. Assim, para obter uma medida da variabilidade ou dispersão com as mesmas unidades que os dados, tomamos a raiz quadrada da variância e obtemos o desvio padrão:



O desvio padrão é uma medida que só pode assumir valores não negativos e quanto maior for, maior será a dispersão dos dados. É definido como o afastamento em relação a uma média (X-barra) próxima da aritmética.

Algumas propriedades do desvio padrão, que resultam imediatamente da definição, são:

  • o desvio padrão é sempre positivo e será tanto maior quanta mais variabilidade houver entre os dados.

  • se s = 0, então não existe variabilidade, isto é, os dados são todos iguais.

Do mesmo modo que a média, também o desvio padrão é uma medida pouco resistente, pois é influenciado por valores ou muito grande ou muito pequeno (o que seria de esperar já que na sua definição entra a média que é não resistente). Assim, se a distribuição dos dados for bastante enviesada, não é conveniente utilizar a média como medida de localização, nem o desvio padrão como medida de variabilidade. Estas medidas só dão informação útil, respectivamente sobre a localização do centro da distribuição dos dados e sobre a variabilidade, se as distribuições dos dados forem aproximadamente simétricas.

Fonte: datalyzer