A estatística descritiva está dentro da análise exploratória de dados. É a parte inicial da matéria que tem um foco na redução, análise e como interpretar os dados.
Em primeiro lugar a descrição dos dados é um ponto de partida para conhecer as o banco de dados, por isso mesmo, é muito presente em concurso e tem muitos cálculos.
Provas antigas nos mostram que a chance de questões desse assunto em concurso é muito alta, pois as bancas gostam desse tema.
Antes de tudo, de trazer a dica desse post, vamos ver o contexto da análise exploratória de dados abaixo. Acesse aulas grátis de estatística!
Conteúdo
Análise Exploratória de Dados
Jonh Tukey lidera uma corrente moderna que se baseia em gráficos para a fazer a análise descritiva de dados.
Segundo o estatístico, essa análise não deve se basear apenas no cálculo de algumas medidas numéricas. Mas, apesar disso, as provas ainda não refletem essa tendência.
É muito comum a cobrança de medidas de posição, dispersão e de forma, vamos falar de cada delas uma abaixo.
De antemão, estatística é um mundo dentro da ciência. Em que pese ter assuntos mais atraentes, essa parte inicial é uma das mais comuns em concurso.
Medidas de Tendência Central
A ideia dessas medidas é ter um valor típico da série de dados, isto é, que forneça um rápido resumo.
O princípio é que o valor seja muito informativo, apesar disso, deve se ter cuidado, pois ele causa uma grande redução grande dos mesmos.
As medidas resumo mais comuns são as médias, moda e da mediana. Temos vários tipos de médias, por exemplo:
- Aritmética;
- Aparada;
- Ponderada;
- Harmônica;
- Geométrica; e
- Quadrática
Cada média tem seu uso em certas áreas da estatística.
Algumas médias são muito úteis no cálculo de números índices, ao passo que outras são úteis para avaliar simetria dos dados.
Veja aqui a importância de estatística para concurso. Vai se preparar para o Exame CFC? Clique aqui!
Medidas de Dispersão
O grau sob o qual os dados tendem a se afastar de um valor médio chama-se variação, em outras, a dispersão dos dados.
As métricas de posição causam uma redução dos mesmos, todavia sem informar o como se comporta a dispersão dos mesmos.
Dessa forma fica claro o papel dessas medidas, tendo em vista que dizem como se comporta a variação dos mesmos.
Seja como for, no contexto dessas medidas, podemos listar:
- Range (ou amplitude total);
- Desvio quartil;
- Amplitude entre percentis 10-90;
- Desvio médio;
- Desvio Mediano;
- Variância;
- Desvio padrão;
As medidas acima são conhecidas como métricas de dispersão absoluta. Por outro lado, temos medidas de dispersão relativas.
Medidas de Dispersão Relativa
A dispersão relativa tem objetivo de efetuar comparação entre espalhamento de diferentes série de dados.
De maneira gral podemos escrever:
Os cálculos mais comuns em prova são o coeficiente de variação e a variável reduzida ou escores reduzidos, além disso, podemos enumerar.
- Coeficiente de variação de Pearson;
- Coeficiente de Thorndike;
- Escore reduzido;
- Coeficiente de variação quartil;
- Desvio quartil reduzido;
- Variância relativa;
O escore reduzido é uma medida abstrata, pois mede o desvio em relação à média em unidades de desvio padrão.
As medidas acima são ditas abstratas, pois não dependem das unidades de medidas dos dados.
Medidas de Forma
Sob o mesmo ponto de vista, as medidas de forma completam as estatísticas descritivas.
Em suma, nos falam acerca da forma da curva de frequências ou do histograma dos dados.
Por fim, a combinação dessas medidas de posição, dispersão e forma são valiosas na análise dos dados.
Medidas de Assimetria
A Assimetria refere-se ao desvio ou afastamento da simetria. Sendo assim, é o grau de deformação de uma curva de frequências.
Rodolfo Hermans (Godot) at en.wikipedia. – Own work; transferred from en.wiki pedia by Rodolfo Hermans (Godot).
As questões de cálculo das medidas de assimetria são clássicas em prova de concurso. Apesar de serem associadas à forma, isto é, terem apelo visual, fórmulas são recorrentes.
Em suma, dentre as medidas de simetria/assimetria listamos:
- Primeiro Coefificente de Assimetria de Pearson;
- Segundo Coefificente de Assimetria de Pearson;
- Coeficiente Quartil de Assimetria;
- Assimetria entre Percentis 10 e 90.
Por fim, se os dados têm simetria muitas análises se tornam mais féceis ou tem método disponível para as análises mais avançadas.
Medidas de Curtose
Antes de tudo, a palavra curtose tem origem grega e significa κυρτός, kyrtos or kurtos. Mostra o quão de achatada de uma curva em relação à curva padrão.
Nesse sentido estamos falando das formas das distribuições de frequências.
A curva padrão usada para comparar é a de Gauss, que tem a forma de sino, pois é muito famosa e usada em muitas aplicações.
Em geral se diz que uma curva leptocúrtica tem um alto grau de afilamento quando comparada com o gráfico da normal.
Isso significa que tem excesso de curtose.
A curtose da distribuição normal é igual a 3 (curva preta).
Em geral a medida de curtose é calculada em excesso à medida da distribuição normal.
Acima temos uma demonstração gráfica de curvas com suas medidas de curtose.
Métodos Gráficos
Métodos gráficos tem forte apelo visual e, por isso mesmo, têm grande aceitação entre os usuários de estatística.
São importantes ferramentas, mas não serão objeto desse post, pois merecem um só deles.
Existem muitos métodos gráficos, seguindo vários princípios. Um dos mais usados e que aparece muito em prova é o boxpot.
Esse gráfico nos permite ter uma ideia tanto da simetria dos dados, como das medidas de posição e dispersão. Portanto é muito informativo.
Estatística Descritiva na Prática
É importante estar muito bem preparado para resolver contas. Afinal de contas, você deve ter traquejo algébrico.
Por isso mesmo, nesse post, trago para você uma dica muito útil no cálculo de medidas de dispersão como variância.
Veja abaixo uma aula do canal de Estatística para Concurso.
Em conclusão, ficou claro acima o papel da descrição do dados. Afinal de contas, um bom job começa com uma boa análise geral dos dados.
Neste ponto, você deve conhecer bem os dados e, acima de tudo, saber que tipo de análise vai usar na etapa seguinte.
A missão da análise inicial é prepar os dados para a próxima etapa de estudo. Uma dica extra: veja um curso rápido de estatística para conhecer mais da análise exploratória de dados.
Um grande abraço e até a próxima.
Deixe um comentário