top of page

ESTATÍSTICA

Disciplina: Estatística e Probabilidade

Curso Completo (Apostila)

Professor: Altamir A. R. Araldi

Ano: 2004 e 2005, Local: CAV-UDESC, Cidade: Lages-SC

  

CAPÍTULO 3 - MEDIDAS DE TENDÊNCIA CENTRAL E SEPARATRIZES

 

 

I - MEDIDAS DE TENDÊNCIA CENTRAL

  

Ensino&Informação: Medidas de Tendência Central - Média Aritmética - para uma Série Simples

3.1 – INTRODUÇÃO

As Medidas de Tendência Central são valores representativos de uma série de dados estatísticos. Assim, as Tabelas e os Gráficos vistos no Capítulo 2 são bastante úteis para resumir a informação contida nos dados. Através de um Histograma, por exemplo, verificamos que as observações obtidas de um experimento variam em torno de um valor central, próximo do qual apresentam a máxima concentração. Assim, uma maneira sintética de apresentar os resultados contidos nos dados é por meio de uma medida de posição desse valor central, bem como por uma Medida de Variação ou Dispersão em torno do valor central, esta última a ser vista no Capítulo 4.

 

3.2 – CLASSIFICAÇÃO

3.2.1  – Média: Aritmética, Geométrica e Harmônica

3.2.2  – Moda: Bruta, Czuber e Pearson

3.2.3 – Separatrizes: Mediana, Quartis e CentisObservação: No “Apêndice A” foi desenvolvido um estudo genérico sobre a média geométrica e Harmônica.

3.3 - MÉDIA ARITIMÉTICA OU MÉDIA

 

 

 

 

 

 

OBSERVAÇÃO: Geometricamente, a média é o ponto da Variável Aleatória “X” cuja ordenada mantém a curva em equilíbrio.

3.3.1 – Tipos de MÉDIA:

 

3.3.1.1 – Média Simples

De uma série de observações, é a soma dos valores observados dividido pelo número total de valores.

Seja {x1, x2, . . ., xn}, o conjunto de “n” valores observados. A média destes valores,   , é dada por:

Exemplo:

Calcular a média dos seguintes valores: {12, 18, 40, 50, 80}

Resposta:    =40.

 

3.3.1.2 – MÉDIA PONDERADA

Seja x={x1, X2, . . ., Xn} uma Série de Valores Observados, onde f1, f2, . . ., fn são as freqüências (ou pesos) dos valores observados. A média ponderada, da série de valores observados, é a razão entre a soma dos produtos dos termos da série “X” pelos respectivos pesos “fi” e a soma destes. Isto é,

OBSERVAÇÃO: Σfi=n, ou seja, o total de observações.

No caso de Tabela de Freqüência para dados agrupados em classe, xi corresponde aos Pontos Médios de Classe.

 

Exemplo:

1) Calcular a média da Tabela abaixo:

Resposta:    =36.

 

2) Calcular a média da Distribuição de Freqüências dada pela Tabela abaixo,

Resposta:    =67,5.

Observação: Na resolução do exercício, os pontos médios de classe, “Pi”, entram nas expressões para o cálculo da Média no lugar dos “xi”.

 

3.3.1.3 – CARACTERÍSTICAS DA MÉDIA ARITMÉTICA

a) O valor da média é determinado em função de todos os valores da distribuição;

b) O valor da média é influenciado pelos valores extremos da distribuição;

c) A média independe da ordem das classes (todas as classes) igualmente importantes no seu cálculo), não dizendo nada sobre a distribuição das classes;

d) A média tem um valor determinado.

 

3.3.1.4 – VANTAGENS DA MÉDIA ARITMÉTICA

a) É a mais comum das médias, mais compreensível e a mais reconhecida como média propriamente dita, pois se presta a tratamento algébrico por ter seus termos matematicamente bem definidos;

b) Seu cálculo é simples, para realiza-los são necessários somente valores totais e número de classes ou valores.

3.3.1.5 – DESVANTAGENS

a) Seu valor pode ficar alienado devido à influência de valores extremos por não representar bem o conjunto de valores de uma Série Simples ou da Distribuição de Freqüência.

 

Exemplos:

1) x={1, 2, 2, 2, 3, 3, 5, 34};

 

2)

b) A média não pode ser calculada numa Distribuição de Freqüências que possua Classes Extremas Abertas.

 

Exemplo:

3.3.1.6 – PROPRIEDADES DA MÉDIA ARITMÉTICA

Definimos antes:

Desvio (di)=xi -    .

OBSERVAÇÃO: Quando o desvio for em relação a outra medida de tendência central que não seja a média, será citado o tipo de medida utilizada.

a) A soma algébrica dos desvios, di, em cada valor, xi, de uma Série de Observações e sua Média,    , é zero. Isto é,

OBSERVAÇÃO: Numa Distribuição de Frequências, a soma dos produtos dos desvios dos pontos médios de classes, Pi, pelas respectivas freqüências, fi, é zero.

3.3.1.7 – PROCESSO INDIRETO DO CÁLCULO DA MÉDIA ARITMÉTICA

3.3.1.7.1 – INTRODUÇÃO

Este cálculo é baseado na Propriedade (a), vista anteriormente, em que: “A soma algébrica dos desvios a partir da média é igual a zero”.

 

O cálculo indireto da média consiste:

 

1o) Em tomar um valor qualquer da série de observações, como sendo a média aritmética (valor arbitrado      ).

 

2o) Subtrair a média arbitrada      de cada um dos valores xi da Série dada. Ou seja, (xi -     ) denominado afastamento (Definição), ai.

 

3o) Se:

          a) A soma dessas diferenças ai for zero, o valor é a própria média.

         b) A soma dessas diferenças ai for diferente de zero, então o valor de deverá ser corrigido, tomando-se a média dos afastamentos "    ".

 

3.3.1.7.2 – MÉDIA SIMPLES (PARA DADOS NÃO AGRUPADOS)

Fluxograma – Processo indireto de Cálculo da média para Séries Simples

3.3.1.7.3 - MÉDIA PONDERADA (PARA DISTRIBUIÇÀO DE FREQÜÊNCIA E PARA DADOS AGRUPADOS EM CLASSES)

O procedimento é análogo, com a diferença de que devemos considerar as freqüências fi de cada classe.

 

 

                                                                                (4)

 

 

De maneira que                    é o fator de correção.

II - SEPARATRIZES

Ensino&Informação: Medidas de Tendência Central e Separatrizes - Exercício 01

3.4 – SEPARATRIZES:

CÁLCULO E REPRESENTAÇÃO GRÁFICA

 

3.4.1 – INTRODUÇÃO

Separatrizes são valores de um conjunto ou de uma distribuição, nomeados por suas posições numa série em que os valores estão ordenados (crescente ou decrescente). Assim, de dividirmos um conjunto ou uma distribuição de freqüência em “m” partes iguais, determinamos “m – 1” separatrizes.

 

3.4.2 – CLASSIFICAÇÃO DAS SEPARATRIZES

Mediana (Md);

Quartis (Qi): Q1, Q2 e Q3;

Centis (Ci): C1, C2, . . ., C99.

 

3.4.3 – CÁLCULO DA POSIÇÃO E VALOR DAS SEPARATRIZES PARA SÉRIES SIMPLES (DADOS NÃO AGRUPADOS)

 

3.4.3.1 – POSIÇÃO DAS SEPARATRIZES

A expressão que dá a posição das separatrizes para as séries simples é:

 

                                                                                                                                (1)             

 

m=2, . . . , 4, . . . , 100

i  =1, 2, 3, . . . , 99

n=Tamanho da Amostra;

P=Posição da Separatriz de ordem “i” .

 

3.4.3.2 –CÁCULO DO VALOR DAS SEPARATRIZES.

 

3.4.3.2.1 – Mediana (Md)

É o valor correspondente ao elemento calculado através da expressão (1), quando m=2 e i=1:

A mediana é definida como sendo a medida do meio, se existe alguma, após as medidas (observações) terem sido ordenadas por ordem de grandeza. O ponto mediano (PMd) é encontrado apenas com auxilio de uma simples contagem.

 

Interpretação: A Mediana é o valor que divide ao meio o Conjunto de Observações ou a Distribuição de Freqüência dada, ou seja, 50% dos valores estão abaixo (ou esquerda) e 50% acima (ou à direita).

 

OBSERVAÇÕES:

a) Se “n” for ímpar, a Mediana corresponde ao valor central;

b) Se “n” for par, a Mediana será a média aritmética dos valores centrais.

 

Exemplos: Calcular a posição e o valor da Mediana, nos conjuntos abaixo:

 

1) x={3, 4, 4, 5, 6, 8, 8, 8, 10}

Resposta: PMd=5         Md=6;

 

2) x={5, 5, 7, 9, 11, 12, 15, 18}

Resposta: PMd=4,5      Md=10.

 

3.4.3.2.2 – QUARTIS (Qi): Q1, Q2 e Q3

São os valores que dividem um Conjunto de Observações ou Distribuição em quatro partes iguais (quartos). Cada um dos três correspondem aos elementos calculados através da expressão (1) quando m=4 e i=1, 2, 3.

 

a) Se m=4 e i=1, obtêm-se o 1o quartil ou quartil inferior (Q1). Assim, com PQ1 (Ponto Quartílico 1), o valor de Q1 é obtido com o auxílio de uma simples contagem.

Interpretação: O quartil inferior (Q1) é o valor que precede a 25% dos valores de uma Série ou Conjunto em Ordem Crescente ou Decrescente.

 

b) Se m=4 e i=2, se obtém o 2o quartil ou quartil mediano (Q2) e que é a própria Mediana cujo valor precede 50% dos valores de uma Série ou Conjunto em Ordem Crescente ou Decrescente.

 

c) Se m=4 e i=3, se obtém o 3o quartil ou quartil superior (Q3). Assim, com PQ3, o valor de Q3 é obtido através de uma simples contagem.

Interpretação: O quartil superior é o valor que precede a 75% dos valores de uma Série ou Conjunto em Ordem Crescente ou Decrescente.

3.4.3.2.3 – CENTIS (Ci): C1, C2, C3, . . ., C99

São os valores que dividem um Conjunto de Observações ou uma Distribuição de Freqüência em cem partes iguais. Os Centis são denominados, também, de Percentis. O estudo é análogo ao dos Quartis (Qi) e São obtidos para os valores de m=100 e i=1, 2, 3, . . ., 99.

 

3.5 – CÁLCULO DA POSIÇÃO E VALOR DAS SEPARATRIZES PARA AS DISTRIBUIÇÕES DE FREQÜÊNCIA (PARA DADOS AGRUPADOS)

 

3.5.1 – POSIÇÃO DAS SEPARATRIZES

Para a localização das Separatrizes na Distribuição de Freqüência dada, é necessário construir as Freqüências Acumuladas (fa) ou denominada ,também, "Frequencia Acumulada Abaixo de". Para determinar a posição da Separatriz utiliza-se a seguinte expressão:

 

                                                                                                                                 (2)

                                                                         

m=2, . . ., 4, . . ., 100

i=1, 2, 3, . . ., 99 

Σfi=n= Tamanho da Amostra

P=posição da Separatriz de Ordem “i”.

 

3.6 – ALGUNS PONTOS IMPORTANTES SOBRE A MEDIANA

3.6.1 – CARACTERÍSTICAS DA MEDIANA 

a) Mediana é afetada pelo número de valores e não pelos valores extremos;

b) A Mediana é mais típica onde os valores centrais das Séries são intimamentes agrupados

 

3.6.2 – VANTAGENS

a) É facilmente calculada;

b) Quando as distribuições são muito assimétricas (assimetria será vista nos capítulos a frente), é o valor de tendência central mais representativo;

c) A Mediana pode ser determinada, mesmo quando faltam valores iniciais ou finais de uma distribuição ou de uma série simples.

 

3.6.3 – DESVANTAGENS

a) A Mediana é menos familiar do que a média aritmética;

b) O seu cálculo exige o Ordenamento dos Valores;

c) Não pode ser tratada algebricamente, pois das Medianas de subgrupos não se pode determinar a Mediana Geral, fato que não acontece com a média aritmética.

 

Leitura Complementar Sobre Quartil, Decil e Centil - Arquivo Formato ".PDF" - Tamanho do Arquivo = 217kb.

 

 

 

3.7 – MODA (Mo): CÁLCULO E REPRESENTAÇÃO GRÁFICA

3.7.1 – INTRODUÇÃO

O termo Moda ou Norma (valor dominante de um conjunto) foi introduzido por Karl Pearson em 1895 e originou-se talvez na maneira de se falar “tal coisa está na moda”, “tal coisa é mais freqüente”.

 

3.7.2 – DEFINIÇÃO

Moda é o valor que possui maior freqüência que os valores contíguos do conjunto (anterior ou posterior) admitindo ordenado. Em outras palavras, é o valor que mais se repete.

 

OBSERVAÇÕES:

a) A moda pode não existir, e mesmo que exista, pode não ser única. Assim, um conjunto de valores ou uma Distribuição de Freqüência pode ter várias modas e é dito ser “multimodal”. Se tem duas modas, bimodal e assim por diante.

 

b) Nas Distribuições de Freqüência, não temos o valor que mais se repete e sim a classe que possui a maior freqüência. Nestas condições, é dita CLASSE MODAL (classe de maior freqüência).

Exemplos:

1) x={2, 2, 5, 7, 9, 9, 9, 10, 10, 11, 12, 18} → Mo=9;

2) x={3, 5, 8, 10, 12, 15, 16} → não tem moda;

3) x={ 2, 3, 4, 4, 4, 5, 5, 7, 7, 7, 9} → é bimodal: Mo1=4 e Mo2=7.

 

3.7.3 – CÁLCULO DA MODA E REPRESENTAÇÃO GRÁFICA

3.7.3.1 – MODA BRUTA: Mo(B)

É o valor correspondente ao Ponto Médio de Classe Modal, pois considera-se que os valores da classe modal estão concentrados no Ponto Médio de Classe.

 

3.7.3.2 – PROCESSO DE CZUBER

Neste processo considera-se a influência, sobre a classe modal, das freqüências das classes adjacentes, anterior e posterior, assim como da freqüência da classe modal. O ponto correspondente à moda divide o intervalo em partes proporcionais às diferenças respectivas da freqüência da classe modal, com as freqüências adjacentes.

 

a) MÉTODO GRÁFICO

b) MÉTODO ANALÍTICO: Mo (Czuber)=LI + d

Usando a propriedade de triângulos semelhantes, temos:

Logo,

 

 

 

 

                                                                                                                             (3)

 

 

 

Onde: c=Amplitude da Classe Modal;

Δf2=f - f2;

Δf1=f - f2;

LI =Limite Inferior da Classe Modal;

LS=Limite Superior da Classe Modal.

3.8 – RELAÇÃO DE PEARSON

Para obtermos a Moda de Pearson é necessário o estudo da relação que existe entre a Média, a Mediana e a Moda. Assim, se a Distribuição for Absolutamente Simétrica (difícil de ocorrer na prática), então a média, a mediana e a moda coincidem num mesmo ponto, Ou seja,    =Md=Mo. No entanto, se a Assimetria é pequena (a ser aborda no Capítulo 5), existe a relação empírica (baseada na experiência) seguinte:

 

                                                                                Relação de Pearson.

 

Podemos obter da relação anterior, a Moda de Pearson:

 

                                                       Mo(Pearson)=3.Md -                                        (4)

II - ESCOLHA DA MEDIDA DE TENDÊNCIA CENTRAL

3.9 – ESCOLHA DA MEDIDA DE TENDÊNCIA CENTRAL

Os motivos que levam os pesquisadores a procurar uma visão sintética de uma série de dados estatísticos podem ser dIferentes,­ e conforme a variação deles, uma ou outra medida de tendência central torna-se mais conveniente para corresponder-lhes.

 

A escolha entre as três medidas de tendência central de­pende, ainda, da definição e das propriedades da síntese, e de características peculiares ao domínio de aplicação.

 

Com um mesmo problema em exame, por exemplo - o consumo individual de alimentos (expresso em calorias) dos componentes de grupo de homens adultos – pode-se mostrar que a escolha da medida de tendência central depende dos objetivos fixados; e , também da definição e das propriedades da síntese. Assim, a cada um dos intuitos seguintes corresponde um tipo de medida:

 

a) Verificar a suficiência (ou insuficiência) do consumo to­tal, em comparação com o mínimo indispensável determinado pelas experiências dos fisiólogos. Nesse caso, somaremos os consumos individuais e dividiremos pelo número de pessoas observadas.

 

b) Identificar o padrão de consumo dominante. Nesse caso, determinaremos qual é o nível de consumo individual que se encontra com maior freqüência.

 

c) Pesquisar o nível de consumo individual que é alcançado ou exercido em cada fração dos consumidores (por exemplo a metade deles) .

 

d) Verificar qual consumo caberia a cada pessoa se o consumo total fosse distribuído em partes iguais, em vez partes de­siguais.

 

As exigências (a) e (d) seriam satisfeitas pela média aritmética; a (b) pelo valor mais freqüente (moda), e a (c) pelo valor mediano.

 

As propriedades das sínteses devem ser consideradas, pois podem, ou não, estar de acordo com o objetivo da nossa indagação; além disso uma propriedade terá maior ou menor grau de adequação com a realidade, no sentido de que certas características do fato observado tenham comportamento compatível com a referida propriedade.

 

Ainda mais, convém levar em consideração a informação intrínseca que a medida de tendência central contém em sua definição. Por exemplo, a mediana, além de se constituir uma das sínteses do conjunto, nos informa que 50% de seus valores situam-se abaixo dela e outros tantos, acima.

 

Assim, pode-se concluir que, não há um motivo geral de preferência para uma ou outra medida de tendência central, já que conforme o fim da aplicação , uma delas poderá ser preferível.

 

Convém ressaltar aqui que quando se querem fazer comparações através de uma medida de tendência central, deverá ser usa­da a mesma medida para todas as séries por comparar: Salário mediano de Florianópolis com salário mediano de Porto Alegre e não salário mediano de Florianópolis com salário médio de Porto Alegre.

 

Em resumo, uma medida de tendência central constitui o meio ideal para a comparação entre duas ou mais séries, conduzindo a um resultado unívoco e independente do arbítrio do operador. Mas, justamente pela sua grande virtude sintética, torne insuficiente e exige o auxílio de dados subsidiários que dêem uma idéia das desigualdades existentes entre os diferentes termos das séries.

Em Breve estaremos apresentando uma Página especialmente para  falar sobre:

a) Significado do Ponto Médio de Classe;

b) Quais as vantagens e desvantagens ao se escolher um número de

     classes k muito grande ou muito pequeno;

c) Quando é preferível trabalhar com classes de amplitude desiguais; e etc.

Capítulo 1 - SÉRIES ESTATÍSTICAS E NÃO ESTATÍSTICAS - GRÁFICOS

VARIÁVEIS ALEATÓRIAS: TIPOS OU CLASSIFICAÇÃO

Capítulo 2 - DISTRIBUIÇÃO DE FREQUÊNCIAS OU TABELA DE FREQUÊNCIAS

Capítulo 3 - Medidas de Tendência Central, Separatrizes

Capítulo 4 - MEDIDAS DE DISPERSÃO (OU VARIAVILIDADE)

Capítulo 5 - ASSIMETRIA e CURTOSE

Capítulo 6 - TEORIA ELEMENTAR DA PROBABILIDADE

Capítulo 7 - DISTRIBUIÇÕES TEÓRICAS DE PROBABILIDADE

___________________

Exercícios Propostos: Capítulos 3 e 4 (Arquivo ".PDF")

 

Resolução dos Exercícios: Exercício 01 / Exercício 02 / Exercício 03 / Exercício 04 /

                                          Exercício 05 / Exercício 06Exercício 07 / Exercício 08 /

                                          Exercício 09 / Exercício 10 / Exercício 11 / Exercício 12 /

                                           Exercício 13 (Já resolvido: Veja as Vídeo Aulas abaixo) /

 

 

 

 

______________________

TABELAS (Capítulo 7):

I - Distribuição Normal; II - Distribuição Binomial

 

Exercícios Propostos: Capítulo 7 (Arquivo ".PDF")

 

Resolução dos Exercícios do Capítulo 7:

Exercício Resolvido (5)   YouTube

 

 

 

 

 

 

 

______________________

Processos de Amostragem:

I - Tamanho da Amostra

Formato ".PDF"

Ítem (a);    (b);    (c);    (d)  YouTube

Tópicos em Estatísticas: Arquivo Formato ".PDF"

  A partir de 22 Set de 2018

Você é o Visitante de Número

bottom of page