Estatística aplicada unifacs

Page 1

ESTATÍSTICA APLICADA Aula 01 - Séries e Gráficos Estatísticos


©Copyright 2014 da Laureate. É permitida a reprodução total ou parcial, desde que sejam respeitados os direitos do Autor, conforme determinam a Lei n.º 9.610/98 (Lei do Direito Autoral) e a Constituição Federal, art. 5º, inc. XXVII e XXVIII, “a” e “b”.

Dados Internacionais de Catalogação na Publicação (CIP) (Sistema de Bibliotecas da UNIFACS Universidade Salvador - Laureate International Universities)

T323e Terra, Luiz Carlos Estatística aplicada / Luiz Carlos Terra. – Salvador: UNIFACS, 2014. 96 p. ISBN 978-85-8344-009-3 1.Estatística. I. Título. CDD: 519


SUMÁRIO AULA 1 - SÉRIES E GRÁFICOS ESTATÍSTICOS.......................................................................... 7 1. Introdução...................................................................................................................7 2. Definições...................................................................................................................7 3. Séries Estatísticas........................................................................................................8 3.1 Séries Históricas:..................................................................................................9 3.2 Séries Geográficas:...............................................................................................9 3.3 Séries Específicas:................................................................................................9 3.4 Séries Compostas ou Conjugadas.......................................................................10 3.5 Distribuição de Frequências:..............................................................................10 4. Gráficos Estatísticos...................................................................................................11 4.1 Diagramas..........................................................................................................11 4.1.1 Gráficos em linha.....................................................................................11 4.1.2 Gráficos em barras ou colunas.................................................................12 4.1.3 Gráficos em colunas ou em barras agrupadas.........................................12 4.1.4 Gráficos de setores..................................................................................12 4.1.5 Gráfico polar............................................................................................13 4.2 Cartogramas.......................................................................................................13 4.3 Pictogramas.......................................................................................................13 Bibliografia....................................................................................................................14

AULA 2 - DISTRIBUIÇÃO DE FREQUÊNCIAS......................................................................... 15 1. Introdução.................................................................................................................15 2. Definições.................................................................................................................16 3. Cálculo de frequências..............................................................................................17 3.1 Frequência absoluta simples (Fi).......................................................................17 3.2 Frequência absoluta acumulada (FA).................................................................17 3.3 Frequência relativa simples (fi).........................................................................17 3.4 Frequência relativa acumulada (fA)...................................................................18 4. Exemplo de aplicação................................................................................................18 5. Representação gráfica da série de distribuição de frequência.................................21 Bibliografia....................................................................................................................23

AULA 3 - MEDIDAS DE POSIÇÃO........................................................................................ 25 1. Introdução.................................................................................................................25 2. Média .......................................................................................................................26 2.1. Média aritmética (x ) para dados não agrupados..............................................26


2.2. Média aritmética (x) para dados agrupados sem intervalo de classes.............26 2.3. Média aritmética (x) para dados agrupados com intervalo de classes.............28 2.4. Média geométrica (xg) para dados não agrupados:..........................................28 2.5. Média geométrica (xg) para dados agrupados sem intervalo de classes:.........29 2.6. Média harmônica (xh) para dados não agrupados............................................29 2.7. Média harmônica (xh) para dados agrupados sem intervalo de classes:..........29 3. Mediana (Me)............................................................................................................30 3.1. Mediana (Me) para dados não agrupados........................................................30 3.2. Mediana (Me) para dados agrupados sem intervalo de classes.......................31 3.3. Mediana (Me) para dados agrupados com intervalo de classes.......................32 4. Separatrizes...............................................................................................................34 4.1 Introdução..........................................................................................................34 4.2 Cálculo das separatrizes.....................................................................................34 4.3 Exemplo de aplicação........................................................................................35 5.1. Moda (Mo) para dados não agrupados.............................................................36 5.2. Moda (Mo) para dados agrupados sem intervalo de classes............................36 5.3. Moda (Mo) para dados agrupados com intervalo de classes............................37 Bibliografia....................................................................................................................38

AULA 4 - MEDIDAS DE DISPERSÃO.................................................................................... 39 1. Introdução.................................................................................................................39 2. Amplitude Total (AT).................................................................................................40 2.1. Amplitude total (AT) para dados não agrupados..............................................40 2.2. Amplitude total (AT) para dados agrupados sem intervalo de classes.............40 2.3. Amplitude total (AT) para dados agrupados com intervalo de classes.............40 3. Variância e Desvio-padrão........................................................................................41 3.1. Variância e Desvio-padrão para dados não agrupados.....................................41 3.1.1. Variância amostral (S2):..........................................................................41 3.1.2. Desvio-padrão amostral (s): ..................................................................41 3.2 Variância e Desvio-padrão para dados agrupados sem intervalo de classes ..................................................................................42 3.2.1. Variância amostral (s2):..........................................................................42 3.2.2. Desvio-padrão amostral (s)....................................................................43 3.3. Variância e Desvio-padrão para dados agrupados com intervalo de classes...................................................................................43 3.3.1 Variância amostral (s2).............................................................................43 3.3.2. Desvio-padrão amostral (s):...................................................................44 4. Coeficiente de Variação (CV).....................................................................................44 5. Medidas de Assimetria e Curtose..............................................................................45


5.1 Assimetria..........................................................................................................45 5.2 Curtose...............................................................................................................46 Bibliografia....................................................................................................................48

AULA 5 - NÚMEROS ÍNDICES............................................................................................. 49 1. Introdução.................................................................................................................49 2. Definição...................................................................................................................51 3. Classificação..............................................................................................................51 3.1 Número-índice simples......................................................................................52 3.1.1 Índices relativos de base fixa.........................................................................54 3.1.2 Índices relativos de base móvel.....................................................................54 3.2 Números-índices agregativos (ou compostos)...................................................55 3.2.1 Números-índices agregativos (ou compostos) não ponderados..............56 3.2.2 Números-índices agregativos (ou compostos) ponderados.....................56 3.2.2.1 Índices de Laspeyres..................................................................57 3.2.2.2 Índices de Paasche.....................................................................57 3.2.2.3 Índices de Fisher (fórmula ideal)................................................57 3.3 Mudança de base de um número-índice...........................................................62 3.4 Deflacionamento ou inflacionamento de dados................................................62 3.5 Principais índices brasileiros..............................................................................64 3.5.1 IPC – Índice de Preços ao Consumidor.....................................................64 3.5.2 IPA – Índice de Preços por Atacado.........................................................64 3.5.3 INCC – Índice Nacional da Construção Civil..............................................64 3.5.5 IGP – Índice Geral de Preços ...................................................................64 Bibliografia....................................................................................................................65

AULA 6 - PROBABILIDADES............................................................................................... 67 1. Introdução.................................................................................................................67 2. Definições.................................................................................................................68 2.1. Experimentos aleatórios (E)..............................................................................68 2.2. Espaço Amostral (S)..........................................................................................68 2.3. Evento...............................................................................................................70 2.3.1 Evento Simples ou Elementar..................................................................70 2.3.2 Evento Composto.....................................................................................70 2.3.3 Evento Certo............................................................................................71 2.3.4 Evento Impossível....................................................................................71 2.3.5 Evento Complementar.............................................................................71 2.3.6 Eventos Mutuamente Exclusivos.............................................................71 2.3.7 Eventos Independentes...........................................................................71 2.3.8 Eventos Condicionais...............................................................................71 2.3.9 Evento Soma (ou união)..........................................................................71


2.3.10 Evento Produto (ou interseção).............................................................72 2.4 Definição de Probabilidade................................................................................72 3. Axiomas de Probabilidade.........................................................................................72 4. Teoremas de Probabilidade.......................................................................................73 5. Probabilidade de eventos independentes.................................................................73 6. Probabilidade condicional.........................................................................................74 Bibliografia....................................................................................................................76

AULA 7 - DISTRIBUIÇÃO DISCRETA DE PROBABILIDADES.................................................... 77 1. Introdução.................................................................................................................77 2. Variáveis aleatórias...................................................................................................77 2.1. Definição de variável aleatória.........................................................................78 3. Distribuição de probabilidades..................................................................................78 4. Valor esperado de uma variável aleatória................................................................79 5. Variância de uma variável aleatória.........................................................................80 6. Distribuições discretas de probabilidade...................................................................80 6.1. Distribuição de Bernoulli...................................................................................80 6.2. Distribuição Binomial........................................................................................81 6.2.1. Esperança e Variância....................................................................................83 6.3. Distribuição de Poisson.....................................................................................83 6.3.1. Esperança e Variância.............................................................................84 Bibliografia....................................................................................................................85

AULA 8 - DISTRIBUIÇÃO CONTÍNUA DE PROBABILIDADES.................................................. 87 1. Introdução.................................................................................................................87 2. Definições.................................................................................................................87 2.1 Definição e conceito de probabilidade..............................................................88 2.1.1 Definição..................................................................................................88 2.1.2. Conceito fundamental.............................................................................88 2.2. Características da Distribuição Normal..............................................................88 2.3. Cálculo das probabilidades................................................................................89 2.3.1. Uso da tabela..........................................................................................89 2.3.2. Exemplo de aplicação.............................................................................91

ANEXO .............................................................................................................................. 94 BIBLIOGRAFIA.................................................................................................................... 95


AULA 1 Séries e Gráficos Estatísticos 1. INTRODUÇÃO

O

método estatístico é um processo para se obter, apresentar e analisar características ou va numéricos para uma melhor tomada de decisão em situações de incerteza.

lores

É o único modo de se lidar com uma grande quantidade de observações ou de valores e aplica-se somente a observações redutíveis a uma forma quantitativa. Tem tratamento idêntico para Ciências Sociais, Humanas ou Tecnológicas. É objetivo; entretanto os resultados são influenciados (embora não devessem) pela necessária interpretação subjetiva.

2. DEFINIÇÕES » » População: é um conjunto definido de elementos que possuem determinadas características. Normalmente falase de população como referência ao total de habitantes de determinado lugar. Todavia, em termos estatísticos, uma população pode ser definida, como por exemplo, um conjunto de alunos matriculados numa universidade.


ESTATÍSTICA APLICADA

» » Amostra: subconjunto da população ou do universo por meio do qual se estabelecem ou se estimam as características desse universo ou população. » » Variável é a atribuição numérica a cada característica observada em determinado estudo estatístico. As variáveis podem ser qualitativas (atributos) ou quantitativas (numéricas). As qualitativas são classificadas em nominal e ordinal, enquanto que as quantitativas em discretas e contínuas. Se, por exemplo, numa pesquisa de mercado fossem levantadas as seguintes variáveis das pessoas entrevistadas: idade, estado civil, grau de instrução, número de filhos, faixa salarial e estado de origem, poderíamos afirmar que as variáveis: estado civil e grau de instrução são atributos do indivíduo entrevistado e, portanto são variáveis qualitativas. Por outro lado, as variáveis: idade, número de filhos e faixa salarial são resultado de uma contagem ou mensuração e então são denominadas de variáveis quantitativas. Variável qualitativa nominal é aquela em que não existe nenhuma ordenação, como no exemplo, o estado de origem. A variável qualitativa ordinal apresenta uma ordem em seus resultados, como o grau de instrução, no exemplo acima, pois ensino fundamental, médio e superior correspondem a uma ordenação baseada no número de anos de escolaridade. As variáveis quantitativas são classificadas em discretas e contínuas. As discretas são aquelas que podem assumir apenas determinados valores e resultam de uma contagem, como a quantidade de alunos desta universidade. As variáveis contínuas podem assumir qualquer valor dentro de uma determinada faixa de valores e resultam de uma medição. Por exemplo, a altura dos alunos desta universidade. Resumindo

Variáveis Quantitativas (são numéricos)

Qualitativas (são atributos) Nominal Ex. Sexo Religião Cor dos olhos

Ordinal

Discretas

Ex. Ex. Quantidade de Grau de instrução estudantes de uma disciplina Classificação em Quantidade de um concurso Faixa etária cômodos em uma casa

Contínuas Ex. Altura de alunos Tempo de voo entre duas cidades Peso de mercadorias

Figura 1 - Variáveis 3. Séries Estatísticas

3. SÉRIES ESTATÍSTICAS As séries estatísticas são tabelas que resumem um conjunto de observações nas quais existe um critério distinto que as especifica e diferencia. O comportamento de determinada variável deve ser demonstrado de forma simples e objetiva, para fácil compreensão do fenômeno em estudo. 8


AULA 1 - SÉRIES E GRÁFICOS ESTATÍSTICOS

As tabelas estatísticas são compostas basicamente de três partes: cabeçalho, corpo e rodapé. O cabeçalho deve indicar o que está sendo representado, onde e quando ocorreu. O corpo é formado por linhas e colunas e deve conter todas as informações sobre a variável em estudo. Finalmente no rodapé deve estar explicita a fonte dos dados e as notas pertinentes à tabela. Segundo o critério de agrupamento, as séries estatísticas podem ser classificadas em: História, Geográfica, Específica, Composta e Distribuição de Frequência.

3.1 SÉRIES HISTÓRICAS: Tem como característica a variação do tempo enquanto que o local e o fato permanecem constantes. É também conhecida como série cronológica ou temporal. Exemplo: POPULAÇÃO BRASILEIRA 1950 - 2000 Ano

População Total

1950

51.944.397

1960

70.191.370

1970

93.139.037

1980

119.002.706

1990

146.825.475

2000

169.799.170

Fonte: IBGE

3.2 SÉRIES GEOGRÁFICAS: O local é variável enquanto que o tempo e o fato são fixos. Exemplo: PRODUÇÃO DE AÇO BRUTO 1º SEMESTRE 2009 Estado

Toneladas

Minas Gerais

2.731,2

São Paulo

2.172,9

Espírito Santo

1.784,3

Rio de Janeiro

1.436,9

Outros

498,5

TOTAL BRASIL

8.623,8

Fonte: IBS

3.3 SÉRIES ESPECÍFICAS: São aquelas que descrevem os valores da variável, em determinado tempo e local, segundo especificações ou categorias. Exemplo:

9


ESTATÍSTICA APLICADA

PRODUÇÃO DE VEÍCULOS POR FABRICANTE 1º SEMESTRE DE 2009 Empresa

Produção

CITROEN DO BRASIL S.A.

2.731,2

FIAT AUTOMÓVEIS S.A.

2.172,9

FORD MOTOR COMPANY BRASIL

1.784,3

GENERAL MOTORS DO BRASIL LTDA

1.436,9

HONDA AUTOMÓVEIS DO BRASIL LTDA

498,5

MERCEDEZ-BENZ DO BRASIL LTDA PEUGEOT DO BRASIL S.A. RENAULT DO BRASIL S.A. TOYOTA DO BRASIL LTDA VOLKSWAGEN DO BRASIL LTDA VOLKSWAGEN CAMINHÕES E ÔNIBUS OUTROS TOTAL GERAL

8.623,8

Fonte: ANFAVEA

3.4 SÉRIES COMPOSTAS OU CONJUGADAS Apresenta numa única tabela a variação de valores de mais de uma variável. É uma combinação entre as séries anteriores. Neste caso há a classificação horizontal (linhas) e a vertical (colunas). Exemplo: LINHAS DE TELEFONES CELULARES NO BRASIL MAI/08 A MAI/09 mai/08

dez/08

abr/09

mai/09

CELULAR PRÉ-PAGO

105.686.992

122.727.551

126.150.861

128.757.732

CELULAR PÓS-PAGO

24.871.368

27.913.852

28.445.782

28.744.081

TOTAL

130.558.360

150.641.403

154.596.643

157.501.813

Fonte: ANATEL

3.5 DISTRIBUIÇÃO DE FREQUÊNCIAS: Apresenta numa única tabela a variação de valores de mais de uma variável. É uma combinação entre as séries anteriores. Neste caso há a classificação horizontal (linhas) e a vertical (colunas). Exemplo: DISTRIBUIÇÃO DAS FREQUÊNCIAS DO PESO DE 100 ALUNOS DA UNIVERSIDADE X Classe

10

Peso

Nº Alunos

1

45

50

2

2

50

55

4


AULA 1 - SÉRIES E GRÁFICOS ESTATÍSTICOS

3

55

60

7

4

60

65

12

5

65

70

20

6

70

75

22

7

75

80

15

8

80

85

8

9

85

90

6

10

90

95

4

TOTAL

100

Dados fictícios

4. GRÁFICOS ESTATÍSTICOS As séries estatísticas podem ser representadas na forma de gráficos. Com a tabela consegue-se uma maior precisão e detalhamento das informações, enquanto que, com os gráficos, obtêm-se uma visualização rápida e fácil das variáveis envolvidas. Um bom gráfico estatístico deve contemplar três requisitos básicos: Simplicidade, Clareza e Veracidade das informações. Os principais tipos de gráficos estatísticos são os diagramas, cartogramas e pictogramas.

4.1 DIAGRAMAS São gráficos com no máximo duas dimensões e geralmente são plotados no sistema cartesiano

4.1.1 Gráficos em linha Para a construção deste tipo de gráfico utiliza-se de eixos coordenados, perpendiculares entre si, sendo que na intersecção encontra-se a origem. O eixo horizontal é a abcissa enquanto que o vertical a ordenada. Exemplo: População Brasileira 180.000.000 160.000.000 140.000.000 120.000.000 100.000.000 80.000.000 60.000.000 40.000.000 1950

1960

1970

1980

1990

2000

Figura 2 - População Brasileira

11


ESTATÍSTICA APLICADA

4.1.2 Gráficos em barras ou colunas Neste caso, a série é representada por retângulos dispostos horizontalmente (em barras) ou verticalmente (em colunas). Exemplos:

4.1.3 Gráficos em colunas ou em barras agrupadas Este tipo de gráfico geralmente é utilizado quando se quer comparar duas ou mais variáveis simultaneamente. Exemplo:

Figura 3 - Fonte Anatel.

4.1.4 Gráficos de setores É o gráfico apropriado para situações em que se deseja evidenciar o quanto cada informação representa do total. Exemplo:

Figura 4 - Fonte IBS.

12


AULA 1 - SÉRIES E GRÁFICOS ESTATÍSTICOS

4.1.5 Gráfico polar É muito utilizado para representar variações de séries temporais cíclicas, isto é, séries que apresentam em seu desenvolvimento determinada periodicidade. Exemplo:

Figura 5 - Dados Fictícios

4.2 CARTOGRAMAS É a representação sobre uma carta geográfica de dados estatísticos diretamente relacionados a essas regiões. Para dados absolutos, utilizam-se pontos proporcionais ao valor. Para dados relativos, utilizam-se hachuras ou cores diferenciadas. Exemplo:

4.3 PICTOGRAMAS É a representação por meio de figuras dos dados estatísticos. Indica a proporcionalidade entre os dados. Apesar da pouca precisão, são muito utilizados em revistas e cartazes, por serem atraentes e de fácil leitura. Exemplo:

13


ESTATÍSTICA APLICADA

BIBLIOGRAFIA Básica: CRESPO, Antonio Arnot. Estatística Fácil. 18ª ed. São Paulo, Saraiva, 2002. TRIOLA, Mário F. Introdução à Estatística.10ª ed. Rio de Janeiro, LTC, 2008.

Complementar: BUSSAB, W.O; MORETITIN, P. A. Estatística básica. São Paulo, Saraiva, 20023 IBGE. www.ibge.gov.br ANFAVEA. www.anfavea.com.br ANATEL. www.anatel.gov.br IBS. www.ibs.org.br SILVA, Paulo Cezar Ribeiro da. Metodologia Científica. 2008. Faculdade Batista de Vitória, Vitória, 2008. Disponível em: < http://www.introsmoveis.com.br>. Acesso em: 6 jun. 2013.

14


AULA 2 Distribuição de Frequências 1. INTRODUÇÃO

D

istribuição de Frequências é a mais importante das séries estatísticas e tem como principal finalidade agrupar e resumir os dados coletados, possibilitando uma melhor informação sobre seu comportamento.

As distribuições de frequências contêm basicamente as quatro principais frequências de uma distribuição, sendo denominadas como:

» » Fi = frequência absoluta simples » » FA = frequência absoluta acumulada » » fi = frequência relativa simples » » fA = frequência relativa acumulada


ESTATÍSTICA APLICADA

Para a correta representação de uma amostra utilizando as distribuições de frequências, deve-se construir a tabela das frequências e os gráficos relativos à distribuição, tais como histograma, polígono de frequências e curva polida, entre outros.

2. DEFINIÇÕES » » Dados Brutos: o conjunto de dados numéricos dos valores coletados constitui-se nos dados brutos. » » Rol: é o arranjo dos dados brutos em ordem crescente ou decrescente.

Por exemplo, se o intervalo de classe fosse de 10 |------- 15, significa que, à esquerda, esse intervalo começa com 10,000... e, à direita, termina em 14,999... sendo que o valor 15,000...começará no intervalo seguinte. Se trabalharmos com números decimais, esse critério precisa ser respeitado.

» » Amplitude Total ou “Range”: é a diferença entre o maior e o menor valor observado no rol.

» » Intervalo e Limite de classes: define o limite inferior (Li) e o limite superior (Ls) de cada classe de frequência, sendo representado pelo símbolo:

A notação acima significa que o Li está contido na classe em questão, enquanto que o Ls não, sendo que este será o Li da próxima classe.

» » Número de intervalos de classes (k): o número de intervalos de classes é determinado pela fórmula de Sturges, em que n é o tamanho da amostra.

16


AULA 2 - DISTRIBUIÇÃO DE FREQUÊNCIAS

» » Amplitude do intervalo de classes (h): é a razão entre a amplitude total (AT) e o número de intervalos de classe (k).

Ou ainda pode ser determinado pela diferença entre os limites (superior e inferior) de qualquer intervalo.

» » Ponto médio das classes (PM): o ponto médio de uma classe é a média aritmética entre o Li e o Ls:

3. CÁLCULO DE FREQUÊNCIAS 3.1 FREQUÊNCIA ABSOLUTA SIMPLES (FI) É o número de vezes que o elemento aparece na amostra, ou o número de elementos pertencentes a uma classe. A partir do Rol, contam-se quantos elementos estão contidos em cada intervalo de classe.

3.2 FREQUÊNCIA ABSOLUTA ACUMULADA (FA) A frequência absoluta acumulada de uma classe é a soma da frequência dessa classe com as frequências das classes anteriores.

3.3 FREQUÊNCIA RELATIVA SIMPLES (FI) É o quociente entre a Frequência absoluta simples (Fi) da classe e o número total de ocorrências, que é igual ao tamanho da amostra (n):

17


ESTATÍSTICA APLICADA

Como a soma das frequências absolutas é igual ao número total de ocorrências, a frequência relativa simples também pode ser definida como:

Pela definição, pode-se concluir que a frequência relativa indica a participação (ou porcentagem) de uma determinada frequência absoluta no total da amostra, e portanto, a soma dessas frequências deve ser igual ao todo, sendo válida a relação: ∑fi = 1,0.

3.4 FREQUÊNCIA RELATIVA ACUMULADA (FA) Analogamente à frequência absoluta acumulada (FA), a frequência relativa acumulada (fA) é a soma das frequências relativas dessa classe com as frequências relativas das classes anteriores.

4. EXEMPLO DE APLICAÇÃO Construir a tabela de distribuição de frequências, para os dados brutos do peso de 30 alunos de uma universidade.

1º passo: rol Para arranjar os dados brutos em rol, pode-se utilizar duas técnicas:

» » contagem dos dados brutos; » » diagrama Ramo-folha. Contagem dos dados brutos: marcar os valores que aparecem nos dados brutos, numa relação com os possíveis valores, entre o menor e o maior valor, listados em ordem crescente:

18


AULA 2 - DISTRIBUIÇÃO DE FREQUÊNCIAS

Diagrama ramo-folha: separam-se os valores listados em dezena e unidade (no caso) e anotar num arranjo conforme abaixo. Depois, basta colocar os valores em ordem crescente:

Dessa forma, pode-se construir o rol:

2 º passo: amplitude total AT = xMÁX - xMIN j AT = 93 – 52 = 41

19


ESTATÍSTICA APLICADA

3 º passo: número de intervalos de classes k = 1 + 3,3 log n j k = 1+3,3. 1,48 j k= 5,88 ≈ 6 intervalos de classe 4º passo: amplitude do intervalo de classes h = AT / k jh = 41/6 = 6,83 ≈ 7,0 5º passo: construção da tabela de distribuição de frequências Inicia-se com o menor valor do rol (52) e soma-se a amplitude do intervalo da classe (7) sucessivamente, até atingir a sexta classe (k=6).

6º passo: determinar as frequências absolutas da distribuição Verifica-se no Rol a quantidade de valores compreendidos entre 52 e 58 (pois o intervalo é aberto no limite superior). Em seguida, a quantidade de valores compreendidos entre 59 e 65, e assim por diante.

20


AULA 2 - DISTRIBUIÇÃO DE FREQUÊNCIAS

7º passo: determinar as frequências acumuladas da distribuição Repetir o primeiro valor, pois não há nada acima para acumular. A partir do segundo, somar com o anterior e acumular na classe posterior, conforme indicado pelas setas na tabela abaixo:

5. REPRESENTAÇÃO GRÁFICA DA SÉRIE DE DISTRIBUIÇÃO DE FREQUÊNCIA Histograma: é a representação gráfica por meio de retângulos justapostos, em que a base colocada no eixo das abcissas corresponde aos intervalos das classes, e a altura é dada pela frequência absoluta das classes.

Para o exemplo dado acima, da distribuição de frequências do peso de 30 alunos de uma universidade, resulta o seguinte histograma: Polígono de frequências: gráfico de linha, sendo que a frequência é marcada sobre perpendiculares ao eixo horizontal, nos pontos médios dos intervalos de classe.

21


ESTATÍSTICA APLICADA

Para o exemplo dado acima, da distribuição de frequências do peso de 30 alunos de uma universidade, resulta o seguinte polígono de frequências: Polígono de frequências acumulada: também conhecido como Ogiva de Galton. É traçado marcando-se as frequências acumuladas sobre perpendiculares ao eixo horizontal, levantadas nos pontos médios dos intervalos de classe.

Para o exemplo dado acima, da distribuição de frequências do peso de 30 alunos de uma universidade, resulta o seguinte polígono de frequências acumuladas: Curva de frequência (Curva polida): como, em geral, os dados coletados pertencem a uma amostra extraída de uma população, pode-se imaginar as amostras tornando-se cada vez maiores e a amplitude das classes cada vez menor, de forma que a linha poligonal (contorno do polígono de frequência) tende a se transformar em uma curva, a curva de frequência – mostrando a natureza da distribuição da população. (LIMA, 2006). O polígono de frequência fornece a imagem real do fenômeno estudado, enquanto a curva de frequência, a imagem tendencial. Assim, após o traçado de um polígono de frequência, é desejável, muitas vezes, que se lhe faça um polimento, de modo a mostrar o que seria tal polígono com um número maior de dados. (LIMA, 2006). Consegue-se isso com o emprego de uma fórmula bastante simples, a qual, a partir das frequências reais, fornece novas frequências – frequências calculadas (Fc) – que se localizarão, como no polígono de frequência, nos pontos médios. (LIMA, 2006).

Para o exemplo dado acima, da distribuição de frequências do peso de 30 alunos de uma universidade, resulta a seguinte curva de frequência:

22


AULA 2 - DISTRIBUIÇÃO DE FREQUÊNCIAS

BIBLIOGRAFIA Básica: CRESPO, A. A. Estatística Fácil. 18. ed. São Paulo: Saraiva, 2002. MARTINS, G.de A. Estatística Geral e Aplicada. 3. ed. São Paulo: Atlas, 2006. SPIEGEL, M. R. Estatística. 3. ed. São Paulo: Makron Books, 2004.

Complementar: LIMA, Elcio. Estatística. 2006. Universidade da Região de Campanha, Caçapava do Sul, 2006. Disponível em: <http:// elcio.org>. Acesso em: 6 jun. 2013. TRIOLA, M. F. Introdução à Estatística.10. ed. Rio de Janeiro: LTC, 2008. BUSSAB, W.O; MORETITIN, P. A. Estatística básica. 5. ed. São Paulo: Saraiva: 2002.

23



AULA 3 Medidas de Posição 1. INTRODUÇÃO

M

edidas de posição permitem representar um conjunto de dados relativos à observação de determinado fenômeno, de forma resumida. As chamadas medidas de posição ou medidas de tendência central representam esses fenômenos pelos seus valores médios, em torno dos quais tendem a se concentrar os dados.

As medidas de posição mais comuns em estatística são a média, a mediana e a moda. A média representa todos os valores de um conjunto de dados; é a mais utilizada. A mediana elimina a influência de valores extremos. Já a moda apresenta um valor típico no conjunto de dados em estudo.


ESTATÍSTICA APLICADA

2. MÉDIA 2.1. MÉDIA ARITMÉTICA (X) PARA DADOS NÃO AGRUPADOS: É obtida pelo quociente elementos considerados.

entre a soma de todos os elementos da distribuição, pela quantidade de

Exemplos: a) Calcular a média aritmética simples dos valores: 2, 5, 6, 9, 12, 17, 20 e 28.

b) Calcular o faturamento médio mensal da Indústria Metalúrgica Alvorada no ano de 2008, conforme dados da tabela abaixo:

2.2. MÉDIA ARITMÉTICA (X) PARA DADOS AGRUPADOS SEM INTERVALO DE CLASSES Para séries agrupadas, arranjadas em classes simples de frequência, sem intervalo de classes, a média aritmética é dada pela fórmula:

26


AULA 3 - MEDIDAS DE POSIÇÃO

Exemplo: dada a distribuição, determinar a média aritmética.

Solução: construir a tabela:

Aplicar a fórmula da média:

Observação: a média aritmética ponderada (xp) é um caso particular, definida pela relação abaixo, em que pi é o peso associado a cada elemento da distribuição.

Exemplo: uma empresa é constituída de 20 funcionários, sendo os seus salários representados pela tabela a seguir. Qual o salário médio dos funcionários dessa empresa?

27


ESTATÍSTICA APLICADA

2.3. MÉDIA ARITMÉTICA (X) PARA DADOS AGRUPADOS COM INTERVALO DE CLASSES É obtida pela fórmula:

Onde Pm é o ponto médio dos intervalos de classe da distribuição de frequências. Exemplo: calcular a média da renda familiar de um grupo de 40 famílias de um condomínio, conforme tabela abaixo:

Nesse caso, as classes deverão ser representadas pelos seus pontos médios, portanto:

Como a renda familiar é dada em milhares, pode-se dizer que a renda média desse grupo de 40 famílias é de R$ 6.700,00.

2.4. MÉDIA GEOMÉTRICA (XG) PARA DADOS NÃO AGRUPADOS: É definida como sendo a raiz enésima dos produtos dos elementos da série, em que n é o tamanho da distribuição.

Exemplo: calcular a média geométrica para a série: 2, 5, 6, 9, 12, 17, 20 e 28.

28


AULA 3 - MEDIDAS DE POSIÇÃO

2.5. MÉDIA GEOMÉTRICA (xg) PARA DADOS AGRUPADOS SEM INTERVALO DE CLASSES: Para séries agrupadas, arranjadas em classes simples de frequência, a média geométrica segue o mesmo conceito acima, só que agora as frequências absolutas são os expoentes dos elementos.

Exemplo: dada a distribuição, determinar a média geométrica.

2.6. MÉDIA HARMÔNICA (xh) PARA DADOS NÃO AGRUPADOS É o quociente entre o número de elementos da série e a soma dos seus inversos, admitindo-se todos os elementos da série diferentes de zero.

Exemplo: calcular a média harmônica: 2, 5, 6, 9, 12, 17, 20 e 28.

2.7. MÉDIA HARMÔNICA (xh) PARA DADOS AGRUPADOS SEM INTERVALO DE CLASSES: para séries agrupadas, arranjadas em classes simples de frequência, a média geométrica segue o mesmo conceito acima, só que agora as frequências absolutas são os numeradores das frações e os elementos da série são os denominadores.

29


ESTATÍSTICA APLICADA

Exemplo: determinar a média harmônica da distribuição abaixo.

Curiosidade Comparando as três médias apresentadas nos exemplos:

Pode-se concluir que:

3. MEDIANA (ME) 3.1. MEDIANA (ME) PARA DADOS NÃO AGRUPADOS Com os dados brutos arranjados em ordem crescente, isto é, na forma de Rol, a mediana (Me) é o valor que divide a série em partes iguais.

» » Se o número de elementos (n) for ímpar, a mediana será o termo de ordem:

» » Se o número de elementos (n) for par, a mediana será a média aritmética dos termos de ordem:

30


AULA 3 - MEDIDAS DE POSIÇÃO

Exemplos: a) Calcular a mediana dos valores de faturamento da Metalúrgica Alvorada. Inicialmente, precisamos colocar os dados na forma de rol (organizados do menor para o maior valor). Como o número de elementos da série “n” é igual a 12, a posição n/2 corresponderá à sexta posição, e a n/2 +1 à sétima. A mediana será então a média aritmética dos valores dessas posições.

Me = (4.358.725,42 + 4.445.794,33) / 2 = 4.402.260,87 b) Calcular a mediana para a série: 2, 5, 6, 9, 12, 17, 20. Neste caso, “n” vale 7, e os dados já estão na forma de rol. Como “n” é ímpar, a mediana será o valor da posição (n+1)/2 ou (7+1)/2 = 4ª posição. Portanto, o valor da mediana será: Me = 9. Notar que esse valor deixa três elementos de cada lado, dividindo a série em duas partes exatamente iguais.

3.2. MEDIANA (ME) PARA DADOS AGRUPADOS SEM INTERVALO DE CLASSES Para séries agrupadas, arranjadas em classes simples de frequência, a mediana deve ser determinada da seguinte forma:

» » “n” ímpar Na coluna da frequência acumulada (FA), verificar em que classe está o valor da posição (n+1)/2 ≤ FA. O valor da variável dessa classe (xi) será a mediana.

31


ESTATÍSTICA APLICADA

Exemplo: calcular a mediana para a distribuição de frequência abaixo.

Construindo a tabela de frequências, verifica-se que “n” é igual a 11, e a posição da mediana será (n+1)/2 = (11+1)/2 = 6 (sexta posição). Pela tabela a condição (n+1)/2 ≤ FA ocorre na terceira classe (6 < 9). Portanto, a mediana será o valor correspondente de xi, Me = 3. De fato, abrindo a série verifica-se tal condição: 1, 2, 2, 2, 3, 3, 3, 3, 3, 4, 4.

» » “n” par Na coluna da frequência acumulada (FA), verificar em que classe está o valor da posição n/2 ≤ FA e da posição n/2 + 1 ≤ FA. A mediana será a média aritmética dos valores da variável (xi) dessas classes. Exemplo: calcular a mediana para a distribuição de frequência.

Construindo a tabela de frequências, verifica-se que “n” é igual a 10 e, então, a posição n/2 = 5 (quinta posição) e a n/2 +1 = 6 (sexta posição). Pela tabela, a condição n/2 ≤ FA ocorre na segunda classe (5 = 5), e a condição n/2 + 1 ≤ FA ocorre na terceira classe (6< 9). Portanto, a mediana será o valor correspondente à média dos valores de xi, ou seja: Me = (2 + 3) /2 = 2,5. De fato, abrindo a série verifica-se tal condição: 1, 1, 2, 2, 2, 3, 3, 3, 3, 4.

3.3. MEDIANA (ME) PARA DADOS AGRUPADOS COM INTERVALO DE CLASSES Neste caso, para o cálculo da mediana, deve-se seguir a sequência: 1) Calcular n/2.

32


AULA 3 - MEDIDAS DE POSIÇÃO

2) Identificar a classe que contém a mediana (classe Me) na coluna de FA da tabela de frequências verificando a condição: n/2 ≤ FA. 3) Aplicar a fórmula:

Exemplo: calcular a mediana da renda familiar, conforme tabela abaixo:

Solução: construir a tabela de frequências. O valor de n/2 será de 40/2 = 20. A condição: n/2 ≤ FA ocorre na terceira classe que será, então, a classe mediana.

Aplicar a fórmula.

A mediana da renda familiar será de R$ 6.710,00.

33


ESTATÍSTICA APLICADA

4. SEPARATRIZES 4.1 INTRODUÇÃO Separatrizes são medidas de posição particulares, baseadas no conceito da mediana. Assim, são muito utilizados os Quartis, Decis e Percentis, que dividem a distribuição em, respectivamente, quatro, dez ou cem partes iguais. Na figura abaixo, onde estão colocadas comparativamente com a mediana todas as separatrizes, é mostrado de maneira simples como se posicionam essas medidas na distribuição. Observando a figura, fica fácil concluir que:

4.2 CÁLCULO DAS SEPARATRIZES Baseado no estudo da mediana, as separatrizes têm as seguintes fórmulas genéricas:

34


AULA 3 - MEDIDAS DE POSIÇÃO

4.3 EXEMPLO DE APLICAÇÃO Para a distribuição abaixo, calcular o Q1, Q3, D6, P10 e P90:

A tabela de frequências já foi calculada em exemplo anterior:

a) Cálculo dos quartis:

35


ESTATÍSTICA APLICADA

b) Cálculo do decil:

c) Cálculo dos percentis:

5.1. MODA (MO) PARA DADOS NÃO AGRUPADOS A moda de uma amostra ou população é o valor que ocorre com a maior frequência, isto é, o valor mais comum ou o que mais se repete. Portanto, basta observar a série para determinar sua moda. Exemplos: a) A série 2, 5, 6, 9, 12, 17, 20 e 28 não tem moda, porque todos os valores apareçam apenas uma vez. b) A série 2, 3, 5, 5, 5, 7, 9, 13, 15 tem moda igual a 5, pois é o valor que ocorre com maior frequência.

5.2. MODA (MO) PARA DADOS AGRUPADOS SEM INTERVALO DE CLASSES Basta observar qual é a maior frequência absoluta (Fi) da distribuição. Exemplo: dada a distribuição abaixo, determinar a moda.

A maior frequência absoluta (Fi = 5) corresponde à variável xi = 3 e, portanto a moda dessa distribuição será: Mo = 3.

36


AULA 3 - MEDIDAS DE POSIÇÃO

5.3. MODA (MO) PARA DADOS AGRUPADOS COM INTERVALO DE CLASSES Neste caso, para o cálculo da moda, deve-se seguir a sequência: 1) identificar a classe modal, como sendo aquela que apresenta o maior valor de Fi; 2) calcular a moda por meio da fórmula:

Exemplo: calcular a moda da renda familiar, conforme tabela abaixo:

Solução: construir a tabela da frequência. A classe modal será a terceira, pois é a que apresenta a maior frequência absoluta (Fi). O valor de d1 será 14 – 10 = 4, enquanto que o valor de d2 será 14 – 8 = 6. Aplicar a fórmula.

A moda da renda familiar será de R$6.800,00.

37


ESTATÍSTICA APLICADA

BIBLIOGRAFIA Básica: CRESPO, A. A. Estatística Fácil. 18. ed. São Paulo: Saraiva, 2002. MARTINS, G.de A. Estatística Geral e Aplicada. 3. ed. São Paulo: Atlas, 2006. SPIEGEL, M. R. Estatística. 3. ed. São Paulo: Makron Books, 2004.

Complementar: TRIOLA, M. F. Introdução à Estatística.10. ed. Rio de Janeiro: LTC, 2008. BUSSAB, W.O; MORETITIN, P. A. Estatística básica. 5. ed. São Paulo: Saraiva, 2002.

38


AULA 4 Medidas de Dispersão 1. INTRODUÇÃO

S

ão medidas estatísticas utilizadas para avaliar o grau de variabilidade ou dispersão dos valores em torno da média. Medem o afastamento do valor considerado em relação à média. As medidas de dispersão mais utilizadas são a amplitude total, a variância e o desvio-padrão.Sejam, por exemplo, as séries numéricas de uma determinada amostra:

» » Série A j 20, 20, 20. j = 20X » » Série B j 10, 15, 20, 25, 30 j =X20 » » Série C j 5, 7, 12, 20, 28, 33, 35.j = 20X

As três séries têm médias iguais a 20, mas percebe-se que a dispersão dos valores em torno dessa média é diferente. Então, como calcular essa dispersão?


ESTATÍSTICA APLICADA

2. AMPLITUDE TOTAL (AT) 2.1. AMPLITUDE TOTAL (AT) PARA DADOS NÃO AGRUPADOS É calculada pela diferença entre os valores máximo e mínimo da série. Tem o inconveniente de só considerar os extremos das séries:

Para o exemplo acima, resultaria: Série A j 20, 20, 20. j x = 20 j AT = 20 – 20 = 0 Série B j 10, 15, 20, 25, 30.j x = 20 j AT = 30 – 10 = 20 Série C j 5, 7, 12, 20, 28, 33, 35.j x = 20 j AT = 35 – 5 = 30

2.2. AMPLITUDE TOTAL (AT) PARA DADOS AGRUPADOS SEM INTERVALO DE CLASSES Nesse caso, ainda temos:

Exemplo: dada a distribuição, determinar a amplitude total.

2.3. AMPLITUDE TOTAL (AT) PARA DADOS AGRUPADOS COM INTERVALO DE CLASSES

Neste caso, a amplitude total é a diferença entre o limite superior da última classe e o limite inferior da primeira: Exemplo: para a distribuição de frequências, determinar a amplitude total.

40


AULA 4 - MEDIDAS DE DISPERSÃO

3. VARIÂNCIA E DESVIO-PADRÃO 3.1. VARIÂNCIA E DESVIO-PADRÃO PARA DADOS NÃO AGRUPADOS 3.1.1. Variância amostral (S2): É definida como sendo a média aritmética do quadrado dos desvios:

Exemplo: calcular a variância das séries abaixo:

Série A j 20, 20, 20. j x = 20 S2 = [(20 - 20)2 + (20 - 20)2 + (20 - 20)2] / 3 -1 = 0 Série B j 10, 15, 20, 25, 30j x = 20 S2 = [(10 - 20)2 + (15 - 20)2 + (20 - 20)2 + (25 - 20)2 + (30 - 20)2 ] / 5 -1 = 62,5 Série C j 5, 7, 12, 20, 28, 33, 35j x = 20 S2 = [(5-20)2+(7-20)2+(12-20)2+(20-20)2+(28-20)2+(33-20)2+(35-20)2] / 7 -1 = 152,6 3.1.2. Desvio-padrão amostral (s): É definido como sendo a raiz quadrada da variância:

Exemplo: calcular o desvio-padrão das séries abaixo.

41


ESTATÍSTICA APLICADA

Série A j 20, 20, 20. j x = 20 j

Série B j 10, 15, 20, 25, 30 j

Série C j 5, 7, 12, 20, 28, 33, 35 j

3.2 VARIÂNCIA E DESVIO-PADRÃO PARA DADOS AGRUPADOS SEM INTERVALO DE CLASSES 3.2.1. Variância amostral (s2): Para a aplicação da fórmula abaixo, inicialmente deve-se calcular as novas colunas xiFi e xi2Fi na tabela de distribuição de frequências, para facilitar os cálculos.

Exemplo: dada a distribuição, determinar a variância.

Solução: construir a tabela de frequências com as colunas xiFi e xi2Fi, calcular o somatório e aplicar a fórmula abaixo.

42


AULA 4 - MEDIDAS DE DISPERSÃO

3.2.2. Desvio-padrão amostral (s) Neste caso, também é definido como sendo a raiz quadrada da variância:

Para o exemplo acima, o desvio padrão vale:

3.3. VARIÂNCIA E DESVIO-PADRÃO PARA DADOS AGRUPADOS COM INTERVALO DE CLASSES 3.3.1 Variância amostral (s2) Neste caso, como há intervalo nas classes de frequência, a variável xi é substituída pelo ponto médio do intervalo de classes (PM) e a fórmula de cálculo se torna:

Exemplo: calcular a variância para a distribuição de frequências abaixo.

3.3.2. Desvio-padrão amostral (s): 43


ESTATÍSTICA APLICADA

Este caso, também é definido como sendo a raiz quadrada da variância:

Para o exemplo acima, o desvio-padrão vale:

4. COEFICIENTE DE VARIAÇÃO (CV) Trata-se de uma medida relativa de dispersão, útil para a comparação em termos relativos do grau de concentração em torno da média de séries distintas. É dado por:

Exemplo 1: numa determinada empresa, o salário médio dos gerentes é de R$ 4.000,00, com desvio-padrão de R$ 1.500,00 e o dos supervisores é em média de R$ 3.000,00, com desvio-padrão de R$ 1.200,00. Então:

Logo, podemos concluir que os salários dos supervisores apresentam maior dispersão relativa que os dos gerentes. Exemplo 2: calcular o coeficiente de variação (CV) para a distribuição de frequências abaixo:

44


AULA 4 - MEDIDAS DE DISPERSÃO

Nos exemplos anteriores, foi determinado o desvio-padrão (s) e a média (x) para esta distribuição de frequências: s = 2,24 e x = 6,7. Portanto, o CV será:

Quanto à medida da dispersão ou variabilidade dos dados com o auxílio do CV, pode-se considerar:

5. MEDIDAS DE ASSIMETRIA E CURTOSE 5.1 ASSIMETRIA É o grau de afastamento de uma distribuição da unidade de simetria. Em uma distribuição simétrica, os valores da média, mediana e moda coincidem.

» » Em uma distribuição assimétrica à direita, também denominada de distribuição

assimétrica positiva, acontece a desigualdade: Mo < Me < x .

» » Em uma distribuição assimétrica à esquerda, também denominada de distribuição

assimétrica negativa, acontece a desigualdade: x < Me <Mo.

45


ESTATÍSTICA APLICADA

As fórmulas mais comuns para o cálculo da assimetria são os coeficientes de Pearson: 1º Coeficiente de Pearson:

2º Coeficiente de Pearson:

Interpretação do coeficiente de assimetria: AS = 0 Distribuição simétrica AS > 0 Distribuição assimétrica positiva (à direita) As < 0 Distribuição assimétrica negativa (à esquerda)

5.2 CURTOSE É o grau de achatamento da distribuição.

Exemplo: calcular a assimetria e a curtose para a distribuição de frequências abaixo.

46


AULA 4 - MEDIDAS DE DISPERSÃO

Dos exemplos anteriores, sabe-se que: x = 6,70; Me = 6,71; Mo = 6,80; s = 2,24; Q1= 5,00; Q3= 8,25; P10 = 3,60; P90 = 9,75 Então:

a) Coeficiente de assimetria: 1º Coeficiente de Pearson:

2º Coeficiente de Pearson:

Como nos dois casos AS < 0, diz-se que a distribuição é assimétrica negativa.

b) Análise de curtose:

Como k > 0,263 j, distribuição é ligeiramente platicúrtica.

47


ESTATÍSTICA APLICADA

BIBLIOGRAFIA Básica: CRESPO, A. A. Estatística Fácil. 18. ed. São Paulo: Saraiva, 2002. MARTINS, G.de A. Estatística Geral e Aplicada. 3. ed. São Paulo: Atlas, 2006. SPIEGEL, M. R. Estatística. 3. ed. São Paulo: Makron Books, 2004.

Complementar: TRIOLA, M. F. Introdução à Estatística.10. ed. Rio de Janeiro: LTC, 2008. BUSSAB, W.O; MORETITIN, P. A. Estatística básica. 5. ed. São Paulo: Saraiva, 2002.

48


AULA 5 Números Índices 1. INTRODUÇÃO

S

eja a seguinte tabela, publicada por um jornal, quando do segundo turno das eleições municipais para prefeito em seis cidades do interior do Estado:


ESTATÍSTICA APLICADA

Para um estudo comparativo dos votos brancos, à primeira vista, poderia ter sido concluído que a cidade A foi a que apresentou o maior número. Essa tabela, com números absolutos, não permite concluir tal fato, devendo ser confeccionada uma tabela com números relativos:

Importante

Para cálculo dos índices, basta fixar um valor, no caso 2004, e dividir todos os demais por esse valor fixado. Na tabela acima: 2004 j 1050/1050 x 100 =100; 2005 j 1150/1050 x 100 = 109,5; 2006 j 1200/1050 x 100 = 114,3; 2007j 1400/1050 x 100 = 133,3; 2008 j 1560/1050 x 100 = 148,6 e 2009 j 1700/1050 x 100 = 161,9

Dessa forma, podemos concluir de imediato, que a cidade E foi a que apresentou maior índice de votos brancos e não a cidade A. Não são poucas as situações em que, para a descrição ou análise de um fenômeno quantitativo, o emprego dos números relativos revela-se mais pertinente do que o dos números absolutos. Isso acontece, naturalmente, quando pretendemos efetuar comparações dos valores tomados por uma mesma variável em épocas ou regiões diferentes. Consideremos agora a tabela abaixo, relativa às matrículas efetivadas numa universidade no período de 2004 a 2009:

50


AULA 5 - NÚMEROS ÍNDICES

A vantagem dos índices é permitir uma rápida avaliação da variação relativa (percentual) sofrida pelo número de matrículas, e que se traduz, em relação a 2004: Num aumento de 9,5% em 2005, 14,3% em 2006, 33,3% em 2007, 48,6% em 2008 e 61,9% em 2009.

2. DEFINIÇÃO Números-índices são medidas estatísticas frequentemente utilizadas para comparar grupos de variáveis relacionadas entre si e para obter um quadro simples e resumido das mudanças significativas ocorridas ao longo do tempo. Aplicam-se no campo da produção, evolução dos preços de matériasprimas e de produtos, custo de vida, salários, registros demográficos, economia etc.

Como medem variações no tempo, permitem sintetizar e apresentar de forma eficaz a natureza das alterações em uma ou várias variáveis, sendo mais fácil identificar flutuações referentes a períodos que se repetem ao longo do tempo. Usando os números-índices é possível, com um só valor, avaliar a evolução de um conjunto complexo de variáveis. Os números-índices são expressos em termos percentuais (porém, não é usual utilizar o símbolo de %), e os mais utilizados indicam a variação relativa no preço, na quantidade ou no valor entre um ponto anterior no tempo (período base) e, usualmente, o período corrente. Um número-índice é uma transformação da série original com a finalidade de eliminar a unidade de medida. Os valores da nova série passam a ser relativos, importando somente sua variação. Uma série de número-índice é gerada dividindo-se todos os termos da série original pelo valor da base (=100); em seguida, multiplica-se cada resultado por 100. A base pode ser qualquer valor (ou uma média de valores da série).

3. CLASSIFICAÇÃO Os três índices mais utilizados são: » » índices de preços; 51


ESTATÍSTICA APLICADA

» » índices de quantidades; » » índices de valores.

Esses são classificados em duas categorias: » » Quando só uma variável está em jogo, o índice é chamado índice simples. » » Quando uma comparação envolve um grupo de variáveis, ela é chamada índice composto. Os números-índices podem ainda ser classificados em índice de base fixa e índice de base móvel.

3.1 NÚMERO-ÍNDICE SIMPLES Um número-índice simples avalia a variação relativa de um único item ou variável econômica entre dois períodos de tempo. É calculado como a razão entre o preço, quantidade ou valor em dado período (t) e o preço, quantidade ou valor num período base (0).

52


AULA 5 - NÚMEROS ÍNDICES

Onde: » » p0 = preço de um item no período base; » » q0 = quantidade de um item no período base; » » pt = preço de um item em determinado período; » » qt = quantidade de um item em determinado período. Exemplo 1: Admita-se que o preço, para o consumidor, de um litro de leite longa vida nos anos de 2005 e 2009 é, respectivamente, R$ 2,00 e R$ 2,50. Tomando-se 2005 como ano-base e 2009 como ano dado (ou considerado), tem-se:

Índice relativo de preço à p 2005, 2009: » » p 05,09 = (preço em 2009 / preço em 2005)*100 » » p 05,09 = (2,50/2,00)*100 = 1,25*100 = 125 Esse resultado significa que em 2009 o preço do leite aumentou 25% em relação ao ano de 2005. Exemplo 2: Qual o índice de crescimento do salário de um operário da construção civil, sabendo-se que ele ganhava em 2000, R$ 8,79/h e que, depois de seis anos, obtinha R$10,60/h?

53


ESTATÍSTICA APLICADA

p 00,06 = (10,60 / 8,79 ) * 100 = 120,59 Significa que em seis anos esse operário obteve um aumento salarial de 20,59%.

3.1.1 Índices relativos de base fixa Os números-índices simples, que utilizam um período base comum, chamam-se relativos de base fixa. Os chamados relativos de base fixa ou relativos em cadeia são aqueles em que todos os relativos são calculados tomando uma determinada época como base. Exemplo: O tambor de 200 kg de uma determinada matéria-prima utilizada na fabricação de plásticos ABS apresentou, no período de 2005 a 2008, os preços de: R$ 240,00, R$ 300,00, R$ 360,00 e R$ 540,00 respectivamente. Calcular os relativos de base fixa (também conhecido como relativos em cadeia) considerando 2005 como ano-base. p 05,05 = p05 /p05 x 100 = 240/240 x 100 = 1,00 x 100 = 100 p 05,06 = p06 /p05 x 100 = 300/240 x 100 = 1,25 x 100 = 125 p 05,07 = p07 /p05 x 100 = 360/240 x 100 = 1,50 x 100 = 150 p 05,08 = p08 /p05 x 100 = 540/240 x 100 = 2,25 x 100 = 225 Com esses resultados podemos montar a seguinte tabela e gráfico:

3.1.2 Índices relativos de base móvel Os números-índices simples, chamados relativos de base móvel, relativos de ligação, ou elos de relativos são aqueles que tomam como base o valor anterior. Calcula-se o preço, a quantidade ou o valor de cada período em relação aos dados do período anterior. Utiliza-se esse tipo de relativos quando se quer acompanhar um crescimento (positivo ou negativo) anual, mensal ou diário.

54


AULA 5 - NÚMEROS ÍNDICES

Exemplo: o tambor de 200 kg de uma determinada matéria-prima utilizada na fabricação de plásticos ABS apresentou, no período de 2005 a 2008, os preços de: R$ 240,00, R$ 300,00, R$ 360,00 e R$ 540,00, respectivamente. Calcular os relativos de base móvel (também conhecido como relativos de ligação ou elos de relativos). p 05,06 = p06 /p05 x 100 = 300/240 x 100 = 1,25 x 100 = 125 p 06,07 = p07 /p06 x 100 = 360/300 x 100 = 1,20 x 100 = 120 p 07,08 = p08 /p07 x 100 = 540/360 x 100 = 1,50 x 100 = 150 Com esses resultados podemos montar a seguinte tabela e gráfico:

Para se obter a variação percentual entre dois períodos, quaisquer que sejam eles, deve-se proceder da mesma forma que se procederia com os dados originais. Exemplo: o crescimento percentual do preço da matéria-prima para a fabricação de plásticos ABS entre 2007 e 2008 foi de: [(225/150) -1].100 = 50% - cálculo pelos números-índices base fixa [(540/360) -1].100 = 50% - cálculo pelos dados originais VARIAÇÃO % = [(VALOR FINAL / VALOR INICIAL) -1]. 100 É claro que se utilizarmos a base móvel, esse resultado é visualizado imediatamente, pois essa base já se refere, por definição, ao período anterior. Para o exemplo acima, pode-se ler diretamente na tabela que a variação 2007/2008 foi 50%, uma vez que o índice resultou em 150.

3.2 NÚMEROS-ÍNDICES AGREGATIVOS (OU COMPOSTOS) A principal limitação dos índices simples é que eles se referem apenas a itens isolados, en-quanto que frequentemente necessita-se estudar as variações para um grupo de itens. Os números-índices para grupos são chamados números-índices compostos.

55


ESTATÍSTICA APLICADA

O estudo das variações de preço da cesta básica é um exemplo clássico do uso de índices agregativos ou compostos. Não necessariamente todos os produtos de uma cesta básica sofrem aumento (ou diminuição) de preço ao longo de um período de tempo. Alguns itens podem ter o preço aumentado, enquanto outros podem ter sofrido redução de preço.

3.2.1 Números-índices agregativos (ou compostos) não ponderados Um dos índices classificados nessa categoria são os Índices agregativos simples. São semelhantes aos índices simples, só que agora se considera o quociente entre o somatório de todos os preços ou quantidades do período considerado e o somatório de todos os preços ou quantidades do período base.

É um índice de fácil aplicação, mas que apresenta duas grandes limitações para seu uso: a) Não leva em consideração a importância relativa dos itens (por exemplo, no cálculo do índice de preços de alimentos seria atribuída ao feijão e ao camarão a mesma importância). b) Não há homogeneidade entre as unidades dos diversos bens. Assim, por exemplo, o feijão pode vir expresso em quilogramas e a azeite em litros. Outro Índice agregativos não ponderado é o Índice médio aritmético, para preço ou quantidade. É definido pelas relações:

Geralmente, o índice médio não representa nenhum dos itens considerados, levando a uma distorção dos valores encontrados. Devido a essas limitações, esses índices não serão estudados, mesmo porque sua utilização é restrita a alguns casos específicos.

3.2.2 Números-índices agregativos (ou compostos) ponderados Apesar de os índices de preços serem de grande utilidade, existem variáveis sujeitas a alterações no tempo que não se expressam em termos de preços. Para variáveis definidas em unidades físicas, usam-se índices de quantidades.

56


AULA 5 - NÚMEROS ÍNDICES

Além disso, pode-se querer saber até que ponto as variações de valor (preço x quantidade), são devidas a variações de preço, sem precisarmos considerar variações de quantidade. Uma forma de realizar isso é fazer as quantidades do período corrente iguais às quantidades do período base. Dessa forma, a única diferença será nos preços entre os dois períodos. Calcula-se um Índice composto a partir de dados referentes a um conjunto de bens ou serviços para determinado período de tempo, todos eles expressos na mesma unidade de medida. Esses índices permitem medir as alterações de preços, quantidades ou valores entre vários períodos de tempo relativamente ao mesmo período base. Os índices agregativos ponderados mais conhecidos são os índices de Laspeyres, Paasche e Fischer, tanto para preços como para quantidades.

3.2.2.1 Índices de Laspeyres É calculado pela média aritmética ponderada dos relativos, sendo que a ponderação é feita utilizandose os preços ou as quantidades da época base. Laspeyres-preço:

Laspeyres-quantidade:

3.2.2.2 Índices de Paasche É semelhante ao índice de Laspeyres, sendo que a ponderação é feita utilizando-se os preços e as quantidades da época atual. Paasche-preço:

Paasche-quantidade:

3.2.2.3 Índices de Fisher (fórmula ideal) É a média geométrica (raiz quadrada) dos respectivos índices de Laspeyres e de Paasche. Fisher-preço:

57


ESTATÍSTICA APLICADA

Fisher-quantidade:

Exemplo de aplicação: na fabricação de determinado produto são utilizados quatro itens diferentes de matéria-prima. A tabela resume os preços e as quantidades utilizadas desses materiais nos últimos quatro anos. Determinar os índices agregativos ponderados de Laspeyres, Paasche e Fischer - preço e quantidade - para os anos de 2006, 2007 e 2008, tomando como ano-base 2005.

a) Cálculo dos índices de Laspeyres: a1) Laspeyres-preço:

Conforme pode ser verificado na fórmula, precisa-se calcular a soma dos produtos Pt.Q0 e P0.Q0. Para facilitar os cálculos e evitar possíveis erros é recomendado utilizar a tabela:

58


AULA 5 - NÚMEROS ÍNDICES

Aplicando os valores da tabela na fórmula resulta:

a2) Laspeyres-quantidade:

Para facilitar os cálculos e evitar possíveis erros é recomendado utilizar a tabela:

Aplicando os valores da tabela na fórmula resulta:

b) Cálculo dos índices de Paasche: 59


ESTATÍSTICA APLICADA

b1) Paasche-preço:

Aplicando os valores da tabela na fórmula resulta:

b2) Paasche-quantidade:

Aplicando os valores da tabela na fórmula resulta:

60


AULA 5 - NÚMEROS ÍNDICES

c) Cálculo dos índices de Fisher: c1) Fisher-preço:

c2) Fisher-quantidade:

61


ESTATÍSTICA APLICADA

3.3 MUDANÇA DE BASE DE UM NÚMERO-ÍNDICE Às vezes é conveniente mudar a base de um índice de um período para outro. O objetivo de tal mudança pode ser o de tornar o período base mais recente ou pode ser o de tornar comparáveis duas séries com bases diferentes. O processo é simples, dada uma série de números-índices na base antiga. Exige apenas que cada número da série seja dividido pelo número-índice do novo período base. A tabela ao lado ilustra o processo.

3.4 DEFLACIONAMENTO OU INFLACIONAMENTO DE DADOS Para inflacionar ou deflacionar séries de valores podemos usar qualquer um dos deflatores normalmente encontrados em publicações especializadas, tais como: Índice Geral de Preços – IGP, Índice de Custo de Vida – ICV, Índice de Preços no Atacado – IPA, Índice de Preços ao Consumidor – IPC, Índice de Preços ao Consumidor Amplo – IPCA. Para estudar a evolução real dos salários devemos usar o ICV ou o IPC. No caso de dados sobre empresas, podemos utilizar o IGP ou o IPCA. Exemplo: uma empresa possui os dados relativos a seu faturamento no período de 1980 a 1985, apresentados na tabela abaixo. Dado o Índice Geral de Preços – IGP desse período, determinar: a) o faturamento real em termos de 1980; b) o faturamento real em termos de 1985; c) a variação percentual do faturamento real ano a ano.

62


AULA 5 - NÚMEROS ÍNDICES

a) Como se deseja o faturamento real em termos de 1980, deve-se deflacionar os dados (para deflacionar ou inflacionar deve-se dividir diretamente o valor corrente pelo índice), encontrando os resultados a seguir:

Pode-se concluir que o faturamento em termos reais cresceu até 1982, passando a decrescer continuadamente desde então.

O poder aquisitivo de uma unidade monetária = 1 índice A deflação pode ser calculada pela relação: VR é o valor real e VN o valor nominal VR = VN x 100 índice

b) Para se obter o faturamento real em termos de 1985, deve-se inflacionar os dados anteriores. Assim, inicialmente é necessária uma mudança de base no IGP, dado originalmente como IGP1980=100, para IGP1985=100.

c) A variação real do faturamento deve ser feita sobre o faturamento a preços constantes, podendo aqui ser usado tanto o encontrado no item a (1980 = 100) como no item b (1985 = 100). Usando esses últimos dados, teremos:

63


ESTATÍSTICA APLICADA

3.5 PRINCIPAIS ÍNDICES BRASILEIROS 3.5.1 IPC – Índice de Preços ao Consumidor IPC / Fipe (São Paulo): é calculado com base em 4 conglomerados, aproximadamente 300 endereços, sistematicamente pesquisados. A ponderação é alterada sempre que ocorram mudanças significativas. São pesquisados mais de 250 produtos, gerando cerca de 50.000 preços a consultar. É calculado pela média geométrica dos relativos e divulgado semanalmente. ICV/Dieese (São Paulo): são utilizados aproximadamente 350 produtos, pesquisados em famílias paulistanas com renda mensal entre 1 e 30 salários mínimos. INPC - Índice Nacional de Preços ao Consumidor: é calculado com base nos preços de 11 regiões metropolitanas (São Paulo, Rio de Janeiro, Porto Alegre, Belo Horizonte, Salvador, Recife, Belém, Fortaleza, Curitiba, Goiânia e Brasília), num total de 116 municípios, em famílias com renda entre 1 e 8 salários mínimos. São utilizados, aproximadamente, 350 produtos e 140.000 preços a pesquisar. São obtidos índices regionais. O índice nacional é obtido por ponderação dos regionais. O índice para produtos sazonais é calculado por Paasche. IPCA – Índice de Preços ao Consumidor Ampliado: variante do INPC, utiliza renda entre 1 e 40 salários mínimos.

3.5.2 IPA – Índice de Preços por Atacado Utiliza, aproximadamente, 430 produtos, totalizando cerca de 10.000 preços atualizados mensalmente. O cálculo do índice é feito por Laspeyres com base móvel.

3.5.3 INCC – Índice Nacional da Construção Civil É obtido com base nos preços e quantidades padrões consumidas na construção de casas térreas (em média 82 m²) e edifícios com quatro, oito e doze pavimentos. São considerados 427 itens de materiais de construção, serviços e mão de obra.

3.5.5 IGP – Índice Geral de Preços Calculado pela FGV - Fundação Getúlio Vargas, utiliza bens e serviços, assim como os respectivos pesos, atualizados, sistematicamente, de acordo com o momento econômico. Utiliza a fórmula de Laspeyres de base móvel. É a média ponderada do IPA (0,6), do IPC (0,3) e do INCC (0,1).

64


AULA 5 - NÚMEROS ÍNDICES

BIBLIOGRAFIA Básica: CRESPO, A. A. Estatística Fácil. 18. ed. São Paulo: Saraiva, 2002. MARTINS, G. de A. Estatística Geral e Aplicada. 3. ed. São Paulo: Atlas, 2006. SPIEGEL, M. R. Estatística. 3. ed. São Paulo: Makron Books, 2004.

Complementar: TRIOLA, M. F. Introdução à Estatística.10. ed. Rio de Janeiro: LTC, 2008. BUSSAB, W.O; MORETITIN, P. A. Estatística básica. 5. ed. São Paulo: Saraiva, 2002.

65



AULA 6 Probabilidades 1. INTRODUÇÃO

A

teoria das probabilidades é uma ferramenta importante da Estatística para tomada de decisão em situações de incerteza. O conhecimento dos fundamentos da probabilidade é fundamental, por exemplo, no estudo da Inferência Estatística.

Historicamente, a teoria das probabilidades teve início como teoria dos jogos de azar no século XVI, com Pascal e Fermat, que estudaram diversos problemas relativos a esses jogos. Mais adiante, em 1713, J. Bernoulli demonstrou que em experimentos aleatórios, isto é, ao acaso, a frequência relativa se aproxima da probabilidade. Um marco no desenvolvimento da probabilidade ocorreu em 1812, quando Laplace publica o seu livro Theorie Analytique des Probabilités. No século XIX o cálculo das probabilidades continuou sua expansão, sendo hoje utilizado não somente em jogos de azar, mas também, por exemplo, na área de seguros, engenharia de segurança, aeronáutica, eletrônica, administração industrial e patrimonial e em uma infinidade de outras aplicações.


ESTATÍSTICA APLICADA

2. DEFINIÇÕES 2.1. EXPERIMENTOS ALEATÓRIOS (E) São aqueles que, mesmo repetidos várias vezes sob condições semelhantes apresentam resultados imprevisíveis, sendo impossível prever, com absoluta certeza, qual resultado será obtido. Exemplos:

» » retirar uma carta de um baralho com 52 cartas e observar seu “naipe”; » » jogar uma moeda 10 vezes e observar o número de coroas obtidas; » » jogar um dado e observar o número obtido na face superior; » » retirar uma bola de uma urna e observar sua cor.

2.2. ESPAÇO AMOSTRAL (S) Para cada experimento aleatório E, define-se Espaço Amostral S como sendo o conjunto de todos os resultados possíveis desse experimento. Exemplos: a) Se o experimento aleatório considerado for E = Jogar um dado e observar o resultado. O espaço amostral desse experimento aleatório E será dado pelo conjunto: S = {1, 2, 3, 4, 5, 6}, uma vez que apenas esses são os resultados possíveis daquele experimento. b) Para o experimento aleatório E = Jogar duas moedas e observar o resultado. O espaço amostral desse experimento será o conjunto formado pelos elementos: S = {(cara,cara), (cara,coroa), (coroa,cara), (coroa,coroa)}, uma vez que apenas esses são os resultados possíveis daquele experimento. Cada um dos elementos de S, que correspondem a um resultado possível, recebe o nome de Ponto Amostral. Dessa forma, por exemplo, o par (cara, cara) é um ponto amostral, do espaço amostral, do experimento aleatório jogar duas moedas e observar o resultado.

68


AULA 6 - PROBABILIDADES

DADOS:

E = Jogar um dado e observar o resultado - S = {1, 2, 3, 4, 5, 6} = 6 elementos E = Jogar dois dados e observar o resultado - S = {(1,1) (1, 2), (1,3) (1,4) (1,5) (1,6) (2,1) (2,2) (2,3)... (6,6)} = 36 pares E = Jogar três dados e observar o resultado - S = {(1,1,1) (1,1,2), (1,1,3) (1,1,4)(1,1,5) (1,1,6) (2,1,1) (2,1,2) (2,1,3) ...(6,6,6)} = 216 trincas Essas quantidades de elementos, pares, trincas etc, podem ser calculadas por análise combinatória, tratando-se de Arranjos com Repetição de “n” elementos “k” a “k”. A fórmula genérica é dada por:

Exemplo: Seja o conjunto S = {1, 2, 3, 4, 5 e 6} os pontos de um dado. Quantos pares de pontos são possíveis de se obter quando se lança dois dados?

A6(2) = 62 = 36

Dessa forma, podemos considerar que para:

1 dado - A6(1)

= 61 = 6 elementos

2 dados - A6(2)

= 62 = 36 pares

3 dados - A6(3)

= 63 = 216 trincas

Pode-se construir uma matriz dos resultados possíveis quando se lançam dois dados, que será útil a seguir, para o cálculo das probabilidades desse evento.

69


ESTATÍSTICA APLICADA

MOEDAS:

E = Jogar uma moeda e observar o resultado S = {c,k} = 2 elementos E = Jogar duas moedas e observar o resultado S = {(c,c) (c, k), (k,c) (k,k)} = 4 pares E = Jogar três moedas e observar o resultado S = {(c,c,c) (c,c,k), (c,k,c) (k,c,c) (c,k,k) (k,c,k) (c,k,k) (k,k,k)} = 8 trincas Nesse caso também valem as considerações de Arranjos com Repetição, e então o espaço amostral será: 1 moeda - A2(1)

= 21

= 2 elementos

2 moedas - A2(2)

= 22

= 4 pares

3 moedas - A2(3) = 23 = 8 trincas Para 3 moedas, pode-se construir a árvore de probabilidades para definição do espaço amostral (onde c=cara e k = coroa): Esta é a árvore de probabilidade para definição do espaço amostral no lançamento de 3 moedas:

2.3. EVENTO É um conjunto de resultados de um experimento, ou seja, é um subconjunto do espaço amostral S. Sejam os seguintes eventos, quando do lançamento de 1 dado:

» » Evento A: obter número ímpar na face superior de um dado; » » Evento B: obter um número menor ou igual a 6 na face superior de um dado; » » Evento C: obter o número 1 na face superior de um dado; » » Evento D: obter um número maior que 6 na face superior de um dado. Como o espaço amostral é dado por S = {1, 2, 3, 4, 5, 6}, temos: A= {1, 3, 5}  A é um evento qualquer de S B= {1, 2, 3, 4, 5, 6}  B é um evento certo de S (B = S) C= {1}  C é um evento elementar de S D= Ø (vazio)  D é um evento impossível de S

2.3.1 Evento Simples ou Elementar É o evento formado apenas por um elemento do espaço amostral. Exemplos: A = { 5 } B = { ccc } C = { Ás de ouro }.

2.3.2 Evento Composto É o evento formado por dois ou mais elementos do espaço amostral. Exemplos: A = { 1, 3, 5 } B = { cc, ck, kc }.

70


AULA 6 - PROBABILIDADES

2.3.3 Evento Certo É aquele que ocorre em qualquer uma das realizações do experimento. Exemplo: obter um número entre 1 e 6 no lançamento de 1 dado.

2.3.4 Evento Impossível É aquele que não ocorre em qualquer uma das realizações do experimento. Exemplo: obter 0 no lançamento de 1 dado.

2.3.5 Evento Complementar Um evento complementar de A é o evento formado por todos os elementos do espaço amostral que não pertencem à A. Exemplo: no lançamento de um dado, seja o evento A obter um número ímpar. Portanto, A = { 1, 3, 5 }. O complementar de A será: Ac = { 2, 4, 6 }. Para eventos complementares são válidas as relações: A Ò Ac = Ø A Ó Ac = S.

2.3.6 Eventos Mutuamente Exclusivos Dois eventos A e B são ditos mutuamente exclusivos quando não possuírem elementos em comum, ou seja, quando A Ò B = Ø.

2.3.7 Eventos Independentes Dois eventos A e B são ditos independentes quando o resultado de um deles não interferir no resultado do outro. Exemplo: o lançamento simultâneo de dois dados.

2.3.8 Eventos Condicionais Dois eventos são ditos condicionais quando a ocorrência de um interferir na ocorrência do outro. Exemplo: extração de cartas de um baralho.

2.3.9 Evento Soma (ou união) É o evento constituído por todos os elementos dos eventos que serão reunidos. Exemplo: A = { 2, 3, 4 } B = { 3, 5. 7 } Soma = { 2, 3, 4, 5, 7 }

71


ESTATÍSTICA APLICADA

2.3.10 Evento Produto (ou interseção) É o evento formado pelos elementos comuns a ambos. Exemplo: A = { 2, 3, 4 } e B = { 3, 5. 7 } Produto = { 3 }

2.4 DEFINIÇÃO DE PROBABILIDADE Chama-se Probabilidade de um evento A, pertencente ao espaço amostral S, o número P(A), tal que:

Ou simplesmente:

Exemplo: nos quatro eventos A, B, C e D do lançamento de um dado, acima citado, têm-se as seguintes probabilidades: A= {1, 3, 5}  P(A) = 3/6 = 1/2 B= {1, 2, 3, 4, 5, 6}  P(B) = 6/6 =1 C= {1}  P(C) = 1/6 D= Ø (vazio)  P(D) = 0/6 = 0 Portanto: a probabilidade de um evento certo é 1  P(S) = 1 a probabilidade de um evento impossível é 0  P(Ø) = 0 a probabilidade de um evento qualquer está entre 0 e 1 (0 � P(A) 1) a probabilidade de um evento elementar é 1 / n  P(E) = 1 / n O valor da probabilidade tem obrigatoriamente que estar contido no intervalo de 0 a 1 (ou de 0% a 100%). Não tem sentido falar em probabilidade maior do que 1 ou menor do que zero.

3. AXIOMAS DE PROBABILIDADE Sendo P(A) a probabilidade de ocorrência de um determinado evento A, sendo que A está contido num espaço amostral S, então: a) a probabilidade de ocorrência de um evento qualquer é um número real situado no intervalo [0,1]  0 ≤ P(A) ≤ 1

72


AULA 6 - PROBABILIDADES

b) a probabilidade do evento certo (sucesso total) é igual à unidade  P(S) = 1 c) se A e B forem dois eventos mutuamente exclusivos, então é válida a relação P(A Ò B) = P(A) + P(B) Exemplo: no lançamento de um dado, a probabilidade de se obter o ponto 3 ou o ponto 5 será: P(3 ou 5) = 1 / 6 + 1 / 6 = 2 / 6 = 1/3. Note que os pontos de um dado são mutuamente exclusivos.

4. TEOREMAS DE PROBABILIDADE 1) A Probabilidade do evento impossível (Ø) é nula  P(Ø) 0 Exemplo: em uma urna há 5 bolas vermelhas. Qual a probabilidade de retirarmos uma bola branca? Como não há bolas brancas na urna, esse evento é impossível e, portanto, a probabilidade é zero  P(Ø) =0 2) Se Ac é um evento complementar de A  P(Ac) = 1 – P(A) Exemplo: sabemos que a probabilidade de tirar o 2 no lançamento de um dado é P(A) = 1/6. Logo, a probabilidade de não tirar o 2 será P(Ac) = 1 – 1/6 = 5/6. 3) Se o evento A estiver contido no evento B, (A  B)  P(A) ≤ P(B) Exemplo: seja o evento B sair ponto ímpar quando do lançamento de um dado: B = {1, 3, 5} e o evento A sair o ponto 1: A = {1}. Então, P(B) = 3/6 e P(A) =1/6. Como A  B  P(A) < P(B). 4) Se A e B são dois eventos quaisquer  P(A Ó B) = P(A) + P(B) – P(AÒB) Exemplo: qual a probabilidade de se retirar de um baralho de 52 cartas, uma carta vermelha ou um rei? Nesse caso, os eventos não são mutuamente exclusivos, pois existem duas cartas vermelhas do rei. Então, P(vermelha ou rei) = P(vermelha) + P(rei) – P(vermelha e rei). Se não pensarmos assim, contaríamos duas cartas por duas vezes. Dessa forma, teremos: P(vermelha ou rei) = 26/52 + 4/52 – 2/52 = 28/52 = 7/13 ou 52%.

5. PROBABILIDADE DE EVENTOS INDEPENDENTES Se A e B são eventos independentes  P(A Ò B) = P(A) x P(B) Exemplo: no lançando dois dados, qual a probabilidade de se obter 1 no primeiro e 5 no segundo? A probabilidade de obtermos 1 no primeiro dado será: P(A)=1/6. A probabilidade de obtermos 5 no segundo dado será: P(B)=1/6. Logo, a probabilidade de obtermos simultaneamente 1 no primeiro e 5 no segundo será: P(1 e 5) = 1/6 x 1/6 = 1/36 (2,8%).

73


ESTATÍSTICA APLICADA

6. PROBABILIDADE CONDICIONAL Sejam dois eventos A e B pertencentes ao espaço amostral S. Denominamos P(A/B) à probabilidade de ocorrência do evento A, sabendo-se que o evento B já ocorreu. (lê-se: probabilidade condicional de A dado B).

» » P(A/B) = P(A Ò B) / P(B) Exemplo: consideremos 250 funcionários de uma grande empresa dos quais 100 são homens (H) e 150 são mulheres (M). 110 são gerentes (G) dos quais 40 são homens e 140 são diretores (D), sendo que 80 são mulheres. Um funcionário é sorteado ao acaso. Qual a probabilidade de que seja diretor, dado que é mulher? Observamos que P(D Ò M) = 80/250 e P(M) = 150/250. Aplicando a definição de Probabilidade Condicional: P(A/B) = P(A Ò B) / P(B), que no exemplo corresponde a P(D/M) = P(D Ò M) / P(M).

» » P(D/M) = P(80/250) / P(150/250) = 80/150 A probabilidade condicional, via de regra, pode ser determinada pela observação de um quadro resumo das ocorrências. No exemplo acima, poderíamos montar a seguinte tabela:

Fica fácil perceber que P(D/M) = 80/150, pois se pode visualizar que dado mulher resume o espaço amostral de 250 para 150, e que diretores mulheres são 80. Nessa linha de raciocínio, como ficaria P(G/H)? Homens somam 100 e gerentes homens são 40. Então P(G/H) = 40/100. E se fosse pedido o inverso, P(H/G)? Gerentes são 110 e gerentes homens são 40. Portanto P(H/G) = 40/110. Cuidado! Se fosse solicitada a probabilidade de um homem ser gerente seria apenas 40/250, pois não foi dito a priori que só seriam considerados os homens!

74


AULA 6 - PROBABILIDADES

Relembrando a teoria dos conjuntos e aplicando em probabilidades: União (Ó) significa “ou” e então se somam as probabilidades P(A Ó B) = P(A) + P(B) - caso de mutuamente exclusivos P(A Ó B) = P(A) + P(B) – P(AÒB) - caso geral “OU” significa alternância (tanto faz) Intersecção (Ò) significa “e” e então se multiplicam as probabilidades P(A Ò B) = P(A) x P(B) “E” significa simultaneidade (obrigatoriedade)

Exemplos: União: no lançamento de um dado, a probabilidade de se obter 2 ou 6? (mutuamente exclusivos). P(A Ó B) = P(A ou B) = P(3 Ó 5) = P(3 ou 5) = 1/6 + 1/6 = 2/6 =1/3. Interseção: no lançando de dois dados, qual a probabilidade de se obter 1 no primeiro e 5 no segundo? P(A Ò B) = P(A e B) = P(1Ò 5) = P(1 e 5) = 1/6 x 1/6 = 1/36.

75


ESTATÍSTICA APLICADA

BIBLIOGRAFIA Básica: MARTINS, Gilberto de Andrade. Estatística Geral e Aplicada. 3. ed. São Paulo: Atlas, 2006 MORETTIN, Luiz Gonzaga. Estatística Básica. São Paulo: Makron Books, 2000. CRESPO, Antonio Arnot. Estatística Fácil. 18. ed. São Paulo: Saraiva, 2002.

Complementar: BUSSAB, W de O; MORETITIN, P. A. Estatística básica. 5. ed. São Paulo: Saraiva, 2002. TRIOLA, Mário F. Introdução à Estatística.10. ed. Rio de Janeiro: LTC, 2008. COSTA NETO, P. L. O; Cymbalista, M. Probabilidades. São Paulo: Edgard Blucher, 1974.

76


AULA 7 Distribuição Discreta de Probabilidades 1. INTRODUÇÃO

A

distribuição de probabilidade é um modelo estatístico que descreve o que provavelmente ocorrerá em vez do que realmente aconteceu. Por exemplo, jogando-se repetidamente um dado, usando o conceito de estatística descritiva, seria coletado os dados amostrais. Usando o conceito de probabilidades, calcula-se a probabilidade de cada resultado possível. Pode-se construir uma distribuição de probabilidade apresentando os resultados possíveis junto com as frequências esperadas.

2. VARIÁVEIS ALEATÓRIAS O resultado de um experimento probabilístico, frequentemente uma contagem ou uma medida, é chamado de variável aleatória. Uma variável aleatória será discreta se houver um número finito ou contável de resultados possíveis que possam ser enumerados.


ESTATÍSTICA APLICADA

2.1. DEFINIÇÃO DE VARIÁVEL ALEATÓRIA Seja S o espaço amostral associado a um determinado experimento aleatório. Uma função X que associe a cada elemento de S um número real X é denominada variável aleatória. Exemplo: seja X o número de coroas obtido no lançamento de duas moedas (X é variável aleatória). Para esse experimento o espaço amostral será: S={cc, ck, kc, kk} (c = cara e k = coroa). A variável X poderá assumir os valores: 0, 1 e 2, onde: X = 0  corresponde ao resultado do evento cc  nenhuma coroa X = 1  corresponde ao resultado do evento ck ou kc  uma coroa X = 2  corresponde ao resultado do evento kk  duas coroas

3. DISTRIBUIÇÃO DE PROBABILIDADES Seja “X” uma variável aleatória que pode assumir os valores X1, X2, X3,..., Xn. A cada valor Xi corresponde a pontos do espaço amostral. Associamos, então, a cada valor Xi a probabilidade P(Xi) de ocorrência de tais pontos no espaço amostral. Assim, temos:

Os valores X1, X2, X3,..., Xn e seus correspondentes P(X1), P(X2), P(X3),..., P(Xn) definem uma distribuição de probabilidade. Exemplo: lançamento de três moedas. S = {ccc, cck, ckc, ckk, kcc, kck, kkc, kkk} X = número de caras = 0, 1, 2, 3 X = 0  kkk

78


AULA 7 - DISTRIBUIÇÃO DISCRETA DE PROBABILIDADES

X = 1  ckk, kck, kkc X = 2  cck, ckc, kcc X = 3  ccc A distribuição de probabilidades será: XI

0

1

2

3

P(Xi)

1/8

3/8

3/8

1/8

A média amostral de uma variável discreta é dada por: ∑ Xi.Fi/n. Como Fi/n = fi, então: ∑ xi.fi, que é muito semelhante à fórmula da média amostral dada acima: µ = ∑ Xi.P(Xi). Então, à medida que o tamanho da amostra aumenta, a frequência relativa (fi) aproxima-se de P(Xi), ou seja, a média amostral aproxima-se da média populacional.

4. VALOR ESPERADO DE UMA VARIÁVEL ALEATÓRIA Seja X uma variável aleatória discreta que assume os valores X1, X2, X3, ..., Xn com as respectivas probabilidades P(X1), P(X2), P(X3),..., P(Xn). O valor esperado de X ou esperança matemática de X, ou, ainda, a média de X é definida pela relação:

Exemplo: considere um jogo em que três moedas são lançadas e se recebe R$ 5,00 por cada ocorrência de coroa. Quanto se esperaria ganhar se o jogo fosse realizado apenas uma vez (ou seja, qual o valor esperado de uma jogada)?

µ = E(X) = ∑ xi . P(Xi) = 0,1/8 + 5.3/8 +10.3/8 + 15.1/8 = R$ 7,50

79


ESTATÍSTICA APLICADA

5. VARIÂNCIA DE UMA VARIÁVEL ALEATÓRIA É o grau de espalhamento da variável X. É a medida que dá o grau de dispersão (ou de concentração) dos valores da variável em torno da média, sendo dada por:

Onde:

E(X2) = ∑ xi2.P(Xi) e E(X) = ∑ xi.P(Xi).

Exemplo: suponha que o Gerente de Vendas de uma grande construtora tenha levantado a seguinte distribuição de probabilidades para as vendas de apartamentos de alto padrão, por semana:

6. DISTRIBUIÇÕES DISCRETAS DE PROBABILIDADE Os principais tipos de distribuição discreta de probabilidades são:

» » Distribuição de Bernoulli » » Distribuição Binomial » » Distribuição de Poisson

6.1. DISTRIBUIÇÃO DE BERNOULLI Quando executamos um experimento (ensaio) do tipo Bernoulli, associado a esse ensaio, temos uma variável aleatória com o comportamento descrito abaixo. Suponhamos a realização de um experimento E, cujo resultado pode ser um sucesso (se acontecer o evento que nos interessa) ou um fracasso (o evento não se realiza). Seja p a probabilidade de sucesso e q a probabilidade de fracasso, com p + q = 1. Definimos a seguinte variável aleatória discreta: X = nº de sucessos em uma única tentativa do experimento. X assume os valores:

» » X = 1 se o resultado for um sucesso, com P(X=1) = p » » X = 0 se o resultado for um fracasso, com P(X=0) = q

80


AULA 7 - DISTRIBUIÇÃO DISCRETA DE PROBABILIDADES

Nessas condições, a variável aleatória X tem distribuição de Bernoulli e sua função de probabilidade é dada por: P(X = x) = px.q1-x Utilizando as propriedades da média e da variância, pode-se facilmente demonstrar que: Esperança (média)  E(X) = μ = p Variância  Var(X) = σ2(X) = p.q Exemplo: uma urna tem 30 bolas brancas e 20 verdes. Retira-se uma bola dessa urna. Seja X: nº de bolas verdes. Calcular E(X), Var(X) e determinar P(X). Solução: X = 0  q = 30/50 = 3/5 X = 1  p = 20/50 = 2/5 Portanto P(X = x) = (2/5)x.(3/5)1-x E(X) = p = 2/5 Var(X) = p.q = (2/5).(3/5) = 6/25

6.2. DISTRIBUIÇÃO BINOMIAL É uma distribuição discreta de probabilidade, aplicável sempre que o processo de amostragem for do tipo Bernoulli, com a diferença que agora consideramos “n” tentativas independentes de um experimento aleatório. Cada tentativa admite apenas dois resultados: fracasso com probabilidade “q”; e sucesso com probabilidade “p”, com p + q = 1. Seja X = número de sucessos em “n” tentativas, então:

Números Binomiais: Dados dois números naturais n e p com n > p, chama-se número binomial n sobre p, indicado por, ao número definido pela relação:

Ao número n chamamos numerador do binomial e, ao número p, denominador do binomial. Esse operador matemático também é utilizado em Análise Combinatória: representando por Cn,k o número total de combinações de n elementos, tomados k a k (taxa k), temos a seguinte fórmula para combinações simples:

Que nada mais é, do que o número binomial n sobre k, citado acima na fórmula da distribuição binomial, e que deve ser utilizada para os cálculos.

81


ESTATÍSTICA APLICADA

Exemplo: no ano de 2008, 70% dos dias apresentaram uma valorização do IBOVESPA. Sorteia-se 4 dias ao acaso.

a) Determine a probabilidade de que em nenhum deles tenha havido valorização. b) Determine a probabilidade de que em todos eles tenha havido valorização. c) Determine a probabilidade de que em ao menos a metade deles tenha havido valorização. Pelo enunciado, imediatamente se obtém: n = 4; p = 0,7 e q = 0,3.

a) n = 4 e k = 0  C4,0 = 4!/0!.(4 - 0)!  C4,0 = 4x3x2x1 / (1)x(4x3x2x1) = 1 P(X = 0) = 1 x (0,7)0 x (0,3)4  P(X = 0) = 0,008 b) n = 4 e k = 4 C4,4 = 4!/4!.(4 - 4)!  (0,7)4 x (0,3) 0  P(X = 4) = 0,240 c) n = 4 e k = 2 C4,2 = 4!/2!.(4 - 2)!  x (0,3)2  P(X = 2) = 0,044

C4,4 = 4x3x2x1 / (4x3x2x1)x(1) = 1 P(X = 4) = 1 x

C4,2 = 4x3x2x1 / (2x1)x(2x1) = 6 P(X = 2) = 6 x (0,7)2

Exemplo: Uma moeda é jogada 10 vezes. Calcule as seguintes probabilidades:

a) de ocorrer 6 caras; b) de ocorrer pelo menos duas caras; c) de não ocorrer nenhuma coroa; d) de ocorrer pelo menos uma coroa. Solução: nesse caso, trata-se de uma distribuição binomial, onde: n = 10; p = q = 1/2. Condição: (X= k) = sucesso = obter cara.

a) k = 6  C10,6 = 10!/6!.(10 - 6)!  C10,6 = (10x9x8x7x6!) / (6!) x (4x3x2x1) = 210 P(X = 6) = 210 x (1/2)6 x (1/2)4 = 210 x 1/64 x 1/16 = 210/1024 = 105/512

82


AULA 7 - DISTRIBUIÇÃO DISCRETA DE PROBABILIDADES

b) Para ocorrer pelo menos duas caras, não pode ocorrer 0 caras e nem 1 cara. Portanto, basta calcular essas probabilidades e subtrair do total: K = 0 ou k = 1  C10,0 = 1; C10,1 = 10 P(X = 0) = 1 x (1/2)0 x (1/2)10 = 1/1024 P(X = 1) = 10 x (1/2)1 x (1/2)9 = 10/1024 P(X ≥ 2) = 1 – 11/1024 = 1013/1024 c) K = 10  C10,10 = 1 P(X = 10) = 1 x (1/2)10 x (1/2)0 = 1/1024

c) Para ocorrer pelo menos uma coroa, não pode ocorrer 0 coroa, ou seja, não pode ocorrer 10 caras. Basta calcular essas probabilidades e subtrair do total. Do item anterior, P(X = 10) = 1/1024. Portanto: P(X ≤ 9) = 1 – 1/1024 = 1023/1024.

6.2.1. Esperança e Variância Se a variável “X” tem distribuição Binomial, com parâmetros “n” e “p”, então temos que:

» » E(X) = n.p » » Var(X) = n.p.q Exemplo: Qual a média diária esperada de cheques sem fundo emitidos por clientes de uma determinada agência bancária, considerando que a probabilidade de um cheque não ter fundos é 0,05 e que os clientes daquela agência emitam 200 cheques por dia? Qual a variância? p = 0,05 q = 0,95 n = 200 E(X ) = n × p = 200×0,05 E( X ) = 10 200×0,05×0,95 Var(X ) = 9,5 Var(X) = n× p × q = ⇒

6.3. DISTRIBUIÇÃO DE POISSON

A distribuição de Poisson representa um modelo probabilístico adequado para o estudo de um grande número de fenômenos observáveis. É útil para descrever as probabilidades do número de ocorrências num intervalo contínuo (em geral, tempo ou espaço). (WIKIPÉDIA, 2013). DISTRIBUIÇÃO DE POISSON. In: WIKIPÉDIA, a enciclopédia livre. Flórida: Wikimedia Foundation, 2013. Disponível em: <http://pt.wikipedia.org/w/index.php?title=Distribui%C3%A7%C3%A3o_de_Poisson&oldid=35803616>. Acesso em: 10 jun. 2013.

83


ESTATÍSTICA APLICADA

Exemplos:

» » defeitos por unidade de área; » » acidentes por unidade de tempo; » » clientes numa loja por unidade de tempo; » » chamadas telefônicas por unidade de tempo; » » emendas por unidade de comprimento. Apesar de a unidade de medida (área, comprimento, tempo...) ser contínua, a variável aleatória (número de ocorrências) é discreta. Além disso, as ocorrências não são contáveis, isto é, não é possível contar os acidentes que não ocorreram, nem o número de chamadas telefônicas que não foram realizadas. A utilização da distribuição de Poisson baseia-se nas seguintes hipóteses:

» » em intervalos de mesmo tamanho, são iguais as probabilidades das ocorrências do mesmo número de sucessos; » » a probabilidade de mais de uma ocorrência num intervalo pequeno é desprezível; » » eventos definidos em intervalos não sobrepostos são independentes; » » a distribuição do número de ocorrências num intervalo depende somente do tamanho do intervalo.

A probabilidade de um dado número “X” de sucessos em uma distribuição de Poisson é dada pela relação: Onde: λ = coeficiente de proporcionalidade (ou média do processo) x = número de sucessos (é uma variável aleatória) e = 2,718 = base dos logaritmos naturais

6.3.1. Esperança e Variância

84


AULA 7 - DISTRIBUIÇÃO DISCRETA DE PROBABILIDADES

Exemplo: Em um determinado processo de produção de perfis de alumínio aparece, em média, uma falha a cada 400 m ou o equivalente a 0,0025 falhas por metro (1/400). Qual a probabilidade de ocorrerem três falhas em 1000 m de perfil? Solução: 1m 1000 m

 = 0,0025 

Portanto:

λ

=x

λ

λ = (1000. 0,0025) / 1  λ = 2,5 P(X=x) = (λx. e-λ) / x!  P(X=3) = (2,53. e-2, 5) / 3! = 0,2138 A probabilidade de ocorrerem três falhas em 1000 m de perfil será de 0,2138 ou 21,38%.

BIBLIOGRAFIA Básica: MARTINS, Gilberto de Andrade. Estatística Geral e Aplicada. 3. ed. São Paulo: Atlas, 2006. MORETTIN, Luiz Gonzaga. Estatística Básica. São Paulo: Makron Books, 2000. CRESPO, Antonio Arnot. Estatística Fácil. 18. ed. São Paulo: Saraiva, 2002.

Complementar: BUSSAB, W de O; MORETITIN, P. A. Estatística básica. 5. ed. São Paulo: Saraiva, 2002. TRIOLA, Mário F. Introdução à Estatística.10. ed. Rio de Janeiro: LTC, 2008. COSTA NETO, P. L. O; Cymbalista, M. Probabilidades. São Paulo: Edgard Blucher, 1974.

85



AULA 8 Distribuição Contínua de Probabilidades 1. INTRODUÇÃO

E

xistem diversos tipos de distribuição de probabilidades de variáveis aleatórias contínuas, tais como a distribuição uniforme, a exponencial, a normal, a distribuição gama, a qui-quadrado, a distribuição t de Student e a F de Snedecor.

Devido à sua maior importância para o estudo da Estatística, será abordada neste capítulo apenas a distribuição normal. Na bibliografia citada existem inúmeros exemplos das demais distribuições de probabilidades de variáveis aleatórias contínuas e suas aplicações.

2. DEFINIÇÕES É a mais importante distribuição de probabilidades, sendo utilizada para o desenvolvimento teórico da estatística. Inúmeras variáveis contínuas que descrevem fenômenos naturais e sociais apresentam distribuição de probabilidades próximas da distribuição normal.


ESTATÍSTICA APLICADA

É conhecida como curva normal, curva de Gauss, curva dos erros acidentais ou distribuição de Gauss, sendo que este deduziu matematicamente a distribuição normal como distribuição de probabilidade dos erros de observação, denominando-a, então, “lei normal dos erros”. De um modo geral, a maior parte dos fenômenos probabilísticos de natureza contínua, e mesmo alguns de natureza discreta, tendem a seguir uma lei de distribuição designada por função de distribuição normal, ou de Gauss. Essa lei de distribuição estabelece que os valores mais frequentes (isto é, os valores a que correspondem às maiores probabilidades) se encontram em torno da média da variável aleatória; quanto mais afastados os valores estão da média (esse afastamento é quantificado em termos de variância), quer acima quer abaixo desta, menos frequentes serão.

2.1 DEFINIÇÃO E CONCEITO DE PROBABILIDADE 2.1.1 Definição Seja X uma variável aleatória contínua. X terá uma distribuição normal, se:

2.1.2. Conceito fundamental A probabilidade de uma variável aleatória tomar um valor entre dois pontos quaisquer é igual à área sob a curva normal entre aqueles pontos.

2.2. CARACTERÍSTICAS DA DISTRIBUIÇÃO NORMAL a) A curva normal é mesocúrtica (tem a forma de um sino).

88


AULA 8 - DISTRIBUIÇÃO CONTÍNUA DE PROBABILIDADES

b) Como a curva é simétrica em torno de x, a probabilidade de ocorrer valor maior do que a média é igual à probabilidade de ocorrer valor menor do que a média, isto é, ambas as probabilidades são iguais a 0,5. c) A curva normal é assintótica em relação ao eixo das abscissas, isto é, aproxima-se indefinidamente do eixo sem, contudo, alcançá-lo. Prolonga-se de ≤∞ a + ∞ (menos infinito a mais infinito). Cada distribuição normal fica completamente caracterizada por sua média μ e seu desvio-padrão σ [ Notação: X ≈ N ( μ; σ2 ) ]; e há uma distribuição normal distinta para cada combinação de média e desvio-padrão.

d) A área total limitada pela curva e pelo eixo das abscissas é igual a 1 (100%). e) Como há um número ilimitado de valores no intervalo de ≤∞ a + ∞, a probabilidade de uma variável aleatória normal tomar exatamente determinado valor é aproximadamente zero. As probabilidades sempre se referem a intervalos de valores.

2.3. CÁLCULO DAS PROBABILIDADES Como fica praticamente impossível o cálculo das áreas sob a curva normal para infinitas combinações de média e desvio-padrão, a fim de se determinar a probabilidade de uma variável aleatória contínua, utiliza-se a Distribuição Normal Padronizada ou Reduzida, por meio de uma transformação de variáveis. Então, se X é uma variável aleatória com distribuição N ( μ; σ2 ), a transformação linear de X para Z será:

Onde Z é uma variável aleatória com distribuição normal padronizada N (0; 1). Existe uma tabela das áreas sob a curva normal padronizada, para cálculo (fácil) de probabilidades. Essa tabela pode ser encontrada no final do capítulo.

2.3.1. Uso da tabela A tabela padronizada de áreas sob a curva normal em função de Z é uma tabela de dupla entrada, onde, com o valor calculado de Z se determina a respectiva área sob a curva. Exemplo: determinar a área sob a curva normal padronizada para Z = 2,65.

Entrando na tabela com 2,6 e 0,05, no cruzamento desses valores será possível encontrar o valor 0,4960, que será a área sob a curva normal para Z = 2,65.

89


ESTATÍSTICA APLICADA

Atenção! Essa área está contida no intervalo 0 < Z < 2,65. A tabela só é válida para valores de Z a partir da origem! Existirão três possibilidades para as áreas sob a curva normal padronizada Z: Caso A: a área sob a curva inicia na origem. É o caso acima, em que se lê diretamente na tabela a área desejada no intervalo 0 < Z < Z1. Caso B: a área sob a curva transpassa a origem. Nesse caso, deve-se efetuar uma leitura entre Z1 < Z < 0, outra entre 0 < Z < Z2 e somar as áreas obtidas. Exemplo: Calcular a área sob a curva normal padronizada no intervalo: -1,53 < Z < 2,15. Conforme a figura, a área será:

0,4370 + 0,4842 = 0,9212. Utiliza-se duas vezes a tabela, sempre determinando as áreas a partir da origem de Z. Caso C: a área sob a curva está afastada da origem. Nesse caso, deve-se calcular a área sob a curva normal padronizada no intervalo 0 < Z < Z1 e subtrair de 0,5 que corresponde à área da metade da curva, conforme ilustrado na figura. Exemplo: calcular a área sob a curva normal padronizada para Z > 0,74. A área desejada é obtida pela subtração de 0,5000 (área que corresponde à metade da curva) da área determinada pela tabela entre 0 e 0,74.

90


AULA 8 - DISTRIBUIÇÃO CONTÍNUA DE PROBABILIDADES

Dois casos são consequência dos anteriores: 1) Cálculo da área sob a curva normal padronizada quando Z1 < Z < Z2, e ambos estiverem do mesmo lado da curva. Exemplo: calcular a área sob a curva normal padronizada quando 1,23 < Z < 1,78. Nesse caso, deve-se calcular a área entre 0 e 1,23, a área entre 0 e 1,78 e subtraí-las.

2) Cálculo da área sob a curva normal padronizada quando Z > Z1 e estiver à esquerda da origem, ou quando Z < Z1 e estiver à direita da origem. Exemplo: calcular a área sob a curva normal padronizada quando Z < 2,25. Nesse caso, deve-se calcular a área entre 0 e 2,25 e somar 0,5, pois não se definiu o limite inferior. O mesmo raciocínio é válido para o caso em que Z > Z1 e estiver à esquerda da origem.

2.3.2. Exemplo de aplicação 1. A duração de certo tipo de pneu, em km rodados, é uma variável aleatória normal com média de 60.000 km e desvio-padrão de 10.000 km. Qual a probabilidade de um pneu escolhido ao acaso durar:

a) mais de 75.000 km? b) entre 63.500 e 70.000 km? c) entre 50.000 e 70.000 km? d) exatamente 65.555 km? Solução: X = vida do pneu  N(m;o)  N(60.000; 10.000)

a) A probabilidade procurada P(X>75.000) é igual à área sombreada da figura abaixo. Utilizando a transformação Z, podemos utilizar as áreas tabeladas da curva normal padronizada. Então:

91


ESTATÍSTICA APLICADA

A probabilidade desejada P(X>75.000) também será igual à área sombreada da figura:

Entrando com Z=1,5 na tabela da normal reduzida, encontra-se o valor 0,4332 que é a probabilidade P(0<Z<1,5). Como se trata do caso C, deve-se subtrair o valor encontrado na tabela de 0,5 (que corresponde à área da metade da curva normal). P(X > 75.000) = P(Z > 1,5) = 0,5 – P(0<Z<1,5) = 0,5 – 0,4332 = 0,0668

b) P(63.500 < X<70.000) = P(Z1<Z<Z2)

Portanto: P(63.500 < X<70.000) = P(0,35<Z<1,00) = = P(0<Z<1,0) - P(0<Z<0,35) = 0,3413 – 0,1368 = 0,2045 c) P(50.000 < X<70.000) = P(Z1<Z<Z2)

Portanto: P(50.000 < X<70.000) = P(-1,00 < Z < 1,00) =

92


AULA 8 - DISTRIBUIÇÃO CONTÍNUA DE PROBABILIDADES

= P(-1,00 <Z< 0) + P(0<Z<1,00) = 0,3413 0,3413 = 0,6826

c) Como em qualquer tipo de variável aleatória contínua, a probabilidade de a variável ser exatamente igual a um único valor é zero. Portanto: P(X=65.555) = 0 2. O gerente de marketing dessa fábrica de pneus deseja fixar uma garantia de km rodados, de tal forma que, se a duração do pneu for inferior à garantia, o pneu será trocado. De quanto deve ser essa garantia para que somente 1% dos pneus sejam trocados? A garantia procurada será o valor de X1 tal que P(X<X1) = 0,01, conforme mostra a figura.

Deve-se procurar na tabela da normal reduzida qual o valor Z1 que determina uma área de 0,5 – 0,01 = 0,49. O valor mais próximo é Z1 = 2,33, que leva a uma área de 0,4901. Logo, utilizando a transformação da normal reduzida, obtém-se a seguinte relação:

O sinal negativo é determinado pelo fato de X1 < μ, logo Z1 < 0. Continuando:

93


ESTATÍSTICA APLICADA

ANEXO DISTRIBUIÇÃO NORMAL PADRONIZADA Z 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9

94

0,00 0,0000 0,0398 0,0793 0,1179 0,1554 0,1915 0,2257 0,2580 0,2881 0,3159 0,3413 0,3643 0,3849 0,4032 0,4192 0,4332 0,4452 0,4554 0,4641 0,4713 0,4772 0,4821 0,4861 0,4893 0,4918 0,4938 0,4953 0,4965 0,4974 0,4981 0,4986 0,4990 0,4993 0,4995 0,4997 0,4998 0,4998 0,4999 0,4999 0,5000

0,01 0,0040 0,0438 0,0832 0,1217 0,1591 0,1950 0,2291 0,2612 0,2910 0,3186 0,3438 0,3665 0,3869 0,4049 0,4207 0,4345 0,4463 0,4564 0,4649 0,4719 0,4778 0,4826 0,4864 0,4896 0,4920 0,4940 0,4955 0,4966 0,4975 0,4982 0,4987 0,4991 0,4993 0,4995 0,4997 0,4998 0,4998 0,4999 0,4999 0,5000

0,02 0,0080 0,0478 0,0871 0,1255 0,1628 0,1985 0,2324 0,2642 0,2939 0,3212 0,3461 0,3686 0,3888 0,4066 0,4222 0,4357 0,4474 0,4573 0,4656 0,4726 0,4783 0,4830 0,4868 0,4898 0,4922 0,4941 0,4956 0,4967 0,4976 0,4982 0,4987 0,4991 0,4994 0,4995 0,4997 0,4998 0,4999 0,4999 0,4999 0,5000

0,03 0,0120 0,0517 0,0910 0,1293 0,1664 0,2019 0,2357 0,2673 0,2967 0,3238 0,3485 0,3708 0,3907 0,4082 0,4236 0,4370 0,4484 0,4582 0,4664 0,4732 0,4788 0,4834 0,4871 0,4901 0,4925 0,4943 0,4957 0,4968 0,4977 0,4983 0,4988 0,4991 0,4994 0,4996 0,4997 0,4998 0,4999 0,4999 0,4999 0,5000

0,04 0,0160 0,0557 0,0948 0,1331 0,1700 0,2054 0,2389 0,2704 0,2995 0,3264 0,3508 0,3729 0,3925 0,4099 0,4251 0,4382 0,4495 0,4591 0,4671 0,4738 0,4793 0,4838 0,4875 0,4904 0,4927 0,4945 0,4959 0,4969 0,4977 0,4984 0,4988 0,4992 0,4994 0,4996 0,4997 0,4998 0,4999 0,4999 0,4999 0,5000

0,05 0,0199 0,0596 0,0987 0,1368 0,1736 0,2088 0,2422 0,2734 0,3023 0,3289 0,3531 0,3749 0,3944 0,4115 0,4265 0,4394 0,4505 0,4599 0,4678 0,4744 0,4798 0,4842 0,4878 0,4906 0,4929 0,4946 0,4960 0,4970 0,4978 0,4984 0,4989 0,4992 0,4994 0,4996 0,4997 0,4998 0,4999 0,4999 0,4999 0,5000

0,06 0,0239 0,0636 0,1026 0,1406 0,1772 0,2123 0,2454 0,2764 0,3051 0,3315 0,3554 0,3770 0,3962 0,4131 0,4279 0,4406 0,4515 0,4608 0,4686 0,4750 0,4803 0,4846 0,4881 0,4909 0,4931 0,4948 0,4961 0,4971 0,4979 0,4985 0,4989 0,4992 0,4994 0,4996 0,4997 0,4998 0,4999 0,4999 0,4999 0,5000

0,07 0,0279 0,0675 0,1064 0,1443 0,1808 0,2157 0,2486 0,2794 0,3078 0,3340 0,3577 0,3790 0,3980 0,4147 0,4292 0,4418 0,4525 0,4616 0,4693 0,4756 0,4808 0,4850 0,4884 0,4911 0,4932 0,4949 0,4962 0,4972 0,4979 0,4985 0,4989 0,4992 0,4995 0,4996 0,4997 0,4998 0,4999 0,4999 0,5000 0,5000

0,08 0,0319 0,0714 0,1103 0,1480 0,1844 0,2190 0,2518 0,2823 0,3106 0,3365 0,3599 0,3810 0,3997 0,4162 0,4306 0,4429 0,4535 0,4625 0,4699 0,4761 0,4812 0,4854 0,4887 0,4913 0,4934 0,4951 0,4963 0,4973 0,4980 0,4986 0,4990 0,4993 0,4995 0,4996 0,4998 0,4998 0,4999 0,4999 0,5000 0,5000

0,09 0,0359 0,0753 0,1141 0,1517 0,1879 0,2224 0,2549 0,2852 0,3133 0,3389 0,3621 0,3830 0,4015 0,4177 0,4319 0,4441 0,4545 0,4633 0,4706 0,4767 0,4817 0,4857 0,4890 0,4916 0,4936 0,4952 0,4964 0,4974 0,4981 0,4986 0,4990 0,4993 0,4995 0,4997 0,4998 0,4998 0,4999 0,4999 0,5000 0,5000


AULA 8 - DISTRIBUIÇÃO CONTÍNUA DE PROBABILIDADES

BIBLIOGRAFIA Básica: MARTINS, Gilberto de Andrade. Estatística Geral e Aplicada. 3. ed. São Paulo: Atlas, 2006. MORETTIN, Luiz Gonzaga. Estatística Básica. São Paulo: Makron Books, 2000. CRESPO, Antonio Arnot. Estatística Fácil. 18. ed. São Paulo: Saraiva, 2002.

Complementar: BUSSAB, W de O; MORETITIN, P. A. Estatística básica. 5. ed. São Paulo: Saraiva, 2002. TRIOLA, Mário F. Introdução à Estatística.10. ed. Rio de Janeiro: LTC, 2008. COSTA NETO, P. L. O; CYMBALISTA, M. Probabilidades. São Paulo: Edgard Blucher, 1974.

95



Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.