ESTAT JOHNSON / KUBY
JOHNSON / KUBY
Conecte-se.
ESTAT
Leia e Estude On-line com a Trilha www.cengage.com.br/4ltr
CONTEÚDO:
Uma técnica de aprendizagem testada por estudantes e aprovada por universidades Estatística Conteúdo desenvolvido por alunos como você Trilha E-book, quizzes, exercícios e mais! Cartões de Revisão do capítulo, cartões técnicos e Trilha permitem que você estude como e quando quiser.
E-BOOK EXERCÍCIOS FLASHCARDS E MAIS!
CCORP
ADM
GO ISBN 13: 978-85-221-1236-4 ISBN 10: 85-221-1236-3
DA EQUIPE Professores e estudantes buscam uma nova técnica para ensinar e aprender. Como podemos fazer isso? Continuamos a questionar! Determinados a realmente nos conectar aos estudantes, conduzimos continuamente grupos de foco, enquetes e entrevistas. Desejamos saber como você aprende e como os professores ensinam. A resposta a esta solução inovadora tem sido impressionante. Mas não paramos aqui. Trabalhamos com centenas de estudantes para saber mais sobre sua experiência com os produtos da coleção 4LTR Press, a fim de compreender o que funciona e o que pode ser aprimorado. O resultado é o ESTAT! Novos exemplos, conteúdos atualizados e contínuos recursos on-line de excelência a um preço incrivelmente baixo. Esta é uma solução de aprendizado e ensino como nenhuma outra! ESTAT combina o que há de melhor – autores experientes, abordagem concisa, porém completa, e ferramentas de aprendizagem criadas para o estudante contemporâneo. E isso é exatamente o que você e seus professores estão pedindo. Estamos reavivando a aprendizagem.
Você está nessa? As ferramentas de aprendizagem utilizadas até alguns anos atrás já não atraem os alunos de hoje, que dominam novas tecnologias, mas dispõem de pouco tempo para o estudo. Na realidade, muitos buscam uma nova abordagem. A Trilha está abrindo caminho para uma nova estratégia de aprendizagem e tudo teve início com alguns professores e alunos. Determinados a nos conectar verdadeiramente com os alunos, conduzimos pesquisas e entrevistas. Conversamos com eles para descobrir como aprendem, quando e onde estudam, e por quê. Conversamos, em seguida, com professores para obter suas opiniões. A resposta a essa solução inovadora de ensino e aprendizagem tem sido excelente. Trilha é uma solução de ensino e aprendizagem diferente de todas as demais!
Os alunos pediram, nós atendemos! • E-book • Exercícios • Cartões de memória • Cartões técnicos • E mais! Plataforma de acesso e conteúdo em língua portuguesa!
Você está nessa?
Você está nessa?
Conceito inovador em soluções de ensino e aprendizagem desenvolvidas de modo a atingir os estudantes contemporâneos
Tradução EZ2TRANSLATE Revisão técnica PROF. MSC. GALO CARLOS LOPEZ NORIEGA Mestre em Engenharia pela Escola Politécnica da Universidade de São Paulo (USP). Gerente do In Company da Trevisan Escola de Negócios. Especialista em Controle Estatístico de Processos. Docente da Business School São Paulo – Universidade Anhembi Morumbi (BSP), da Fundação Instituto de Administração (FIA), do Laboratório de Negócios SSJ (LABSSJ), do Instituto de Ensino e Pesquisa (Insper) e da Fundação Escola de Comércio Álvares Penteado (Fecap).
Sumário reduzido 1 Estatística 2 2 Análise descritiva e apresentação de dados de
uma única variável 22
3 Análise descritiva e apresentação de dados
bivariados 54
4 Probabilidade 74 5 Distribuições de probabilidade (variáveis
discretas) 100
6 Distribuições de probabilidade normais 118 7 Variabilidade amostral 136
8 Introdução à inferência estatística 152 9 Inferências envolvendo uma população 182 10 Inferências envolvendo duas populações 208
11 Aplicações de qui-quadrado 236 12 Análise de variância 254 13 Análise de correlação e regressão linear 272 14 Elementos de estatística não paramétrica 298
Apêndice A: Conceitos introdutórios e lições de revisão 326 Apêndice B: Tabelas 327 Índice remissivo 349
STAT_iniciais.indd 3
18/07/2013 16:05:39
ESTUDE DO SEU JEITO Sem nenhum custo adicional, os estudantes têm acesso a recursos de aprendizagem on-line que incluem cartões de memória para impressão, exercícios, manual de tecnologia e respostas de exercícios. Com os cartões de memória para impressão on-line, os estudantes também têm mais esta maneira para verificar a sua compreensão sobre os principais conceitos estatísticos.
STAT_iniciais.indd 4
Os alunos podem encontrar esses recursos em: www.cengage.com.br/4ltr
18/07/2013 16:05:47
Sumário Parte 1 Estatística descritiva 2 1 Estatística 2 1.1 O que é Estatística? 3 Exemplos de estatística na vida cotidiana 4 Onde a estatística é utilizada 7 A linguagem da estatística 7 Tipos de variáveis 8 1.2 Mensurabilidade e variabilidade 10 1.3 Coleta de dados 11 O processo de coleta de dados 12 Estrutura e elementos de amostragem 12 Métodos de fase única 13 Métodos multiestágio 15 1.4 Estatística e tecnologia 16
2 Análise descritiva e apresentação de dados de uma única variável 22 2.1 Gráficos, diagramas de Pareto e diagramas de ramo e folhas 23 Dados qualitativos 24 Dados quantitativos 25 2.2 Distribuições de frequência e histogramas 29 Construção de uma distribuição de frequência agrupada 30 Histogramas 31 Distribuição de frequência acumulada e ogivas 34 2.3 Medidas de tendência central 35 Determinação da média 35 Determinação da mediana 35 Determinação da moda 36 Determinação da semiamplitude 37 2.4 Medidas de dispersão 39 Desvio padrão de amostra 40 2.5 Medidas de posição 41 Quartis 42
v STAT_iniciais.indd 5
18/07/2013 16:05:56
Sumário Percentis 42 Outras medidas de posição 44 2.6 Interpretação e compreensão do desvio padrão 46 Regra empírica e teste de normalidade 46 Teorema de Chebyshev 47 2.7 A arte da fraude estatística 49 Boa aritmética, estatística ruim 49 Enganação gráfica 49
3 Análise descritiva e apresentação de dados bivariados 54 3.1 Dados bivariados 54 Duas variáveis qualitativas 54 Uma variável qualitativa e uma quantitativa 57 Duas variáveis quantitativas 58 3.2 Correlação linear 60 Cálculo do coeficiente de correlação linear, r 61 Variáveis causais e de confusão 63 3.3 Regressão linear 64 Linha de melhor ajuste 65 Fazendo previsões 68
Parte 2 Probabilidade 74 4 Probabilidade 74 4.1 Probabilidade de eventos 74 Representação do espaço amostral 76 Propriedades dos números de probabilidade 78 Qual a relação entre as probabilidades empírica e teórica? 79 Probabilidades como chances 81 Comparação de probabilidade e estatística 81 4.2 Probabilidade condicional de eventos 82 4.3 Regras da probabilidade 84
vi STAT_iniciais.indd 6
18/07/2013 16:05:59
Sumário Determinação da probabilidade de “não A” 84 Determinação da probabilidade de “A ou B” 84 Determinação da probabilidade de “A e B” 85 4.4 Eventos mutuamente exclusivos 87 Compreensão dos eventos mutuamente exclusivos (e não mutuamente exclusivos) 88 Representação visual e compreensão dos eventos mutuamente excludentes 89 Regra especial da adição 90 4.5 Eventos independentes 90 Compreensão dos eventos independentes (e não independentes) 91 Regra especial da multiplicação 92 4.6 A exclusividade mútua e a independência estão relacionadas? 93 Cálculo de probabilidades e regra da adição 93 Utilização das probabilidades condicionais para determinar a independência 93
5 Distribuições de probabilidade (variáveis discretas) 100 5.1 Variáveis aleatórias 100 5.2 Distribuições de probabilidade de uma variável aleatória discreta 102 Determinação de uma função de probabilidade 103 Média e variância de uma distribuição de probabilidade discreta 104 5.3 Distribuição de probabilidade binomial 105 Determinação de um experimento binomial e suas probabilidades 107 Média e desvio padrão da distribuição binomial 111
6 Distribuições de probabilidade normais 118 6.1 Distribuições de probabilidade normais 118 6.2 Distribuição normal padrão 120 6.3 Aplicações de distribuições normais 124 Probabilidades e curvas normais 124 Utilização da curva normal e z 125
vii STAT_iniciais.indd 7
18/07/2013 16:06:01
Sumário 6.4 Notação 127 Interpretação visual de z(α) 127 Definição de valores de z correspondentes a z(α) 127 Tabela 4 e valores de z comumente usados 128 Definição dos escores-z para áreas delimitadas 128 6.5 Aproximação normal da binomial 129
7 Variabilidade amostral 136 7.1 Distribuições amostrais 136 Criação de uma distribuição amostral das médias 138 Criação de uma distribuição amostral de médias amostrais 138 7.2 Distribuição amostral das médias amostrais 141 Construção de uma distribuição amostral de médias amostrais 142 7.3 Aplicação da distribuição amostral de médias amostrais 145 Conversão de informações de x em escores-z 145 Distribuição de x e aumento do tamanho da amostra individual 146
Parte 3 Estatística inferencial 152 8 Introdução à inferência estatística 152 8.1 A natureza da estimativa 152 8.2 Estimativa da média µ (σ conhecido) 156 Construção de um intervalo de confiança 157 Demonstração do significado de um intervalo de confiança 158 Tamanho da amostra 159 8.3 A natureza dos testes de hipóteses 161 8.4 Teste de hipótese da média µ (σ conhecido): uma abordagem valor-probabilidade 166 Teste de hipótese unicaudal utilizando a abordagem do valor-p 167
viii STAT_iniciais.indd 8
18/07/2013 16:06:02
Sumário Teste de hipótese bicaudal utilizando a abordagem do valor-p 171 Avaliação da abordagem do valor-p 172 8.5 Teste de hipóteses da média µ (σ conhecido): uma abordagem clássica 173 Teste de hipóteses bicaudal utilizando a abordagem clássica 176
9 Inferências envolvendo uma população 182 9.1 Inferências sobre a média µ (σ desconhecido) 182 Utilizando a Tabela de distribuição-t (Tabela 6, Apêndice B) 185 Procedimento do intervalo de confiança 186 Procedimento do teste de hipóteses 187 9.2 Inferências sobre a probabilidade binomial do sucesso 191 Procedimento do intervalo de confiança 192 Definição do tamanho da amostra 193 Procedimento de teste de hipóteses 195 9.3 Inferências sobre a variância e o desvio padrão 198 Valores críticos de qui-quadrado 199 Procedimento do teste de hipóteses 199
10 Inferências envolvendo duas populações 208 10.1 Amostras dependentes e independentes 208 10.2 Inferências sobre a diferença média utilizando duas amostras dependentes 210 Procedimentos e pressupostos para inferências envolvendo dados emparelhados 211 Procedimento do intervalo de confiança 211 Procedimento de teste de hipóteses 212 10.3 Inferências sobre a diferença entre as médias utilizando duas amostras independentes 215 Procedimento do intervalo de confiança 216 Procedimento do teste de hipótese 217 10.4 Inferências sobre a diferença entre as proporções utilizando duas amostras independentes 221 Procedimento do intervalo de confiança 222 Procedimento do teste de hipóteses 223
ix STAT_iniciais.indd 9
18/07/2013 16:06:05
Sumário 10.5 Inferências sobre a razão das variâncias utilizando duas amostras independentes 225 Formulação de hipóteses para a igualdade das variâncias 226 Usando a distribuição-F 226 Valores críticos de F para testes unicaudais e bicaudais 229
Parte 4 Mais estatística inferencial 236 11 Aplicações de qui-quadrado 236 11.1 Estatística qui-quadrado 236 Montagem de dados 237 Resumo do procedimento de teste 238 11.2 Inferências referentes a experimentos multinomiais 239 11.3 Inferências sobre tabelas de contingência 244 Teste de independência 244 Teste de homogeneidade 247
12 Análise de variância 254 12.1 Introdução à técnica de análise de variância 254 Testes de hipótese para várias médias 256 12.2 A lógica por trás da ANOVA 260 12.3 Aplicações da ANOVA com um fator fixo 263 Teste de hipótese para a igualdade de várias médias 264
13 Análise de correlação e regressão linear 272 13.1 Análise de correlação linear 273 13.2 Inferências sobre o coeficiente de correlação linear 276 Procedimento do intervalo de confiança 277 Procedimento do teste de hipóteses 277
x STAT_iniciais.indd 10
18/07/2013 16:06:09
Sumário 13.3 Análise da regressão linear 279 Variância do erro experimental 281 13.4 Inferências sobre a inclinação da linha de regressão 284 Procedimento do intervalo de confiança 285 Procedimento do teste de hipóteses 286 13.5 Intervalos de confiança para regressão 287 Intervalos de previsão 289 13.6 Compreendendo a relação entre correlação e regressão 292
14 Elementos de estatística não paramétrica 298 14.1 Estatística não paramétrica 298 Comparação de testes estatísticos 299 14.2 O teste do sinal 300 Procedimento do intervalo de confiança para uma amostra única 301 Procedimento do teste de hipóteses para uma amostra única 301 Procedimento do teste de hipóteses para duas amostras 303 Aproximação normal 304 14.3 O teste U de Mann-Whitney 307 Procedimento do teste de hipóteses 307 Aproximação normal 310 14.4 O teste de runs 312 Aproximação normal 314 14.5 Correlação de postos 315
Apêndice A: Conceitos introdutórios e lições de revisão 326 Apêndice B: Tabelas 327 Índice remissivo 349
xi STAT_iniciais.indd 11
18/07/2013 16:06:11
Parte 1 Capítulo 1
Estatística O U. S. Census Bureau publica anualmente o Statistical Abstract of the United States (Resumo Estatístico dos Estados Unidos), um livro com mais ou menos mil páginas que fornece uma visão estatística de muitas das facetas mais obscuras e inusitadas de nossas vidas. Ele é apenas uma das milhares de fontes para todos os tipos de coisas que você sempre quis saber, mas nunca pensou em perguntar. Você está interessado em saber quantas horas passamos trabalhando e nos divertindo? Quanto gastamos com lanches? Quanto subiu o preço da maçã? Tudo isso e muito mais pode ser encontrado no Statistical Abstract. Disponível em: http://www.census.gov/statab. Os dados estatísticos apresentados a seguir provêm de diversas fontes e representam apenas uma pequena amostra do que pode ser aprendido sobre os norte-americanos por meio da estatística. Essas são apenas algumas das milhares de formas utilizadas para descrever a vida nos Estados Unidos. Observe.
objetivos 1.1 O que é estatística? 1.2 Mensurabilidade e variabilidade 1.3 Coleta de dados 1.4 Estatística e tecnologia
QUANTAS VEZES SUA CAMA É ARRUMADA? 80%
76%
70% 60% 50% 40% 30%
10%
10%
5%
Lasse Kristensen/Shutterstock
0%
2 STAT_cap01.indd 2
Diariamente A cada ou com maior 2–6 dias frequência
2%
2%
Semanal- Menos do Somente mente que sema- quando há nalmente visita
4% Nunca
FONTE: Consumer Reports National Research Center Levantamento realizado com 1.008 mulheres. Margem de erro: ± 3,2 pontos porcentuais. Nota: Não adicionar a 100% em função dos arredondamentos.
Olga Miltsova/Shutterstock
20%
Parte 1: Estatística descritiva
10/04/2013 16:03:59
O que é Estatística?
UMA VEZ QUE IREMOS EMBARCAR EM NOSSA JORNADA RUMO AO
CAPÍTULO
1.1
1
ESTUDO DA ESTATÍSTICA, DEVEMOS COMEÇAR PELA SUA DEFINIÇÃO DE ESTATÍSTICA E AMPLIAR OS DETALHES ENVOLVIDOS. A estatística tornou-se a linguagem universal das ciências. Como usuários potenciais da estatística, precisamos dominar a “ciência” e a “arte” de utilizar a metodologia estatística corretamente. O uso cuidadoso dos métodos estatísticos nos possibilitará obter informações precisas com base nos dados disponíveis. Esses métodos incluem (1) definir cuidadosamente a situação,
3 STAT_cap01.indd 3
10/04/2013 16:04:04
Estatística A ciência de coletar, descrever e interpretar dados.
Exemplos de estatística na vida cotidiana Dos esportes à política e aos negócios, a estatística está presente quase que diariamente em nossas vidas. Vejamos alguns exemplos de como e quando a estatística pode ser aplicada. Por exemplo, quando você frequentava o jardim de infância, muito provavelmente, sua principal preocupação era se divertir e fazer amigos. Mas e quanto ao seu professor? Numa pesquisa descreveram-se as habilidades que educadores do jardim de infância consideram essencial ou muito importante. Oitocentos educadores do jardim de infância (apenas uma fração de todos os educadores do jardim de infância) foram entrevistados, resultando nas habilidades e porcentagens relatadas. “Prestar atenção” e “não ser indisciplinado” estão no topo da lista. Dos 800 professores entrevistados, 86% consideram essas habilidades essenciais ou muito importantes.
4 STAT_cap01.indd 4
Considerando-se todas as porcentagens, fica claro que elas somam mais de 100%. Aparentemente, foi permitido aos professores entrevistados citar mais de uma habilidade como resposta. Além de descrever nossas preocupações, a estatística pode descrever mudanças em nosso comportamento. Por exemplo, o comportamento dos adolescentes em sala de aula e no trânsito sofreram mudanças com o predomínio do telefone celular e da tecnologia MP3. Como mostram os gráficos sobre adolescentes e motoristas jovens apresentados na página seguinte, a grande maioria dos adolescentes possui celular, o qual usam o tempo todo, até mesmo na sala de aula e no trânsito. Considere as informações coletadas para formular esses gráficos: em primeiro lugar, o status de telefone celular, o número de mensagens de texto por semana, o número de mensagens de texto durante as aulas por semana e os tipos de atividades ao dirigir um veículo. Como as organizações responsáveis pelas pesquisas utilizaram as informações coletadas para chegar aos 84% e 83% indicados nos gráficos? As porcentagens apresentadas no gráfico “Ocupado atrás do volante” somam muito mais de 100%, o que sugere que foi permitido aos entrevistados selecionar mais de uma resposta. Sempre observe a fonte das estatísticas publicadas (e qualquer outro detalhe fornecido); essa observação vai dizer muito sobre a informação que está sendo apresentada. Nesses casos, ambas são organizações norte-americanas. A Common Sense Media é um líder respeitado nas questões infância e adolescência, e a Allstate, membro fundador da the National Youth Health and Safety Coalition (Coalizão Nacional pela Saúde e Segurança dos Jovens). Esses detalhes de origem podem fornecer esclarecimentos sobre a qualidade das informações. Tenha em mente que as informações podem ser parciais ou incompletas, mas saber sobre a origem e o método de coleta de dados ajuda a reconhecer dados parciais. Os meios de comunicação são um dos principais veículos para apresentação da estatística. Os jornais, em particular, publicam gráficos e tabelas informando como várias organizações e pessoas pensam como um todo. Você já se perguntou o quanto do
Alle12/iStockphoto
(2) coletar dados, (3) resumi-los com precisão e (4) obter e comunicar conclusões significativas. A estatística envolve informações, números e gráficos visuais de forma resumida, bem como a interpretação dos números e gráficos. A palavra estatística possui significados diferentes para pessoas de diferentes áreas e interesses. Para algumas pessoas, é um campo da “abracadabra”, no qual uma pessoa tenta se sobrepor aos demais com informações e conclusões incorretas. Para outros, é uma forma de coleta e fornecimento de informações. E, ainda, para outro grupo de pessoas, é uma forma de tomar decisões diante de incertezas. Conforme a perspectiva, cada um desses pontos de vista está correto. O campo da estatística pode ser subdividido em duas áreas: estatística descritiva e estatística inferencial. A estatística descritiva é o que vem à mente da maioria das pessoas ao ouvir a palavra estatística. Ela inclui a coleta, apresentação e a descrição dos dados da amostra. O termo estatística inferencial refere-se à técnica de interpretação dos valores resultantes das técnicas descritivas, bem como à tomada de decisões e obtenção de conclusões sobre a população. A estatística é mais do que apenas números: são dados – o que é feito com esses dados, o que é aprendido com eles e as conclusões resultantes desse processo. Ou seja, estatística é a ciência de coletar, descrever e interpretar dados.
Parte 1: Estatística descritiva
10/04/2013 16:04:05
OCUPADO ATRÁS DO VOLANTE
Atividades realizadas por jovens entre 16 e 20 anos de idade durante a condução de um veículo: Falou ao celular
ADOLESCENTES QUE UTILIZAM TELEFONES CELULARES NA SALA DE AULA Adolescentes sem telefones celulares 16%
Adolescentes com telefones celulares 84%
Laurent Davoust/iStockphoto
Mensagens de textos por semana: 440 enviadas durante o horário escolar: 110 por período de aula: 3
FONTE: Common Sense Media Survey com 1.013 adolescentes, mai./jun. 2009.
83%
Infringiu a lei
76%
Enviou uma mensagem
68%
Verificou o iPod
54% 50%
Perturbou um motorista 0
20
40
60
80
100
FONTE: National Organization for Youth Safety, Pesquisa on-line da Fundação Allstate com 605 motoristas entre 16 e 20 anos de idade, 16 de junho de 2009.
que pensamos é influenciado diretamente pelas informações lidas nesses artigos? O gráfico “O que os empregadores buscam” informa que 39% dos empregadores procuram atitude positiva e entusiasmo por parte dos trabalhadores sazonais. De onde vêm essas informações? Observe a fonte, SnagAJob.com. Como os pesquisadores coletaram essas informações? Eles realizaram uma pesquisa com 1.043 gerentes de contratação. A margem de erro é de ± 3 pontos porcentuais. (Lembre-se de verificar as letras pequenas, geralmente na parte inferior de um gráfico ou tabela de estatística.) Com base nesse detalhe adicional, os 39% no gráfico tornam-se “entre 36% e 42% dos empregadores que buscam atitude positiva e entusiasmo por parte de seus trabalhadores sazonais”.
O QUE OS EMPREGADORES BUSCAM O que os empregadores procuram em um trabalhador temporário?
Online Creative Media/iStockphoto
Experiência anterior 20%
Atitude positiva e entusiasmo 39%
Possibilidade de trabalhar conforme cronograma necessário 28% Compromisso para toda a temporada 13%
FONTE: Pesquisa do SnagAJob.com com 1.043 gerentes de contratação. Margem de erro: ± 3 pontos porcentuais.
Capítulo 1: Estatística
STAT_cap01.indd 5
5 10/04/2013 16:04:08
Apesar de as publicações estatísticas serem regularmente de meios de comunicação respeitáveis, isso não significa que você deva acreditar nelas cegamente. Lembre-se de considerar a fonte ao ler um relatório estatístico. Certifique-se de que está visualizando a imagem completa. Dito isso, lembre-se também de que “um grama de técnica estatística requer um quilo de bom senso para uma aplicação correta”. Observe o International Shark Attack File (ISAF) (Arquivo Internacional de Ataques de Tubarão). O ISAF, administrado pela Sociedade Norte-Americana de Elasmobrânquios e pelo Museu de História Natural da Flórida, é uma compilação de todos os ataques conhecidos de tubarão. Ele é mostrado no gráfico e na tabela a seguir. Utilizando o bom senso ao observar o gráfico de ataques de tubarão, uma pessoa certamente permaneceria longe dos Estados Unidos caso goste do mar. Cerca de dois quintos dos ataques de tubarões no mundo ocor-
rem neste país. As águas dos Estados Unidos devem estar cheias de tubarões, e os tubarões devem estar loucos! Bom senso, lembra? O gráfico é um pouco enganoso? O que mais poderia estar influenciando as estatísticas mostradas aqui? Primeiro, é preciso considerar o quanto da fronteira de um país ou continente está em contato com o oceano. Segundo, quem está rastreando esses ataques? Nesse caso, essa informação é apresentada na fonte do gráfico, FLMNH se refere ao The Florida Museum of Natural History (Museu de História Natural da Flórida), um museu nos Estados Unidos. Aparentemente, os Estados Unidos estão tentando manter um controle dos ataques de tubarão não provocados. O que mais é diferente sobre os Estados Unidos em comparação com outras áreas? O oceano é uma área de lazer em outros lugares? Qual é a economia dessas outras áreas, e/ou quem mantém o controle de seus ataques de tubarão? Lembre-se de considerar a fonte ao ler um relatório esta-
ESTADOS UNIDOS
EUROPA
HAVAÍ
ÁSIA
BERMUDAS AMÉRICA CENTRAL
ANTILHAS e BAHAMAS
ÁFRICA
ILHAS DO PACÍFICO/OCEANIA
AMÉRICA DO SUL
AUSTRÁLIA NOVA ZELÂNDIA
Total de ataques
Ataques fatais
Última fatalidade
Estados Unidos (com/sem Havaí) Austrália África Ásia Ilhas do Pacífico / Oceania (com/sem Havaí)
881 345 276 117 131
38 135 70 55 50
2005 2006 2004 2000 2007
Havaí América do Sul
113 100
15 23
2004 2006
Território
Território Antilhas e Bahamas América Central Nova Zelândia Europa Bermudas Não especificado MUNDO
Total de ataques
Ataques fatais
Última fatalidade
65 61 47 39 4 20 2.199
19 31 9 19 0 6 470
1972 1997 1968 1984 1965 2007
FONTE: http://www.flmnh.ufl.edu/fish/sharks/statistics/GAttack/World.htm
6 STAT_cap01.indd 6
Parte 1: Estatística descritiva
10/04/2013 16:04:09
tístico. Certifique-se de que está visualizando a imagem completa.
Onde a estatística é utilizada Os usos da estatística são ilimitados. É muito mais difícil citar uma área na qual a estatística não é utilizada do que uma de que seja parte integrante. Exemplos de como e onde a estatística é utilizada: • Na educação, a estatística descritiva é frequentemente usada para descrever os resultados dos testes. • Na ciência, os dados resultantes das experiências devem ser coletados e analisados. • No governo, diversos tipos de dados estatísticos são coletados todo o tempo. Na verdade, o governo dos Estados Unidos é provavelmente o maior colecionador de dados estatísticos do mundo. Uma parte muito importante do processo estatístico é o estudo dos resultados estatísticos e a elaboração das conclusões adequadas. Essas conclusões devem ser comunicadas com precisão: não se ganha nada com pesquisas, a menos que os resultados sejam compartilhados com outras pessoas. As estatísticas são transmitidas por toda parte: jornais, revistas, rádio e televisão. Lemos e ouvimos falar sobre todos os tipos de resultados de novas pesquisas, especialmente nas áreas relacionadas à saúde.
A linguagem da estatística A fim de prosseguirmos com nosso estudo de estatística, é preciso falar esta língua. A estatística possui seu próprio jargão, com termos além da estatística descritiva e da estatística inferencial, que precisam ser definidos e ilustrados. O conceito de população é a ideia mais fundamental em estatística. A população é o conjunto completo de indivíduos ou objetos que são de interesse para o coletor de amostras. A população de interesse deve ser cuidadosamente definida, sendo considerada totalmente definida somente quando sua lista de membros de elementos for especificada. O conjunto de “todos os alunos que já cursaram uma faculdade nos Estados Unidos” é um exemplo de uma população bem definida. Normalmente, pensamos em uma população como um conjunto de pessoas. No entanto, em estatística, a população pode ser uma coleção de animais, objetos manufaturados, ou qualquer outra coisa. Por exemplo, o conjunto de todas as sequoias na Califórnia pode ser uma população. Existem dois tipos de população: o finito e o infinito. Quando os componentes de uma população podem ser
(ou poderiam ser) fisicamente listados, diz-se que a população é finita. Quando os componentes são ilimitados, a população é considerada infinita. Os livros na biblioteca da faculdade formam uma população finita, e seus componentes listados com exatidão pelo Opac (Online Public Access Catalog, um catálogo informatizado). Todos os eleitores registrados nos Estados Unidos formam uma grande população finita; se necessário, é possível compilar uma composição com todas as listas eleitorais de todos os distritos eleitorais dos Estados Unidos. Por outro lado, a população de todas as pessoas que poderiam usar a aspirina e a população de todas as lâmpadas de 40 watts a serem produzidas pela General Electric são infinitas. Grandes populações são difíceis de estudar, por isso costuma-se selecionar uma amostra, ou um subconjunto de uma população, e estudar os seus dados. A amostra é composta de indivíduos, objetos ou medidas, selecionados com base em uma população pelo coletor de amostras. Os estatísticos estão interessados em variáveis específicas de uma amostra ou uma população. Ou seja, eles examinam uma ou mais características de interesse de cada elemento de uma população ou amostra. Itens como idade, cor dos cabelos, altura e peso são variáveis. Cada variável associada a um elemento de uma população ou amostra representa um valor. Esse valor, chamado de valor de dados, pode ser um número, palavra ou símbolo. Por exemplo, quando Bill Jones entrou na faculdade aos “23” anos de idade, seu cabelo era “castanho”, ele media “1,80 m” de altura e pesava “83 kg”. Esses quatro valores de dados são os valores para as quatro variáveis aplicadas a Bill Jones. O conjunto de valores coletados com base em uma variável de cada um dos elementos que pertencem a uma amostra é chamado de dados. Uma vez que os dados são coletados, é prática comum referir-se ao conjunto de dados como amostra. O conjunto de 25 alturas (ou pesos, idades, cores de cabelos) coletadas de 25 alunos é um exemplo de um conjunto de dados. Para a coleta de um conjunto de dados, um estatístico conduzirá um experimento, que é uma atividade planejada, cujos resultados geram um conjunto de dados. Um experimento inclui as atividades de seleção dos elementos e obtenção dos valores de dados. A idade “média” no momento da admissão para todos os alunos que já cursaram nossa faculdade e a “proporção” de alunos que tinham mais de 21 anos ao entrar na faculdade são exemplos de dois parâmetros de população. Um parâmetro é um valor numérico que resume toda a população. Geralmente, é utilizada uma letra grega para simbolizar o nome de um parâmetro. Esses símbolos serão atribuídos ao estudarmos parâmetros específicos.
Capítulo 1: Estatística
STAT_cap01.indd 7
7 10/04/2013 16:04:09
Para cada parâmetro, existe uma estatística de amostra correspondente. A estatística é um valor numérico que resume os dados da amostra e a descreve da mesma forma que o parâmetro descreve a população. A altura “média”, encontrada usando o conjunto de 25 alturas, é um exemplo de estatística de amostra. A estatística é um valor que descreve uma amostra. A maioria das estatísticas de amostra é encontrada com o auxílio de fórmulas e, em geral, recebem nomes simbólicos representados por letras do alfabeto (por exemplo, x, s e r).
: Os parâmetros descrevem a população e a estatística descreve a
amostra.
Tipos de variáveis Existem basicamente dois tipos de variáveis: (1) variáveis qualitativas, que resultam em informações que descrevem ou categorizam um elemento de uma população, e (2) variáveis quantitativas, que resultam em informações que quantificam um elemento de uma população. Uma amostra de quatro clientes de um salão de beleza foi coletada para “cor de cabelo”, “cidade de origem” e “nível de satisfação”, com os resultados de seu tratamento no salão. Todas as três variáveis são exemplos de variáveis qualitativas (atributos), pois descrevem alguma característica da pessoa, e todas as pessoas com o mesmo atributo pertencem à mesma categoria. Os dados coletados foram {loiro, castanho, preto, castanho}, {Brighton, Columbus, Albany, Jacksonville}, e {muito satisfeito, satisfeito, pouco satisfeito, insatisfeito}. Em contrapartida, o “custo total” dos livros comprados por cada aluno para as aulas deste semestre é um exemplo de variável quantitativa (numérica). A amostra resultou nos seguintes dados: US$ 238,87, US$ 94,57 e US$ 139,24. [Para determinar o “custo médio”, basta somar os três números e dividir por 3: (238,87 + 94,57 + 139,24) ÷ 3 = US$ 157,56.] Como se pode ver, as operações aritméticas, como adição e média, são significativas para os dados que resultam de uma variável quantitativa (e seriam inúteis para examinar as variáveis qualitativas). Cada um desses tipos de variáveis (quantitativas e qualitativas) pode ser subdividido, como mostra o diagrama a seguir.
8 STAT_cap01.indd 8
Qualitativa ou atributo Variável
Nominal Ordinal Discreta
Quantitativa ou numérica
Contínua
As variáveis qualitativas podem ser classificadas como nominal ou ordinal. Uma variável nominal é uma variável qualitativa que caracteriza (ou descreve, ou denomina) um elemento de uma população. Não apenas as operações aritméticas não são significativas para os dados que resultam de uma variável nominal, como não é possível atribuir uma ordem às categorias. Na pesquisa com os quatro clientes do salão de beleza, duas variáveis, a “cor do cabelo” e a “cidade de origem”, são exemplos de variáveis nominais, porque, além de identificar uma característica da pessoa, não podem ser utilizadas para determinar a média da amostra por meio de sua soma e divisão do resultado por 4. Por exemplo, (loiro + castanho + preto + castanho) ÷ 4, o resultado é indefinido. Além disso, as características de cor do cabelo e cidade de origem não apresentam uma ordem. Uma variável ordinal é uma variável qualitativa que incorpora uma posição ordenada, ou classificação. Na pesquisa com os quatro clientes do salão de beleza, a variável “nível de satisfação” é um exemplo de uma variável ordinal, porque incorpora uma ordem de classificação: “muito satisfeito” está à frente de “satisfeito”, que está à frente de “pouco satisfeito”. Outro exemplo de variável ordinal é a classificação de cinco fotos de paisagens de acordo com a preferência de alguém: primeira escolha, segunda escolha, e assim por diante. As variáveis quantitativas ou numéricas também podem ser subdivididas em duas categorias: variáveis discretas e variáveis contínuas. Uma variável discreta é uma variável quantitativa que pode assumir um número contável de valores. Intuitivamente, a variável discreta pode assumir qualquer valor correspondente a pontos isolados ao longo de um intervalo de linha. Ou seja, existe uma lacuna entre dois valores. Por outro lado, uma variável contínua é uma variável quantitativa que pode assumir um número incontável de valores. Intuitivamente, a variável contínua pode assumir qualquer valor ao longo de um intervalo de linha, incluindo todos os valores possíveis entre dois valores.
Variável discreta É uma variável quantitativa que pode assumir um número contável de valores. Variável contínua É uma variável quantitativa que pode assumir um número incontável de valores.
Parte 1: Estatística descritiva
10/04/2013 16:04:12
DA EQUIPE Professores e estudantes buscam uma nova técnica para ensinar e aprender. Como podemos fazer isso? Continuamos a questionar! Determinados a realmente nos conectar aos estudantes, conduzimos continuamente grupos de foco, enquetes e entrevistas. Desejamos saber como você aprende e como os professores ensinam. A resposta a esta solução inovadora tem sido impressionante. Mas não paramos aqui. Trabalhamos com centenas de estudantes para saber mais sobre sua experiência com os produtos da coleção 4LTR Press, a fim de compreender o que funciona e o que pode ser aprimorado. O resultado é o ESTAT! Novos exemplos, conteúdos atualizados e contínuos recursos on-line de excelência a um preço incrivelmente baixo. Esta é uma solução de aprendizado e ensino como nenhuma outra! ESTAT combina o que há de melhor – autores experientes, abordagem concisa, porém completa, e ferramentas de aprendizagem criadas para o estudante contemporâneo. E isso é exatamente o que você e seus professores estão pedindo. Estamos reavivando a aprendizagem.
Você está nessa? As ferramentas de aprendizagem utilizadas até alguns anos atrás já não atraem os alunos de hoje, que dominam novas tecnologias, mas dispõem de pouco tempo para o estudo. Na realidade, muitos buscam uma nova abordagem. A Trilha está abrindo caminho para uma nova estratégia de aprendizagem e tudo teve início com alguns professores e alunos. Determinados a nos conectar verdadeiramente com os alunos, conduzimos pesquisas e entrevistas. Conversamos com eles para descobrir como aprendem, quando e onde estudam, e por quê. Conversamos, em seguida, com professores para obter suas opiniões. A resposta a essa solução inovadora de ensino e aprendizagem tem sido excelente. Trilha é uma solução de ensino e aprendizagem diferente de todas as demais!
Os alunos pediram, nós atendemos! • E-book • Exercícios • Cartões de memória • Cartões técnicos • E mais! Plataforma de acesso e conteúdo em língua portuguesa!
Você está nessa?
ESTAT JOHNSON / KUBY
JOHNSON / KUBY
Conecte-se.
ESTAT
Leia e Estude On-line com a Trilha www.cengage.com.br/4ltr
CONTEÚDO:
Uma técnica de aprendizagem testada por estudantes e aprovada por universidades Estatística Conteúdo desenvolvido por alunos como você Trilha E-book, quizzes, exercícios e mais! Cartões de Revisão do capítulo, cartões técnicos e Trilha permitem que você estude como e quando quiser.
E-BOOK EXERCÍCIOS FLASHCARDS E MAIS!
CCORP
ADM
GO ISBN 13 978-85-221-1167-1 ISBN 10 85-221-1167-7