Dennis J. Sweeney Thomas A.Williams David R. Anderson
de Administração e Economia. É uma obra muito útil para todos que utilizam ferramentas estatísticas nas áreas de contabilidade, finanças, marketing, entre outras. Trilha é uma solução digital, com plataforma de acesso em português, que disponibiliza ferramentas multimídia para uma nova estratégia de ensino e aprendizagem.
ISBN 13 978-85-221-1281-4 ISBN 10 85-221-1281-9
Para suas soluções de curso e aprendizado, visite www.cengage.com.br
9 7 8 8 5 2 2 11 2 8 1 4
Tradução da 6ª edição norte-americana
ESTATÍSTICA APLICADA à administração e economia
OUTRAS OBRAS Estatística básica Sonia Vieira Estatística para economistas 4ª edição revista e ampliada Rodolfo Hoffmann Probabilidade e estatística para engenharia e ciências Também disponível em e-book
Jay L. Devore
Inferência estatística Tradução da 2ª edição norte-americana George Casella e Roger L. Berger
Tradução da 6ª edição norte-americana
Aplicações: Livro-texto para a disciplina estatística nos cursos
Dennis J. Sweeney Thomas A.Williams David R. Anderson
Estatística aplicada à administração e economia apresenta uma introdução conceitual à estatística e suas aplicações. Orientado à análise de dados e de metodologia estatística, o texto oferece uma boa preparação para o estudo de material estatístico mais avançado. Apresenta uma didática muito bem estruturada, com exercícios que exigem que os alunos utilizem fórmulas e material do capítulo em situações reais. Além de outros recursos didáticos como tabelas, gráficos, anotações de margem e glossário, esta edição apresenta conteúdo atualizado com novos apêndices, novos estudos de caso e outros tópicos, como ética e novas abordagens sobre coletas de dados. Traz ainda novas opções de estatística adicionais para os usuários do Excel.
ESTATÍSTICA APLICADA
ESTATÍSTICA APLICADA à administração e economia
à administração e economia
Tradução da 6ª edição norte-americana
Dennis J. Sweeney Thomas A.Williams David R. Anderson
Estatística Aplicada à Administração e Economia Tradução da 6a edição norte-americana 3a edição brasileira
Dennis J. Sweeney
University of Cincinnati Thomas A. Williams
Rochester Institute of Technology David R. Anderson
University of Cincinnati Tradução Solange Aparecida Visconti Revisão Técnica Cléber da Costa Figueiredo Professor Adjunto I da ESPM – Campus Álvaro Alvim – SP.
Daniel Kashiwamura Scheffer Professor do Centro Universitário do Instituto Mauá de Tecnologia.
Mayra Ivanoff Lora Professora Adjunta da Escola de Economia de São Paulo – Fundação Getulio Vargas.
Tatiana Terabayashi Melhado (Coord.) Professora do Insper Instituto de Ensino e Pesquisa. Professora Assistente II da ESPM – Campus Álvaro Alvim – SP.
Austrália Brasil Japão Coreia México Cingapura Espanha Reino Unido Estados Unidos
Dedicado a Mรกrcia, Cherri e Robbie
Sumário Prefácio xv Agradecimentos xix Sobre os autores xxiii Capítulo 1
Dados e a estatística.............................................................................................. 1
1.1
Aplicações em administração e economia...................................................................... 3 Contabilidade..................................................................................................................... 3 Finanças.............................................................................................................................. 3 Marketing........................................................................................................................... 3 Produção............................................................................................................................. 4 Economia............................................................................................................................ 4 1.2 Dados................................................................................................................................. 4 Elementos, variáveis e observações.................................................................................... 5 Escalas de medição............................................................................................................. 6 Dados categorizados e quantitativos.................................................................................. 7 Dados de seção transversal e de série temporal................................................................. 7 1.3 As fontes de dados............................................................................................................ 8 Fontes existentes............................................................................................................... 10 Estudos estatísticos........................................................................................................... 11 Erros na obtenção de dados.............................................................................................. 12 1.4 Estatística descritiva...................................................................................................... 13 1.5 Inferência estatística...................................................................................................... 14 1.6 Computadores e a análise estatística............................................................................ 16 1.7 Mineração (data mining) ................................................................................................ 16 1.8 Diretrizes éticas para a prática estatística.................................................................... 18 Resumo................................................................................................................................... 19 Glossário................................................................................................................................ 20 Exercícios suplementares...................................................................................................... 21 Apêndice Uma introdução ao StatTools........................................................................... 29
Capítulo 2 2.1
2.2
Estatística descritiva: métodos tabulares e métodos gráficos..................... 33
Sintetizando os dados categorizados............................................................................. 35 Distribuição de frequências absolutas.............................................................................. 35 Distribuições de frequências relativas e de frequências relativas percentuais.................. 36 Gráficos de colunas e gráficos de setores......................................................................... 36 Sintetizando os dados quantitativos.............................................................................. 42 Distribuição de frequências absolutas.............................................................................. 42 Distribuições de frequências relativas e de frequências relativas percentuais......................................................................................................... 44 Diagrama de pontos (Dot plot)......................................................................................... 45 Histograma....................................................................................................................... 45 Distribuições cumulativas................................................................................................. 47
vii
viii
Estatística aplicada à administração e economia
Ogiva................................................................................................................................ 47 2.3 Análise exploratória dos dados: a apresentação de ramo-e-folhas............................. 53 2.4 Tabulações cruzadas e diagramas de dispersão........................................................... 58 Tabulação cruzada............................................................................................................ 58 Paradoxo de Simpson....................................................................................................... 61 Diagrama de dispersão e linha de tendência.................................................................... 62 Resumo................................................................................................................................... 70 Glossário................................................................................................................................ 71 Fórmulas-chave..................................................................................................................... 72 Exercícios suplementares...................................................................................................... 72 Estudo de Caso 1 Pelican Stores........................................................................................... 79 Estudo de Caso 2 Indústria cinematográfica....................................................................... 80 Apêndice 2.1 Métodos tabulares e gráficos utilizando o Minitab....................................... 81 Apêndice 2.2 Métodos tabulares e gráficos utilizando o Excel........................................... 83 Apêndice 2.3 Métodos tabulares e gráficos utilizando o StatTools..................................... 91
Capítulo 3 3.1
Estatística descritiva: medidas numéricas....................................................... 93
Medidas de posição......................................................................................................... 94 Média................................................................................................................................ 94 Mediana ........................................................................................................................... 96 Moda................................................................................................................................. 97 Percentis........................................................................................................................... 97 Quartis.............................................................................................................................. 98 3.2 Medidas de variabilidade............................................................................................. 103 Amplitude ...................................................................................................................... 104 Amplitude interquartil.................................................................................................... 104 Variância......................................................................................................................... 104 Desvio padrão ................................................................................................................ 106 Coeficiente de variação.................................................................................................. 107 3.3 Medidas da forma de distribuição, da posição relativa e detecção de valores atípicos (outliers).............................................................................................. 110 Forma da distribuição..................................................................................................... 110 Escores-z......................................................................................................................... 111 Teorema de Chebyshev................................................................................................... 112 Regra empírica............................................................................................................... 113 Detecção de valores atípicos (outliers)........................................................................... 114 3.4 Análise exploratória dos dados.................................................................................... 117 Regra de cinco itens....................................................................................................... 117 Box plot (Diagrama em caixa)........................................................................................ 118 3.5 Medidas de associação entre duas variáveis............................................................... 123 Covariância .................................................................................................................... 123 Interpretação da covariância........................................................................................... 125 Coeficiente de correlação............................................................................................... 127 Interpretação do coeficiente de correlação..................................................................... 128 3.6 Média ponderada e o trabalho com dados agrupados .............................................. 132 Média ponderada............................................................................................................ 132 Dados agrupados............................................................................................................ 133 Resumo................................................................................................................................. 138 Glossário.............................................................................................................................. 138
Sumário
ix
Fórmulas-chave................................................................................................................... 139 Exercícios suplementares.................................................................................................... 141 Estudo de Caso 1 Pelican Stores......................................................................................... 146 Estudo de Caso 2 Indústria cinematográfica..................................................................... 147 Estudo de Caso 3 Transações no site da Heavenly Chocolates........................................ 148 Apêndice 3.1 Estatística descritiva utilizando o Minitab.................................................. 149 Apêndice 3.2 Estatística descritiva utilizando o Excel...................................................... 151 Apêndice 3.3 Estatísticas descritivas usando StatTools.................................................... 153
Capítulo 4
Introdução à probabilidade............................................................................... 157
4.1
Experimentos, regras de contagem e atribuição de probabilidades......................... 159 Regras de contagem, combinações e permutações......................................................... 159 Atribuindo probabilidades.............................................................................................. 163 Probabilidades do projeto da KP&L.............................................................................. 165 4.2 Eventos e suas probabilidades..................................................................................... 169 4.3 Algumas relações básicas de probabilidade................................................................ 173 Complemento de um evento........................................................................................... 173 Lei da adição.................................................................................................................. 174 4.4 Probabilidade condicional............................................................................................ 179 Eventos independentes................................................................................................... 182 Lei da multiplicação....................................................................................................... 183 4.5 Teorema de Bayes......................................................................................................... 187 Abordagem tabular......................................................................................................... 190 Resumo................................................................................................................................. 193 Glossário.............................................................................................................................. 193 Fórmulas-chave................................................................................................................... 194 Exercícios suplementares.................................................................................................... 195 Estudo de Caso Os juízes do Condado de Hamilton......................................................... 200
Capítulo 5 5.1
Distribuições discretas de probabilidade....................................................... 203
Variáveis aleatórias....................................................................................................... 203 Variáveis aleatórias discretas.......................................................................................... 204 Variáveis aleatórias contínuas........................................................................................ 205 5.2 Distribuições discretas de probabilidade.................................................................... 207 5.3 Valor esperado e variância........................................................................................... 212 Valor esperado................................................................................................................ 212 Variância......................................................................................................................... 213 5.4 Distribuição de probabilidade binomial...................................................................... 217 Experimento binomial.................................................................................................... 217 O problema da Loja de Roupas do Martin..................................................................... 219 Usando tabelas de probabilidades binomiais................................................................. 223 Valor esperado e variância da distribuição binomial...................................................... 224 5.5 Distribuição de Poisson................................................................................................ 227 Um exemplo envolvendo intervalos de tempo............................................................... 228 Um exemplo envolvendo intervalos de comprimento ou de distância........................... 230 5.6 Distribuição de probabilidade hipergeométrica......................................................... 232 Resumo................................................................................................................................. 235 Glossário.............................................................................................................................. 236
x
Estatística aplicada à administração e economia
Fórmulas-chave................................................................................................................... 237 Exercícios suplementares.................................................................................................... 238 Apêndice 5.1 Distribuições discretas de probabilidade com o Minitab............................ 241 Apêndice 5.2 Distribuições discretas de probabilidade com o Excel................................ 241
Capítulo 6
Distribuições contínuas de probabilidade...................................................... 243
6.1
Distribuição de probabilidade uniforme..................................................................... 244 A área como uma medida de probabilidade................................................................... 245 6.2 Distribuição de probabilidade normal........................................................................ 249 Curva normal.................................................................................................................. 249 Distribuição de probabilidade normal padrão................................................................ 251 Como calcular probabilidades de qualquer distribuição normal.................................... 255 O problema da Grear Tire Company.............................................................................. 255 6.3 Aproximação normal às probabilidades binomiais.................................................... 260 6.4 Distribuição de probabilidade exponencial................................................................ 263 Como calcular probabilidades da distribuição exponencial........................................... 264 Relações entre a distribuição de Poisson e a distribuição exponencial.......................... 265 Resumo................................................................................................................................. 267 Glossário.............................................................................................................................. 267 Fórmulas-chave................................................................................................................... 268 Exercícios suplementares.................................................................................................... 268 Estudo de Caso Specialty Toys........................................................................................ 272 Apêndice 6.1 Distribuições contínuas de probabilidade com o Minitab...................... 273 Apêndice 6.2 Distribuições contínuas de probabilidade com o Excel.......................... 274
Capítulo 7 7.1 7.2
7.3 7.4 7.5
7.6
7.7
Amostragem e distribuições amostrais........................................................... 275
O problema de amostragem da Electronics Associates ............................................ 277 Selecionando uma amostra.......................................................................................... 278 Amostragem a partir de uma população finita............................................................... 278 Amostragem a partir de uma população infinita............................................................ 280 Estimação pontual........................................................................................................ 284 Recomendação prática.................................................................................................... 285 Introdução às distribuições amostrais........................................................................ 287 Distribuição amostral dex........................................................................................... 290 Valor esperado de x........................................................................................................ 290 Desvio padrão de x......................................................................................................... 291 Forma da distribuição amostral de x............................................................................... 292 Distribuição amostral de x para o problema da EAI ..................................................... 293 Valor prático da distribuição amostral de x.................................................................... 294 Relação entre o tamanho amostral e a distribuição amostral de x.................................. 295 Distribuição amostral dep........................................................................................... 300 Valor esperado de p........................................................................................................ 300 Desvio padrão de p......................................................................................................... 300 Forma da distribuição amostral de p.............................................................................. 301 Valor prático da distribuição amostral de p.................................................................... 302 Outros métodos de amostragem ................................................................................. 305 Amostragem aleatória estratificada................................................................................ 305 Amostragem por conglomerados................................................................................... 306 Amostragem sistemática................................................................................................ 306
Sumário
xi
Amostragem por conveniência....................................................................................... 307 Amostragem por julgamento.......................................................................................... 307 Resumo................................................................................................................................. 308 Glossário ............................................................................................................................. 308 Fórmulas-chave................................................................................................................... 309 Exercícios suplementares.................................................................................................... 310 Apêndice 7.1 Amostragem aleatória utilizando o Minitab............................................... 312 Apêndice 7.2 Amostragem aleatória utilizando o Excel................................................... 313 Apêndice 7.3 Amostragem aleatória utilizando o StatTools............................................. 313
Capítulo 8
Estimação intervalar........................................................................................... 315
8.1
Média populacional: s conhecido............................................................................... 316 Margem de erro e a estimativa intervalar....................................................................... 317 Conselho prático............................................................................................................. 320 8.2 Média populacional: s desconhecido.......................................................................... 322 Margem de erro e a estimativa intervalar....................................................................... 323 Conselho prático............................................................................................................. 326 Usando uma pequena amostra........................................................................................ 326 Resumo dos procedimentos de estimação intervalar...................................................... 328 8.3 Determinando o tamanho amostral............................................................................ 331 8.4 Proporção populacional............................................................................................... 334 Determinando o tamanho amostral................................................................................ 335 Resumo................................................................................................................................. 340 Glossário.............................................................................................................................. 340 Fórmulas-chave................................................................................................................... 341 Exercícios suplementares.................................................................................................... 341 Estudo de Caso 1 Revista Young Professional ................................................................... 345 Estudo de Caso 2 Gulf Real Estate Properties................................................................... 346 Estudo de Caso 3 Metropolitan Research, Inc................................................................... 348 Apêndice 8.1 Estimação intervalar com o Minitab............................................................ 349 Apêndice 8.2 Estimação intervalar com o Excel................................................................ 350 Apêndice 8.3 Estimação intervalar utilizando o StatTools............................................... 353
Capítulo 9 9.1
9.2 9.3
9.4
Testes de hipóteses............................................................................................ 357
Desenvolvendo as hipóteses nula e alternativa.......................................................... 358 A hipótese alternativa como uma hipótese de pesquisa ................................................ 359 A Hipótese nula como uma suposição a ser desafiada................................................... 360 Resumo das formas para as hipóteses nula e alternativa................................................ 361 Erros tipo i e tipo ii...................................................................................................... 362 Média populacional: s conhecido............................................................................... 365 Teste unicaudal............................................................................................................... 365 Teste bicaudal................................................................................................................. 370 Resumo e conselho prático............................................................................................. 373 Relação entre a estimação intervalar e o teste de hipóteses........................................... 374 Média populacional: s desconhecido.......................................................................... 379 Teste unicaudal............................................................................................................... 380 Teste bicaudal................................................................................................................. 381 Resumo e conselho prático............................................................................................. 382
xii
Estatística aplicada à administração e economia
9.5 Proporção populacional............................................................................................... 385 Resumo................................................................................................................................. 387 Resumo................................................................................................................................. 391 Glossário.............................................................................................................................. 391 Fórmulas-chave................................................................................................................... 392 Exercícios suplementares.................................................................................................... 392 Estudo de Caso 1 Quality Associates, Inc.......................................................................... 395 Estudo de Caso 2 Comportamento ético dos estudantes de administração na Bayview Universtiy................................................................................ 397 Apêndice 9.1 Testes de hipóteses com o Minitab............................................................... 398 Apêndice 9.2 Testes de hipóteses com o Excel................................................................... 400 Apêndice 9.3 Testes de hipóteses com o StatTools............................................................. 402
Capítulo 10 Comparações envolvendo médias, planejamento experimental e análise de variância........................................................................................ 407 10.1 Inferências sobre a diferença entre duas médias populacionais: s1 e s2 conhecidos..................................................................................................................... 409 Estimação intervalar de m1 – m2...................................................................................... 409 Testes de hipóteses sobre m1 – m2................................................................................... 411 Conselho prático............................................................................................................. 413 10.2 Inferências sobre a diferença entre duas médias populacionais: s1 e s2 desconhecidos............................................................................................................... 416 Estimação intervalar de m1 – m2...................................................................................... 416 Testes de hipóteses sobre m1 – m2................................................................................... 417 Conselho prático............................................................................................................. 419 10.3 Inferências sobre a diferença entre duas médias populacionais: amostras emparelhadas (ou pareadas)........................................................................................ 424 10.4 Uma introdução ao planejamento experimental e à análise de variância..................429 Coleta de dados.............................................................................................................. 431 Suposições para a análise de variância........................................................................... 431 Análise de variância: uma visão geral conceitual.......................................................... 432 10.5 Análise de variância e o planejamento completamente aleatorizado ..................... 434 Estimativa da variância populacional entre tratamentos................................................ 435 Estimativa da variância populacional dentro dos tratamentos........................................ 436 Comparando as estimativas das variâncias: o Teste F.................................................... 436 Tabela de ANOVA.......................................................................................................... 438 Resultados computacionais para a análise de variância................................................. 439 Testando a igualdade de k médias populacionais: um estudo observacional................. 440 Resumo................................................................................................................................. 444 Glossário.............................................................................................................................. 445 Fórmulas-chave................................................................................................................... 445 Exercícios suplementares.................................................................................................... 447 Estudo de Caso 1 Par, Inc.................................................................................................... 451 Estudo de Caso 2 Wentworth Medical Center................................................................... 452 Estudo de Caso 3 Remuneração de profissionais de vendas............................................. 453 Apêndice 10.1 Inferências sobre duas populações com o Minitab................................... 454 Apêndice 10.2 Análise de variância com o Minitab........................................................... 456 Apêndice 10.3 Inferências sobre duas populações com o Excel....................................... 456
Sumário
xiii
Apêndice 10.4 Análise de variância com o Excel............................................................... 458 Apêndice 10.5 Inferências sobre duas populações com o StatTools ................................ 459 Apêndice 10.6 Análise de variância com o StatTools........................................................ 461
Capítulo 11 Comparações envolvendo proporções e teste de independência............. 463 11.1 Inferências sobre a diferença entre duas proporções populacionais........................ 463 Estimação intervalar de p1 – p2....................................................................................... 464 Testes de hipóteses sobre p1 – p2.................................................................................... 466 11.2 Testes de hipóteses para proporções de uma população multinomial............................. 471 11.3 Teste de independência................................................................................................ 477 Resumo................................................................................................................................. 484 Glossário.............................................................................................................................. 485 Fórmulas-chave................................................................................................................... 485 Exercícios suplementares.................................................................................................... 486 Estudo de Caso Programa bipartidário de reforma.......................................................... 490 Apêndice 11.1 Inferências sobre duas proporções populacionais com o Minitab........... 491 Apêndice 11.2 Testes da qualidade de ajuste e de independência com o Minitab.......... 492 Apêndice 11.3 Testes da qualidade de ajuste e de independência com o Excel.............. 492 Apêndice 11.4 Inferências sobre duas proporções populacionais com o StatTools........ 493 Apêndice 11.5 Teste de independência com o StatTools................................................... 495
Capítulo 12 Regressão linear simples................................................................................... 497 12.1 Modelo de regressão linear simples............................................................................. 499 Modelo de regressão e equação de regressão................................................................. 499 Equação de regressão estimada...................................................................................... 500 12.2 Método dos mínimos quadrados.................................................................................. 501 12.3 Coeficiente de determinação........................................................................................ 512 Coeficiente de correlação............................................................................................... 516 12.4 Suposições do modelo................................................................................................... 519 12.5 Testando a significância............................................................................................... 521 Estimativa de s 2............................................................................................................. 521 Teste t............................................................................................................................. 522 Intervalo de confiança para b1........................................................................................ 523 Teste F............................................................................................................................ 524 Alguns cuidados quanto à interpretação dos testes de significância.............................. 526 12.6 Utilizando a equação de regressão estimada para estimação e previsão............... 529 Estimação pontual.......................................................................................................... 529 Estimação intervalar....................................................................................................... 530 Intervalo de confiança para o valor médio de y.............................................................. 530 Intervalo de previsão para um valor individual de y....................................................... 531 12.7 Solução computacional................................................................................................ 536 12.8 Análise de resíduos: validando suposições do modelo............................................... 540 Diagrama de resíduos versus x....................................................................................... 541 Diagrama de resíduos versus yˆ ...................................................................................... 542
Resumo................................................................................................................................. 546 Glossário.............................................................................................................................. 546 Fórmulas-chave................................................................................................................... 547 Exercícios suplementares.................................................................................................... 549
xiv
Estatística aplicada à administração e economia
Estudo de Caso 1 Como medir o risco no mercado de ações............................................ 556 Estudo de Caso 2 U.S. Department of Transportation..................................................... 556 Estudo de Caso 3 Doações de ex-alunos............................................................................. 557 Estudo de Caso 4 Estatística da PGA................................................................................. 558 Apêndice 12.1 Análise de regressão com o Minitab........................................................... 560 Apêndice 12.2 Análise de regressão com o Excel............................................................... 561 Apêndice 12.3 Análise de regressão com o StatTools........................................................ 563
Capítulo 13 Regressão múltipla............................................................................................. 565 13.1 Modelo de regressão múltipla...................................................................................... 565 Modelo de regressão e equação de regressão................................................................. 565 Equação de regressão múltipla estimada........................................................................ 567 13.2 Método dos mínimos quadrados.................................................................................. 567 Um exemplo: Butler Trucking Company....................................................................... 568 Nota sobre a interpretação de coeficientes..................................................................... 571 13.3 Coeficiente de determinação múltiplo........................................................................ 576 13.4 Suposições do modelo................................................................................................... 579 13.5 Testando a significância............................................................................................... 581 Teste F............................................................................................................................ 581 Teste t............................................................................................................................. 583 Multicolinearidade......................................................................................................... 584 13.6 Usando a equação de regressão estimada para estimação e previsão...................... 588 13.7 Variáveis independentes categorizadas...................................................................... 590 Um exemplo: Johnson Filtration, Inc............................................................................. 590 Interpretando os parâmetros........................................................................................... 592 Variáveis categorizadas mais complexas........................................................................ 593 Resumo................................................................................................................................. 598 Glossário.............................................................................................................................. 599 Fórmulas-chave................................................................................................................... 599 Exercícios suplementares.................................................................................................... 600 Estudo de Caso 1 Consumer Research, Inc....................................................................... 606 Estudo de Caso 2 Doações de ex-alunos............................................................................. 607 Estudo de Caso 3 PGA Tour Statistics............................................................................... 609 Estudo de Caso 4 Como prever a porcentagem de vitórias na NFL................................ 611 Apêndice 13.1 Regressão múltipla com o Minitab............................................................. 611 Apêndice 13.2 Regressão múltipla com o Excel................................................................. 612 Apêndice 13.3 Regressão múltipla com o StatTools.......................................................... 613
Apêndice A Apêndice B Apêndice C Apêndice D Apêndice E Apêndice F
Referências e Bibliografia........................................................................... 615 Tabelas.......................................................................................................... 617 Notação de somatório.................................................................................. 645 Soluções dos autotestes e respostas dos exercícios.................................... 647 Utilizando as funções do Excel................................................................... 677 Como calcular valores-p com o Minitab e o Excel.................................... 681
Índice.................................................................................................................................... 685
Prefácio O objetivo do livro Estatística aplicada à administração e aconomia é oferecer aos alunos, principalmente àqueles das àreas de administração e economia, uma introdução conceitual ao campo da Estatística e suas muitas aplicações. O texto é orientado à prática e foi escrito tendo em mente as necessidades do aluno não matemático; o único pré-requisito exigido é o conhecimento de álgebra. As aplicações de análise de dados e metodologia estatística são parte integrante da organização e apresentação do conteúdo deste livro. A discussão e o desenvolvimento de cada técnica são apresentados em um conjunto de aplicações, com os resultados estatísticos fornecendo critérios para decisões e soluções de problemas. Apesar de o livro ser orientado a aplicações, tivemos o cuidado de proporcionar um desenvolvimento metodológico correto e de utilizar a notação geralmente aceita para o tópico em discussão. Assim, os alunos descobrirão que o texto oferece boa preparação para o estudo de material estatístico mais avançado. Uma bibliografia revisada e atualizada para orientar estudos adicionais foi incluída como apêndice. O livro apresenta os pacotes Minitab 15 e Microsoft® Office Excel® 2007 e enfatiza o papel da computação na aplicação da análise estatística. O Minitab pode ser visto como um dos principais pacotes estatísticos destinados tanto à educação quanto à prática estatística. O Excel não é um pacote estatístico, mas sua ampla disponibilidade e uso tornam-no importante para que os alunos compreendam as capacidades estatísticas desse pacote. Nesta edição, trabalhamos com um suplemento comercial do Excel, o StatTools1, que amplia o alcance das opções de estatística para os usuários do Excel. Os procedimentos referentes ao Minitab, ao Excel e ao StatTools são fornecidos nos apêndices dos capítulos, de modo que os professores tenham a flexibilidade de utilizar tanta ênfase computacional quanto desejarem para o curso. É provável que haja usuários tanto do Excel 2007 como do Excel 2010 utilizando este livro. Para atender a esses dois grupos de usuários, os procedimentos passo a passo e as planilhas apresentados em nossos apêndices a respeito do Excel foram desenvolvidos e testados utilizando tanto o Excel 2007 quanto as versões beta públicas do Excel 2010.
1
N.E.: StatTools é um produto comercial, desenvolvido pela Palisade Corporation. Entre em contato com o fornecedor para adquiri-lo em www.palisade.com.
xv
xvi
Estatística aplicada à administração e economia
Mudanças na sexta edição Agradecemos a aceitação e a resposta positiva às edições anteriores de Estatística aplicada à administração e economia. Consequentemente, ao fazer modificações nesta nova edição, mantivemos o estilo de apresentação e a legibilidade das edições anteriores. As mudanças significativas na nova edição estão resumidas a seguir.
Revisões de conteúdo • Suplemento StatTools para o Excel. O Excel 2007 não contém funções estatísticas nem ferramentas de análise de dados para realizar todos os procedimentos estatísticos discutidos neste livro. O StatTools é um suplemento comercial do Excel 2007, desenvolvido pela Palisade Corporation, que fornece opções de estatística adicionais para os usuários do Excel. No Apêndice do Capítulo 1 e de outros capítulos são apresentadas as etapas requeridas para implementar um procedimento estatístico utilizando o StatTools. Foi tomado o devido cuidado para que o StatTools fosse uma ferramenta completamente opcional, de modo que os professores que quiserem ensinar recorrendo às ferramentas padrão disponíveis no Excel 2007 possam continuar a fazer isso. Mas os usuários que preferirem recursos adicionais que não estão disponíveis no Excel 2007 agora poderão ter acesso a um suplemento de estatística profissional que os alunos poderão continuar a utilizar no local de trabalho. • Modificação na terminologia referente à natureza dos dados. Na edição anterior, dados nominais e ordinais foram classificados como qualitativos; os dados intervalares ou em escala de razões foram classificados como quantitativos. Nesta edição, os dados nominais e ordinais foram denominados dados categóricos. Os dados nominais e ordinais utilizam rótulos ou nomes para identificar categorias de itens similares. Desse modo, acreditamos que o termo categórico seja mais descritivo desse tipo de dados. • Introduzindo mineração. Uma nova seção no Capítulo 1 apresenta o campo relativamente novo da mineração. Oferecemos uma breve visão geral de mineração e do conceito de armazenamento de dados. Também descrevemos como os campos da estatística e da ciência da computação se unem para tornar a mineração operacional e valiosa. • Questões éticas na estatística. Outra seção nova no Capítulo 1 oferece uma discussão concernente a questões éticas ao apresentar e interpretar informações estatísticas. • Apêndice atualizado do Excel para estatísticas descritivas tabulares e gráficas. O Apêndice de final de capítulo sobre o Excel, do Capítulo 2, mostra como as Ferramentas de Gráfico, o Relatório de Tabela Dinâmica e o Relatório de Gráfico Dinâmico podem ser utilizados para aprimorar os recursos destinados a exibir estatísticas descritivas tabulares e gráficas. • Análise comparativa com box plots. A abordagem dos box plots no Capítulo 2 foi expandida para incluir comparações rápidas e fáceis de dois ou mais conjuntos de dados. Dados típicos a respeito de salários iniciais para estudos de contabilidade, finanças, administração e marketing são utilizados para ilustrar comparações de diversos grupos com box plots. • Material de amostragem revisado. A introdução do Capítulo 7 foi revisada e agora inclui os conceitos de uma amostra populacional e de um sistema de referências. A distinção entre a amostragem em uma população finita e em uma população infinita foi esclarecida, com a amostragem de um processo utilizado para ilustrar a seleção de uma amostra aleatória a partir de uma população infinita. A seção Recomendação Prática enfatiza a importância de se obter estreita correspondência entre a amostra populacional e a população-alvo. • Revisão da introdução aos testes de hipóteses. A Seção 9.1, Desenvolvendo as hipóteses nula e alternativa, foi revisada. Um melhor conjunto de diretrizes foi desenvolvido para identificar as hipóteses nula e alternativa. O contexto da situação e a razão para se considerar uma amostra são fundamentais. Em situações nas quais o foco está em encontrar evidências
Prefácio
xvii
para se apoiar a descoberta de uma pesquisa, a hipótese da pesquisa é a hipótese alternativa. Em situações nas quais o foco está em desafiar uma suposição, a suposição é a hipótese nula. • Novos estudos de caso. Acrescentamos cinco novos estudos de caso nesta edição, chegando ao total de 31. Um novo estudo de caso referente à estatística descritiva é apresentado no Capítulo 3, outro concernente aos testes de hipóteses é fornecido no Capítulo 9. Dois novos estudos de caso foram acrescentados para regressão nos capítulos 12 e 13, oferecendo aos alunos a oportunidade de analisar maiores conjuntos de dados e preparar relatórios gerenciais, com base nos resultados das análises. • Novas seções Estatística na Prática. Cada capítulo começa com a seção chamada Estatística na Prática, que descreve uma aplicação acerca da metodologia estatística a ser abordada no capítulo. Nesta edição há de novidade o artigo Estatística na Prática, a respeito da Oceanwide Seafood, no Capítulo 4. • Novos exemplos e exercícios fundamentados em dados reais. Continuamos a fazer um grande esforço para atualizar nossos exemplos e exercícios neste livro com os dados reais e as fontes de referência de informações estatísticas mais atualizadas. Nesta edição, acrescentamos aproximadamente 140 novos exemplos e exercícios com base em dados reais e fontes de referência. Recorrendo a dados de fontes também utilizadas pelos jornais The Wall Street Journal, USA Today, Barron’s e outros, selecionamos dados reais para desenvolver explicações e criar exercícios que demonstrem os muitos usos da estatística na administração e na economia. Acreditamos que a utilização de dados reais ajuda a gerar maior interesse no material, por parte dos alunos e a possibilitar que eles aprendam sobre a metodologia de estatística e sua aplicação. Esta nova edição contém mais de 300 exemplos e exercícios fundamentados em dados reais.
xviii
Estatística aplicada à administração e economia
Características e pedagogia Continuamos com muitas das características introduzidas em edições anteriores. Algumas das mais importantes são destacadas a seguir.
Exercícios de métodos e exercícios de aplicações Os exercícios no final de cada seção estão divididos em duas partes, Métodos e Aplicações. Os Exercícios de Métodos exigem que os alunos utilizem as fórmulas e façam os cálculos necessários. Os Exercícios de Aplicações requerem que os alunos usem o material do capítulo em situações reais. Assim, os estudantes se focarão primeiro na generalização dos cálculos e, então, irão se dedicar às sutilezas da aplicação e interpretação estatística.
Exercícios de autoteste Muitos exercícios são identificados como exercícios de Autoteste. Soluções completas para tais exercícios são fornecidas no Apêndice D, no final do livro. Os alunos podem tentar resolvê-los e imediatamente verificar as respostas para avaliar sua compreensão dos conceitos apresentados no capítulo.
Anotações de margem e notas e comentários As anotações de margem, que destacam aspectos importantes e fornecem percepções adicionais para o aluno, são uma importante característica deste livro. Essas anotações são projetadas para enfatizar e aprimorar o entendimento dos termos e conceitos que são apresentados no livro. No final de muitas seções, fornecemos Notas e Comentários elaborados para proporcionar aos alunos maior percepção sobre a metodologia estatística e sua aplicação. As Notas e Comentários incluem advertências sobre possíveis limitações da metodologia, recomendações de aplicação, breves descrições de considerações técnicas adicionais e outros assuntos.
Arquivos de dados que acompanham o livro Aproximadamente 250 arquivos de dados estão disponíveis na Trilha (ferramenta de aprendizagem que acompanha o livro). Os conjuntos de dados estão disponíveis nos formatos para o Minitab e o Excel (os arquivos estão em inglês). Ao longo do livro são utilizados logotipos da Trilha, identificando o conjunto de dados que está disponível na ferramenta.
Agradecimentos Gostaríamos de agradecer pelo trabalho de nossos revisores, que forneceram seus comentários e sugestões sobre as formas de continuar a melhorar nosso livro. Agradecemos a: Ahmad Saranjam Bridgewater State College
Ceyhun Ozgur Valparaiso University
Eric B. Howington Valdosta State University
Ahmad Syamil Arkansas State University
Charles Nicholas Gomersall Luther College
Eric Huggins Fort Lewis College
Alan Olinsky Bryant University
Charles Vawter, Jr. Glendale Community College
Gauri Shankar Guha Arkansas State University
Amanda Felkey Lake Forest College
Christopher Ball Quinnipiac University
Amy Schmidt Saint Anselm College
Chuck Parker Wayne State College
Geetha Vaidyanathan University of North Carolina – Greensboro
Anirudh Ruhil Ohio University
Constance Lightner Fayetteville State University
Asatar Bair City College of San Francisco Atul Gupta Lynchburg College Bedassa Tadesse University of Minnesota, Duluth
Dale Bails Christian Brothers University Dale DeBoer University of Colorado, Colorado Springs
George H. Jones University of Wisconsin-Rock County Gordon Stringer University of Colorado, Colorado Springs Greg Miller U.S. Naval Academy
David Keswick University of Michigan – Flint
Harvey Singer George Mason University
Denise Robson University of Wisconsin, Oshkosh
Helen Moshkovich University of Montevallo Stephens’ College of Business
Doug Dotterweich East Tennessee State University
Herbert Moskowitz Purdue University
Bruce Gouldey Shenandoah University
Doug Morris University of New Hampshire
Carl Poch Northern Illinois University
Dwight Goehring California State University – Monterey Bay
James Jozefowicz Indiana University of Pennsylvania
Bill Swank George Mason University Billy L. Carson II Itawamba Community College Brad McDonald Northern Illinois University
Carlton Scott University of California, Irvine Carol Jensen Upper Iowa University Carolyn Rochelle East Tennessee State University
Edwin Shapiro University of San Francisco Elaine Zanutto University of Pennsylvania Emmanuelle Vaast Long Island University
James Perry Owens State Community College James Schmidt University of Nebraska, Lincoln James Thorson Southern Connecticut State University
xix
xx
Estatística aplicada à administração e economia
James Wright Green Mountain College
Julie Szendrey Malone College
Michael Sklar Rutgers University
Jan Stallaert University of Connecticut Janet Pol University of Nebraska, Omaha
Kazim Ruhi University of Maryland
Mike Racer University of Memphis
Ken Mayer University of Nebraska, Omaha
Minghe Sun University of Texas – San Antonio
Jean Meyer Xavier University of Louisiana
Kevin Murphy Oakland University
Jeffrey Bauer University of Cincinnati, Clermont
Kevin Nguyen Montgomery College
Jeffrey Jarrett University of Rhode Island
Khosrow Moshirvaziri California State University, Long Beach
Jena Shafai Bellevue University Jennifer Kohn Montclair State University Jeremy Pittman Coahoma Community College Jerzy Kamburowski The University of Toledo Jigish Zaveri Morgan State University Jim Knudsen Creighton University Jim Kuchta D’Youville College Jim Zimmer Chattanooga State Technical Community College Jodey Lingg City University Joe Williams Itawamba Community College John Christiansen Southwestern Oregon Community College John Davis University of the Incarnate Word
Kiran R. Bhutani The Catholic University of America Kyle Vann Scott Snead State Community College Larry Corman Fort Lewis College Linda Sturges SUNY Maritime College Lyle Rupert Hendrix College Maggie Williams Flint Northeast State Community College Mark Gius Quinnipiac University Marvin Gonzalez College of Charleston Mary Lynn Engel Saint Joseph’s College of Maine Maryanne Clifford Eastern Connecticut State University
Molly Zimmer University of Evansville Nancy Brooks University of Vermont Omer Benli California State University, Long Beach Phuoc Huu Tran Bellevue University Phyllis Schumacher Bryant University Ranga Ramasesh Texas Christian University Robert Cochran University of Wyoming Robert Taylor Mayland Community College Robert Vokurka Texas A&M University – Corpus Christi Ronald Kizior Loyola University Chicago Ronnie Watson Southern Arkansas University Rosa Lemel Kean University Saiid Ganjalizadeh The Catholic University of America Scott Callan Bentley College
Melissa Miller Meridian Community College
Shauna L. Van Dewark Humphreys College
John Vangor Fairfield University
Michael Broida Miami University of Ohio
Sheng-Kai Chang Wayne State University
Joseph Cavanaugh Wright State University, Lake Campus
Michael Gordinier Washington University, St. Louis
Shin-Ping Tucker University of Wisconsin, Superior
Joseph Williams Itawamba Community College
Michael McKittrick Santa Fe Community College
Stephen Grubagh Bentley University
Josh Kim Quinnipiac University
Michael Polomsky Cleveland State University
Steven Eriksen Babson College
Agradecimentos
xxi
Sue Umashankar University of Arizona
Tenpao Lee Niagara University
Wayne Bedford University of West Alabama
Sunil Sapra California State University, Los Angeles
Thomas R. Sexton Stony Brook University
William Pan University of New Haven
Toni Somers Wayne State University
Yongjing Zhang Midwestern State University
Vivek Shah Texas State University
Yuri Yatsenko Houston Baptist University
Susan Emens Kent State University, Trumbull Campus Susan Sandblom Scottsdale Community College
Continuamos em débito com muitos de nossos colegas e amigos por seus úteis comentários e sugestões no desenvolvimento desta edição e de edições anteriores de nosso livro. Entre eles, estão: Alan Smith Robert Morris College
Laramie County Community College
Raj Devasagayam St. Norbert College
Ali Arshad College of Santa Fe
Gary Nelson Central Community College – Columbus Campus
Robert Cochran University of Wyoming H. Robert Gadd Southern Adventist University
Bennie Waller Francis Marion University Carlton Scott University of California – Irvine Charles Reichert University of Wisconsin – Superior Charles Zimmerman Robert Morris College Dale DeBoer University of Colorado – Colorado Springs Elaine Parks
Gipsie Ranney Belmont University Habtu Braha Coppin State College Karen Gutermuth Virginia Military Institute Larry Scheuermann University of Louisiana, Lafayette Md. Mahbubul Kabir Lyon College Nader Ebrahimi University of New Mexico
Stephen Smith Gordon College Timothy Bergquist Northwest Christian College Wibawa Sutanto Prairie View A&M University Yan Yu University of Cincinnati Zhiwei Zhu University of Louisiana, em Lafayette
Um agradecimento especial a nossos associados das empresas e da indústria, que nos forneceram os recursos referentes à seção “Estatística na Prática”. Em cada um dos artigos, há créditos individuais de agradecimento. Por fim, também agradecemos ao nosso editor Sênior de Aquisições, Charles McCormick, Jr., à editora de Desenvolvimento, Maggie Kubale, à gerente de Projeto de Conteúdo, Jacquelyn K. Featherly, à gerente de Projeto na MPS Content Services, Lynn Lustberg, ao gerente de Marketing, Adam Marsh, ao editor de Mídia, Chris Valentine, e a outros profissionais na Cengage South-Western, por seu apoio e orientação editorial durante a preparação desta obra. Dennis J. Sweeney Thomas A. Williams David R. Anderson
Sobre os autores Dennis J. Sweeney é professor de Análise Quantitativa e fundador do Centro para a Melhoria da Produtividade na University of Cincinnati. Nascido em Des Moines, Iowa, obteve o diploma de bacharel na Drake University e os de mestre e doutor na Indiana University, onde foi membro do NDEA. De 1978 a 1979 integrou o grupo de Ciência da Administração na Procter & Gamble, e de 1981 a 1982 foi professor visitante na Duke University. Exerceu os cargos de chefe do Departamento de Análise Quantitativa e de diretor associado da Faculdade de Administração de Negócios da University of Cincinnati. Sweeney publicou mais de 30 artigos e monografias na área de Ciência da Administração e Estatística. Instituições como National Science Foundation, IBM, Procter & Gamble, Federated Department Stores, Kroger e Cincinnati Gas & Electric têm patrocinado suas pesquisas, publicadas nas revistas Management Science, Operations Research, Mathematical Programming, Decision Sciences, entre outras. É coautor de dez livros nas áreas de Estatística, Ciência da Administração, Programação Linear e Administração de Produção e Gerenciamento. Thomas A. Williams é professor de Ciência da Administração na Faculdade de Administração do Rochester Institute of Technology. Nascido em Elmira, Nova York, obteve o diploma de bacharel na Clarkson University. Fez pós-graduação no Rensselaer Polytechnic Institute, onde obteve os diplomas de mestre e doutor. Antes de lecionar na Faculdade de Administração do RIT, Williams foi, durante sete anos, professor da Faculdade de Administração de Negócios na University of Cincinnati, onde desenvolveu e coordenou o programa de graduação em Sistemas de Informação. No RIT, foi o primeiro presidente do Departamento de Ciências da Decisão. Ministra cursos de Ciência da Administração e de Estatística, bem como cursos de graduação em Análise de Regressão e de Decisão. É coautor de 11 livros nas áreas de Ciência da Administração, Estatística, Administração da Produção e de Operações e Matemática. É consultor de inúmeras empresas da Fortune 500 e tem trabalhado em projetos que incluem desde o uso da análise de dados até o desenvolvimento de modelos de regressão em larga escala. David R. Anderson é professor de Análise Quantitativa na Faculdade de Administração de Negócios da University of Cincinnati. Nascido em Grand Forks, Dakota do Norte, obteve os diplomas de bacharel, mestre e doutor na Purdue University. Exerceu os cargos de chefe do Departamento de Análise Quantitativa e Gerenciamento de Operações e de diretor-adjunto da Faculdade de Administração de Negócios, além de ter sido o coordenador do primeiro programa executivo dessa faculdade. Na University of Cincinnati, ensinou estatística introdutória para os alunos de Administração, além de ministrar cursos de pós-graduação em Análise de Regressão, Análise Multivariada e Ciência da Administração. Também ministrou cursos de estatística no Ministério do Trabalho, em Washington, D.C., e tem recebido honrarias como indicações e prêmios de excelência no ensino e excelência em serviços a organizações estudantis. Anderson é coautor de 10 livros nas áreas de Estatística, Ciência da Administração, Programação Linear e Administração da Produção e Gerenciamento de Operações. É um ativo consultor no campo de amostragem e métodos estatísticos.
xxiii
C A P Í T U LO
11
Dados e a estatística CONTEÚDO
ESTATÍSTICA NA PRÁTICA BUSINESSWEEK 1.1 APLICAÇÕES EM ADMINISTRAÇÃO E ECONOMIA Contabilidade Finanças Marketing Produção Economia
1.2 DADOS Elementos, variáveis e observações Escalas de medição Dados categorizados e quantitativos Dados de seção transversal e de série temporal
1.3 AS FONTES DE DADOS Fontes existentes Estudos estatísticos Erros na obtenção de dados
1.4 ESTATÍSTICA DESCRITIVA 1.5 INFERÊNCIA ESTATÍSTICA 1.6 COMPUTADORES E A ANÁLISE ESTATÍSTICA 1.7 MINERAÇÃO (DATA MINING) 1.8 DIRETRIZES ÉTICAS PARA A PRÁTICA ESTATÍSTICA
Vemos com frequência os seguintes tipos de afirmação em artigos de jornais e de revistas: • A National Association of Realtors (Associação Nacional de Corretores de Imóveis) relatou que o preço médio pago pelos que compram sua primeira casa é de $ 165.000 (The Wall Street Journal, de 11 fevereiro de 2009). • A NCAA (National Collegiate Athletic Association, ou Associação Atlética do Colegiado Nacional) relatou que atletas universitários estão obtendo diplomas a índices recorde. Os números mais recentes mostram que 79% de todos os alunos e alunas que são atletas se formam (Associated Press, 15 de outubro de 2008). • O tempo médio de percurso de ida para o trabalho é de 25,3 minutos (Agência de Recenseamento dos Estados Unidos, março de 2009). • Uma pesquisa demonstrou que 73% dos indivíduos pesquisados esperavam que a Média Industrial do Índice Dow Jones aumentasse 10% ou mais durante o próximo ano (Money Investor’s Guide, fevereiro de 2010).
1
2
Estatística aplicada à administração e economia
ESTATÍSTICA na PR Á TIC A BUSINESSWEEK* Nova York, NY Com uma circulação global de mais de um milhão de exemplares, a BusinessWeek é a revista de negócios mais lida em todo o mundo. Mais de 200 repórteres exclusivos e editores em 26 agências internacionais publicam uma série de artigos que interessam à comunidade empresarial e econômica. Além dos artigos especiais sobre temas da atualidade, a revista contém seções regulares sobre negócios internacionais, análise econômica, processamento de informação e ciência e tecnologia. As informações apresentadas nos artigos e nas seções regulares ajudam o leitor a se manter atualizado sobre os acontecimentos e a avaliar o impacto desses acontecimentos sobre as condições econômicas e de negócios. A maioria das edições da BusinessWeek fornece uma reportagem mais aprofundada sobre um assunto de interesse atual. Frequentemente, essas reportagens contêm fatos e resumos estatísticos que ajudam o leitor a entender as informações empresariais ou econômicas. Por exemplo, a edição de 17 de março de 2009 incluía uma discussão sobre quando o mercado de ações começaria a se recuperar; a edição de 4 de maio de 2009 tinha uma reportagem especial sobre como tornar a redução salarial menos problemática; e a edição de 18 de janeiro de 2010 continha um artigo sobre a permanência da mão de obra temporária. Além disso, a revista semanal BusinessWeek Investor for-
nece estatísticas sobre a situação da economia, incluindo índices de produção, preços de ações, fundos mútuos e taxas de juros. A BusinessWeek também usa a estatística e informações estatísticas para gerenciar seu próprio negócio. Por exemplo, uma pesquisa anual feita com os assinantes ajuda a empresa a conhecer aspectos demográficos relativos a eles, seus hábitos de leitura, a probabilidade de compras, estilos de vida e assim por diante. Os gerentes da revista utilizam os resumos estatísticos dessa pesquisa para oferecer melhores serviços aos assinantes e aos anunciantes. Uma pesquisa recente com os assinantes norte-americanos indicou que 90% dos assinantes da BusinessWeek têm computadores em casa e que 64% articulam a compra de um computador no trabalho. Esse tipo de estatística alerta os gerentes da BusinessWeek quanto ao interesse do assinante em artigos sobre novos desenvolvimentos na área da informática. Os resultados da pesquisa também são colocados à disposição de potenciais assinantes. A elevada porcentagem de assinantes que usam computadores pessoais em casa e dos que articulam a compra de computadores no trabalho seria um incentivo para os fabricantes pensarem em anunciar na revista. Neste capítulo, discutiremos os tipos de dados disponíveis para análise estatística e descreveremos como são obtidos. Apresentaremos a estatística descritiva e a inferência estatística como meios de converter dados em informações estatísticas significativas e de fácil interpretação.
*Os autores agradecem a Charlene Trentham, gerente de Pesquisas da BusinessWeek, por fornecer esta Estatística na Prática.
• O preço médio nacional da gasolina comum atingiu $ 4,00 por galão pela primeira vez na história (site da Cable News Network, 8 de junho de 2008). • O time do New York Yankees obteve os mais elevados salários da liga profissional de beisebol. A folha de pagamento total é de $ 201.449.289, com um salário mediano de $ 5.000.000 (USA Today Salary Data Base, setembro de 2009). • A Média Industrial do Índice Dow Jones fechou a 10,664 (The Wall Street Journal, 12 de janeiro de 2010). Os fatos numéricos contidos nessas afirmações ($ 165.000, 79%, 25,3 minutos, 73%, $ 4,00, $ 201.449.289, $ 5.000.000 e 10,664) denominam-se estatísticas. Desse modo, o termo estatística se refere a fatos numéricos, como médias, medianas, percentuais e índices, que nos ajudam a compreender uma variedade de situações administrativas e econômicas. Entretanto, como veremos, a área ou o objeto da estatística envolve muito mais do que fatos numéricos. Em um sentido mais amplo, estatística é a arte e a ciência de coletar, analisar, apresentar e interpretar dados. Especialmente na área da administração e economia, as informações obtidas por meio de coleta, análise, apresentação e interpretação dos dados proporcionam aos gerentes e tomadores de decisões uma melhor compreensão do ambiente empresarial e econômico e, assim, capacita-os a tomar decisões
Capítulo 1 Dados e a estatística
3
mais fundamentadas e de melhor qualidade. Neste livro, enfatizamos o uso da estatística para a tomada de decisões nas áreas de administração e economia. O Capítulo 1 começa com algumas ilustrações da aplicação da estatística no setor de administração e economia. Na Seção 1.2, definimos o termo dados e introduzimos o conceito de conjunto de dados. Essa seção também apresenta termos-chave, como variáveis e observações, discute a diferença entre dados quantitativos e categorizados e ilustra o uso de dados transversais e de séries temporais. A Seção 1.3 discute como é possível obter dados de fontes existentes ou por intermédio de pesquisa e estudos experimentais idealizados para obter novos dados. O importante papel que a Internet desempenha na obtenção de dados também é realçado. A utilização de dados para desenvolver estatística descritiva e fazer inferências estatísticas será descrita nas Seções 1.4 e 1.5. As últimas três seções do Capítulo 1 apresentam o papel dos computadores na análise estatística, uma introdução ao campo relativamente novo da mineração e uma discussão sobre as diretrizes éticas para a prática estatística. O Apêndice no final do capítulo inclui uma introdução ao StatTools, que pode ser utilizado para ampliar as opções estatísticas destinadas aos usuários do Microsoft Excel.
1.1 Aplicações em administração e economia No moderno ambiente administrativo e econômico global, qualquer pessoa pode ter acesso a uma enorme quantidade de informações estatísticas. Os gerentes e tomadores de decisão mais bem-sucedidos são aqueles capazes de entender a informação e usá-la eficazmente. Nesta seção, apresentamos exemplos que ilustram algumas utilizações da estatística nas áreas da administração e economia.
Contabilidade Empresas públicas de contabilidade utilizam procedimentos de amostragem estatística ao realizarem auditorias para seus clientes. Por exemplo, suponha que uma firma de contabilidade queira determinar se o valor das contas a receber indicado na folha de balancete de um cliente representa fielmente o valor real das contas a receber. Geralmente, o grande número de contas a receber individuais torna a revisão e validação de cada conta algo demasiadamente demorado e dispendioso. A prática comum nessas situações é a equipe de auditores selecionar um subconjunto das contas, denominado amostra. Depois de revisar a exatidão das contas amostradas, os auditores concluem se o valor das contas a receber apresentado na folha de balancete do cliente é aceitável.
Finanças Os analistas financeiros usam uma série de informações estatísticas para orientar suas recomendações de investimentos. No caso dos títulos financeiros, os analistas revisam uma série de dados financeiros que incluem os índices de preço/ganhos ou lucros e a rentabilidade em dividendos. Comparando a informação correspondente a um título individual com as informações sobre a média do mercado de ações, o analista financeiro pode concluir se um título individual está valorizado ou desvalorizado. Por exemplo, a revista Barron’s (18 de fevereiro de 2008) publicou que a média dos índices de preço/ ganhos ou lucros dos 30 títulos da Média Industrial Dow Jones era de 2,45%. O Altria Group apresentava um índice de preço/ganhos ou lucros igual a 3,05%. Nesse caso, as informações estatísticas sobre os rendimentos obtidos indicavam um maior rendimento conquistado pelo Altria Group do que a média em comparação aos títulos da Dow Jones. Portanto, um analista financeiro poderia concluir que os títulos do Altria Group estavam valorizados. Essa e outras informações sobre o Altria Group ajudariam o analista a recomendar a compra, venda ou manutenção dos títulos.
Marketing Scanners eletrônicos utilizados nas caixas registradoras das lojas de venda a varejo coletam dados que são usados em uma série de aplicações de pesquisa de marketing. Por exemplo, fornecedores
4
Estatística aplicada à administração e economia
de dados como a ACNielsen e a Information Resources Inc. compram dados colhidos por scanners eletrônicos localizados em pontos de venda de mercearias, processam esses dados e depois vendem seus resumos estatísticos a empresas de manufatura. Empresas manufatureiras gastam centenas de milhares de dólares por categoria de produto para obter esse tipo de informação. A indústria também compra dados e resumos estatísticos a respeito de atividades promocionais, como a fixação de preços especiais e o uso de exibições em vídeo nas lojas. Gerentes de marca podem revisar os dados estatísticos dos scanners e os dados estatísticos da atividade promocional para obter um entendimento melhor da relação entre as atividades promocionais e as vendas. Esse tipo de análise muitas vezes é útil para estabelecer as futuras estratégias de marketing para os vários produtos.
Produção A atual ênfase na qualidade torna o controle da qualidade uma importante aplicação da estatística na área de produção. Utiliza-se uma série de mapas estatísticos de controle da qualidade para monitorar o resultado (output) de um processo de produção. Em especial, pode-se usar uma carta de controle para X-barra para monitorar a média do produto. Suponha, por exemplo, que uma máquina preencha recipientes com 355 ml de determinado refrigerante. Periodicamente, um funcionário do setor de produção seleciona uma amostra dos recipientes e calcula a quantidade média de refrigerante em mililitros. Essa média, ou valor X-barra, é traçada na carta de controle. Um valor acima do limite máximo de controle no gráfico mostra que o recipiente tem um volume de refrigerante maior que o especificado, e um valor abaixo do limite mínimo de controle no gráfico mostra que o recipiente tem um volume menor do que o especificado. O processo é chamado “sob controle” e pode prosseguir contanto que as médias traçadas se situem entre os limites de controle máximo e mínimo indicados na carta de controle. Adequadamente interpretada, uma carta de controle pode ajudar a estabelecer quando há a necessidade de ajustes para corrigir o processo de produção.
Economia Os economistas frequentemente fornecem previsões sobre o futuro da economia ou algum aspecto dela. Eles usam uma série de informações estatísticas para fazer essas previsões. Por exemplo, ao preverem as taxas de inflação, usam informações estatísticas de indicadores como o índice de preços do produtor, a taxa de desemprego e a utilização da capacidade de produção industrial. Com frequência esses indicadores estatísticos são inseridos em modelos de previsão computadorizados que preveem as taxas de inflação. Aplicações de estatística como as que descrevemos nesta seção são parte integrante deste livro. Os exemplos constituem uma visão geral da amplitude das aplicações estatísticas. Para complementá-los, profissionais da área de administração e economia nos forneceram os artigos de abertura de capítulo intitulados Estatística na Prática, que fazem uma introdução à matéria abordada em cada capítulo. As aplicações dessa seção mostram a importância da estatística em uma variedade ampla de situações comerciais e econômicas.
1.2 Dados Dados são os fatos e números coletados, analisados e sintetizados para apresentação e interpretação. Todos os dados coletados em um estudo em particular denominam-se conjunto de dados do estudo. A Tabela 1.1 mostra um conjunto de dados que contém informações financeiras referentes a 25 fundos mútuos de investimento que faziam parte do relatório dos 500 maiores e mais populares fundos da Morningstar Funds 2008. A Morningstar é uma companhia que acompanha o desempenho de mais de 7 mil fundos mútuos de investimentos e prepara análises detalhadas de 2 mil desses fundos. Suas orientações são seguidas à risca por analistas financeiros e investidores individuais.
Capítulo 1 Dados e a estatística
5
Elementos, variáveis e observações Elementos são as entidades a respeito das quais se coletam dados. Em relação ao conjunto de dados da Tabela 1.1, cada fundo de investimento individualmente é um elemento; os nomes dos elementos aparecem na primeira coluna. Com 25 fundos mútuos, o conjunto de dados contém 25 elementos. Uma variável é a característica de interesse para os elementos. O conjunto de dados da Tabela 1.1 inclui as cinco variáveis a seguir: • Tipo de fundo: tipo de fundo mútuo, identificado como DE (Domestic Equity, ou Capital Nacional Americano), IE (International Equity, ou Capital Internacional) e FI (Fixed Income, ou Renda Fixa). • Valor do ativo líquido ($): o preço de fechamento por ação em 31 de dezembro de 2007. • Rendimento médio em 5 anos (%): o rendimento médio anual do fundo durante os últimos cinco anos.
Tabela 1.1 Conjunto de dados referentes a 25 fundos mútuos.
Morningstar
Conjuntos de dados como os da Morningstar estão disponíveis na Trilha.
Nome do fundo
Tipo de fundo
Valor do ativo líquido ($)
Rendimento médio em 5 anos (%)
American Century Intl. Disc
IE
14,37
30,53
1,41
3 estrelas
American Century Tax-Free Bond
FI
10,73
3,34
0,49
4 estrelas
American Century Ultra
DE
24,94
10,88
0,99
3 estrelas
Artisan Small Cap
DE
16,92
15,67
1,18
3 estrelas
Brown Cap Small
DE
35,73
15,85
1,20
4 estrelas
DFA U.S. Micro Cap
DE
13,47
17,23
0,53
3 estrelas
Fidelity Contrafund
DE
73,11
17,99
0,89
5 estrelas
Fidelity Overseas
IE
48,39
23,46
0,90
4 estrelas
Fidelity Sel Electronics
DE
45,60
13,50
0,89
3 estrelas
Fidelity Sh-Term Bond
FI
8,60
2,76
0,45
3 estrelas
Gabelli Asset AAA
DE
49,81
16,70
1,36
4 estrelas
Kalmar Gr Val Sm Cp
DE
15,30
15,31
1,32
3 estrelas
Marsico 21st Century
DE
17,44
15,16
1,31
5 estrelas
Mathews Pacific Tiger
IE
27,86
32,70
1,16
3 estrelas
Oakmark I
DE
40,37
9,51
1,05
2 estrelas
PIMCO Emerg Mkts Bd D
FI
10,68
13,57
1,25
3 estrelas
RS Value A
DE
26,27
23,68
1,36
4 estrelas
T. Rowe Price Latin Am.
IE
53,89
51,10
1,24
4 estrelas
T. Rowe Price Mid Val
DE
22,46
16,91
0,80
4 estrelas
Thornburg Value A
DE
37,53
15,46
1,27
4 estrelas
USAA Income
FI
12,10
4,31
0,62
3 estrelas
Vanguard Equity-Inc
DE
24,42
13,41
0,29
4 estrelas
Vanguard Sht-Tm TE
FI
15,68
2,37
0,16
3 estrelas
Vanguard Sm Cp Idx
DE
32,58
17,01
0,23
3 estrelas
Wasatch Sm Cp Growth
DE
35,41
13,98
1,19
4 estrelas
Fonte: Morningstar Funds 500 (2008).
Quociente de despesas (%)
Classificação pela Morningstar
6
Estatística aplicada à administração e economia
• Quociente de despesas: a porcentagem de ativos deduzidos a cada ano fiscal para as despesas do fundo. • Classificação pela Morningstar: a classificação geral de cada fundo, em número de estrelas, de acordo com os riscos; as classificações da Morningstar vão de 1 estrela (classificação baixa) a 5 estrelas (classificação alta). Os dados foram obtidos coletando-se as medidas para cada variável de cada elemento do estudo. O conjunto de medidas obtidas correspondentes a determinado elemento é chamado observação. Consultando a Tabela 1.1, vemos que o conjunto de medidas referentes à primeira observação (American Century Intl. Disc) é IE, 14,37, 30,53, 1,41 e 3 estrelas. O conjunto de medidas da segunda observação (American Century Tax-Free Bond) é FI, 10,73, 3,34 e 0,49, 4 estrelas e assim por diante. Um conjunto de dados com 25 elementos contém 25 observações.
Escalas de medição A coleta de dados requer uma das seguintes escalas de medição: nominal, ordinal, intervalar ou razão (quociente). A escala de medição determina a quantidade de informação contida nos dados e indica a síntese e as análises estatísticas mais apropriadas aos dados. Quando os dados referentes a uma variável consistem em rótulos ou nomes usados para identificar um atributo do elemento, a escala de medição é considerada escala nominal. Por exemplo, consultando os dados da Tabela 1.1, vemos que a escala de medição da variável Tipo de Fundo é nominal porque DE, IE e FI são rótulos usados para identificar a categoria ou tipos de fundo. Nos casos em que a escala de medição é nominal, um código numérico, bem como rótulos não numéricos, pode ser usado. Por exemplo, para facilitar a coleta de dados e prepará-los para serem digitados em uma planilha eletrônica, poderíamos utilizar um código numérico atribuindo a 1 o significado Capital Nacional Americano (DE), ao número 2 o significado de Capital Internacional (IE) e ao número 3 o significado de Renda Fixa (FI). Nesse caso, os valores numéricos 1, 2 e 3 identificam a categoria do fundo. A escala de medição é nominal, embora os dados se apresentem como valores numéricos. A escala de medição de uma variável denomina-se escala ordinal se os dados exibirem as propriedades de dados nominais e se a ordem ou classificação dos dados for significativa. Por exemplo, a Eastside Automotive envia um questionário aos clientes com o objetivo de obter dados sobre a qualidade de seu serviço de mecânica de automóveis. Cada cliente dá a avaliação de excelente, bom ou ruim ao serviço de mecânica. Uma vez que os dados obtidos são rótulos – excelente, bom ou ruim –, eles têm as propriedades de dados nominais. Além disso, podem ser classificados, ou dispostos em uma ordem, de acordo com a qualidade do serviço. Os dados registrados como “excelente” indicam o melhor serviço, seguidos de “bom” e depois “ruim”. Desse modo, a escala de medição é ordinal. Como outro exemplo, note que a Classificação da Morningstar, para os dados na Tabela 1.1, é ordinal. Ela fornece uma classificação de 1 até 5 estrelas, com base na avaliação da Morningstar em relação ao retorno do fundo ajustado ao risco do investimento. Os dados ordinais também podem ser fornecidos utilizando-se um código numérico, por exemplo, o semestre cursado na faculdade. A escala de medição de uma variável é a escala intervalar se os dados exibirem as propriedades de dados ordinais e o intervalo entre os valores for expresso em termos de unidade de medida fixa. Dados de intervalos são sempre numéricos. As pontuações do exame SAT (Scholastic Aptitude Test, ou Teste de Aptidão Escolar) são exemplos de dados com escala intervalar. Por exemplo, três estudantes com pontuações SAT iguais a 620, 550 e 470 podem ser classificados, ou ordenados, em termos do melhor para o pior desempenho. Além disso, as diferenças entre as pontuações são significativas. Por exemplo, o estudante 1 pontuou 620 – 550 = 70 pontos a mais que o estudante 2, ao passo que o estudante 2 pontuou 550 – 470 = 80 pontos a mais que o estudante 3. A escala de medição de uma variável é a escala de razão (ou quociente) se os dados tiverem todas as propriedades de dados intervalares e o quociente de dois valores for significativo. Variáveis como distância, altura, peso e tempo usam como medição a escala de razão. Essa escala
Capítulo 1 Dados e a estatística
7
exige que um valor zero seja incluído para indicar que não existe nada para a variável no ponto zero. Por exemplo, considere o custo de um automóvel. Um valor zero para o custo indicaria que o automóvel não tem nenhum custo e é grátis. Além disso, se compararmos o custo de $ 30 mil para um automóvel com o custo de $ 15 mil para um segundo automóvel, a propriedade da razão mostra que o primeiro automóvel é $ 30 mil/$ 15 mil = 2 vezes (ou o dobro) o custo do segundo automóvel.
Dados categorizados e quantitativos
O método estatístico apropriado para a sintetização dos dados depende de eles serem categorizados ou quantitativos.
Os dados também podem ser classificados como categorizados ou quantitativos. Os dados que podem ser agrupados por categorias específicas são chamados dados categorizados e utilizam escala de medição nominal ou ordinal. Os dados que utilizam valores numéricos para indicar quantidade são denominados dados quantitativos e são obtidos utilizando medição de escala intervalar ou escala de razão. Uma variável categorizada ou categórica é aquela com dados categóricos, e uma variável quantitativa é aquela com dados quantitativos. A análise estatística apropriada de determinada variável depende de a variável ser categorizada ou quantitativa. Se a variável for categórica, a análise estatística será bastante limitada. Podemos sintetizar os dados categorizados contando o número de observações em cada categoria ou calculando a proporção das observações em cada categoria. Entretanto, mesmo quando os dados categorizados usam código numérico, operações aritméticas como a adição, subtração, multiplicação e divisão não produzem resultados significativos. A Seção 2.1 discute maneiras de sintetizar dados categorizados. As operações aritméticas frequentemente produzem resultados significativos para variáveis quantitativas. Por exemplo, em relação a uma variável quantitativa, os dados podem ser somados e depois divididos pelo número de observações para calcularmos o valor médio. Essa média geralmente é significativa e facilmente interpretada. Em geral, quando os dados são quantitativos há mais alternativas para a análise estatística. A Seção 2.2 e o Capítulo 3 apresentam maneiras de sintetizar dados quantitativos.
Dados de seção transversal e de série temporal Para fins de análise estatística, é importante estabelecer a distinção entre dados de seção transversal e dados de série temporal. Dados de seção transversal são dados coletados no mesmo intervalo de tempo ou aproximadamente no mesmo intervalo de tempo. Os dados da Tabela 1.1 são transversais porque descrevem as cinco variáveis correspondentes aos 25 fundos mútuos no mesmo intervalo de tempo. Dados de série temporal são dados coletados ao longo de diversos períodos. Por exemplo, a Figura 1.1 apresenta um gráfico da média de preço por galão de gasolina comum, entre 2006 e 2009. Note que os maiores preços para a gasolina tendem a ocorrer nos meses de verão, com a média de preço mais elevada de $ 4,05 por galão ocorrendo em julho de 2008. Em janeiro de 2009, os preços da gasolina tiveram um declínio acentuado, atingindo o mínimo no período de três anos, de $ 1,65 por galão. Gráficos que representam dados de série temporal são, geralmente, encontrados em publicações na área de administração e economia. Tais gráficos ajudam os analistas a compreender o que aconteceu no passado, a identificar as tendências ao longo do tempo e a projetar níveis futuros para a série temporal. Os gráficos de dados de série temporal podem assumir diversas formas, conforme mostra a Figura 1.2. Com algum estudo, esses gráficos normalmente são fáceis de serem entendidos e interpretados. Por exemplo, o Painel (A), na Figura 1.2, é um gráfico que mostra a Média Industrial do Índice Dow Jones de 1997 até 2010. Em abril de 1997, o popular índice do mercado de ações estava próximo de 7 mil. Ao longo dos 10 anos seguintes o índice aumentou para mais de 14 mil, em julho de 2007. Contudo, observe o declínio acentuado na série temporal após as altas sucessivas verificadas em 2007. Em março de 2009, as más condições econômicas fizeram com que a Média
8
Estatística aplicada à administração e economia
Figura 1.1 Preço médio por galão para a gasolina comum, nos Estados Unidos.
$ 4,50
Preço médio por galão
$ 4,00 $ 3,50 $ 3,00 $ 2,50 $ 2,00 $ 1,50 $ 1,00 $ 0,50 $0 Mar. 6
Out. 6
Abr. 7
Nov. 7
Jun. 8
Dez. 8
Jul. 9
Data Fonte: Administração de Informações sobre Energia, Ministério de Energia dos Estados Unidos, julho de 2009.
Industrial do Índice Dow Jones voltasse ao nível de 7 mil, de 1997. Esse foi um período assustador e desencorajador para os investidores. Em janeiro de 2010, o índice mostrava recuperação, tendo atingido o nível de 10.600. O gráfico no Painel (B) mostra o Rendimento Líquido do McDonald’s Inc. de 2003 a 2009. A situação de crise econômica em 2008 e 2009, na realidade, foi benéfica para o McDonald’s, uma vez que o rendimento líquido da companhia aumentou para sucessivas altas. O crescimento do rendimento líquido do McDonald’s mostrou que a companhia prosperou durante a recessão econômica em virtude de as pessoas diminuírem a frequência aos restaurantes tradicionais, mais caros, e passarem a procurar as alternativas mais baratas, oferecidas pelo McDonald’s. O Painel (C) mostra a série temporal referente à Taxa de Ocupação de Hotéis do Sul da Flórida durante o período de um ano. As taxas de ocupação mais altas, de 95% e 98%, ocorrem durante os meses de fevereiro e março, quando o clima no sul da Flórida é atrativo para os turistas. De fato, tipicamente, o período de janeiro a abril de cada ano é uma época de grande taxa de ocupação nos hotéis do sul da Flórida. Por outro lado, note as baixas taxas de ocupação nos meses de agosto a outubro, com a menor taxa, de 50%, sendo registrada em setembro. As elevadas temperaturas e a temporada de furacões são as principais razões para a queda na taxa de ocupação em hotéis, nesse período. NOTAS e COMENTÁRIOS
1. Uma observação é o conjunto de medidas obtidas correspondentes a cada elemento de um conjunto de dados. Portanto, o número de observações é sempre igual ao número de elementos. O número de medidas obtidas correspondentes a cada elemento é igual ao número de variáveis. Portanto, o número total de itens de dados pode ser determinado multiplicando-se o número de observações pelo número de variáveis.
2. Os dados quantitativos podem ser discretos ou contínuos. Dados quantitativos que medem uma quantidade (algo enumerável, por exemplo, número de chamadas telefônicas recebidas em 15 minutos) são discretos. Dados quantitativos que medem uma quantificação (algo não enumerável, como peso ou tempo) são contínuos, porque não ocorre nenhuma separação entre os possíveis valores dos dados.
1.3 As fontes de dados Os dados podem ser obtidos de fontes existentes ou de pesquisas e estudos experimentais planejados para a coleta de novas observações.
Visite a página deste livro na Cengage Learning Brasil e conheça também todo o nosso catálogo
Dennis J. Sweeney Thomas A.Williams David R. Anderson
de Administração e Economia. É uma obra muito útil para todos que utilizam ferramentas estatísticas nas áreas de contabilidade, finanças, marketing, entre outras. Trilha é uma solução digital, com plataforma de acesso em português, que disponibiliza ferramentas multimídia para uma nova estratégia de ensino e aprendizagem.
ISBN 13 978-85-221-1281-4 ISBN 10 85-221-1281-9
Para suas soluções de curso e aprendizado, visite www.cengage.com.br
9 7 8 8 5 2 2 11 2 8 1 4
Tradução da 6ª edição norte-americana
ESTATÍSTICA APLICADA à administração e economia
OUTRAS OBRAS Estatística básica Sonia Vieira Estatística para economistas 4ª edição revista e ampliada Rodolfo Hoffmann Probabilidade e estatística para engenharia e ciências Também disponível em e-book
Jay L. Devore
Inferência estatística Tradução da 2ª edição norte-americana George Casella e Roger L. Berger
Tradução da 6ª edição norte-americana
Aplicações: Livro-texto para a disciplina estatística nos cursos
Dennis J. Sweeney Thomas A.Williams David R. Anderson
Estatística aplicada à administração e economia apresenta uma introdução conceitual à estatística e suas aplicações. Orientado à análise de dados e de metodologia estatística, o texto oferece uma boa preparação para o estudo de material estatístico mais avançado. Apresenta uma didática muito bem estruturada, com exercícios que exigem que os alunos utilizem fórmulas e material do capítulo em situações reais. Além de outros recursos didáticos como tabelas, gráficos, anotações de margem e glossário, esta edição apresenta conteúdo atualizado com novos apêndices, novos estudos de caso e outros tópicos, como ética e novas abordagens sobre coletas de dados. Traz ainda novas opções de estatística adicionais para os usuários do Excel.
ESTATÍSTICA APLICADA
ESTATÍSTICA APLICADA à administração e economia
à administração e economia
Tradução da 6ª edição norte-americana
Dennis J. Sweeney Thomas A.Williams David R. Anderson