Fernando Malheiro de Magalhães Cristina Teles de Oliveira Eduardo Sá Silva
ESTATÍSTICA DESCRITIVA APLICADA À GESTÃO Uma Análise Exploratória dos Dados
FICHA TÉCNICA Título Estatística Descritiva Aplicada à Gestão - Análise exploratória de dados Autores Fernando Malheiro de Magalhães, Cristina Teles de Oliveira e Eduardo Sá Silva Editor Vida Económica - Editorial, SA R. Gonçalo Cristóvão, 14 - 2º • 4000-263 Porto www.vidaeconomica.pt • http://livraria.vidaeconomica.pt Composição e montagem Vida Económica Impressão e acabamento Uniarte Gráfica, S.A. • 4300-414 Porto Depósito Legal 420064/17 ISBN 978-989-768-308-4 Executado em janeiro de 2017
A cópia ilegal viola os direitos dos autores. Os prejudicados somos todos nós.
© Todos os direitos reservados para Vida Económica, Editorial, SA Nenhuma parte deste livro pode ser utilizada ou reproduzida, no todo ou em parte, por qualquer processo mecânico, fotográfico, eletrónico ou de gravação, ou qualquer outra forma copiada, para uso público ou privado (além do uso legal como breve citação em artigos e críticas) sem autorização prévia por escrito da Vida Económica – Editorial, S.A.
Veja no final deste livro como se registar na n/ editora e receber informação sobre lançamentos, iniciativas e promoções da Vida Económica – Editorial SA
Índice Nota introdutória.................................................................................... 7 Capítulo 1 – Conceitos básicos 1. Introdução ........................................................................................ 11 2. Conjunto de dados............................................................................ 12 3. População e amostra.......................................................................... 13 4. Frequências absolutas e frequências relativas.................................... 14 Capítulo 2 – Distribuição de frequências e apresentação gráfica 1. Introdução......................................................................................... 23 2. Distribuição de frequências e apresentação gráfica de dados qualitativos ........................................................................ 24 3. Distribuição de frequências e apresentação gráfica de dados quantitativos ...................................................................... 28 3.1. Variáveis estatísticas discretas.................................................... 29 3.1.1. Distribuição de frequências............................................... 29 3.1.2. A função de distribuição empírica..................................... 32 3.1.3. Representações gráficas...................................................... 39 3.2. Variáveis estatísticas contínuas.................................................. 45 3.2.1. Distribuição de frequências............................................... 46 3.2.2. A função de distribuição empírica..................................... 55 3.2.3. Representações gráficas...................................................... 56
5
Estatística Descritiva Aplicada à Gestão
Capítulo 3 – Medidas descritivas de um conjunto de dados quantitativos 1. Introdução ........................................................................................ 77 2. Medidas de localização ..................................................................... 78 2.1. Média aritmética ....................................................................... 78 2.2. Moda ......................................................................................... 81 2.3. Mediana .................................................................................... 86 2.4. Quantis ..................................................................................... 89 3. Medidas de dispersão ........................................................................ 92 3.1. Amplitude total ........................................................................ 93 3.2. Amplitude interquartil ............................................................. 94 3.3. Desvio médio ............................................................................ 95 3.4. Variância .................................................................................. .97 3.5. Desvio-padrão ..........................................................................101 3.6. Coeficiente de variação.............................................................102 4. Diagrama de Box and Plot ou Caixa com Bigodes............................104 5. Momentos........................................................................................125 6. Medida de assimetria........................................................................127 7. Medida de achatamento ou de curtose.............................................131 8. Um exemplo de aplicação com recurso ao EXCEL............................133 Capítulo 4 – Correlação e regressão simples 1. Introdução........................................................................................145 2. Diagrama de dispersão e tabela de correlação...................................147 3. Covariância e coeficiente de correlação linear simples ....................155 4. Regressão linear simples...................................................................168 5. Coeficiente de determinação............................................................177 6. Regressão curvilínea.........................................................................181 Anexo ...............................................................................................193 Bibliografia..........................................................................................203
6
Nota introdutória A Estatística (e mais genericamente os métodos quantitativos) tem vindo a revelar-se uma disciplina fundamental, capaz de fornecer métodos e técnicas para recolher, organizar, apresentar, resumir e interpretar conjuntos de dados, com o objetivo de tirar conclusões sobre a informação contida nesses dados e, com base nessas conclusões, poder tomar decisões bem fundamentadas. Este objetivo tem especial importância na área das ciências empresariais. Cada vez mais a quantidade de informação disponível é maior e torna-se vital que o decisor possa filtrar, organizar e interpretar a informação contida nos dados que recolhe, de modo a tomar decisões acertadas. Não é objetivo desta obra abordar a Estatística Descritiva de uma forma puramente académica. Para esse fim existem numerosas obras de excelente qualidade no mercado. Pretende-se apresentar a metodologia estatística para a análise exploratória de dados numa componente mais prática, sem, contudo, descurar a apresentação resumida dos fundamentos dessa metodologia. Assim, será feita uma breve abordagem teórica a cada um dos temas apresentados, a que se seguirá a apresentação de exemplos práticos, utilizando, frequentemente, uma folha de cálculo, como, por exemplo, o EXCEL. Poder-se-ia ter recorrido a outros softwares muito utilizados na análise de dados, nomeadamente o SPSS. Contudo, esse software tem licenças de utilização caras e nem todos os gestores estão dispostos a adquiri-las, ao contrário do EXCEL, que, hoje em dia, todos têm no seu computador pessoal.
7
As folhas de cálculo são, atualmente, ferramentas muito poderosas, pois permitem a realização de cálculos que, sem elas, seriam morosos e complexos. Assim, as folhas de cálculo tornaram-se muito populares, por permitirem realizar a análise rápida e eficaz de um grande conjunto de dados, tornando possível, muitas vezes, ao gestor criar e analisar diferentes cenários e, assim, tomar a melhor decisão para o seu negócio. No primeiro capítulo, serão abordados alguns conceitos básicos necessários à compreensão das metodologias de análise exploratória de dados, apresentadas nos capítulos seguintes. Seguidamente, no segundo capítulo, será abordada a forma de organizar e apresentar um conjunto de dados observados. No terceiro capítulo, apresenta-se um conjunto de medidas que permitem, de algum modo, resumir a informação contida nos dados. Essas medidas, que são passíveis de serem interpretadas, são, usualmente, designadas por “medidas descritivas”. No quarto capítulo, aborda-se a possível relação existente entre dois conjuntos de dados e como se podem estabelecer modelos simples que tentam explicar um conjunto de observações em função do outro. Serão, neste capítulo, abordados os conceitos de correlação e de regressão simples.
CapĂtulo 1
Conceitos básicos 1. Introdução Sempre que se pretende estudar um determinado assunto ou tomar decisões, o primeiro passo consiste, geralmente, na recolha de dados, para, com base nestes, melhor compreender o assunto em causa e, então, poder tomar as decisões mais acertadas. Ora, o que usualmente sucede é que, após ter recolhido os dados, fica-se perante um conjunto de observações, muitas vezes de grande dimensão, desorganizado, o que torna a imediata interpretação desses dados muito difícil ou mesmo impossível de ser realizada. Contudo, é óbvio que os dados recolhidos, regra geral, têm uma grande quantidade de informação sobre o fenómeno em estudo e a sua interpretação permitirá compreender melhor o problema e, assim, tomar as decisões mais corretas. Assim, torna-se imperioso estabelecer regras que permitam organizar os dados para que estes se tornem facilmente interpretáveis. As técnicas e os métodos usados para organizar, apresentar, resumir e interpretar um conjunto de dados constitui a metodologia usualmente designada por estatística descritiva ou, também, por análise exploratória dos dados. Neste capítulo, são apresentados os conceitos básicos necessários para a posterior organização, apresentação e análise dos dados.
11
Estatística Descritiva Aplicada à Gestão
2. Conjunto de dados O início de qualquer estudo, que se pretende bem fundamentado, começa com a recolha de informação sobre o assunto em causa. Assim, o primeiro passo, usualmente, consiste em recolher observações sobre o problema que se deseja estudar. O conjunto de todas as observações recolhidas é, normalmente, designado por conjunto de dados, coleção de dados ou, mais simplesmente, por dados. Os dados observados podem ser de diferente natureza, consoante o objeto do estudo, podendo ser qualitativos ou quantitativos. Quando os dados representam alguma característica cuja representação é feita numa escala nominal, não podendo ser observada sob a forma numérica, diz-se que os dados são qualitativos. Como exemplo de dados qualitativos, pode referir-se o sexo dos indivíduos, a sua profissão, o seu estado civil, o seu nível académico, etc.. Por vezes, opta-se por codificar numericamente os dados qualitativos. Por exemplo, convencionar que, se o indivíduo é do sexo masculino, este é representado por 1 e, se é do sexo feminino, é representado por 2. Note-se, porém, que esta codificação é arbitrária e não faz sentido efetuar qualquer tratamento matemático com estes códigos. No caso de os dados observados serem de natureza qualitativa, estes são divididos em categorias ou modalidades. Por exemplo, para a característica “Sexo” consideram-se as categorias “Feminino” e “Masculino”, para a característica “Estado Civil” consideram-se as categorias “Solteiro”, “Casado”, Viúvo” e “Divorciado”. Relativamente à característica “Profissão”, as suas categorias devem ser definidas de acordo com os dados observados. Devem ser definidas categorias de forma a considerar todas as profissões observadas no conjunto dos dados recolhidos. Quando se está a estudar uma característica de natureza qualitativa, é necessário que as suas categorias sejam definidas de acordo com os dados observados de um modo exaustivo e incompatível, isto é, para que cada observação seja classificada em uma e só uma das categorias do atributo. Se, por outro lado, os dados observados são representados por uma escala numérica, estes dados são considerados quantitativos. Como exem-
12
Conceitos básicos
plos de dados quantitativos, tem-se o número de filhos de cada indivíduo em estudo, o seu vencimento bruto mensal, o número de assoalhadas da habitação onde reside, etc.. Quando a característica em estudo é de natureza quantitativa, esta é, usualmente, representada por variáveis estatísticas que se convenciona representar por uma letra maiúscula. A razão de representar a característica em estudo por uma variável (estatística) reside no facto de o seu valor variar de elemento para elemento do conjunto. As variáveis estatísticas podem ser discretas ou contínuas. Uma variável estatística é discreta quando só pode assumir um número finito ou uma infinidade numerável de valores. As variáveis estatísticas discretas resultam, muitas vezes, de processos de contagem. Por exemplo, o número de filhos de um indivíduo, o número de faltas, por ano, de um trabalhador são variáveis discretas. Por outro lado, uma variável estatística é contínua caso possa assumir um qualquer valor dentro de um intervalo de números reais. Por exemplo, o vencimento bruto mensal de um trabalhador e a idade de um indivíduo são representados por variáveis estatísticas contínuas.
3. População e amostra Quando, em Estatística, se fala em “população”, está-se a falar de um conjunto de elementos com alguma característica comum, de interesse para o estudo. É importante notar a diferença entre o conceito de “população” em termos de Língua Portuguesa e em termos de Estatística. Para melhor compreender esta diferença, note-se que, em relação a uma população (em Português) dos indivíduos que trabalham numa dada empresa, é possível definir várias populações (no sentido estatístico), como, por exemplo, a população das idades, a população das profissões, a população dos vencimentos brutos mensais, a população do número de filhos, etc.. Sempre que se observam todos os elementos existentes com uma determinada característica comum, ou seja, quando se observa a população, usualmente o investigador depara-se com um enorme conjunto de dados
13
Estatística Descritiva Aplicada à Gestão
e, para o seu tratamento, a Estatística Descritiva é, sem dúvida, uma ferramenta essencial para organizar, apresentar, resumir e analisar o conjunto de dados. Sempre que se faz a observação exaustiva de uma população, diz-se que se realiza um recenseamento ou censo. Muitas vezes, a análise exaustiva de uma população não é possível ou não é viável do ponto de vista prático e económico. Assim, é costume observar um subconjunto da população, a que se chama amostra. A Estatística Descritiva é, também, utilizada para organizar, apresentar, resumir e analisar os dados observados que constituem essa amostra. Quando se pretende que uma amostra dê alguma indicação sobre o que se passa na população, é óbvio que a amostra deve ser suficientemente grande e que todas as observações que a constituem devem ter sido escolhidas de forma completamente aleatória. O processo de recolha da amostra deve ser feito com todo o cuidado de forma a garantir que a amostra seja, de facto, representativa da população. A amostragem constitui uma extensa área dentro da Estatística que não cabe no âmbito desta obra.
4. Frequências absolutas e frequências relativas Suponha-se que se recolheu um conjunto de n observações que podem ser quantitativas ou qualitativas. Após esta recolha ter sido efetuada, tem-se uma lista desorganizada de observações cuja análise e interpretação é difícil, senão mesmo impossível. Ao conjunto desorganizado de observações dá-se, usualmente, o nome de conjunto de dados brutos. O primeiro passo a dar para que se torne possível a análise e interpretação dos dados consiste em organizá-los de modo a evidenciar padrões ou tendências. Para isso, começa-se por agrupar os dados em categorias ou classes, contando, seguidamente, quantas observações pertencem a cada uma dessas categorias ou classes. Para facilidade de exposição, considere-se uma característica qualitativa que pode ser observada em k categorias incompatíveis e exaustivas.
14
consiste em organizá-los modo evidenciar tendências. Para isso,dos dado O primeiro passodea dar paraa que se tornepadrões possívelou a análise e interpretação , no econjunto dasem ndosobservações, a frequência observa categoria j (começa-se j possível 1, 2, por ) agrupar os dados categorias contando, passo a dar apara que se torne a, kanálise interpretação dados ou éclasses consiste em organizá-los de modo a evidenciar começa-se por agrupar os dados emdecategorias ou classes padrões contando,ouseguidamente, análise e interpretação dos consiste emdados organizá-los modo a evidenciar tendências. Para pad iss quantas observações pertencem a cada uma dessas categorias ou classes. organizá-los de modo a evidenciar padrões ou tendências. Para isso, absoluta dessa categoria e representa-se, usualmente, por . n começa-se por agrupar os dados em categorias ou quantas observações pertencem a cada uma dessas categorias ou classes. drões ou tendências. Para isso, j classes contando, seguidamentc começa-se por agrupar os dados em categorias por agrupar os dados em categorias ou classes contando, seguidamente, observações pertencem a classes. cada uma dessas categ classes contando, seguidamente, quantas observações pertencem aexposição, cada uma dessas categorias Para facilidade dequantas considere-se umaou característica qualitativ ervações pertencem a cada uma dessas categorias ou classes. Para facilidade de exposição, considere-se uma característica qualitativa que pode ser representada A frequência categoria fj,é d (categorias j 1, 2básicos , incompatíveis , k ) , usualmente gorias ou classes. relativa da observada emjkConceitos e exaustivas. Então,por o número Para facilidade de característica exposição, uma caracts observada Para em kfacilidade categoriasde incompatíveis e exaustivas. Então, o número considere-se dequalitativa vezes queque se pode exposição, considere-se uma no conjunto das n observações, é observa acaracterística categoria j (àqualitativa adea de exposição, considere-se uma pode ser j categoria 1, 2, ,que kj,) ,relativamente proporção de observações que pertencem à totalidade k ncategorias incompatíveis e exaustivas. terística qualitativa que pode ser , noobservada conjuntoem observações, a frequência observa a observada categoria jem ( jk 1, 2, , k )incompatíveis categorias edas exaustivas. Então, oé número de vezesdos que m dados k categorias incompatíveis e exaustivas. Então, o número de vezes que se absoluta representa-se, . a frequênc néj conjunto isto é, Então, dejvezes se acategoria categoria das Então, o recolhidos, número de categoria vezes que ( usualmente, j n1observações, , 2, , kpor ) ,, no conjunto observa ao número categoria (dessa j que 1,categoria 2,observa observa , k ) ,eano absoluta dessa ese representa-se, usualmente, por n j . jj das , no conjunto das n observações, é a frequência ategoria j ( j 1, no 2, , k ) conjunto das n observações, é a frequência absoluta dessa categoria e s n observações, é a frequência absoluta dessa categoria usualmente, p absoluta dessa categoria e representa-se, usualmente, pore representa-se, nj . n j n j .. da categoria j ( j 1, 2, Ausualmente, frequênciapor relativa , k ) , usualmente represe representa-se, usualmente, por ssa categoria e representa-se, A frequência relativa da categoria j , usualmente representada por fj,é ( j 1 , 2 , , k ) por n j . fj , j 1, 2, , k a relativa proporção de pertencem à categoria à nobservações frequência relativa categoria repreA frequência da categoria j (j,j relativamente 1,dos 2, por , k ) ,f us usualmente representada A frequência dada categoria jj ( j que 1, 2,relativa , k ),,usualmente j, a proporção deAobservações que pertencem à categoria j,relativamente à totalidade , usualmente representada por , é a relativa da categoria j f ( j 1 , 2 , , k ) j à categoria isto é, proporção de observações que pertencem sentada por por dados usualmente , éé a recolhidos, a proporção de observações que pertencem à categoria dados representada recolhidos, isto é,def j ,observações a proporção que pertencem à categoria j, pertencem relativamente totalidade Caso se pretenda obter a percentagem de observações que à àcategoria jdo j, relativamente dados recolhidos, isto é, dos de observações que pertencem àà totalidade categoria dos j, relativamente à totalidade dados recolhidos, isto a j, relativamente à totalidade dosisto é, dados recolhidos, n j é,categoria por 100%. relativa dessa (j 1, 2é,, , k ) , basta multiplicar a nfrequência hidos, isto f , j 1, 2, , k j fj , j 1, 2, j , k n nj n n j fj ,suponha-se j 1, 2, nj f jabsoluta , e de j frequência 1, 2, , k relativa, Para ilustrar osf conceitos de frequência n , j 1 , 2 , , k n j Caso se pretenda obter a percentagem de observações que pertencem Caso se pretenda obter a percentagem de observações que pertencem que, , kCaso num conjunto se pretenda aobter a percentagem de observaçõesdeque pertencem categoria relativamente de 50 trabalhadores uma empresa,à se registouj o seu relativa dessa à categoria j ( j 1, 2, , k ),, basta bastamultiplicar multiplicara frequência a frequência relativa dessa categoria po Caso relativa se apretenda obter a percentagem basta multiplicar categoria porpertencem 100%. deà observaçõ ( j académico, 1, 2, , k ) , se Caso pretenda obtera afrequência percentagem de dessa observações que categoria nível sendo informação recolhida seguinte. categoria pora100%. tenda obter a percentagem de observações que pertencem à categoria j basta multiplicar frequência relativa ões que pertencem j ilustrar ( j a frequência 1, 2, k ) ,relativa multiplicar dessa categoria por 100%. ( j 1à, 2categoria , , kPara ) , basta os conceitos de,por frequência absoluta ea de frequência relatid multiplicar a frequência relativa dessa categoria 100%. k ) , basta Para ilustrar os conceitos de frequência absoluta e de frequência relativa, suponha-se Para ilustrar os conceitos de frequência absoluta e de frequência reladessa categoria por 100%. que, relativamente a um conjunto de 50 trabalhadores de uma empresa, se tiva,ilustrar suponha-se que, relativamente um conjunto de 50 frequência trabalhadores Para ailustrar os uma conceitos de frequência absoluta e de que, relativamente a umosconjunto de 50 de se registou o seusuponhaPara conceitos de trabalhadores frequência absoluta eempresa, de relativa, nível académico, sendo a informação recolhida a seguinte. os conceitos dedefrequência absoluta e de frequência relativa, suponha-se empresa, seaSum registou oLseu nível auma informação que,de relativamente umdeconjunto de 50Mtrabalhadores d nível sendo recolhida a seguinte. e frequência relativa, suponha-se que, uma relativamente conjunto 50 trabalhadores se registou L académico, M S a informação Lacadémico, Sasendo M empresa, S o se mente a um conjunto de 50a seguinte. trabalhadores de uma empresa, se registou o seu recolhida recolhida aM seguin de uma se registou nível académico, recolhida asendo seguinte. M empresa,L M o seusendo L a informação Lnível académico, L L a informação L S mico, sendo a informação recolhida a seguinte. DL M ML L M nte. M M S L S LL S S M M SM L M S S L L S M ML LM L M L L M M L M L S S M LS M S LL L L M LL L LS L SL ML M L L DM LLM M M L MM M LLS L LM L L SL LS L L LL L LL M D MSL SMM LS MM LL S M L D SS M M L SML M M S S L M S MM DMM LML S L LM M ML L M LL L MSL ML LL LL ML S L MS L M S M L L M L M L L L L LLM M S L LMS LL LL M M LLM L L DS LLDM DM MM LL LL M M L D LML M L ML L L SM LL M M L M D ondeD MS, L, M M representam, respetivamente, LLMMe D M LLL MSM M LLL L as LML categorias ML L Secundário, LL L S L LM LM M M Ensino S L L Licenciatura, L M L L M L L S D M L as L LSeD L S, L, LMSeeDoutoramento. M L respetivamente, L categorias M L L Mestrado Relativamente aM este Lconjunto deMobservações, onde D representam, Ensino M L L M L M L L L M L Ltem-se que, L M L a frequência cundário, Licenciatura, Relativamente a este onde S, L,Mestrado M eabsoluta De Doutoramento. representam, respetivamente, as categorias Ensin da as categoria L (Licenciatura) é onde S, L,por M exemplo, e D representam, respetivamente, categorias Ensino Secundário, conjunto de Licenciatura, observações, tem-se que, por exemplo, a frequência absoluta a este conjunto d Mestrado e Doutoramento. Relativamente onde S, L, M aeeste D conjunto representam, respetivamente, as Licenciatura, Mestrado Relativamente de observações, onde S, L, Me Doutoramento. e D representam, respetivamente, as categorias Ensino Secundári da categoria L (Licenciatura) é tem-se que, por frequência absoluta da categoria L (Licenciatu M e D representam, respetivamente, as exemplo, categoriasa Ensino Secundário, Licenciatura, Mestrado e aDoutoramento. Relativamente tem-se que, por exemplo, a frequência absoluta da categoria L (Licenciatura) é s categorias Ensino Secundário, Licenciatura, Mestrado e Doutoramento. Relativamente este conjunto de observaçõe , Mestrado e Doutoramento. Relativamente a este conjunto de observações, tem-se que, a frequência absolutaé da categ nL 24 e a este conjunto de observações, tem-se que, por exemplo, a frequência absoluta da categoria L (Licenciatura) ,, por exemplo, por exemplo, a frequência absoluta da categoria L (Licenciatura) é goria L (Licenciatura) é nL 24 , a respetiva relativa frequênciaé relativa né 24 , a respetiva frequência L nL 24 , n 24 , n L relativa 24 L é , naL respetiva 24é, frequência a respetiva frequência relativa 0.48 , fL 50 frequência relativa é a respetiva frequência relativa éan respetiva requência relativa é sendo a percentagem de licenciados, neste conjunto de indivíduos, 15 f L 100% 0.48 100% 48%
n 24 L conjunto 0de .48indivíduos, f L neste , sendo a percentagem de licenciados, n 50 Descritiva Aplicada à Gestão fEstatística L 100% 0.48 100% 48% sendo a percentagem de licenciados, neste conjunto de indivíduos,
sendo a percentagem de licenciados, neste conjunto de indivíduos,
De modo análogo, as frequências absolutas e as frequências relativas de cada uma das f L 100% 0.48 100% 48% outras modalidades são De modo análogo, as frequências absolutas e as frequências relativas de cada uma das outras modalidades são
De modo análogo, as frequências absolutas e as frequências relativas de cada uma das nS 7 f S 0.14 outras modalidades são nM 17
f M 0.34
nnDS 27
f Df S 00.04 .14
O cálculo das frequências absolutas e das frequências relativas pode ser nM 17 f M 0.34 obtido recorrendo a uma folha de cálculo EXCEL. Para isso, na primeira O cálculo coluna das frequências absolutas e das frequências relativas pode ser obtido da folha inserem-se as observações e prepara-se uma tabela como nD 2 f D 0.04 se apresenta seguir. EXCEL. Para isso, na primeira coluna da folha recorrendo aaque uma folha dea cálculo
inserem-se as observações e prepara-se uma tabela como a que se apresenta a seguir. O cálculo das frequências absolutas e das frequências relativas pode ser obtido recorrendo a uma folha de cálculo EXCEL. Para isso, na primeira coluna da folha inserem-se as observações e prepara-se uma tabela como a que se apresenta a seguir.
Para calcular a frequência absoluta de trabalhadores com o ensino secundário (S), utiliza-se a função CONTAR.SE(intervalo;critério), em que intervalo é definido selecionando, com o rato, todas as células dos dados e, critério, selecionando a célula com S (D6, na presente folha de cálculo).
16
Para calcular a frequência absoluta de trabalhadores com o ensino secundário (S), utiliza-se a função CONTAR.SE(intervalo;critério), em que intervalo é definido selecionando, com o rato, todas as células dos dados e, critério, selecionando a célula com S (D6, na presente folha de cálculo). Conceitos básicos
A função CONTAR.SE(intervalo;critério) conta, dentro do conjunto de observações definido em intervalo, quantas verificam a condição definida por critério.
A função CONTAR.SE(intervalo;critério) conta, dentro do conjunto de
Para calcular as frequências absolutas das restantes categorias, o modo mais fácil é observações definido em intervalo, quantas verificam a condição definida “arrastar”, pelo canto inferior direito, a célula E6 até à célula E9. Contudo, para garantir por critério. que a contagem considera todas as observações é preciso fixar o intervalo. Para isso, na função, pinta-se o intervalo A2:A51 absolutas e prime-sedas a tecla F4, antes de calcular, por arrasto, Para calcular as frequências restantes categorias, o modo asmais restantes frequências absolutas. fácil é “arrastar”, pelo canto inferior direito, a célula E6 até à célula
E9. calcular Contudo, para garantir a contagem consideraa Soma todas Automática. as observa- Pode, Para o número total de que observações, seleciona-se ções é preciso fixar o intervalo. Para isso, na função, pinta-se intervalo também, ser utilizada a função CONTAR.VAL(intervalo), selecionando opara o intervalo o A2:A51 e prime-se a tecla F4, antes de calcular, por arrasto, as restantes conjunto dos dados. Esta função conta, no intervalo escolhido, o número de células não frequências absolutas. vazias. O quadro resultante é apresentado a seguir. Para calcular o número total de observações, seleciona-se a Soma Automática. Pode, também, ser utilizada a função CONTAR.VAL(intervalo), selecionando para o intervalo o conjunto dos dados. Esta função conta, no intervalo escolhido, o número de células não vazias. O quadro resultante é apresentado a seguir.
17
Estatística Descritiva Aplicada à Gestão
Para calcular, agora, as frequências relativas, começa-se pela categoria S, definindo a célula F6 como sendo agora, igual a as E6/E10, uma vez que E10 começa-se contém o número total de Para calcular, frequências relativas, pela categoria observações. Tal cálculo é ilustrado a seguir. S, definindo a célula F6 como sendo igual a E6/E10, uma vez que E10
contém o número total de observações. Tal cálculo é ilustrado a seguir.
Seguidamente, para calcular as frequências relativas das restantes cate-
Seguidamente, para calcular as frequências relativas das restantes categorias, basta gorias, basta “arrastar” o rato desde a célula F6 até à F9. Note-se que, antes “arrastar” o rato desde a célula F6 até à F9. Note-se que, antes disso, é necessário fixar a disso, necessário fixar total a célula que contémou o número totalE10. de observações, célula que écontêm o número de observações, seja, a célula Para isso, na ou seja, a célula E10. Para isso, na função, pinta-se o E10 e prime-se a tecla função, pinta-se o E10 e prime-se a tecla F4. Por fim, para verificar que a soma das
F4. Por fim, para verificar que a soma das frequências relativas é igual à
18
Conceitos básicos
frequências relativas é igual à unidade, basta selecionar a função Soma Automática para a célula F10. A seguir, apresenta-se o quadro resultante.
unidade, basta selecionar a função Soma Automática para a célula F10. A seguir, apresenta-se o quadro resultante.
Caso o estudo recaia sobre uma característica quantitativa, as definições de frequência absoluta e de característica frequência relativa são semelhantes àsfrequência anteriorCaso o estudo recaia sobre uma quantitativa, as definições de absoluta e de frequênciaSuponha-se, relativa são por semelhantes anteriormente apresentadas. mente apresentadas. exemplo,àsque, num conjunto de 500 Suponha-se, por exemplo, que, num conjunto de 500 indivíduos, 354 deles têm uma indivíduos, 354 deles têm uma idade superior a 25 anos mas não superior idade superior a 25 anos mas não superior a 30 anos. Então, a frequência absoluta de a 30 anos. Então, a frequência absoluta de idades entre os 25 e os 30 anos idades entre os 25 e os 30 anos é de 354 e a correspondente frequência relativa é é de 354 e a correspondente frequência relativa é 354/500=0.708. 354/500=0.708.
19