Estatística Descritiva

Page 11

Aceite para publicação em 23 de novembro de 2022

Índice 1. Introdução 1 2. Excel e Base de Dados 2 2.1 Ficheiro de Excel com Caso de Estudo 2 2.2 Organização dos Dados 3 2.3 Gestor de Nomes 3 2.4 Inserir Funções.............................................................................................................5 3. Tabela de Frequências ...........................................................................................9 3.1 Tabela de Frequências Simples....................................................................................9 3.2 Tabela de Frequências Simples e Acumuladas 11 3.2.1 Variáveis Quantitativas - Dados não Agrupados em Classes 11 3.2.2 Variáveis Quantitativas - Dados Agrupados em Classes 13 4. Medidas Estatísticas.............................................................................................16 4.1 Medidas de Localização 16 4.2 Medidas de Dispersão 20 5. Gráficos no Excel..................................................................................................21 5.1 Gráfico Circular ou de Setores....................................................................................21 5.2 Gráfico de Barras........................................................................................................23 5.3 Pictograma ou Gráfico de Desenhos 25 5.4 Histograma 27 5.5 Polígono de Frequências para Dados não Agrupados em Classes. 29 5.6 Polígono de Frequências no Gráfico de Barras...........................................................30 5.7 Diagrama de Extremos e Quartis................................................................................32 Bibliografia 34

1.Introdução

Uma vez que …

• Atualmente, praticamente todas as áreas da atividade humana estão influenciadas pela Estatística. 7

• Regularmente, os vários meios de comunicação (jornais, televisão, revistas, …) apresentam-nos estimativas, previsões, gráficos, tabelas, sondagens e inquéritos, que permitem estabelecer uma relação mais próxima entre a Estatística e o quotidiano.

• É cada vez mais imprescindível o estudo da Estatística em todos os níveis do ensino e, em particular, que a sua lecionação tenha bases sólidas no ensino secundário (quer seja no profissional ou no regular).

• No ensino da Estatística, o recurso ao software Excel permite despertar a atenção e a curiosidade dos alunos, contribuindo de forma mais eficaz no processo de ensino e aprendizagem.

Com este trabalho pretende-se …

• Disponibilizar material didático que sirva de apoio às aulas do professor e à aprendizagem dos alunos.

• Mostrar, através de exemplos, as diversas vantagens e potencialidades do Excel como ferramenta no ensino.

• Desenvolver competências elencadas no Perfil dos Alunos à Saída da Escolaridade Obrigatória.

Em relação à versão do Excel, neste documento …

• Tendo em conta que os softwares estão em constante atualização, levando a que sejam lançadas novas versões com alguma frequência, optámos por utilizar ao longo destes apontamentos a versão Excel 16.0 (Office 2016) da Microsoft.

• Contudo, em geral, está garantida a compatibilidade para a maioria das funcionalidades usadas ao longo deste trabalho com versões anteriores (pelo menos a partir da versão 2010 do Excel).

Nota: Pode aceder a este documento, disponível em e-book, em .

Página 1 de 34

2.Excel e Base de Dados

Para conjuntos de dados relativamente grandes, torna-se imprescindível recorrer ao uso de softwares A partir de uma base de dados vamos efetuar o seu tratamento estatístico, destacando a informação mais relevante dos dados.

Assim pretende-se …

• Sensibilizar os alunos para as vantagens da utilização do Excel na análise exploratória de dados

• Utilizar as potencialidades do Excel para apresentar tabelas de frequências, calcular medidas estatísticas e construir gráficos.

• Introduzir as funções mais usuais do Excel que permitem abranger uma parte significativa dos tópicos dos conteúdos abordados

2.1 Ficheiro de Excel com Caso de Estudo

O ficheiro Excel BD_COVID-19, cuja primeira folha de cálculo é a base de dados COVID-19, que irá ser usada ao longo deste documento, contém os dados de 240 doentes de uma unidade de saúde portuguesa que foram infetados com COVID-19 em fevereiro de 2021. As variáveis que irão ser tratadas são as seguintes:

• Assintomático: doente com ou sem sintomas (Não ou Sim);

• Sintomas: número de sintomas que o doente apresentava quando a infeção foi diagnosticada;

• Idade: idade do doente em anos.

O ficheiro BD_COVID-19 contém mais 8 folhas de cálculo que irão ser usadas como apoio para resolver as atividades propostas de seguida

Nota: Para prosseguir a partir daqui deverá abrir o ficheiro BD_COVID-19.

Página 2 de 34

2.2 Organização dos Dados

Os dados devem ser organizados de forma a permitirem resumir a informação mais importante contida neles, recorrendo a tabelas de frequências, gráficos, medidas de localização e medidas de dispersão.

2.3 Gestor de Nomes

• Para que seja mais fácil analisar cada variável, em vez de selecionar os dados da respetiva coluna, vamos usar a ferramenta Gestor de Nomes

• O Gestor de Nomes permite criar, editar, eliminar e identificar todos os nomes/variáveis usados num ficheiro do Excel.

• Os Nomes podem ser utilizados em fórmulas como substitutos de referências de células. Por exemplo, para calcular o máximo da variável Sintomas, em vez de usar-se a expressão =MÁXIMO(I1:I241) iremos usar =MÁXIMO(Sintomas).

Página 3 de 34

Atividade 1

Usando a função Gestor de Nomes do Excel, defina as variáveis:

(a) Sintomas; (b) Assintomático; (c) Idade.

Resolução:

(a) Para associar como variável Sintomas todos os valores assumidos na amostra por esta variável, considere o seguinte procedimento.

1. No separador Fórmulas, selecionar o Gestor de Nomes, o qual abre uma janela com opções: Novo, Editar e Eliminar, conforme ilustrado nas figuras

2. Clicar em Novo….

3. No campo Nome escrever Sintomas Colocar o cursor no campo Refere-se a e em seguida, na folha COVID-19, colocar o cursor sobre a variável Sintomas e selecionar todos os valores da variável, desde a célula I1 até à célula I241 (pode em alternativa, premir simultaneamente as teclas Ctrl, Shift () e a seta direcional ()). Clicar em OK, obtendo-se as seguintes figuras

(b) Clicar em Novo… e repetir o processo da alínea anterior para a variável Assintomático.

(c) Clicar em Novo… e repetir o processo da alínea (a) para a variável Idade.

Página 4 de 34

2.4 Inserir Funções

No separador Fórmulas selecionar o menu Mais Funções e o submenu Estatística. Depois procurar a função que deseja. Caso não encontre pode selecionar Inserir Função.

Por exemplo, ao selecionar a função CONTAR.SE, aparecem os argumentos da função para preencher os campos como se ilustra na figura seguinte.

Ou se selecionar, por exemplo a função MÉDIA, surge o campo para preencher como se ilustra na figura seguinte

Nota:Ao longo das atividades serão exploradas novas vias de introduzir funções.

Página 5 de 34

Atividade 2

Considere a variável Sintomas. Determine:

(a) máximo; (b) mínimo.

Resolução: (a) Selecione a folha do Excel Inserir-Func e considere as três opções seguintes.

Opção 1: Considere o seguinte procedimento.

1. Colocar o cursor na célula B1, e ao escrever =M surge logo uma listagem de funções Ao selecionar a função MÁXIMO, surge do lado direito, uma descrição da função conforme se ilustra na tabela.

2. Escrever Sintomas entre os parênteses.

3. Clicar em Enter

O valor obtido é 9.

Página 6 de 34

Opção 2: Considere o seguinte procedimento.

1. Colocar o cursor, por exemplo, na célula B1, e no separador Fórmulas, clicar em Inserir Função

2. Escrever, por exemplo, MÁX no campo Procurar uma função e clicar em Ir Surgem no campo várias funções. Selecionar a função MÁXIMO

3. Clicar em OK.

4. Na nova janela, escrever Sintomas no campo Núm1

5. Clicar em OK

O valor obtido é 9.

Página 7 de 34

Opção 3: Considere o seguinte procedimento.

1. Colocar o cursor, por exemplo, na célula B1, e clicar no separador Fórmulas.

2. Clicar em Mais Funções (no grupo Biblioteca de Funções). Ao selecionar Estatística surge uma lista das funções disponíveis. Percorrer a lista até encontrar a função MÁXIMO Ao selecionar esta, surge a descrição conforme é ilustrado a seguir

3. Depois de clicar em MÁXIMO, abre-se uma nova janela onde deve escrever Sintomas no campo Núm1

4. Clicar em OK

O valor obtido é 9. (b) O mínimo da variável Sintomas, pode ser obtido usando a função MÍNIMO e procedendo de forma análoga à alínea (a).

O valor obtido será 0.

Página 8 de 34

3.Tabela de Frequências

A tabela de frequências é uma forma de organização dos valores das variáveis e, consoante o seu tipo (qualitativa ou quantitativa), esta pode conter apenas as frequências simples absolutas e relativas ou também conter as frequências acumuladas.

3.1 Tabela de Frequências Simples

Atividade 3

Considere a variável Assintomático.

(a) Construa a tabela de frequências simples.

(b) Indique a percentagem de doentes que são considerados assintomáticos.

Resolução: Selecione a folha do Excel Tab-Assint.

(a) Para construir a tabela de frequências considere o seguinte procedimento.

1. Escrever em A3 e A4, Sim e Não, respetivamente, que são as categorias da variável Assintomático.

2. Cálculo das frequências absolutas simples

Colocar o cursor em B3 e selecionar a função CONTAR.SE, clicando em Mais Funções, seguido de Estatística. Escrever Assintomático no campo Intervalo e selecionar a célula A3 para o campo Critérios. Clicar em OK. Colocar o cursor no canto inferior direito da célula B3 e arrastar até B4

3 Colocar o cursor na célula B5 e clicar no comando Soma Automática, conforme na figura seguinte Clicar em Enter

Página 9 de 34

4 Cálculo das frequências relativas simples em percentagem Introduzir em D3 o sinal de =, selecionar B3 e dividir pela soma (B5). Em D3 “Trancar” a célula B5, colocando um cifrão entre a letra B e 5 (=B3/B$5) Clicar em Enter Arrastar D3 até D4.

5. Colocar o cursor na célula D5 e clicar no comando Soma Automática. Clicar em Enter.

O resultado será semelhante à tabela seguinte.

Para ver as fórmulas criadas basta clicar no separador Fórmulas, no comando Mostrar Fórmulas (no grupo Auditoria de Fórmulas), conforme na figura seguinte.

O resultado será semelhante à tabela seguinte.

(b) 13,3 % dos doentes são considerados assintomáticos.

Página 10 de 34

3.2 Tabela de Frequências Simples e Acumuladas

3.2.1 Variáveis Quantitativas - Dados não Agrupados em Classes

Atividade 4

Considere a variável Sintomas.

(a) Construa a tabela de frequências, simples e acumuladas.

(b) Interprete os valores da linha da tabela associados a 5 sintomas.

Resolução: Selecione a folha do Excel Tab-Sinto

(a) Para construir a tabela de frequências considere o seguinte procedimento.

1. Determinar o menor e o maior valor da variável Sintomas, introduzindo em quaisquer células da folha de Excel, as funções MÁXIMO e MÍNIMO para a variável Sintomas

2. Na coluna A introduzir, de A3 a A12, os números inteiros entre o menor (0) e o maior valor (9).

3. Cálculo das frequências absolutas simples.

Na célula B3, selecionar a função CONTAR.SE, escrevendo Sintomas no campo Intervalo e selecionando a célula A3 para o campo Critérios Clicar em OK Colocar o cursor no canto inferior direito da célula B3 e arrastar até B12.

4. Colocar o cursor na célula B13 e clicar no comando Soma Automática Clicar em Enter.

5 Cálculo das frequências absolutas acumuladas

Colocar o cursor em C3 e introduzir o sinal de = . Clicar na célula B3, seguida de Enter. Na célula C4 introduzir o sinal de = , clicar na célula C3, introduzir o símbolo + da soma e clicar na célula B4, seguida de Enter. Arrastar C4 até C12.

6 Cálculo das frequências relativas simples em percentagem

Introduzir em D3 o sinal de = , selecionar B3 e dividir pela soma (B13). Em D3 “Trancar” a célula B13, colocando um cifrão entre a letra B e 13 (=B3/B$13). Clicar em Enter. Arrastar D3 até D12.

7. Colocar o cursor na célula D13 e clicar no comando Soma Automática.

8 Cálculo das frequências relativas acumuladas em percentagem Proceder de forma análoga ao descrito no ponto 5 das frequências absolutas acumuladas.

Página 11 de 34

O resultado será semelhante à tabela seguinte.

Para ver as fórmulas criadas basta clicar no item Mostrar Fórmulas.

O resultado será semelhante à tabela seguinte.

(b) Os valores a interpretar são:

• 27 doentes apresentavam 5 sintomas, o que corresponde a 11,3% dos doentes;

• 211 doentes apresentavam no máximo 5 sintomas, o que corresponde a 87,9% dos doentes.

Página 12 de 34

3.2.2 Variáveis Quantitativas - Dados Agrupados em Classes

Quando uma variável quantitativa assume muitos valores distintos é usual agrupá-la em classes.

Quantas classes deverão ser utilizadas?

• De acordo com a Regra de Sturges, o número de classes, ��, a utilizar é o menor natural tal que 2k ≥ n, onde n é a dimensão da amostra.

Nota: O número de classes deverá ser entre 5 e 20 inclusive.

• Amplitude total dos dados: AT = máximo – mínimo

Para o caso em que as classes têm a mesma amplitude:

• Amplitude de cada classe: AC = AT k .

Atividade 5

Pretende-se agrupar a variável Idade em classes.

(a) Determine o número adequado de classes.

(b) Apresente as classes e construa a tabela de frequências simples e acumuladas.

(c) Interprete os valores da linha da tabela associados à classe [44,55[.

Resolução: Selecione a folha do Excel Tab-Idade

(a) Como a dimensão da amostra é n = 240 então para determinar o número de classes adequado, ��, considera-se a regra 2k ≥ 240. Portanto, k = 8 (28 = 256) pois 8 é o menor número natural que verifica a condição.

(b) Considere o seguinte procedimento para determinar a amplitude de cada classe.

1. Começar por determinar o mínimo e o máximo da variável Idade. Nas células H3 e H4, escrever =MÍNIMO(Idade) e =MÁXIMO(Idade), respetivamente. Os valores obtidos são respetivamente 0,5 e 88.

2. Em H5, escrever =H4-H3, obtendo-se o valor da amplitude total que é 87,5 Para o cálculo da amplitude das classes considerar, em H6, =H5/8. O valor obtido é 10,9375. Assim, utilizar 8 classes de amplitude 11, considerando o arredondamento às unidades que têm que ser por excesso.

3. Existem várias opções que se podem considerar para definir as 8 classes, sendo que podem utilizar as opções:

Página 13 de 34

• Opção 1: Considerar as classes [0;11[, [11;22[, [22;33[, [33;44[, [44;55[, [55;66[, [66;77[ e [77;88].

Nota: Optou-se por considerar a classe [77;88], fechada à direita em 88, para que esta inclua o valor máximo da variável presente na amostra, em vez do usual que seria [77;88[.

• Opção 2: Considerar as classes [0,5;11,5[, [11,5;22,5[, [22,5;33,5[, [33,5;44,5[, [44,5;55,5[, [55,5;66,5[, [66,5;77,5[ e [77,5;88,5[.

Considere a Opção 1, em que os cálculos das classes são mais simples

4 Colocar o cursor na célula B3 e inserir a função =CONTAR.SE.S, a qual permite usar uma ou mais condições. Escrever Idade no campo Intervalo_critérios1 e escrever <11 no campo Critérios1, conforme se ilustra de seguida.

5 Clicar em OK

6. Como a 2.ª classe é [11;22[, então é necessário contar todos os doentes que têm idade inferior a 22 anos, e que têm 11 anos ou mais Como estão em causa duas condições então inserir, na célula B4, a função =CONTAR.SE.S. Preencher o quadro seguinte da forma como se ilustra

Página 14 de 34

7 Arrastar as células de B4 a B10. Nas células de B5 a B9, alterar os Critérios1 e Critérios2 com os limites das respetivas classes. Atenção, em B10, alterar o Critérios1 de <22 para <=88, pois a classe é fechada à direita em 88

8. O preenchimento do resto da tabela (frequência absoluta acumulada, frequência relativa simples e frequência relativa acumulada) é efetuado de forma análoga à tabela de frequências da variável Sintomas da Atividade 4.

O resultado será semelhante à tabela seguinte.

Para ver as fórmulas criadas basta clicar no item Mostrar Fórmulas, obtendo-se uma tabela semelhante à seguinte.

Nota: A função CONTAR.SE.S permite especificar mais do que um critério enquanto CONTAR.SE permite especificar apenas um

(c) Os valores a interpretar são:

• 32 doentes tinham idade de pelo menos 44 anos, mas inferior a 55, o que corresponde a 13,3% dos doentes;

• 161 doentes tinham idade inferior a 55 anos, o que corresponde a 67,1% dos doentes.

Página 15 de 34

Para obter a tabela de frequências da Opção 2, basta proceder de forma análoga à Opção 1. O resultado será semelhante à tabela seguinte.

4.Medidas Estatísticas

A informação mais relevante de uma variável pode ser resumida através de quantidades calculadas com base na amostra, nomeadamente através de medidas de localização e de dispersão.

4.1 Medidas de Localização

Média =MÉDIA(Idade) 42,97 Mediana =MED(Idade) 42 Moda =MODO.SIMPLES(Idade) 37 Desviopadrão =DESVPAD.S(Idade) 21,22 Variância =VAR.S(Idade) 450,42 Mínimo =MÍNIMO(Idade) 0,5 1.ºquartil =QUARTIL.INC(Idade;1) 27,75 2.ºquartil =QUARTIL.INC(Idade;2) 42 3.ºquartil =QUARTIL.INC(Idade;3) 61 Máximo =MÁXIMO(Idade) 88

Página 16 de 34

Atividade 6

Considere a variável Sintomas.

Determine e interprete as seguintes medidas de tendência central: (a) média; (b) mediana; (c) moda.

Resolução: Selecione a folha do Excel Tab-Sinto-MTC

(a) Considere as duas opções seguintes para a média.

Opção 1: Considere o seguinte procedimento. Cálculo dos valores de ni*xi que representam o produto da frequência absoluta simples ni, pelo respetivo valor xi da variável Sintomas

1. Colocar o cursor na célula F3 e introduzir o sinal de = , clicar na célula A3, introduzir o símbolo * do produto e clicar na célula B3 Clicar em Enter

2 Arrastar F3 até F12.

3. Na célula F13 calcular a soma de F3 a F12, clicando no comando Soma Automática.

4. Colocar o cursor na célula B15 e introduzir o sinal de =, clicar na célula F13, introduzir o símbolo / da divisão e clicar na célula B13. Clicar em Enter.

Opção 2: Considere o seguinte procedimento.

Colocar o cursor na célula B16 e inserir a função MÉDIA para a variável Sintomas (=MÉDIA(Sintomas)). Clicar em Enter.

(b) Para a mediana:

Colocar o cursor na célula B17 e inserir a função MED para a variável Sintomas (=MED(Sintomas)). Clicar em Enter.

(c) Para a moda:

Colocar o cursor na célula B18 e inserir a função MODO.SIMPLES para a variável Sintomas (=MODO.SIMPLES(Sintomas)). Clicar em Enter

O resultado será semelhante à tabela seguinte.

Página 17 de 34

Para ver as fórmulas criadas basta clicar no item Mostrar Fórmulas

O resultado será semelhante à tabela seguinte.

Interpretação das medidas de tendência central:

• Média → Se todos os doentes tivessem o mesmo número de sintomas, esse valor seria 3,075, ou seja, aproximadamente 3 sintomas por doente.

• Mediana → Pelo menos 50% dos doentes têm um número de sintomas inferior ou igual a 3 e pelo menos 50% dos doentes têm 3 ou mais sintomas.

• Moda → O número de sintomas mais frequente entre os doentes é 3.

Página 18 de 34

Atividade

7

Considere a variável Idade.

Determine as seguintes medidas de localização:

(a) média, mediana e moda; (b) mínimo, 1.º quartil, 2.º quartil, 3.º quartil e máximo.

Resolução: Selecione a folha do Excel Tab-Idade-Medidas.

(a) O procedimento é análogo ao da Atividade 6

(b) Considere o seguinte procedimento.

1. Colocar o cursor na célula D5 e inserir a função MÍNIMO para a variável Idade (=MÍNIMO(Idade)). Clicar em Enter

2. Colocar o cursor na célula D6 e inserir a função QUARTIL.INC para a variável Idade (=QUARTIL.INC(Idade;1)). Clicar em Enter

3 Colocar o cursor na célula D7 e inserir a função QUARTIL.INC para a variável Idade (=QUARTIL.INC(Idade;2)). Clicar em Enter.

4 Colocar o cursor na célula D8 e inserir a função QUARTIL.INC para a variável Idade (=QUARTIL.INC(Idade;3)). Clicar em Enter.

5. Colocar o cursor na célula D9 e inserir a função MÁXIMO para a variável Idade (=MÁXIMO(Idade)). Clicar em Enter

Para ver as fórmulas criadas basta clicar no item Mostrar Fórmulas

O resultado será semelhante à tabela seguinte.

Página 19 de 34

4.2 Medidas de Dispersão

Atividade 8

Considere a variável Idade.

Determine as medidas de dispersão: amplitude total, amplitude interquartis, desvio padrão e variância.

Resolução: Selecione a folha do Excel Tab-Idade-Medidas.

Considere o seguinte procedimento.

1. Colocar o cursor na célula D10 e efetuar a diferença entre a célula D9 e a célula D5 (=MÁXIMO(Idade) - MÍNIMO(Idade)). Clicar em Enter

2. Colocar o cursor na célula D11 e efetuar a diferença entre a célula D8 e a célula D6 (=QUARTIL.INC(Idade;3) - QUARTIL.INC(Idade;1)). Clicar em Enter

3 Colocar o cursor na célula D12 e inserir a função DESVPAD.S para a variável Idade (=DESVPAD.S(Idade)). Clicar em Enter.

4 Colocar o cursor na célula D13 e inserir a função VAR.S para a variável Idade (=VAR.S(Idade)). Clicar em Enter

Para ver as fórmulas criadas basta clicar no item Mostrar Fórmulas

O resultado será semelhante à tabela seguinte.

Página 20 de 34

5.Gráficos no Excel

A representação dos dados através de gráficos, a estudar em Excel são:

• Gráfico circular ou de setores.

• Gráfico de barras.

• Pictograma ou gráfico de desenhos.

• Histograma.

• Polígono de frequências.

• Diagrama de extremos e quartis.

5.1 Gráfico Circular ou de Setores

Este gráfico é um círculo constituído por setores, cuja área de cada setor é proporcional à frequência (quer seja absoluta ou relativa) de cada uma das modalidades ou categorias, o qual é adequado para representar variáveis qualitativas ou variáveis quantitativas com poucas categorias.

Atividade 9

Considere a variável Assintomático. Construa o gráfico circular ou de setores que se encontra na Folha de Cálculo Gráf-Assint.

Resolução: Para construir o gráfico a partir da tabela de frequências considere o seguinte procedimento.

1. Selecionar os dados na tabela de frequências de A3 a B4.

2. No separador Inserir, selecionar o comando Gráficos Recomendados e escolher o Gráfico Circular e clicar em OK. Caso não encontre o pretendido, pode procurar no separador Todos os Gráficos.

Página 21 de 34

3. Selecionar no separador Estrutura (do Gráfico), em Estilos de Gráficos, um que tenha percentagens nos setores.

4. Alterar os formatos do gráfico, clicando nosrespetivos elementos, como por exemplo, escrever Assintomático no título do gráfico.

5. No separador Estrutura (do Gráfico), em Estilos de Gráficos, clicar em Alterar as Cores para alterar as cores dos setores.

6. Clicar duas vezes no fundo do gráfico para abrir Formatar Área do Gráfico ou colocar o rato sobre o gráfico e, com o botão direito, selecionar a opção Formatar Área do Gráfico…. Em Preenchimento alterar a Cor à sua escolha, conforme se ilustra.

Página 22 de 34

5.2 Gráfico de Barras

Este gráfico é formado por retângulos separados com a mesma largura e com altura igual à frequência (quer seja absoluta ou relativa) correspondente a cada modalidade ou categoria, o qual é adequado para representar variáveis qualitativas ou variáveis quantitativas com poucas categorias.

Atividade

10

Considere a variável Sintomas.

Construa o gráfico de barras que se encontra na Folha de Cálculo Gráf-Sinto.

Resolução: Considere as duas opções para construir o gráfico a partir da tabela de frequências

Opção 1: Considere o seguinte procedimento.

1. Selecionar os dados na tabela de frequências de A3 a B12.

Nota: Em algumas versões do Excel haverá necessidade de inserir uma linha vazia na tabela antes dos dados a seguir à linha dos títulos.

2. No separador Inserir, selecionar o comando Gráficos Recomendados e escolher o Gráfico de Colunas e clicar em OK Caso não encontre o pretendido, pode procurar no separador Todos os Gráficos.

3. Selecionar no separador Estrutura (do Gráfico), em Estilos de Gráficos, um que lhe agrade.

4. Alterar os formatos do gráfico, clicando nos respetivos elementos, como por exemplo mudar a cor do fundo do gráfico e o título do gráfico.

5. Clicar duas vezes nas barras do gráfico para abrir Formatar Série de Dados. Em Preenchimento alterar a Cor à sua escolha.

6. Para adicionar o título do eixo dos yy, no separador Estrutura (do Gráfico), em Esquemas de Gráficos, clicar em Adicionar Elemento de Gráfico, escolher Títulos dos Eixos e clicar em Vertical Principal. No Título do Eixo, escrever FREQUÊNCIA ABSOLUTA.

O resultado esperado será semelhante à figura seguinte.

Página 23 de 34

Opção 2: Considere o seguinte procedimento.

1. Selecionar a coluna de frequências absolutas simples na tabela de frequências de B3 a B12.

2. No separador Inserir, selecionar Gráfico de Colunas ou de Barras e escolher Colunas Agrupadas e clicar em OK.

3. Substituição dos valores apresentados no eixo horizontal do gráfico, pelos respetivos números de sintomas corretos. Proceder da seguinte forma:

• Colocar o rato sobre o gráfico e, com o botão direito, escolher a opção Selecionar Dados … conforme se ilustra de seguida,

Página 24 de 34

ou optar por clicar duas vezes sobre o gráfico e clicar em Selecionar Dados no separador Estrutura (do Gráfico);

• Em Rótulos do Eixo (Categoria) Horizontal clicar em Editar;

• Selecionar o Intervalo do rótulo do eixo, ou seja, de A3 a A12;

• Clicar em OK

4. Alterar os formatos do gráfico, clicando nos respetivos elementos, como por exemplo mudar a cor do fundo do gráfico, das barras, adicionar o título do gráfico e adicionar o título do eixo dos yy.

O resultado esperado será semelhante à mesma figura da Opção 1.

5.3 Pictograma ou Gráfico de Desenhos

Este gráfico é formado por figuras, onde cada figura se repete de forma proporcional à frequência (quer seja absoluta ou relativa) de cada uma das modalidades ou categorias, o qual pode ser obtido a partir do gráfico de barras O pictograma é adequado para representar variáveis qualitativas ou variáveis quantitativas com poucas categorias.

Página 25 de 34

Atividade 11

Considere a variável Sintomas. Construa o gráfico de desenhos ou pictograma que se encontra na Folha de Cálculo Gráf-Sinto.

Resolução: Para construir o gráfico a partir da tabela de frequências considere o seguinte procedimento.

1. Obter um gráfico de barras de acordo com o procedimento da Atividade anterior (ou simplesmente fazer cópia do gráfico anterior).

2. Clicar duas vezes nas barras do gráfico para abrir Formatar Série de Dados Selecionar Preenchimento com uma imagem ou textura.

3. Selecionar o botão Inserir em Fonte da imagem e inserir uma Imagem, que pode ser um Ícone, por exemplo da categoria Pessoas

4. Selecionar Empilhar e Dimensionar com e introduzir 10 unidades em Unidades/Imagem.

5. Clicar em OK.

Página 26 de 34

6. Inserir uma pequena caixa de texto (no separador Inserir, em Ilustrações, clicar em Formas e selecionar Caixa de Texto) para introduzir uma legenda, onde cada figura/imagem corresponda, neste caso, a 10 doentes.

O resultado esperado será semelhante à figura seguinte.

Número de Sintomas

FREQUÊNCIA ABSOLUTA

50

40

30

20

10

0

= 10 doentes

60 0 1 2 3 4 5 6 7 8 9

5.4 Histograma

Este gráfico é formado por retângulos adjacentes com largura igual à amplitude da classe correspondente e área proporcional à frequência da respetiva classe, o qual é adequado para variáveis quantitativas com um número razoável de categorias.

Atividade 12 Considere a variável Idade. Construa o histograma que se encontra na Folha de Cálculo Tab-Idade-Medidas.

Resolução: Para construir o gráfico considere o seguinte procedimento

1. Selecionar todos os dados originais da variável de A2 a A241.

2. No separador Inserir, selecionar o comando Gráficos Recomendados, escolher o Histograma e clicar em OK Caso não encontre o pretendido, pode procurar no separador Todos os Gráficos.

3. Selecionar no separador Estrutura (do Gráfico), em Estilos de Gráficos, um que lhe agrade.

4. Alterar os formatos do gráfico, clicando nos respetivos elementos, como por exemplo mudar a cor do fundo do gráfico, das barras, adicionar o título do gráfico e adicionar o título do eixo dos yy.

Página 27 de 34

5. Clicar duas vezes no eixo dos xx Vamos considerar as seguintes duas opções de Formatar Eixo.

Opção 1: Em Opções de Eixo, selecionar Número de classes. Em Número, passar a Categoria de Geral a Número e alterar para 1 casa decimal.

O resultado esperado será semelhante à figura seguinte.

Opção 2: Selecionar Largura das classes e alterar para 11.

O resultado esperado será o seguinte:

Observação: Contrariamente ao mais usual, os histogramas do Excel apresentam as classes abertas no limite inferior e fechadas no limite superior, exceto a primeira que é fechada nos dois limites.

Página 28 de 34

5.5 Polígono de Frequências para Dados não Agrupados em Classes.

Este gráfico é formado por uma linha poligonal que une os pontos médios superiores de cada retângulo do gráfico de barras (ou do histograma), o qual é adequado para variáveis quantitativas.

Atividade 13

Considere a variável Sintomas. Construa o polígono de frequências que se encontra na Folha de Cálculo GráfSinto.

Resolução: Considere as duas opções para construir o gráfico a partir da tabela de frequências.

Opção 1: Considere o seguinte procedimento.

1. Obter um gráfico de barras de acordo com o procedimento da Atividade 10 (ou simplesmente fazer cópia desse gráfico).

2. No separador Estrutura (do Gráfico), clicar em Alterar Tipo de Gráfico

3. Selecionar gráfico de Linhas e clicar em Linhas com Marcadores.

4 Clicar em OK

O resultado esperado será semelhante à figura seguinte.

Página 29 de 34

Opção 2: Considere o seguinte procedimento.

1. Selecionar a coluna de frequências absolutas simples na tabela de frequências de B3 a B12.

2. No separador Inserir, selecionar Gráfico de Linhas e escolher Linhas com Marcadores

3. Substituir os valores apresentados no eixo horizontal do gráfico, pelos respetivos números de sintomas corretos, selecionando:

• No separador Estrutura (do Gráfico), em Selecionar Dados;

• Em Rótulos do Eixo (Categoria) Horizontal clicar em Editar;

• Selecionar o Intervalo do rótulo do eixo, ou seja, de A3 a A12;

• Clicar em OK.

4. Alterar os formatos do gráfico, clicando nos respetivos elementos, como por exemplo mudar a cor do fundo do gráfico, da linha, adicionar o título do gráfico e adicionar o título do eixo dos yy.

O resultado esperado será semelhante à mesma figura da Opção 1.

5.6 Polígono de Frequências no Gráfico de Barras

Atividade 14

Considere a variável Sintomas. Construa o polígono de frequências, no gráfico de barras, que se encontra na Folha de Cálculo Gráf-Sinto.

Resolução: Para construir o gráfico considere o seguinte procedimento.

1. Obter um gráfico de barras de acordo com o procedimento da Atividade 10 (ou simplesmente fazer cópia desse gráfico).

2 Colocar o rato sobre o gráfico e, com o botão direito, escolher a opção Selecionar Dados. Clicar em Adicionar, em Entradas de Legenda (Série). Em Nome da série, introduzir, por exemplo, S2. Em Valores da série, selecionar as células B3 a B12.

Página 30 de 34

3. Clicar em OK duas vezes

4. Colocar o rato sobre as barras correspondentes à série criada anteriormente (S2) e, com o botão direito, selecionar Alterar Tipo de Gráfico de Série …

5. No gráfico do tipo Combinação, selecionar Colunas Agrupadas – Linha.

6 Clicar em OK

O resultado esperado será semelhante à figura seguinte.

Página 31 de 34

5.7 Diagrama de Extremos e Quartis

É um gráfico que representa cinco medidas de localização (mínimo, quartis (Q1, Q2 e Q3) e máximo), permitindo interpretar a distribuição dos dados, em particular em relação à simetria, à maior ou menor dispersão e à existência ou não de valores fora do padrão usual dos dados. O diagrama de extremos e quartis é muito útil para comparar conjuntos de dados.

Atividade 15

Considere a variável Idade. Construa o diagrama de extremos e quartis que se encontra na Folha de Cálculo Tab-Idade-Medidas.

Resolução: Considere as duas opções para construir o gráfico.

Opção 1: Considere o seguinte procedimento.

1. Selecionar todos os dados originais da variável de A2 a A241.

2. No separador Inserir, selecionar o comando Gráficos Recomendados e em Todos os Gráficos escolher Caixa de Bigodes. Clicar em OK.

3. Clicar duas vezes no centro do gráfico e em Formatar Série de Dados, em Opções de Série, retirar Mostrar marcadores de média e em Cálculo de Quartil selecionar Mediana inclusiva

Página 32 de 34

4. Alterar os formatos do gráfico, clicando nos respetivos elementos, como por exemplo mudar a cor do fundo do gráfico, ou do próprio gráfico, adicionar o título do gráfico e eliminar o eixo dos xx, ou seja, eliminar o valor 1

O resultado esperado será semelhante à figura da esquerda e a figura da direita contém a indicação das medidas

Nota: Uma vez que decidimos atrás (na Atividade 7) determinar os quartis, cujo cálculo utiliza o método inclusivo da mediana, então no diagrama de extremos e quartis mantivemos essa opção.

Opção 2: Para construir o gráfico a partir da tabela obtida na Atividade 7, que contém o mínimo, os quartis e o máximo, considere o seguinte procedimento.

1. Selecionar os valores do mínimo, dos quartis e do máximo, da célula E5 a E9

2. Repetir os passos 2, 3, e 4 do procedimento anterior da Opção 1

O resultado esperado será semelhante à mesma figura da Opção 1.

Página 33 de 34

Bibliografia

[1] Longo, E. e Branco, I. (2010). Matemática Aplicada às Ciências Sociais 10º Ano Lisboa, Texto Editores Lda

[2] Martins, M. e Loura, L. (2009). Um mundo para conhecer os números. Lisboa, INE, pp 73-153.

[3] Reis, E. (2008). Estatística Descritiva, Edições Sílabo

[4] www.alea.pt.

[5] Neves, M., Silva, M., Ribeiro, B., Jorge, S. e Guerreiro, L. (2022). Matemática Estatística – Módulo A3 – Ensino Profissional. Porto Editora

[6] Aprendizagens Essenciais - Cursos Profissionais (2020) ANQEP/Documentos /Aprendizagens Essenciais - Cursos Profissionais

Página 34 de 34

Ficha Técnica

Autores:

Fernando José do Nascimento Sebastião

Leonel da Silva Vicente

Professores do Departamento de Matemática

Revisora:

Ana Cristina da Conceição Francisco

Professora de Matemática

Os recursos submetidos e publicados no portal Casa das Ciências estão sujeitos a uma Licença Creative Commons da Casa das Ciências

Esta licença, permite a sua distribuição e utilização livre, não sendo autorizadas utilizações para fins comerciais.

Turn static files into dynamic content formats.

Create a flipbook
Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.