
Fonte: Shutterstock.
Deseja ouvir este material?
Áudio disponível no material digital.
Convite ao estudo
Prezado estudante, na atividade diária de análise de dados, uma das etapas mais importantes é a análise exploratória, em que conhecemos um pouco melhor as nossas observações e buscamos obter algumas características que determinarão os tipos de ferramentas a serem utilizadas. Após conhecermos um pouco mais a respeito das análises gráficas e frequências na Unidade 1, veremos, nesta segunda unidade, um conjunto de mecanismos que nos permitirão obter algumas informações relevantes, denominadas medidas-resumo.
As medidas-resumo, como o próprio nome remete, nos apresentam algumas informações que sumarizam os nossos conjuntos de dados. De forma geral, existem três principais tipos de medidas-resumo: medidas de localização (ou tendência central), medidas de variabilidade e medidas de posição relativa.
Considerando a relevância e a quantidade de conteúdo presente em cada uma dessas divisões, na primeira seção desta unidade abordaremos as medidas de localização, com um intuito de aprendermos um pouco mais sobre os tipos de médias, além dos conceitos de moda e mediana.
Na segunda seção, contemplaremos as principais medidas de variabilidade, buscando compreender o que cada uma delas representa e suas aplicações em situações da atividade de análise de dados. Abordaremos, portanto, conceitos como amplitude, variância, covariância e desvio-padrão.
Por fim, na terceira seção fecharemos a unidade com algumas medidas que representam a distribuição dos dados. Para tanto, trabalharemos com as conceituações de quantis e uma importante ferramenta gráfica que, como veremos, nos traz diversas medidas-resumo reunidas: o boxplot.
Veremos que os conhecimentos desenvolvidos na primeira unidade nos ajudarão a compreender cada vez mais as novas seções, e que os conteúdos vão se amarrando. É um trabalho contínuo de aprendizagem, que nos abrirá os caminhos para a atividade profissional de análise de dados.
Ótimo estudo!
Praticar para aprender
Prezado estudante, dentre as medidas-resumo que abordaremos na Unidade 2, nesta seção trabalharemos com as medidas de localização, também denominadas medidas de tendência central, que são compostas, de modo geral, pela média, mediana e moda.
Abordaremos cada uma delas individualmente, apresentando seus conceitos e métodos de cálculo. Ainda que se trate de um conteúdo relativamente mais simples, seu domínio é de grande relevância.
Média, mediana e moda são assuntos que estão presentes em nosso dia a dia e são itens praticamente obrigatórios nas análises de dados: desde o fechamento das notas do semestre, em que nos preocupamos com a famosa “média final”, até os índices de inflação, como o Índice Nacional de Preços ao Consumidor (INPC), que acompanha a evolução do custo médio de vida das famílias.
As medidas de localização, portanto, estão aplicadas e são aplicáveis em diversos contextos. Dessa forma, realizaremos um desenvolvimento teórico dos principais elementos relacionados a tais medidas e trabalharemos alguns exemplos práticos utilizando o R. Não deixe de realizar os exercícios ao final da seção, visto que são importantes para a fixação do conteúdo.
O domínio das ferramentas de Estatística e Probabilidade é fundamental para o exercício da profissão de análise de dados, mesmo que se trabalhe de forma direta ou indireta com a geração de informações. Uma das mais importantes etapas de uma análise é a análise inicial, também denominada exploratória, em que conhecemos um pouco mais a respeito do conjunto de dados com que estamos trabalhando. Nesse sentido, destacam-se as medidas de localização, as medidas de dispersão e outras ferramentas, como as separatrizes, e as representações gráficas, como o boxplot. O domínio de suas aplicações e a escolha correta das ferramentas que melhor apresentem a informação a ser transmitida são de grande relevância para situações e problemas práticos.
Você é analista de dados de uma empresa multinacional. Após uma reunião, você ficou responsável por verificar se o faturamento das dez lojas distribuídas em shoppings do país está dentro da meta estabelecida no semestre anterior. Se o faturamento médio das lojas no semestre estiver abaixo de R$ 450 mil, as duas lojas de menor faturamento serão fechadas. No entanto, por questões de reformas, duas lojas passaram o semestre fechadas, ou seja, apresentaram faturamento nulo. As outras oito faturaram R$ 420 mil, R$ 475 mil, R$ 485 mil, R$ 500 mil, R$ 515 mil, R$ 515 mil, R$ 565 mil e R$ 630 mil. Considerando a situação apresentada em relação ao faturamento das dez lojas, qual é o faturamento médio? O resultado é coerente e pode-se tomar uma decisão utilizando essa média? Se não, qual é a sua proposta? Você deverá reunir argumentos e alternativas para avaliar a proposta, buscando a melhor maneira de tomar a decisão.
Uma excelente seção e um ótimo aprendizado!
Conceito-chave
O exercício da atividade de análise de dados traz consigo uma série de tratamentos e análises necessárias para que possamos transformar, inicialmente, dados em informação. Uma das principais ferramentas é a análise exploratória, que nos permitirá conhecer um pouco melhor nossas observações e tirar algumas conclusões incipientes. Algumas representações gráficas e as análises de frequências, ambas abordadas na Unidade 1, são mecanismos importantes para a análise exploratória, ao passo que oferecem algumas noções de distribuição e incidência, respectivamente.
A essas duas ferramentas, somam-se as medidas-resumo, que oferecem um conjunto de métricas capazes de sumarizar alguns aspectos do nosso conjunto de dados. De modo geral, existem três categorias de medidas-resumo: medidas de localização (ou tendência central/posição), medidas de variabilidade (ou dispersão) e medidas de posição relativa. Nesta seção, investigaremos um pouco mais as medidas de localização, trabalhando variabilidade e posição relativa nas duas seções subsequentes.
As medidas de localização nos informam o comportamento de posição central do nosso conjunto de dados. Por essa razão, são compostas por três ferramentas que remetem ao conceito da palavra “meio”: média, mediana e moda.
Uma das medidas de localização mais populares é a média aritmética simples, utilizada quando todas as observações do seu conjunto de dados possuem a mesma importância (peso). Seja um vetor, tal que . A soma dos elementos deste vetor é dada por:
Para calcularmos a média aritmética dos elementos do vetor , devemos dividir a soma obtida pelo número de observações deste vetor, denotado por (BUSSAB; MORETTIN, 2010). Dessa forma, temos que:
Exemplificando
Você está participando de um processo seletivo composto por quatro fases distintas: análise curricular, entrevista com RH, teste de habilidade e entrevista com a gerência. A cada uma dessas fases você obterá uma nota, que poderá variar de 0 a 10. A nota final será obtida com a média aritmética das quatro etapas realizadas. Ao finalizar o processo, suas notas foram divulgadas por e-mail:
- Análise Curricular: 8,0.
- Entrevista com RH: 8,0.
- Teste de Habilidade: 10,0.
- Entrevista com Gerente: 9,0.
Aplicando uma vetorização das suas notas, temos que seu vetor . Assim, a soma das notas obtidas é dada por .
Considerando que , a média final do processo seletivo é dada por:
Frequentemente, nos deparamos com situações em que algumas observações/variáveis são mais importantes que as outras, ou seja, para nos aproximarmos de uma representação próxima do comportamento real, devemos atribuir pesos no cálculo da média desse conjunto de dados (TRIOLA, 2008). A esse processo damos o nome de média aritmética ponderada. Seja um vetor de observações, tal que e um vetor de pesos, tal que . A média aritmética ponderada é dada por:
Suponha que para o mesmo exemplo do processo seletivo, cada etapa tenha uma importância diferente para a composição final da nota. Os pesos de cada uma das etapas são dados por:
- Análise Curricular: peso 1.
- Entrevista com RH: peso 2.
- Teste de Habilidade: peso 3.
- Entrevista com Gerente: peso 4.
Aplicando a fórmula da média aritmética ponderada, temos que:
Observamos que, para o exemplo relacionado, a alteração do método de cálculo implicou uma diferença de 0,25 na média final do processo seletivo. No material complementar desta seção retomaremos a discussão das médias, abordando outros tipos de métricas frequentemente utilizadas.
Além das duas médias aritméticas apresentadas, outra importante medida de localização é a mediana. De modo geral, essa é a ferramenta responsável por dividir nosso conjunto de dados exatamente ao meio. No entanto, para podermos encontrar a mediana de determinado conjunto, o primeiro passo é classificar seus elementos em ordem crescente.
Por exemplo, considere . Se procedêssemos com a obtenção da mediana sem a devida classificação crescente das observações, o elemento que dividiria o vetor exatamente ao meio seria o número 3. No entanto, quando olhamos nosso conjunto calmamente, observamos que ele se estende do -2 ao 3, passando pelos valores 0, 1 e 2.
Ao classificarmos o vetor de forma crescente, temos que . Nesse sentido, o elemento que divide o conjunto exatamente ao meio (metade das observações ao lado direito e metade ao lado esquerdo) é o número 1, que representa a mediana do nosso vetor de dados, expressa por .
No exemplo, o vetor possui um número ímpar de observações, o que permite identificar de forma mais intuitiva o elemento que divide o conjunto ao meio: na terceira observação (1), temos dois elementos à direita (2 e 3), e dois elementos à esquerda (-2 e 0). No entanto, quando o vetor de dados possui um número par de observações, devemos realizar um cálculo médio dos elementos centrais que, então, representará a mediana. Seja . O valor que divide o vetor ao meio é obtido pela média entre os valores 2 e 3, equivalente a 2,5.
Partindo para o caso geral, considerando e um valor ímpar, a mediana é dada por:
Para um número de observações par, a mediana é obtida pela média entre os dois elementos centrais:
Note que o índice subscrito à letra refere-se à ordem daquele elemento em nosso vetor de dados. No intervalo de 0 a 10, por exemplo, temos onze números inteiros. Considerando que , a mediana é dada por , ou seja, pelo sexto elemento do nosso conjunto, equivalente ao número 5. Se trabalhássemos com um conjunto de 1 a 10, teríamos um . Logo, a mediana seria expressa por:
.
Assimile
A média e a mediana são duas medidas de localização utilizadas na composição de diversos modelos estatísticos. A média, no entanto, é uma medida de grande sensibilidade a valores discrepantes. Por exemplo: se tivermos um conjunto de dados com dez observações, sendo que nove delas apresenta o valor 1 e uma apresenta o valor 100, a média desse conjunto de dados equivale a . Nesse sentido, ainda que 90% das observações apresentem o valor 1, a média do conjunto de dados é dez vezes superior a esses valores. Por outro lado, quando olhamos para a mediana, ela apresentará, nesse caso, o valor da observação que está no meio do conjunto de dados. Como estamos diante de um conjunto com dez observações (conjunto par), a mediana será expressa pela média dos valores da quinta e da sexta observações, elencadas em ordem crescente. Como ambas apresentam o mesmo valor (1), a mediana desse conjunto de dados equivale a 1. Perceba, portanto, como a mediana está menos suscetível às observações extremas. Por essa razão, em casos com a presença de muitos pontos discrepantes, é preferível a utilização de modelos estatísticos que incorporem a mediana, em vez da média.
Além da média e da mediana, uma terceira medida de localização é a moda, representada pelo(s) valor(es) de maior frequência em um conjunto de dados. De acordo com o site Maiores e Melhores, no ano de 2020, dentre as maiores empresas do país, considerando seus valores de mercado, cinco são do setor bancário. As demais empresas distribuem-se em outros setores, conforme apresentado na Tabela 2.1.
Setor de Atividade | Empresas |
---|---|
Banco | 5 |
Varejo | 1 |
Setor Elétrico | 1 |
Cosméticos | 1 |
Comércio Eletrônico | 1 |
Seguros | 1 |
Papel e Celulose | 1 |
Indústria de Alimentos | 1 |
Holding | 1 |
Telecomunicações | 1 |
Equipamentos Eletroeletrônicos | 1 |
Bolsa de Valores | 1 |
Rede Varejista de Móveis e Eletrônicos | 1 |
Produção de Bebidas | 1 |
Petróleo e Gás | 1 |
Mineração | 1 |
Nesse sentido, a moda dos setores das 20 maiores empresas em 2020 é a categoria “Banco”. Temos, para esse caso, um conjunto unimodal. Se, além do setor bancário, a categoria “Varejo” também apresentasse 5 empresas entre as 20 maiores, teríamos um conjunto bimodal, e assim sucessivamente. Caso todos os setores tivessem somente uma empresa, o conjunto seria amodal, ou seja, todos os elementos possuem a mesma frequência.
Reflita
O termo “moda” é frequentemente utilizado em diversos contextos, como vestuário, transporte ou até mesmo no dia a dia. Em quais desses contextos o termo pode ser associado ao mesmo significado estatístico? Em quais apresenta outro sentido? Lembre-se: para a Estatística, a moda refere-se à observação de maior frequência em um conjunto de dados.
A moda, diferentemente da média e da mediana, pode ser aplicada tanto para dados quantitativos quanto para qualitativos. Isso porque a medida trabalha com o conceito de frequência, ou seja, não há a necessidade de se trabalhar diretamente com operações numéricas. Suponha, por exemplo, que estamos trabalhando com um conjunto de sete ativos de investimento, classificados por seu grau de risco (baixo, médio e alto). As observações são dadas por: (alto, baixo, alto, alto, médio, médio, baixo). Então, a classificação “alto” possui a maior frequência, com 3 observações, enquanto “baixo” e “médio” completam a lista com 2 observações cada. Nesse sentido, a moda de nosso conjunto de dados é a classificação “alto”. No mesmo caso, no entanto, não é possível obtermos a média e a mediana das observações. Isso nos ajuda a observar que essas duas últimas medidas precisam de dados numéricos para serem encontradas.
Para melhor fixarmos as três medidas de localização apresentadas nesta seção, trabalharemos com um exemplo prático, que nos permitirá simular uma situação real de análise de dados: suponha que uma empresa do setor de vestuário e tecidos esteja avaliando o desempenho de vendas de três produtos distintos – Malha de algodão (Fio 24.1), Malha Poliéster Comum, Malha Poliéster Proteção UV –, considerando suas oito lojas. Para tanto, foram tabuladas as quantidades de vendas de cada produto, segmentadas pelas distintas unidades, conforme expresso na Tabela 2.2.
Loja | Malha Algodão (Fio 24.1) |
Malha Poliéster Comum |
Malha Poliéster Proteção UV |
Total |
---|---|---|---|---|
Loja A | 130 | 125 | 75 | 330 |
Loja B | 145 | 112 | 85 | 342 |
Loja C | 122 | 84 | 85 | 291 |
Loja D | 130 | 126 | 85 | 341 |
Loja E | 175 | 144 | 72 | 391 |
Loja F | 137 | 108 | 86 | 331 |
Loja G | 214 | 119 | 91 | 424 |
Loja H | 133 | 139 | 72 | 344 |
Total | 1.186 | 957 | 651 | 2.794 |
Com base na tabela apresentada, é possível aplicarmos os cálculos das medidas de localização abordadas. Obteremos, portanto, a média aritmética, a moda e a mediana do nosso conjunto de dados, considerando as segmentações por loja. Antes de prosseguirmos, no entanto, são válidas algumas orientações:
- A tabela apresentada traz linhas e colunas totalizadoras, o que facilita nossos cálculos de média. Como não temos pesos atribuídos às lojas, procedemos com uma média aritmética simples.
- Para encontramos a mediana dos conjuntos, é preciso realizarmos a ordenação crescente dos valores. Por se tratar de um número par de lojas, precisaremos trabalhar com o cálculo da mediana, obtido a partir da média dos dois elementos centrais.
- A moda é obtida após encontrarmos o(s) valor(es) de maior frequência do nosso conjunto de dados.
- Consideraremos os produtos Malha de algodão (Fio 24.1), Malha Poliéster Comum e Malha Poliéster Proteção UV como variáveis e , respectivamente.
Tendo em vista essas considerações, partiremos para os cálculos das medidas de localização dos três produtos, iniciando pela Malha de Algodão (Fio 24.1).
Malha de Algodão (Fio 24.1)
MÉDIA
A média é obtida com a divisão do somatório das observações pelo total de elementos do respectivo conjunto, expressão que matematicamente é dada por:
Com base na linha totalizadora, temos que, para a Malha de Algodão (Fio 24.1), . Como estamos trabalhando com a análise em relação às oito lojas, o valor de equivale a 8. Assim, a média de unidades vendidas por loja é equivalente a:
MODA
Para o mesmo produto, é possível observar que somente a quantidade 130 aparece duas vezes. Logo, trata-se de um conjunto unimodal, cuja moda equivale a 130.
Mediana
Para a mediana, precisamos inicialmente classificar o conjunto de forma crescente. Após a ordenação dos elementos temos que:
Por se tratar de um conjunto com uma quantidade par de observações, a mediana é calculada por:
Temos, portanto, que para a Malha de Algodão (Fio 24.1), a média, a moda e a mediana da quantidade de vendas equivalem a (148,25), 130 e 135, respectivamente.
Malha Poliéster Comum
Média
Repetindo os procedimentos para a Malha Poliéster Comum, temos que . Assim, a média de vendas do respectivo produto é obtida por:
Moda
No caso da Malha Poliéster Comum, observamos, pela Tabela 2.2, que não há quantidades de vendas que se repetem entre as oito lojas, de modo que as frequências são exatamente as mesmas. Nesse sentido, trata-se de um conjunto amodal, em que não é possível um valor que represente a moda.
Mediana
Para a mediana, após a classificação crescente dos valores, temos o vetor representado por . Dessa forma, aplicando a fórmula de cálculo da mediana para valores pares, temos que:
Malha Poliéster Proteção UV
Média
Por fim, para a Malha Poliéster Proteção UV, o total de vendas realizadas () equivale a 651.
A média, portanto, é obtida por:
Moda
No caso da Malha Poliéster Proteção UV, observamos que as Unidades B, C e D venderam 85 unidades do produto em questão. Como esse é o valor mais frequente, equivale à moda do nosso conjunto de dados que, assim como a Malha Poliéster Proteção UV, apresenta uma quantidade de vendas unimodal. Aqui vale destacar o valor 72, que por aparecer duas vezes (Unidades E e H), pode ser confundido como um valor modal. Reforçamos o conceito de que a moda é associada aos valores com maior frequência dentro de um conjunto de dados. Se, por exemplo, três unidades tivessem realizado 72 vendas, nosso conjunto teria duas modas, 72 e 85, sendo, nessa situação, bimodal.
Mediana
Após classificarmos os dados, temos que . Da mesma forma do que foi realizado nas situações anteriores, a mediana é dada por:
Para o caso da Malha Poliéster Proteção UV, temos que a mediana e a moda são equivalentes (85). Por outro lado, a média ficou um pouco abaixo, atingindo 81,38 (duas casas decimais).
Para sintetizarmos as informações obtidas, apresentamos as medidas da localização reunidas na Tabela 2.3.
Medida | Malha Algodão (Fio 24.1) |
Malha Poliéster Comum |
Malha Poliéster Proteção UV |
---|---|---|---|
Média Aritmética Simples |
148,25 | 119,63 | 81,38 |
Mediana | 135 | 122 | 85 |
Moda | 130 | - | 85 |
Observamos, portanto, que as médias de vendas dos produtos são matematicamente diferentes. A Malha Algodão (Fio 24.1) vende, em média, mais unidades do que as demais malhas, ainda que este padrão não seja observado em todas as lojas, como na H. Além disso, podemos observar o efeito de valores discrepantes na média aritmética. Para a Malha Algodão (Fio 24.1), a Loja G vendeu 214 unidades do produto, valor superior às demais lojas da empresa. Quando avaliamos a mediana (135) e a moda (130), observamos que se tratam de valores relativamente próximos, quando comparados à média. Isso se deve à sensibilidade que a média aritmética possui frente a esses valores discrepantes.
Para confirmarmos os valores obtidos com os cálculos, vamos refazer o exemplo no R. Caso desejar, após a confirmação dos resultados simule os valores com algumas observações discrepantes e avalie seus impactos em relação à média e mediana.
Exercício prático
Medidas de Localização
Prezado estudante, trabalharemos, neste momento, com um exercício prático de aplicação das medidas de localização (ou tendência central). Para tanto, utilizaremos o exemplo apresentado no corpo do texto, que considera as quantidades de vendas de cada tecido por loja.
Inicialmente geraremos quatro colunas de dados, representado as observações presentes na Tabela 2.4.
Loja | Malha Algodão (Fio 24.1) |
Malha Poliéster Comum |
Malha Poliéster Proteção UV |
---|---|---|---|
Loja A | 130 | 125 | 75 |
Loja B | 145 | 112 | 85 |
Loja C | 122 | 84 | 85 |
Loja D | 130 | 126 | 85 |
Loja E | 175 | 144 | 72 |
Loja F | 137 | 108 | 86 |
Loja G | 241 | 119 | 91 |
Loja H | 133 | 139 | 72 |
Gerando a tabela de dados
lojas = c ("Loja A", "Loja B", "Loja C", "Loja D", "Loja E", "Loja F", "Loja G", "Loja H")
algodao_fio24.1 = c (130, 145, 122, 130, 175, 137, 124, 133)
poliester_comum = c (125, 112, 84, 126, 144, 108, 119, 139)
poliester_uv = c (75, 85, 85, 85, 72, 86, 91, 72)
total = algodao_fio24.1 + poliester_comum + poliester_uv
dados = data.frame(lojas, algodao_fio24.1, poliester_comum, poliester_uv, total) # transformando os vetores em conjunto de dados - data.frame(0)
head(dados)
## lojas algodao_fio24.1 | lojas algodao_fio24.1 | poliester_comum |
poliester_uv |
total |
---|---|---|---|---|
## 1 Loja A | 130 | 125 | 75 | 330 |
## 2 Loja B | 145 | 112 | 85 | 342 |
## 3 Loja C | 122 | 84 | 85 | 291 |
## 3 Loja D | 130 | 126 | 85 | 341 |
## 3 Loja E | 175 | 144 | 72 | 391 |
## 3 Loja F | 137 | 108 | 88 | 331 |
Agora, vamos obter as estimativas das medidas de localização de cada um dos tecidos.
Malha de Algodão (Fio 24.1)
media_alg24.1 = mean(dados$algodao_fio24.1) # média
mediana_alg24.1 = median(dados$algodao_fio24.1) # mediana
Para a mediana, no entanto, o R não dispõe de um comando padrão. Assim, utilizaremos o comando mfv (most frequent value), disponível no pacote modeest.
library (modeest)
moda_alg24.1 = mfv(dados$algodao_fio24.1) # moda
print(rbind(media_alg24.1, mediana_alg24.1, moda_alg24.1))
## [,1]
## media_alg24.1 148.25
## mediana_alg24.1 135.00
## moda_alg24.1 130.00
Malha Poliéster Comum
media_poli_comum = mean(dados$poliester_comum) # média
mediana_poli_comum = median(dados$poliester_comum) # mediana
moda_poli_comum = NA # moda
print(rbind(media_poli_comum, mediana_poli_comum, moda_poli_comum))
## [,1]
## media_poli_comum 119.625
## mediana_poli_comum 122.000
## moda_poli_comum NA
Malha Poliéster Proteção UV
media_poli_uv = mean(dados$poliester_uv) # média
mediana_poli_uv = median(dados$poliester_uv) # mediana
moda_poli_uv = mfv(dados$poliester_uv) # moda
print(rbind(media_poli_uv, mediana_poli_uv, moda_poli_uv))
## [,1]
## media_poli_uv 81.375
## mediana_poli_uv 85.000
## moda_poli_uv 85.000
Resumo
tabela_resumo = data.frame('Medida'=c('Média' ,'Mediana' ,'Moda'),
'Malha Algodão (Fio 24.1)'=c(media_alg24.1,mediana_alg24.1,moda_alg24.1),
'Malha Poliéster Comum'=c(media_poli_comum, mediana_poli_comum, moda_poli_comum),
'Malha Poliéster Proteção UV' = c(media_poli_uv, mediana_poli_uv, moda_poli_uv))
print(tabela_resumo)
## Medida Malha.Algodão..Fio.24.1. Malha.Poliéster.Comum
## 1 Média 148.25 119.625
## 2 Mediana 135.00 122.000
## 3 Moda 130.00 NA
## Malha.Poliéster.Proteção.UV
## 1 81.375
## 2 85.000
## 3 85.000
Confirmamos, portanto, os valores obtidos no corpo do texto.
Agora faça você mesmo os testes utilizando o compilador a seguir:
Para visualizar o vídeo, acesse seu material digital.
Com base nos conteúdos apresentados nesta seção, estamos aptos a utilizar as medidas de localização em contextos práticos, conhecendo suas diferenças e impactos de aplicação. Demos, portanto, mais um importante passo para a formação em análise de dados.
Faça a valer a pena
Questão 1
Uma empresa está realizando uma análise de dados referente ao total de vendas por funcionário, decidindo premiar aquele que obter a maior média de faturamento em três meses. Foram obtidos os seguintes valores quinzenais:
Funcionário(a) | Mês 1 | Mês 2 | Mês 3 |
---|---|---|---|
Paulo | R$ 4.128 | R$ 2.850 | R$ 6.780 |
Roberta | R$ 3.750 | R$ 4.350 | R$ 4.150 |
Tereza | R$ 2.255 | R$ 2.385 | R$ 8.325 |
Jeferson | R$ 3.673 | R$ 5.685 | R$ 3.675 |
Antônio | R$ 5.125 | R$ 6.375 | R$ 5.572 |
Considerando a tabela apresentada, é correto afirmar que o funcionário que obteve a maior média de faturamento e, consequentemente, será premiado é o(a):
Tente novamente...
Esta alternativa está incorreta, leia novamente a questão e reflita sobre o conteúdo para tentar outra vez.
Tente novamente...
Esta alternativa está incorreta, leia novamente a questão e reflita sobre o conteúdo para tentar outra vez.
Tente novamente...
Esta alternativa está incorreta, leia novamente a questão e reflita sobre o conteúdo para tentar outra vez.
Tente novamente...
Esta alternativa está incorreta, leia novamente a questão e reflita sobre o conteúdo para tentar outra vez.
Correto!
A questão aborda aplicação do cálculo da média simples, considerando os faturamentos individuais nos três meses em questão. Para encontrar as médias, é necessário somar o mensal dos funcionários e dividir por três, que é o total de meses analisados. Dessa forma, será obtida a seguinte tabela:
Funcionário(a) | Mês 1 | Mês 2 | Mês 3 | Média |
---|---|---|---|---|
Paulo | R$ 4.128 | R$ 2.850 | R$ 6.780 | R$ 4.586 |
Roberta | R$ 3.750 | R$ 4.350 | R$ 4.150 | R$ 4.083 |
Tereza | R$ 2.255 | R$ 2.385 | R$ 8.325 | R$ 4.322 |
Jeferson | R$ 3.673 | R$ 5.685 | R$ 3.675 | R$ 4.344 |
Antonio | R$ 5.125 | R$ 6.375 | R$ 5.572 | R$ 5.691 |
Observa-se, portanto, que o funcionário de maior média foi o Antônio.
Questão 2
Uma indústria está avaliando a prospecção mensal de clientes, mensurando a quantidade de novos contratos entre três gerências distintas, conforme a tabela a seguir.
Mês | Gerência A | Gerência B | Gerência C |
---|---|---|---|
Janeiro | 28 | 20 | 24 |
Fevereiro | 20 | 37 | 17 |
Março | 38 | 23 | 26 |
Abril | 32 | 39 | 25 |
Maio | (I) | 32 | 23 |
Junho | 25 | 23 | 21 |
Julho | 26 | 28 | (III) |
Agosto | 29 | 28 | 15 |
Setembro | 25 | (II) | 22 |
Outubro | 27 | 27 | 28 |
Novembro | 31 | 39 | 11 |
Dezembro | 22 | 38 | 29 |
Média Mensal | 28 | 30 | 22 |
Considerando as quantidades apresentadas, assinale a alternativa que preencha corretamente os valores em I, II e III, de modo a se obter as médias estabelecidas na última linha da tabela.
Tente novamente...
Esta alternativa está incorreta, leia novamente a questão e reflita sobre o conteúdo para tentar outra vez.
Tente novamente...
Esta alternativa está incorreta, leia novamente a questão e reflita sobre o conteúdo para tentar outra vez.
Tente novamente...
Esta alternativa está incorreta, leia novamente a questão e reflita sobre o conteúdo para tentar outra vez.
Correto!
A questão envolve a aplicação de conceitos de média aritmética simples, porém em uma situação em que a média já está apresentada. É preciso, portanto, encontrar os valores que completem corretamente os conjuntos referentes às Gerências A, B e C. Ao se recordar a fórmula para a obtenção da média aritmética simples, temos que sua expressão é dada por:
Para cada gerência, temos os respectivos valores de e n (12 para todas as gerências). Resta, portanto, encontrar os somatórios que contemplem as médias apresentadas.
Para a Gerência A, temos que:
Além disso, sabemos que . Assim, substituindo os valores na fórmula, tem-se que:
Da mesma forma, para as Gerência B, tem-se que:
Por fim, para a Gerência C, obtém-se que:
Por essa razão, a alternativa correta é: I – 33; II – 36; III – 23.
Tente novamente...
Esta alternativa está incorreta, leia novamente a questão e reflita sobre o conteúdo para tentar outra vez.
Questão 3
Uma empresa está avaliando o número mensal de novos casos positivados para coronavírus. De abril/2020 até dezembro/2020, foram obtidos os valores expressos na tabela que segue:
Mês | Quantidade de novos casos de coronavírus |
---|---|
abr/20 | 21 |
mai/20 | 34 |
jun/20 | 46 |
jul/20 | 47 |
ago/20 | 47 |
set/20 | 72 |
out/20 | 77 |
nov/20 | 75 |
dez/20 | 58 |
Total | 477 |
Considerando a quantidade de casos apresentada, assinale a alternativa que apresente correta e respectivamente os valores referentes à média, mediana e moda da série.
Tente novamente...
Esta alternativa está incorreta, leia novamente a questão e reflita sobre o conteúdo para tentar outra vez.
Tente novamente...
Esta alternativa está incorreta, leia novamente a questão e reflita sobre o conteúdo para tentar outra vez.
Correto!
A questão envolve a aplicação dos conceitos de medidas de localização (média, mediana e moda). Para a média, o somatório das quantidades de casos colabora com o cálculo. Com o valor em mãos, basta dividir pelo total de observações (9 meses de dados). Dessa forma, a média é expressa por .
Para encontrar a mediana, é necessário ordenar as observações de forma crescente. Além disso, como se trata de um conjunto com um número ímpar de observações, a mediana será obtida pela quantidade que divide os dados exatamente ao meio, restando quatro observações à direita e quatro à esquerda. Ao realizar a ordenação, é obtido o seguinte vetor de dados: . Logo, o quinto elemento do conjunto é o 47, que representa, também, a mediana da série.
Por fim, a moda é dada pelo valor de maior frequência. No caso, somente o valor 47 aparece duas vezes. Tem-se, portanto, uma série unimodal, cuja moda é 47.
A alternativa correta é: 53, 47 e 47.
Tente novamente...
Esta alternativa está incorreta, leia novamente a questão e reflita sobre o conteúdo para tentar outra vez.
Tente novamente...
Lorem ipsum dolor sit amet, consectetur adipiscing elit. Sed et eleifend velit. Nam mattis ultricies risus vitae sollicitudin. Nunc aliquet hendrerit varius. Mauris vitae magna libero.
referências
BANCO CENTRAL DO BRASIL. Dados Diários (SELIC). 2021. Disponível em: https://bit.ly/2T5uQwP. Acesso em: 18 fev. 2021.
BUSSAB, W. de O.; MORETTIN, P. A. Estatística básica. In: BUSSAB, W. de O.; MORETTIN, P. A. Estatística básica. São Paulo: Saraiva, 2010. p. xvi, 540-xvi, 540.
MEDIANA para Selic 2021 segue em 3,5% e fica em 5,0% para 2022, diz Focus. IstoÉ, 8 fev. 2021. Disponível em: https://bit.ly/35LAQxw. Acesso em: 18 fev. 2021.
MELHORES E MAIORES. Quais as maiores empresas do Brasil em 2020? 2020. Disponível em: https://bit.ly/3jbcG7C. Acesso em: 6 jan. 2021.
PUENTE, B. Hotelaria carioca registra média de 63% de ocupação no Carnaval. CNN Brasil, Rio de Janeiro, 18 fev. 2021. Disponível em: https://bit.ly/3ddjw8N. Acesso em: 17 jun. 2021.
SILVA, C. Belo Horizonte registra chuvas acima da média para fevereiro. Estado de Minas Gerais, 18 fev. 2021. Disponível em: https://bit.ly/3jaw4l9. Acesso em: 18 fev. 2021.
SONATI, J. G. et al. Análise comparativa da qualidade de vida de adultos e idosos envolvidos com a prática regular de atividade física. Revista Brasileira de Geriatria e Gerontologia, v. 17, n. 4, p. 731-739, 2014.
TRIOLA, M. F.; IOSSI, L. Essentials of statistics. Boston, MA, USA: Pearson Addison Wesley, 2008.