Comentários

FOCO NO MERCADO DE TRABALHO

Fundamentos de estatística para análise de dados

Gabriel Ferreira dos Santos Silva

lorem ipsum dolor sit amet

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Nunc dignissim euismod urna tincidunt sagittis. Vivamus id vehicula eros, non scelerisque eros.

Fonte: Shutterstock.

Deseja ouvir este material?

Áudio disponível no material digital.

sem medo de errar

Na situação-problema apresentada, você ficou responsável por elaborar e dar suporte ao time de engenharia de sua empresa, que está buscando compreender a incidência de peças defeituosas no processo de fabricação. Para tanto, foram coletados, durante cinco dias, dados referentes à produção de três máquinas distintas, cada uma de uma marca. Além disso, em cada um desses dias, as máquinas foram submetidas a velocidades diferentes que, como vimos, variam entre 300 rpm, 350 rpm, 400 rpm, 450 rpm e 500 rpm. Estamos considerando que o mesmo número de peças foi fabricado em cada um dos dias. 
Após a coleta dos dados, o primeiro passo é identificarmos o número de peças defeituosas em cada um dos dias, nas respectivas máquinas. Em seguida, vamos realizar a tabulação desses dados coletados. É sugerido, neste caso, a disposição dos dados em uma tabela de dupla entrada, conforme segue. Os valores apresentados são hipotéticos.

Dia Velocidade Marca A Marca B Marca C Total
Dia 1 300 rpm 2 1 3 6
Dia 2 350 rpm 0 3 2 5
Dia 3 400 rpm 0 3 1 4
Dia 4 450 rpm 2 1 2 5
Dia 5 500 rpm 1 0 0 1
Total 5 8 8 21

Com base na tabela apresentada, é possível realizar algumas observações. A primeira delas, relacionada à utilização das três marcas distintas de máquinas. No totalizador horizontal, pode-se dizer que, matematicamente, a frequência de ocorrência, considerando os cinco dias avaliados, é maior para as máquinas das marcas B e C, que tiveram 8 peças defeituosas, em contraste à máquina da marca A, com 5. Também, seria possível dizer que foi observado um melhor desempenho da marca A em velocidades intermediárias (350 rpm e 400 rpm), enquanto as marcas B e C tiveram seus melhores desempenhos operando com máxima velocidade (500 rpm). 
Por outro lado, quando olhamos para o comportamento das velocidades sem considerar as distinções de marca, é possível observar que houve uma maior frequência de peças defeituosas (6) no primeiro dia de coleta, em que as máquinas operaram com a menor velocidade. Além disso, o melhor desempenho foi obtido no dia cinco, com a ocorrência de apenas 1 defeito. 
Deve-se destacar, no entanto, que essas diferenças são apresentadas de forma matemática. Para obtermos resultados estatisticamente consistentes, é preciso incorporar algumas outras métricas, como tamanho amostral e margem de erro, fatores que estudaremos nas próximas unidades.
Realizada a tabela, podemos partir para os gráficos. 
A tabulação dos dados servirá como insumo principal para a disposição gráfica dos resultados. Lembre-se de utilizar o gráfico de barras para variáveis categóricas e discretas e histograma para variáveis contínuas.
Observação: na maior parte dos casos, a velocidade, qualquer que seja a unidade, é tratada como variável quantitativa contínua. Nesse exemplo, no entanto, como não estamos coletando a velocidade, mas, sim, observando o comportamento de peças defeituosas em função de 5 velocidades distintas e definidas, é recomendado tratá-la como variável quantitativa discreta. 

Avançando na prática

Avaliação do comportamento do volume de vendas nos últimos cinco anos

Você é analista comercial de uma empresa e ficou responsável por levar, na próxima reunião da equipe, um material com o comportamento das vendas da empresa nos últimos dois anos. Com dados mensais, você avalia que a melhor forma de trazer as informações é partir de um gráfico de evolução da série. Dessa forma, você prepara o material com um único slide, trazendo algumas observações em relação à tendência e sazonalidade das vendas. Os dados coletados estão apresentados na Tabela 1.3.

Tabela 1.3 | Evolução das vendas mensais da empresa
2019 Vendas (R$) 2020 Vendas (R$)
jan/19
fev/19
mar/19
abr/19
maio/19
jun/19
jul/19
ago/19
set/19
out/19
nov/19
dez/19
R$ 43.200
R$ 44.500
R$ 49.700
R$ 41.140
R$ 39.410
R$ 35.360
R$ 37.740
R$ 36.910
R$ 42.750
R$ 39.840
R$ 44.980
R$ 46.730
jan/20
fev/20
mar/20
abr/20
maio/20
jun/20
jul/20
ago/20
set/20
out/20
nov/20
dez/20
R$ 43.500
R$ 44.800
R$ 50.000
R$ 41.440
R$ 39.710
R$ 35.660
R$ 38.040
R$ 37.210
R$ 43.050
R$ 40.140
R$ 45.280
R$ 47.030
Fonte: elaborada pelo autor.

Considerando o comportamento temporal dos dados, é importante destacar que se trata de uma série estatística, que, como vimos, pode apresentar pelo menos um dos três componentes básicos: ciclo, sazonalidade e tendência. Nesta situação-problema, avaliaremos somente dois deles, sazonalidade e tendência. O gráfico sugerido é uma evolução simples das vendas em função dos 24 meses. Assim, o eixo y é formado pelos dados de vendas, e o eixo x, pelo tempo. 
Para a análise da tendência, além da observação de crescente, decrescente ou estável, quando se deseja avaliar se o volume de vendas cresceu ou não e se está trabalhando com o valor em unidades monetárias, é importante trazer um elemento externo ao nosso conjunto de dados: a inflação. As vendas da empresa podem ter crescido ao longo dos cinco anos, mas em movimento de correção dos preços, em decorrência da inflação. Nesse caso, não teria havido um aumento no volume vendido, ou seja, poderíamos passar uma informação equivocada à equipe. É recomendado, portanto, que em situações como essa seja feita a deflação da série antes de iniciarmos a análise. 
Por fim, para a análise da sazonalidade, também, se necessário, com a série deflacionada, é importante avaliarmos se há algum padrão que se repete em um período específico todos os anos, como aumento do volume de vendas em dezembro e queda no mês de janeiro.
Com essas observações, será possível levar o material adiante e discutir o comportamento das vendas no período. 

Bons estudos!

AVALIE ESTE MATERIAL

OBRIGADO PELO SEU FEEDBACK!

0%