Comentários

0%

FOCO NO MERCADO DE TRABALHO

TESTES ESTATÍSTICOS

Gabriel Ferreira dos Santos Silva

Fonte: Shutterstock.

Sem medo de errar

A situação-problema envolve a aplicação direta do Teste Qui-quadrado para independência. A resolução pode ser feita de forma manual, porém encorajamos a realização por meio do R. O primeiro passo é a construção do conjunto de dados, que será feita por meio do comando matrix(). 
Executando o script a seguir, obteremos a tabela de contingência, a partir da qual realizaremos o Teste Qui-quadrado:

faixa_sono = matrix(c(15,16,44,13,

           8,9,14,7,

           13,18,86,21), byrow=T, ncol=4)

colnames(faixa_sono) = c("2_a_4", "5_a_6","7_a_8","8mais")

rownames(faixa_sono) = c("satisfeito", "indiferente","insatisfeito")

faixa_sono

Resultado obtido:

Lorem ipsum Lorem ipsum Column 3 Column 4 Column 4
2_a_4 5_a_6 7_a_8 8mais
satisfeito 15 16 44 13
indiferente 8 9 14 7
insatisfeito 13 18 86 21

A partir disso, podemos realizar o teste por meio do comando chisq.test:

chisq.test(faixa_sono, correct = F)

A partir disso, podemos realizar o teste por meio do comando chisq.test:

Pearson's Chi-squared test



data: faixa_sono

X-squared = 10.735, df = 6, p-value = 0.09693

Dessa forma, temos que, ao nível de significância α=5%, não existem evidências suficientes para rejeitarmos a hipótese nula. Recordando as hipóteses, temos que:

{H0:variáveis e categorias são independentes (não existe associação)H1:variáveis e categorias não são independentes (existe associação)

Assim, com base nos cálculos apresentados, podemos dizer que não há evidências de associação entre o nível de satisfação no trabalho e as horas de sono dos colaboradores.

Avançando na prática

Intervalo de confiança e sua interpretação

Você é o analista de dados de uma empresa e está verificando uma análise realizada por uma consultoria externa. No trabalho elaborado, existe um componente que diz haver diferença estatística entre as médias de rendimento de duas marcas de máquinas específicas, A e B. No entanto, o intervalo de confiança da diferença entre as médias é dado por [-1,67; 4,65]. Você deverá justificar por que esse intervalo não pode estar associado a uma diferença estatisticamente significativa.

De modo geral, essa é uma situação-problema que demanda um pouco mais de reflexão e profundidade. O principal aspecto ao qual devemos nos atentar é o fato de o intervalo de confiança apresentar um limite inferior menor que zero e um limite superior maior que zero. Na prática, isso significaria dizer que uma marca apresenta melhor desempenho que a outra, mas que a mesma marca pode ser melhor ou pior do que a outra, visto que o intervalo de confiança para a diferença das médias é [-1,67; 4,65]. E por que isso é tão crítico? Acontece que dentro desse intervalo está inserido o valor 0, ou seja, a situação na qual não haveria diferença entre as médias de rendimento. Dessa forma, seria contraditório dizer que existe diferença significativa, mas que a possibilidade de que não haja diferença está dentro do intervalo de confiança calculado.

Bons estudos!

AVALIE ESTE MATERIAL

OBRIGADO PELO SEU FEEDBACK!