
Fonte: Shutterstock.
Praticar para aprender
Prezado estudante, a significância estatística é um dos principais conceitos da Probabilidade e Estatística, fazendo-se presente em praticamente toda análise realizada. Nesta seção, vamos aprofundar um pouco mais nossa discussão sobre esse tema, destacando os principais elementos e compreendendo como a significância impacta a interpretação dos resultados e a tomada de decisão baseada em dados.
O termo significância nos remete a algo significativo, importante. Na Estatística, como visto, relaciona-se à probabilidade de se obter algum valor mais extremo do que aquele observado.
A significância é representada pela letra , que indica, portanto, o nível de significância com que estamos trabalhando em determinado teste. Associada a esse nível , existe outra importante ferramenta na tomada de decisão baseada em dados: o p-valor. É nesse sentido que desenvolveremos o conteúdo desta seção, na interlocução entre o nível de significância e o p-valor, ambos fatores preponderantes daqui para frente.
Iniciaremos a discussão abordando algumas questões relacionadas às diferenças entre os dois termos, no intuito de evitar confusões e decisões equivocadas. Em seguida, trataremos do Teste de Fisher para a comparação de médias, que considera a rejeição de igualdade com base em um valor estatisticamente significativo.
Diante disso, exploraremos mais detalhadamente os erros envolvidos nas hipóteses estatísticas, o que nos servirá de base para entender, ainda que de forma introdutória, o lema de Neyman-Person.
Finalizaremos a seção aprendendo a obter o p-valor de um teste e, tão importante quanto essa etapa, entenderemos como interpretá-lo.
Como nas seções anteriores, desenvolveremos algumas atividades práticas em R, buscando exercitar a prática de análise de dados voltada para o conteúdo trabalhado ao longo da seção.
A Probabilidade e Estatística são áreas que nos permitem explorar dados com o intuito de obter informações a respeito de determinado assunto. A partir das diversas ferramentas disponíveis por ambas as áreas, podemos trabalhar com maior profundidade em análises de experimentos, levantar perguntas (hipóteses) e buscar as respostas por meio dos dados. Experimento, em nosso contexto, não se prende a um conceito estritamente acadêmico. Trata-se de qualquer situação real que nos ofereça dados consistentes passíveis de serem transformados em informação e conhecimento. Neste sentido, para a prática diária de análise de dados, conhecer e saber aplicar corretamente as principais ferramentas estatísticas e probabilísticas é um requisito fundamental.
Desta forma, saber como definir uma hipótese experimental, quais são os tipos de testes estatísticos, como encontrar e interpretar a significância de um parâmetro, como realizar um teste de hipótese e como encontrar um intervalo de confiança são domínios necessários para quem deseja trabalhar com análise de dados.
Você trabalha em uma consultoria estatística e será responsável por conduzir o processo inicial de um cliente. Durante a apresentação, você foi questionado acerca da utilização do p-valor. O cliente gostaria de compreender melhor o que esse número representa e por que é possível utilizá-lo para a tomada de decisão. Diante disso, você deverá fazer uma breve explicação sobre o p-valor e as principais razões que justificam a sua utilização como elemento de tomada de decisão a respeito das hipóteses estatísticas.
Uma excelente aula!
conceito-chave
Na seção anterior, trabalhamos com o Teste A/B e seus desdobramentos, como o Teste t de Student e o Teste Z para proporções. Ao realizarmos os processamentos em R, obtivemos, além das estatísticas T e Z, um valor referente ao p-valor, que, como vimos, nos auxiliaria na compreensão da validade das hipóteses testadas.
Esse p-valor está associado à significância estatística do teste e se traduz como uma importante ferramenta para a análise de dados, visto que nos permite tomar decisões criteriosas, levando em consideração o quão verdadeira uma hipótese testada pode ser.
Assimile
O nível de significância e o p-valor são conceitos distintos, porém frequentemente confundidos. De modo geral, o valor de indica, na definição do teste, qual é o nível mínimo de extremidade que os dados devem assumir para que possamos rejeitar a hipótese nula. O p-valor, em contrapartida, aponta qual é o nível de extremidade que os dados de fato assumiram. Ambos, portanto, estão associados ao conceito de significância em situações distintas. é um critério mínimo necessário para a rejeição de , ou seja, é teórico e preestabelecido. Dessa forma, quando o p-valor se concentra em regiões mais extremas do que o nível , no que conhecemos por região crítica, existem elementos para rejeitarmos a hipótese nula, ou seja, . Por outro lado, quando , não existem elementos suficientes para rejeitarmos a hipótese nula.
Veremos, ainda nesta seção, algumas regras de decisões práticas relacionadas ao p-valor, que, apesar de não ser a significância propriamente dita, refere-se a uma probabilidade a ela associada. Além do p-valor, existem outras formas de testar a significância estatística, como por meio do Método de Fisher, utilizado para a comparação de múltiplas médias populacionais, considerando-as duas a duas.
Suponha, por exemplo, que estejamos trabalhando com uma avaliação da distância que os beneficiários precisam percorrer entre o trabalho e suas residências, considerando seus respectivos cargos de ocupação. Para isso, foram selecionados aleatoriamente cinco indivíduos de cada cargo (Analista Júnior, Analista Pleno, Analista Sênior e Coordenador). Os dados estão dispostos na Tabela 4.5.
Cargo | Distância em km |
---|---|
Analista Jr | 8 |
Analista Jr | 9 |
Analista Jr | 13 |
Analista Jr | 10 |
Analista Jr | 8 |
Analista Pl | 7 |
Analista Pl | 5 |
Analista Pl | 9 |
Analista Pl | 10 |
Analista Pl | 11 |
Analista Sr | 4 |
Analista Sr | 6 |
Analista Sr | 5 |
Analista Sr | 3 |
Analista Sr | 8 |
Coordenador | 3 |
Coordenador | 3 |
Coordenador | 2 |
Coordenador | 4 |
Coordenador | 5 |
A ideia inserida nesse contexto é avaliar se há diferenças significativas entre as distâncias percorridas no trajeto até o trabalho para cada um dos cargos avaliados. Para tanto, utilizaremos o Teste de Fisher, no intuito de testar os pares de cargos, como Jr x Pleno, Jr x Sênior, Jr x Coordenador, Pleno x Sênior, e assim por diante.
A hipótese nula do teste é dada por , em que se testa a igualdade entre as médias populacionais das distâncias percorridas pelos indivíduos em seus respectivos cargos. Trabalharemos com um nível de significância tal que . O próximo passo é encontrar um valor crítico para compararmos as médias de cada grupo . No caso do teste de Fisher, esse valor é denominado por Diferença Mínima Significativa (LSD – Least Significant Difference). Quando os grupos possuem o mesmo número de elementos , o estimador do LSD é dado por:
Em que é o número do total de amostras do teste, desconsiderando os grupos, e QME é o Quadrado Médio do Erro (ou resíduo), que é obtido por:
Em que SQE refere-se à Soma dos Quadrados dos Erros, ou seja, o quadrado do desvio de cada observação em relação à média de um grupo específico.
Quando os grupos não possuem o mesmo número de elementos, é necessário encontrar o valor de LSD para cada comparação. Ou seja, se em nosso exemplo tivéssemos quatro analistas júnior em vez de cinco, seria necessário utilizar o seguinte estimador:
A partir do(s) valor(es) da LSD obtido(s), verificaremos se existe diferença entre os grupos. Trabalharemos de forma prática no R, porém suponha que o valor da LSD seja equivalente a 5. Se a diferença entre as médias de dois grupos é maior do que o valor da LSD, então, considerando o nível de significância , existem evidências para rejeitarmos a hipótese de igualdade entre os dois grupos avaliados. Caso a diferença seja menor, não há evidências para se rejeitar a hipótese de igualdade (nula), ou seja, não se pode dizer que existe diferença entre as médias dos dois grupos avaliados.
Assimile
O Teste de Fisher é utilizado para a comparação de médias experimentais, ou seja, dado um experimento aleatório qualquer, avaliamos as diferenças estatísticas entre as médias dos grupos inseridos no estudo. No entanto, antes de realizarmos o Teste de Fisher, é comum trabalharmos com a Análise de Variância (ANOVA), que nos permite identificar se existe alguma diferença entre as médias dos grupos analisados. A ANOVA testa, em sua hipótese nula, se todas as médias são iguais, contra a hipótese alternativa de que pelo menos uma das médias difere das demais. Em caso de não rejeitarmos a hipótese nula, não faz sentido procedermos com um Teste de Fisher, pois já obtemos, a partir da ANOVA, que não há diferença estaticamente significativa entre as médias dos grupos. No entanto, caso rejeitemos a hipótese nula, a ANOVA nos diz que pelo menos uma das médias difere das demais. Nesse sentido, realizamos o Teste de Fisher para verificar qual ou quais médias são discrepantes.
Além do Teste de Fisher para a média de grupos, há diversas outras ferramentas para análise da significância, como o Lema/Método de Neyman-Pearson. No entanto, antes de conhecer esse método, é importante definirmos dois erros associados aos testes de hipóteses: Erro Tipo I e Erro Tipo II, representados no Quadro 4.1.
Lorem ipsum | Lorem ipsum | Column 3 | Column 4 |
---|---|---|---|
Decisão | |||
Aceitar |
Rejeitar |
||
Verdade sobre a população |
é verdadeira |
Decisão Correta |
Erro Tipo I |
é falsa |
Erro Tipo II | Decisão Correta |
Dessa forma, os erros estão associados às tomadas de decisões equivocadas. Ao rejeitamos quando ela é verdadeira, cometemos o Erro Tipo I, que, como vimos, está associado ao nível de significância . Por outro lado, ao aceitarmos quando ela é falsa, estamos cometendo o Erro Tipo II, representado por .
Quando avaliamos em termos probabilísticos, a significância equivale à probabilidade de ocorrência do Erro Tipo I, ou seja, . De modo análogo, equivale à probabilidade de ocorrência do Erro Tipo II, ou seja, . Do valor de , extraímos o valor do poder do teste, expresso por , que está associado, portanto, à probabilidade de não rejeitarmos quando é falsa.
É nesse contexto que se encaixa o Lema de Neyman-Pearson. Em função da densidade teórica, não nos aprofundaremos nas questões desse modelo, porém exploraremos o conceito do Lema. De modo geral, a ideia é, após fixarmos a significância , encontrar uma região crítica com a menor probabilidade de ocorrência do Erro Tipo II. Ou seja, para um fixado, devemos encontrar o menor valor de possível.
Na prática, no entanto, costumamos tomar as decisões levando em consideração o critério do p-valor, um importante elemento que nos oferece uma probabilidade de se obter valores extremos aos observados, considerando a veracidade da hipótese nula ( ). Em outras palavras, considerando que a hipótese nula é verdadeira, o p-valor nos informa a probabilidade de se obter valores mais extremos do que os observados (BUSSAB; MORETTIN, 2010). A Figura 4.6, a seguir, nos ajuda a compreender o conceito de maneira mais efetiva. No exemplo, temos uma estrutura para testes que utilizam a Tabela Z, mas a ideia é a mesma para as demais distribuições. Se somarmos as duas áreas em vermelho e as duas áreas em amarelo, obteremos a significância do teste, que geralmente é estabelecida em . A partir dos valores de Z observados, que são função direta dos dados coletados, obtemos o p-valor, que se refere às áreas dos polígonos em amarelo. Nesse sentido, temos a probabilidade de ocorrência de valores extremos àqueles observados ( ), fato que é exatamente contemplado pelo conceito de p-valor definido anteriormente.

A ideia por trás do p-valor é simples: quando o p-valor de um teste estatístico é maior do que o nível de significância , não há evidências para rejeitarmos a hipótese nula. Por outro lado, quando , existem elementos para rejeitarmos a hipótese nula.
Na parte prática da última seção, trabalhamos com o Teste A/B, que se desdobrou em um Teste t de Student para amostras independentes, em que consideramos as variâncias populacionais desconhecidas, porém iguais. Para relembrarmos, estávamos avaliando se existia diferença nas médias de faturamento das páginas A e B, durante um intervalo de quinze dias. Diante disso, foram rodadas as seguintes hipóteses:
Consideramos, portanto, um teste bicaudal, com um nível de significância . Ao rodarmos o script no R, obtivemos as informações apresentadas na Figura 4.7, a seguir:

O teste nos apresenta uma série de informações, como intervalos de confiança da diferença entre as médias, as próprias médias de cada grupo, o valor crítico de T, o número de graus de liberdade e o p-valor (p-value). Um p-valor de 4.055e-13 implica um valor de 0,0000000000004055, isto é, um número muito próximo de zero e menor do que 5%, que é o nível de significância estabelecido no teste. Dizemos, portanto, que o p-valor do teste é significativo, de modo que temos evidências para rejeitar a hipótese nula, em que .
E como obteremos esse p-valor se não tivermos alguma ferramenta de apoio para o cálculo? O procedimento é relativamente simples. Suponha que uma empresa esteja avaliando o percentual de seus funcionários que falam inglês fluentemente. Tomando como base as informações dos currículos, cerca de 35% dos colaboradores disseram ser fluentes no idioma. No entanto, a empresa deseja testar se esse valor é igual ou menor a 35%, definido as seguintes hipóteses:
Para realizar o teste, 100 funcionários selecionados aleatoriamente foram submetidos a um exame de proficiência, dentre os quais 26 se enquadraram como fluentes. Diante disso, considerando um nível de significância , a empresa realizou um Teste Z para proporções, porém unilateral (veja a hipótese alternativa. Caso , seria um teste bilateral. Porém, em situação de , trata-se de um teste bilateral. O mesmo aconteceria se estivéssemos testando uma hipótese alternativa de ).
Na seção anterior, realizamos o Teste Z para duas proporções, provenientes de amostras distintas. No caso que será avaliado agora, trata-se de um teste sobre uma única proporção. Dessa forma, temos o seguinte estimador de Z:
Assim, obtemos o seguinte valor para o exemplo:
O valor de Z crítico é obtido pela consulta à tabela de distribuição Z. Para um teste unilateral e considerando , temos que:
No entanto, como estamos diante de um teste unilateral à esquerda, podemos considerar o valor crítico de -1,645. Assim, com o auxílio da Figura 4.8, é possível observar que o está inserido na região crítica, ao passo que .

Nesse sentido, temos que, ao nível de significância , existem evidências para rejeitarmos a hipótese nula e, portanto, dizer que existe uma proporção menor do que 35% de colaboradores que falam inglês de forma fluente. Para encontrar o p-valor, precisamos lembrar que estamos falando da probabilidade de se obter valores mais extremos àqueles observados, ou seja, . Devemos, portanto, encontrar a área da Figura 4.8 representada em amarelo.
Assim, o p-valor é obtido por:
Consultando a tabela Z, temos que a probabilidade referente a -1,887 é de cerca de 0,4699. Com o auxílio da Figura 4.9, a seguir, sabemos que o valor da área em verde é equivalente a 0,5. Além disso, entendemos que o p-valor equivale a , ou seja, à área representada em amarelo. No entanto, vimos que , que é a área representada pela cor cinza. Dessa forma, para encontrar a área em amarelo (p-valor), devemos subtrair a área cinza da área verde, ou seja, .

Assim, considerando o nível de significância e o p-valor de 0,030, rejeitamos a hipótese nula, ao passo que . É muito comum, na prática, nos atentarmos somente ao p-valor para a tomada de decisão, visto que a decisão estará associada aos valores observados de Z, ou seja, não precisamos realizar a regra de decisão com base nos valores de Z.
Reflita
O que aconteceria se estivéssemos realizando um teste de hipótese com um nível de significância e obtivéssemos um p-valor equivalente a 0,05, ou seja, ? O nível de significância é, como vimos, o valor mínimo para rejeição da hipótese nula. Nesse sentido, como , há elementos suficientes para rejeitarmos . E se o p-valor fosse equivalente a 0,051? Que conclusão teríamos sobre a hipótese nula considerando ?
O mesmo raciocínio é aplicado às demais distribuições e, consequentemente, aos outros testes, como os testes ts, Teste Qui-quadrado, Teste F, entre outros. Com base na avaliação do p-valor e do nível de significância, podemos tomar a decisão de rejeição ou não rejeição da hipótese nula.
Exemplificando
Suponha que estejamos trabalhando com um teste t bilateral para duas amostras independentes, com , e estabeleçamos as seguintes hipóteses:
Vamos considerar que se trata de médias referentes a populações com variâncias desconhecidas, porém iguais. Se , temos que , implicando 28 graus de liberdade para a testagem das médias. Como estamos utilizando um teste bilateral, os valores críticos de t são dados por . Ao realizarmos o cálculo do valor observado de t, obtivemos que . Cientes de que , rejeitaríamos a hipótese nula diante do nível de significância estabelecido.
Para encontrar o p-valor, nesse caso, devemos verificar, na tabela T, qual é a probabilidade de se obter valores mais extremos do que 3,415, com 28 graus de liberdade. Com o auxílio da Tabela 4.6, podemos observar que, para , o valor de 3,415 está para além de 1%.
Lorem ipsum | Lorem ipsum | Column 3 | Column 4 | |||||
---|---|---|---|---|---|---|---|---|
G.L. |
Nível de significância considerando um teste bicaudal |
|||||||
60% | 50% | 40% | 30% | 20% | 10% | 5% | 1% | |
27 | 0,531 | 0,684 | 0,855 | 1,057 | 1,314 | 1,703 | 2,052 | 2,771 |
28 | 0,53 | 0,683 | 0,855 | 1,056 | 1,313 | 1,701 | 2,048 | 2,763 |
29 | 0,53 | 0,683 | 0,854 | 1,055 | 1,311 | 1,699 | 2,045 | 2,756 |
30 | 0,53 | 0,683 | 0,854 | 1,055 | 1,31 | 1,697 | 2,042 | 2,75 |
Nesse sentido, podemos dizer que p-valor < 0,01, ou seja, apesar de não termos o p-valor exato, sabemos que é significativo a e que, portanto, existem elementos para rejeitarmos a hipótese nula.
Prezado(a) estudante, agora trabalharemos o exercício prático introduzido no corpo do texto, buscando compreender se existe diferença estatisticamente significativa entre as médias das distâncias percorridas pelos colaboradores de uma empresa, considerando os cargos de atuação dos indivíduos. Em todo o momento, consideraremos o nível de significância .
O primeiro passo, no entanto, é gerar os conjuntos de dados no R.
Gerando os conjuntos de dados
cargos=c(rep("JR",5),rep("PL",5),rep("SR",5),rep("CD",5))
distancias = c(8,9,13,10,8,7,5,9,10,11,4,6,5,3,8,3,3,2,4,5)
dist_cargo = data.frame(cargos=cargos, distancias=distancias)
head(dist_cargo
Lorem ipsum | Lorem ipsum | Column 3 | Column 4 |
---|---|---|---|
## |
cargos |
distancias |
|
## 1 |
JR |
8 |
|
## 2 |
JR |
9 |
|
## 3 |
JR |
13 |
|
## 4 |
JR |
10 |
|
## 5 |
JR |
8 |
|
## 6 |
JR |
7 |
cargo_medias = aggregate(dist_cargo$distancias, list(dist_cargo$cargos), mean)
colnames(cargo_medias) = c("cargo", "média")
barplot(height = cargo_medias$média, names = cargo_medias$cargo,
xlab="Cargos",ylab="Distância Média em KM", main="Distância média percorrida até o trabalho por nível de cargo")

Criamos, portanto, o conjunto de dados a ser testado e observamos que, aparentemente, existe difereça entre as médias de distância percorrida para os quatro cargos avaliados. Iremos, agora, testar se existe duas médias de quilometragem diferentes entre si. Para tanto, trabalharemos com o Teste de Fisher. Utilizaremos um pacote adicional no R, denonominado agricolae
. Veremos, também, que precisaremos criar um modelo de Análise de Variância, que será incorporado no Teste de Fisher.
#install.packages("agricolae") # caso seja preciso instalar o pacote, retire o primeiro "#" da linha de código.
library(agricolae)
#Passo 1 - Criar o modelo de Análise de Variância, com Distância em função dos cargos.
modelo_anova<-aov(distancias~cargos, data=dist_cargo)
summary(modelo_anova)
Lorem ipsum | Lorem ipsum | Column 3 | Column 4 | |||
---|---|---|---|---|---|---|
## |
Df |
Sum Sq |
Mean Sq |
F value |
Pr(>F) |
|
## cargos |
3 |
122.2 |
40.72 |
10.79 |
0.000403 |
*** |
## Residuals |
16 |
60.4 |
3.77 |
|||
## --- |
||||||
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 |
Com base nos resultados obtidos na Análise de Variância, temos que o p-valor é de 0,000403, ou seja, bastante significativo. Desta forma, rejeitamos a hipótese nula da ANOVA, que representa igualdade entre as médias das distâncias percorridas nos respectivos cargos. Confirmada a rejeição da hipótese nula, temos elementos suficientes para dizer que pelo menos uma das médias das distâncias percorridas pelos colaboradores/cargo é diferente das demais. O próximo passo, portanto, é identificar qual ou quais destas médias são as diferentes. É neste contexto que se encaixa o teste de Fisher.
teste_F <- LSD.test(modelo_anova,"cargos", p.adj="bonferroni")
print(teste_F)
## $statistics
## MSerror Df Mean CV t.value MSD
## 3.775 16 6.65 29.21708 3.008334 3.696703
##
## $parameters
## test p.ajusted name.t ntr alpha
## Fisher-LSD bonferroni cargos 4 0.05
##
## $means
## distancias std r LCL UCL Min Max Q25 Q50 Q75
## CD 3.4 1.140175 5 1.557999 5.242001 2 5 3 3 4
## JR 9.6 2.073644 5 7.757999 11.442001 8 13 8 9 10
## PL 8.4 2.408319 5 6.557999 10.242001 5 11 7 9 10
## SR 5.2 1.923538 5 3.357999 7.042001 3 8 4 5 6
##
## $comparison
## NULL
##
## $groups
## distancias groups
## JR 9.6 a
## PL 8.4 ab
## SR 5.2 bc
## CD 3.4 c
##
## attr(,"class")
## [1] "group"
plot(teste_F)

O teste é denomninado LSD pois trabalha com a mínima diferença significativa entre as médias dos grupos. Os resultados, no entanto, não são apresentados com base no p-valor. Aqui, as médias foram agruapadas por letras, sendo que letras iguais implicam que não se rejeita a hipótese nula.
A maior distância média percorrida foi observada pelo cargo Júnior, com 9,6 Km, valor que não apresentou significiância estatística com a distância média percorrida pelos colaboradores Plenos. O gráfico do teste nos permite identificar quais são as médias estatisticamente diferentes entre si, como é o caso de JR vs CD, JR vs SR e PL vs CD.
Estamos nos aproximando do final deste livro, conhecendo um pouco mais sobre uma importante ferramenta de Probabilidade e Estatística: o p-valor. Por meio do conteúdo apresentado, pudemos nos capacitar para a interpretação e a consequente tomada de decisão que a análise do p-valor nos permite realizar. Parabéns por mais um passo dado!
Faça valer a pena
Questão 1
A análise de significância estatística é um elemento presente na atividade de análise de dados, apresentando dois fatores preponderantes: p-valor e nível de significância . Ao dominarmos o conhecimento sobre esses elementos, seremos capazes de formular importantes conclusões que envolvem a interpretação da significância estatística.
A esse respeito, avalie as afirmações a seguir:
- O valor de é predeterminado pelo pesquisador em uma análise estatística. Trata-se, portanto, de um parâmetro que guiará a regra de decisão.
- Em um experimento estatístico, quando obtemos um p-valor inferior ao valor , possuímos evidências para rejeitar a hipótese nula testada.
- O p-valor e a significância referem-se ao mesmo conceito.
- Tanto o p-valor quanto a significância estão associados à probabilidade de se obter valores extremos. P-valor toma por base a estatística calculada, enquanto a significância leva em conta um valor crítico.
É correto o que se afirma em:
Tente novamente...
Esta alternativa está incorreta, leia novamente a questão e reflita sobre o conteúdo para tentar outra vez.
Tente novamente...
Esta alternativa está incorreta, leia novamente a questão e reflita sobre o conteúdo para tentar outra vez.
Tente novamente...
Esta alternativa está incorreta, leia novamente a questão e reflita sobre o conteúdo para tentar outra vez.
Tente novamente...
Esta alternativa está incorreta, leia novamente a questão e reflita sobre o conteúdo para tentar outra vez.
Correto!
A questão passa pelo conhecimento dos principais elementos da significância estatística: p-valor e significância . A partir do texto-base, foram feitas as seguintes afirmações:
- O valor de é predeterminado pelo pesquisador em uma análise estatística. Trata-se, portanto, de um parâmetro que guiará a regra de decisão. Afirmação correta. O valor de é determinado como elemento prévio e guiará a tomada de decisão.
- Em um experimento estatístico, quando obtemos um p-valor inferior ao valor , possuímos evidências para rejeitar a hipótese nula testada. Afirmação correta. Pela regra de decisão, quando , temos elementos suficientes para rejeitar a hipótese nula testada.
- O p-valor e a significância referem-se ao mesmo conceito. Afirmação incorreta. P-valor e significância são conceitos relacionados, porém distintos.
- Tanto o p-valor quanto a significância estão associados à probabilidade de se obter valores extremos. P-valor toma por base a estatística calculada, enquanto a significância leva em conta um valor crítico. Afirmação correta. Essa asserção explica corretamente os conceitos de p-valor e significância.
Por essa razão, as afirmações I, II e IV são verdadeiras.
Questão 2
Um pesquisador está realizando uma análise estatística referente ao efeito da aplicação de três diferentes produtos durante o crescimento de fungos em uma planta. Após coletar os dados, foi realizado um Teste de Fisher, a fim de obter a média de crescimento dos fungos com relação a um tratamento de controle no qual utilizou-se somente água. Os resultados obtidos são apresentados a seguir:
Tratamento | P-valor |
---|---|
ÁGUA-PRODUTO 1 | 0.113 |
ÁGUA-PRODUTO 2 | 0.045 |
ÁGUA-PRODUTO 3 | 0.001 |
ÁGUA-PRODUTO 4 | 0.450 |
Considerando um nível de significância , assinale a alternativa que apresenta os produtos com médias de crescimento estatisticamente diferentes daquela observada no tratamento de controle (água).
Tente novamente...
Esta alternativa está incorreta, leia novamente a questão e reflita sobre o conteúdo para tentar outra vez.
Tente novamente...
Esta alternativa está incorreta, leia novamente a questão e reflita sobre o conteúdo para tentar outra vez.
Correto!
A questão passa pela aplicação da regra de decisão com base no p-valor e no nível de significância . Como = 0.05, rejeitaremos as hipóteses de igualdade quando , o que acontece nos produtos 2 e 3. Dessa forma, para esses dois casos, há diferença no crescimento do fungo quando são comparados ao tratamento de controle (água).
Tente novamente...
Esta alternativa está incorreta, leia novamente a questão e reflita sobre o conteúdo para tentar outra vez.
Tente novamente...
Esta alternativa está incorreta, leia novamente a questão e reflita sobre o conteúdo para tentar outra vez.
Questão 3
O p-valor é um critério utilizado como guia para a tomada de decisão estatística, considerando um nível de significância . Em uma distribuição Z, por exemplo, o p-valor está associado à probabilidade de obter valores mais extremos do que aquele observado para a estatística calculada. Com base nesse contexto, avalie a figura a seguir:

Considerando o conteúdo apresentado, é correto afirmar que o p-valor é dado pela(s) seguinte(s) área(s):
Correto!
A questão passa pela aplicação do conhecimento relacionado ao p-valor. Na distribuição Z, considerando uma região crítica com valores menores do que zero, obtemos o p-valor por meio da , como representado pela área I da figura.
Tente novamente...
Esta alternativa está incorreta, leia novamente a questão e reflita sobre o conteúdo para tentar outra vez.
Tente novamente...
Esta alternativa está incorreta, leia novamente a questão e reflita sobre o conteúdo para tentar outra vez.
Tente novamente...
Esta alternativa está incorreta, leia novamente a questão e reflita sobre o conteúdo para tentar outra vez.
Tente novamente...
Esta alternativa está incorreta, leia novamente a questão e reflita sobre o conteúdo para tentar outra vez.
Referências
BUSSAB, W. de O.; MORETTIN, P. A. Estatística básica. 6. ed. São Paulo: Saraiva, 2010.
MILLER, A. et al. Correlation Between Universal BCG Vaccination Policy and Reduced Mortality for COVID-19. MedRxiv, 2020. Disponível em: https://bit.ly/3sOMsuh. Acesso em: 22 jul. 2021.