lorem ipsum dolor sit amet
Lorem ipsum dolor sit amet, consectetur adipiscing elit. Nunc dignissim euismod urna tincidunt sagittis. Vivamus id vehicula eros, non scelerisque eros.

Fonte: Shutterstock.
Deseja ouvir este material?
Áudio disponível no material digital.
sem medo de errar
Prezado estudante, a situação-problema desta seção aborda um contexto de cálculo de probabilidade, a partir de uma tabela de frequência que vimos na seção anterior. Você trabalha em uma empresa que está avaliando a satisfação de seus clientes em três lojas distintas. Considerando os números informados e a disposição em que foram apresentados na Tabela 1.5, é possível obter as probabilidades geral e segmentada (por loja).
Por exemplo, tomando-se por base a empresa como um todo, foram entrevistados 1.256 clientes. Destes, 1.034 disseram estar satisfeitos, e 222, insatisfeitos. Logo, a probabilidade de se tomar, ao acaso, um cliente que esteja insatisfeito é de . Por outro lado, a probabilidade de se tomar um cliente que esteja satisfeito é de . Poderíamos, também, obter a probabilidade de um cliente ter sido atendido por uma das lojas A, B ou C, e pegaríamos o número de clientes atendidos naquela loja específica em relação ao número total de clientes da loja. Nesses casos, estaríamos trabalhando com a probabilidade simples. Quando começamos a segmentar as informações por loja, entramos no contexto da probabilidade condicional. Se pegarmos, por exemplo, a probabilidade de um cliente sair insatisfeito na loja A, estaríamos buscando P(Insatisfeito|A), dada por . Perceba que se trata, nesse caso, da observação de um evento, dado que outro já está acontecendo. Com base no exemplo, encontre as demais probabilidades condicionais e avalie em qual loja a probabilidade de um cliente sair insatisfeito é maior.
Considerando essas reflexões, temos os insumos suficientes para extrairmos as demais informações possíveis.
Avançando na prática
Decisão de manutenção do home office ou retomada da jornada presencial
Você é CEO de uma empresa e, diante da pandemia do novo coronavírus, está avaliando se mantém seus colaboradores em home office ou retoma as atividades presenciais. Para tanto, junto ao médico ocupacional da empresa, fica definido que a métrica a ser utilizada como tomada de decisão é a probabilidade de um beneficiário estar com Covid-19, dado que seu teste deu negativo. Caso esse valor seja igual ou inferior a 3%, vocês retomarão as atividades presenciais. Caso contrário, as atividades serão mantidas a distância. Sabe-se que, em seu setor, a taxa de infecção dos beneficiários é de 30%. Para realizar os cálculos, você e o médico estão refletindo a respeito de quais outros dados são necessários.
Considerando o Teorema de Bayes, chamaremos de A o evento “infectado” e B o resultado “negativo” do teste. Então, estamos buscando a P(A|B). Nesse sentido, precisamos de outras informações para chegarmos a esse valor. Seja a fórmula do Teorema de Bayes dada por:
Temos somente os valores de P(A)=30% e P(Ac)=70%. Precisamos, portanto, coletar os seguintes dados junto aos laboratórios:
• P(B|A): probabilidade de o resultado dar negativo, dado que a pessoa está com Covid-19 (falso negativo).
• P(B|Ac): probabilidade de o resultado dar negativo, dado que a pessoa não está com Covid-19 (verdadeiro negativo).
• P(Ac): probabilidade de a pessoa não estar com Covid-19.
Caso os conceitos de P(A|B) e P(B|A) estejam confusos, realize uma árvore de decisão com um número hipotético de casos iniciais. Simule alguns valores possíveis das probabilidades P(B|A) e P(B|Ac) para que o limite de P(A|B) seja atendido. Quais são os impactos dos valores simulados em relação aos verdadeiros positivos e aos verdadeiros negativos?