lorem ipsum dolor sit amet
Lorem ipsum dolor sit amet, consectetur adipiscing elit. Nunc dignissim euismod urna tincidunt sagittis. Vivamus id vehicula eros, non scelerisque eros.

Fonte: Shutterstock.
Deseja ouvir este material?
Áudio disponível no material digital.
Praticar para aprender
Caro aluno, nesta seção iremos entender o conceito de probabilidade e o que são as distribuições de probabilidade. Tais conceitos são fundamentais quando trabalhamos, por exemplo, com modelagem ou, até mesmo, previsão de lucros de uma empresa.
Como exemplo dessa abordagem, imagine que você tenha interesse em saber, em média, quanto tempo irá demorar para o seu maquinário falhar para saber quando será necessário trocar e se programar com o orçamento. Para fazer isso, você deve considerar a distribuição de probabilidade do tempo de falhar e trabalhar com a média dessa distribuição. Percebe a importância desse conteúdo?
Os acidentes industriais, na atualidade, embora reduzidos, ainda são um problema complexo para muitas indústrias. Pensando nisso, você foi contratado para estimar a probabilidade de acidentes anuais de uma determinada empresa. A única informação que o dono da empresa lhe passou foi de que a chance de um único trabalhador se envolver em um acidente é de aproximadamente 0,00024 e que a empresa tem muitos trabalhadores. Como você faria para estimar esse número? Como você pode interpretar esse resultado?
Que tal começar esse entendimento agora? Você será acompanhado em todo o processo! Iniciaremos com os conceitos básicos de probabilidade e, depois, passaremos para as distribuições de probabilidade.
conceito-chave
Antes de começar nossos estudos, vamos relembrar um pouquinho da história da probabilidade. De acordo com o contexto histórico, acredita-se que a teoria da probabilidade que conhecemos hoje teve seu início com os matemáticos franceses Blaise Pascal (1623-1662) e Pierre Fermat (1601-1665) em estudos sobre jogos de dados, em que o objetivo era determinar a probabilidade exata (NETO, 2006).
De acordo com Magalhães (2002), na literatura, há três interpretações do conceito de probabilidade: a frequentista, a clássica e a subjetiva. O enfoque e os detalhes de cada uma dessas interpretações nós estudamos na Unidade 3, assim, daremos sequência assumindo que estamos todos familiarizados com tais conceitos. Ele é válido para o conceito de experimentos, que são classificados em aleatórios e determinísticos.
Certo, uma vez que temos esses conhecimentos prévios, estamos com todas as ferramentas para definir o que é, de fato, uma probabilidade. Matematicamente, dizemos que uma função P definida em uma -álgebra de subconjuntos de um espaço amostral e imagem restrita ao intervalo [0,1], é uma probabilidade se satisfaz os seguintes axiomas de Kolmogorov (MAGALHÃES, 2002):
- .
- Para todo subconjunto , .
- Para toda sequência , mutuamente exclusiva, tem-se que:
Assimile
A -álgebra é uma “regra” para definir matematicamente a “existência” de um evento e a tripla () define o espaço de probabilidade.
Pronto, agora sabemos o que é uma probabilidade no sentido matemático. Como a calculamos, é com base nas interpretações frequentista, clássica e subjetiva supracitadas. O nosso foco agora é, a partir desse conceito, definir o que é uma distribuição de probabilidade. Mas antes necessitamos de alguns conceitos preliminares que são de suma importância, como a regra da adição.
Regra da adição (MAGALHÃES, 2002): sejam . Então . Por outro lado, se A e B são eventos mutuamente exclusivos, a probabilidade se reduz a .
Com a regra da adição em mãos, temos ferramentas para definir a probabilidade condicional. Antes de fazer essa definição, vamos a uma questão: por que necessitamos de probabilidade condicional? Ora, em algumas situações, a probabilidade necessita ser reavaliada sempre que novas informações se tornam disponíveis e essa nova informação pode causar algum tipo de interferência no resultado anterior. Nessa situação, trabalhamos então com a chamada probabilidade condicional.
Definição 1: seja () um espaço de probabilidade e sejam os eventos , então a probabilidade condicional do evento A, dado que o evento B ocorreu, é definida como:
Exemplificando
Como exemplo, seja espaço amostral descrito por = {lançamento de um dado} e os seguintes eventos: A = {sair uma face par} e B = {sair menor ou igual a 3}. Logo, a probabilidade de se obter uma face par, dado que tivemos um número menor ou igual a 3, é descrita por:
Isto é, como e sabendo que a face foi menor ou igual a 3, temos evidências de que a chance de sair par é improvável de acontecer.
Bom, definimos a nossa primeira regra, a regra da adição, que foi base para a probabilidade condicional. Será que existem outras regras que são bases para outros tipos de probabilidade? A resposta é sim. Vamos trabalhar com a regra da multiplicação, que é base do famoso teorema de Bayes.
Regra da multiplicação (MAGALHÃES, 2002): sejam os eventos com a condição de que , então a regra da multiplicação de probabilidades é definida como:
A partir dessa regra, podemos definir dois teoremas de suma importância no contexto de probabilidade: o teorema da probabilidade total e o teorema de Bayes. Esses dois teoremas são a base do que chamamos de inferência bayesiana. Vamos à definição deles?
Teorema da probabilidade total (MAGALHÃES, 2002): suponha que os eventos , em um espaço de probabilidade , formam uma partição de e todos têm probabilidade positiva. Então, para qualquer evento A nesse espaço de probabilidade, vale que:
Teorema de Bayes (MAGALHÃES, 2002): suponha que os eventos , em um espaço de probabilidade , formam uma partição de e todos têm probabilidade positiva. Seja A um evento qualquer com , então:
Uma das principais aplicações do tão famoso teorema de Bayes é em análises clínicas no contexto de teste de diagnósticos, em que o objetivo é definir os falsos positivos e falsos negativos, a fim de encontrar um padrão-ouro.
Reflita
Em que outras situações você acha que o teorema de Bayes pode ser aplicado? Existe condições especiais para essa aplicação?
Bom, fizemos então um resumo dos principais conceitos de probabilidade que necessitamos para trabalhar com nossas distribuições de probabilidade. No entanto, ainda falta uma ferramenta essencial: a variável aleatória. O que é uma variável aleatória? No que consiste a ideia desse conceito? Basicamente, a ideia de variáveis aleatórias consiste no conceito de que é possível associar um número real a cada resultado no espaço amostral . Matematicamente, podemos definir uma variável aleatória como:
Definição 2 (MAGALHÃES, 2002): uma variável aleatória X em um espaço de probabilidade é uma função real definida no espaço amostral , tal que:
é um evento aleatório , ou seja, é uma variável aleatória se:
Certo, agora sim temos todas as ferramentas necessárias para lidar com as distribuições de probabilidade. Mas antes, vamos primeiro classificar as variáveis aleatórias. Lembra-se de que tínhamos dois tipos de dados quantitativos, discretos ou contínuos? Pois então, temos a mesma classificação para variáveis aleatórias.
De acordo com Neto (2006), dizemos que uma variável aleatória X será discreta se seu domínio/suporte for o conjunto . Caso o domínio dessa variável aleatória seja o conjunto , dizemos que essa variável aleatória é contínua.
Agora que sabemos as classificações, vamos então dar início aos conceitos de distribuições de probabilidade. Inicialmente, vamos começar com a definição do que é uma função de distribuição acumulada. Isto é, seja X é uma variável aleatória definida em , de acordo com Neto (2006), sua função de distribuição acumulada é escrita na forma:
e obedece às seguintes propriedades:
- Se , então . E se , então .
- é contínua à direita.
- é não decrescente.
Uma vez que sabemos o que é uma função de distribuição acumulada, podemos calcular a função densidade de probabilidade. No entanto, devemos tomar cuidado com essa função já que ela possui definições diferentes dependendo da natureza da nossa variável aleatória. Por exemplo, se X é uma variável aleatória discreta, então a função de probabilidade é definida como . Por outro lado, se X é uma variável aleatória contínua, então a função densidade de probabilidade é descrita como . É importante destacar também que o nome “função densidade de probabilidade” muda de acordo com a natureza da variável aleatória justamente para diferenciar as duas, tudo bem?
Bom, definimos as duas funções fundamentais para determinar uma distribuição de probabilidade. Vamos começar então? Iremos dividir as distribuições de probabilidade em dois grupos: contínuas e discretas, iniciando-se pelas discretas. Vale a ressalva que, neste texto, nosso enfoque será entender a equação da distribuição, e não detalhá-la matematicamente.
A primeira distribuição de probabilidade discreta que vamos estudar é a distribuição de Bernoulli. Essa distribuição, em particular, trata de uma variável em que se observa apenas dois tipos de probabilidade: sucesso e fracasso. Matematicamente, podemos defini-la como:
Distribuição de Bernoulli (MAGALHÃES, 2002): seja X uma variável aleatória discreta com as seguintes características:
x: Sucesso, se
x: Fracasso, se
Logo, a função de probabilidade que caracteriza X é descrita por
A distribuição de probabilidade de X é conhecida como distribuição de Bernoulli com parâmetro e função de probabilidade dada pela expressão anterior. Se , então e , em que E(X) representa a média da distribuição e Var(X) a variância da distribuição.
A segunda distribuição discreta que vamos trabalhar é a distribuição binomial. Ela é basicamente uma generalização da distribuição de Bernoulli, aqui estamos interessados em n sucessos. Matematicamente, essa distribuição pode ser definida como:
Distribuição Binomial (MAGALHÃES, 2002): seja X uma variável aleatória discreta, tal que X conta o número de tentativas que resultam em um sucesso em n tentativas. Nesse caso, a distribuição de probabilidade de X é conhecida como distribuição binomial com parâmetro e função de probabilidade caracterizada por:
em que . Se , então e .
A terceira distribuição de probabilidade discreta mais famosa é a distribuição geométrica, diferente das duas anteriores, nosso interesse aqui é trabalhar com o número de fracassos até o primeiro sucesso. Matematicamente, ela pode ser definida como:
Distribuição geométrica (MAGALHÃES, 2002): seja X uma variável aleatória discreta, tal que X conte o número de fracassos anteriores ao primeiro sucesso. Nesse caso, a distribuição de probabilidade de X é conhecida como distribuição geométrica com parâmetro e tem função de probabilidade escrita na forma:
Se , então e .
Por fim, a última distribuição discreta que vamos abordar neste texto é a distribuição de Poisson. Em comparação às outras três, a distribuição de Poisson não lida com fracasso e sucesso, mas sim com número de eventos em um dado intervalo de tempo. Matematicamente, essa distribuição pode ser definida como:
Distribuição de Poisson (MAGALHÃES, 2002): seja X uma variável aleatória discreta, tal que X registre o número de eventos em um intervalo de tempo. A distribuição de probabilidade de X é conhecida como distribuição de Poisson com parâmetro e tem função de probabilidade escrita na forma:
Se , então .
Beleza, encerramos as distribuições de probabilidade discretas. Vamos então para as distribuições de probabilidade contínuas. Vamos dar início ao estudos dessas distribuições com a distribuição uniforme que trabalha com intervalos (a,b). Matematicamente, essa distribuição é definida como:
Distribuição uniforme (MAGALHÃES, 2002): Dizemos que uma variável aleatória contínua X é distribuída uniformemente ao longo do intervalo (a,b) se sua função densidade de probabilidade é dada por:
Nesse caso, se , então e .
Uma segunda distribuição de probabilidade contínua extremamente conhecida é a distribuição beta, que é uma distribuição para lidar com dados no intervalo (0,1), como taxas sanguíneas que estão limitadas a esse intervalo. As principais aplicações dessa distribuição, em geral, são na área da saúde. Matematicamente, podemos definir a distribuição beta como:
Distribuição beta (MAGALHÃES, 2002): dizemos que uma variável aleatória contínua X segue uma distribuição beta com parâmetros e se sua função densidade de probabilidade é dada por:
em que é a função beta. Se , então e .
Para encerrar nossos estudos sobre distribuições contínuas, vamos trabalhar com três distribuições que são muito famosas, especialmente no contexto de teste de hipóteses, que são as distribuições qui-quadrado, t de Student e normal. Essas distribuições têm seus valores tabelados (que chamamos de Tabela da Normal, Tabela do Qui-Quadrado, Tabela t de Student), o que facilita o cálculo das probabilidades dessas distribuições. Mas o maior interesse nelas é, justamente, quando lidamos com testes de hipóteses em que precisamos decidir sobre uma hipótese (veremos mais sobre esses conceitos na Seção 3 desta unidade). Essas distribuições são definidas, matematicamente, como:
Distribuição qui-quadrado (MAGALHÃES, 2002): uma variável aleatória contínua X segue uma distribuição qui-quadrado com graus de liberdade se sua função densidade for escrita na forma:
Distribuição t de Student (MAGALHÃES, 2002): uma variável aleatória contínua X tem distribuição t de Student com graus de liberdade se sua função densidade de probabilidade é dada por:
Distribuição normal (MAGALHÃES, 2002): uma variável aleatória contínua X tem distribuição normal com parâmetros e se sua função densidade de probabilidade for dada por:
Assim, se , então e . Além disso, é simétrica em relação à e quando e , sua densidade se reduz a:
e é conhecida como distribuição normal padrão. Nesse caso, dizemos que . Para transformar uma variável da distribuição normal para a distribuição normal padrão, utilizamos a seguinte equação:
que é chamada de normalização padrão da variável e Z segue uma distribuição normal padrão. Com isso, então, fechamos o nosso conteúdo sobre probabilidade e distribuições de probabilidade. Agora é hora de colocar a mão na massa e trabalhar com esses conceitos!
Faça valer a pena
Questão 1
Suponha que você esteja interessado em avaliar dois eventos: o primeiro sendo tempo de exposição a metais pesados e o segundo sendo intoxicação por metais pesados. Sendo então os eventos A: “tempo de exposição a metais pesados” e B: “concentração do metal no sangue de 2 mg/L”, observou-se que P(A) = 0,2; P(B) = p; P(A U B) = 0,5 e P(A ∩ B) = 0,1.
Assinale a alternativa correta.
Tente novamente...
Esta alternativa está incorreta, leia novamente a questão e reflita sobre o conteúdo para tentar outra vez.
Correto!
Com base nas informações, temos que P(A U B) = P(A) + P(B) – P(A ∩ B), ou seja, P(B) = P(A U B) – P(A) + P(A ∩ B) = 0,5 – 0,2 + 0,1 = 0,4. Portanto, a probabilidade de a concentração do metal no sangue ser de 2 mg/L é P(B) = 0,4.
Tente novamente...
Esta alternativa está incorreta, leia novamente a questão e reflita sobre o conteúdo para tentar outra vez.
Tente novamente...
Esta alternativa está incorreta, leia novamente a questão e reflita sobre o conteúdo para tentar outra vez.
Tente novamente...
Esta alternativa está incorreta, leia novamente a questão e reflita sobre o conteúdo para tentar outra vez.
Questão 2
Seja X uma variável aleatória que representa a concentração de chumbo no sangue para uma determinada população de homens no Brasil. Supondo que essa variável tem distribuição normal com média de 129 mg/L, desvio-padrão de 19,8 mg/L e que nosso interesse seja calcular a proporção de homens nessa população que têm concentração de chumbo no sangue maior ou igual a 150 mg/L.
Assinale a alternativa correta.
Tente novamente...
Esta alternativa está incorreta, leia novamente a questão e reflita sobre o conteúdo para tentar outra vez.
Correto!
Para encontrar essa probabilidade, trabalhamos com a normalização da variável, isto é, encontramos o valor de z da distribuição normal padrão que é dado por:
Agora, utilizando a tabela da distribuição normal padrão disponível em diversos livros didáticos ou até mesmo na internet, vemos que a área à esquerda de é 0,1415. Ou seja, nessa
Tente novamente...
Esta alternativa está incorreta, leia novamente a questão e reflita sobre o conteúdo para tentar outra vez.
Tente novamente...
Esta alternativa está incorreta, leia novamente a questão e reflita sobre o conteúdo para tentar outra vez.
Tente novamente...
Esta alternativa está incorreta, leia novamente a questão e reflita sobre o conteúdo para tentar outra vez.
Questão 3
Suponha que você tenha interesse em investigar a probabilidade de um trabalhador ser infectado por um agente tóxico e defina Y a variável aleatória que corresponde a ser ou não infectado. Sabe-se que 30% dos trabalhadores expostos a agentes tóxicos foram infectados, tal que e , em que 1 significa infectado e 0 significa não infectado. Suponha agora que temos n observações para avaliar a probabilidade de sucesso e que nós selecionamos uma amostra de 5 trabalhadores da população exposta ao agente tóxico.
Com base nesses dados, assinale a alternativa correta.
Correto!
Nas condições do exercício, como temos n observações para avaliar probabilidade de sucesso e fracasso, estamos lidando com a distribuição binomial com parâmetros e . Nesse caso, para calcular a probabilidade de 2 trabalhares estarem infectados, utilizamos a equação:
Isto é, a probabilidade de 2 desses trabalhadores estarem infectados é de 0,309.
Tente novamente...
Esta alternativa está incorreta, leia novamente a questão e reflita sobre o conteúdo para tentar outra vez.
Tente novamente...
Esta alternativa está incorreta, leia novamente a questão e reflita sobre o conteúdo para tentar outra vez.
Tente novamente...
Esta alternativa está incorreta, leia novamente a questão e reflita sobre o conteúdo para tentar outra vez.
Tente novamente...
Esta alternativa está incorreta, leia novamente a questão e reflita sobre o conteúdo para tentar outra vez.
Referências
HENRIQUES, C. Análise de regressão linear simples e múltipla. Departamento de Matemática. Escola Superior de Tecnologia de Viseu. Portugal, 2011.
JUNIOR, P. J. R.; MAYER, F. P.; ZEVIANI, W. M. Probabilidade no R: Conceitos básicos sobre distribuições de probabilidade. Universidade Federal do Paraná. Curitiba, 2015. Disponível em: http://www.leg.ufpr.br/~fernandomayer/aulas/ce083-2015-02/ce083_aula7_2015-02.html. Acesso em: 13 abr. 2021.
MAGALHÃES, M. N.; LIMA, A. C. P. Noções de probabilidade e estatística. São Paulo: Editora da Universidade de São Paulo, 2002.
NETO, P. L. O. C. Estatística. São Paulo: Blucher, 2006.
VIRGILITO, S. B. Estatística Aplicada. São Paulo: Saraiva, 2017.