Comentários

0%

FOCO NO MERCADO DE TRABALHO

Regressão linear e correlação

Ricardo Puziol de Oliveira

lorem ipsum dolor sit amet

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Nunc dignissim euismod urna tincidunt sagittis. Vivamus id vehicula eros, non scelerisque eros.

Fonte: Shutterstock.

Deseja ouvir este material?

Áudio disponível no material digital.

sem medo de errar

Dado que trabalhamos com análise de regressão linear simples nesta seção, então um modelo sugerido é um que só tem uma variável preditora. Nesse caso, podemos trabalhar com o modelo:
Ozonio=β0+β1Temperatura
Para estimar os parâmetros desse modelo, podemos considerar as equações:
β1^=i = 1nXi X¯Yi Y¯i = 1nXi X¯2
e
β0^=Y¯β1^X¯
Ou utilizar o comando “lm” do software R. Sendo assim, realizando os cálculos, temos:
Declive β1^=2,429 indica que, em cada unidade em que a temperatura aumenta, a concentração de ozônio aumenta, em média, 2,429 ppm.
Ordenada na origem β0^=146,995. Nesse caso, temos que quando a temperatura é igual a zero, a concentração de ozônio é, em média, -146,995 ppm, o que na prática é impossível de acontecer, tornando nosso modelo duvidoso e necessitando de mais dados.
Dessa forma, concluímos que o modelo linear talvez não seja o melhor modelo para trabalhar com os dados da nossa amostra sobre poluição atmosférica.

Avançando na prática

Sépalas de plantas

Suponha que um certo engenheiro genético tenha lhe contratado para avaliar as sépalas de plantas. O interesse é saber o que acontece com o tamanho da sépala quando mexemos com o tamanho da pétala. O engenheiro não sabia como descrever isso em um modelo matemático e solicitou sua ajuda. Sabendo que os dados dessa pesquisa se encontram no banco de dados “iris” do software R, como você montaria o modelo matemático para ajudá-lo? Além disso, como você estimaria esse modelo? E as interpretações dos resultados obtidos? Discorra sobre essas questões a fim de dar uma resposta ao engenheiro.

Dado que trabalhamos com análise de regressão linear simples nesta seção, então um modelo sugerido é um que só tem uma variável preditora. Nesse caso, podemos trabalhar com o modelo:
Sépala=β0+β1Pétala
Para estimar os parâmetros desse modelo, podemos considerar as equações:
β1^=i = 1nXi X¯Yi Y¯i = 1nXi X¯2
e
β0^=Y¯β1^X¯
ou utilizar o comando “lm” do software R. Sendo assim, realizando os cálculos, temos:
Declive β1^=0,4089 indica que, em cada unidade em que o tamanho da pétala aumenta, o tamanho da sépala aumenta, em média, 0,4089 cm.
Ordenada na origemβ0^=4,3066. Nesse caso, temos que quando o tamanho da pétala é igual a zero, o tamanho da sépala é 4,3066 cm, o que pode acontecer na prática.
Além disso, calculando a correlação entre as variáveis, obtemos que o coeficiente de correlação é de 0,87, que indica uma associação linear positiva e forte, justificando nosso modelo. Então, podemos responder ao engenheiro que, de fato, o tamanho da sépala é influenciado pelo tamanho da pétala e as taxas de variação são as taxas descritas anteriormente para os parâmetros do modelo.

Bons estudos!

AVALIE ESTE MATERIAL

OBRIGADO PELO SEU FEEDBACK!