Trilha machine learning: Algoritmo de regressão linear múltipla


No artigo anterior vimos a regressão linear simples que traça uma reta com base nos valores de duas variáveis, agora vamos ver a regressão linear múltipla, que é uma técnica estatística que estende o conceito de regressão linear simples para lidar com múltiplas variáveis independentes que podem influenciar uma variável dependente. Ao contrário da regressão linear simples, que considera apenas uma variável independente, a regressão linear múltipla incorpora várias variáveis independentes para modelar e prever a variável dependente.

Na equação da regressão linear múltipla, temos:

onde:

  • é a variável dependente que estamos tentando prever.

  • 0 é o intercepto, ou seja, o valor de quando todas as variáveis independentes são zero.
  • 1,2,, são os coeficientes que representam a influência de cada variável independente 1,2,, na variável dependente.

Vou exemplificar:

Imagine que queremos prever o preço de uma casa () com base em várias características, como o número de quartos (1), a área do terreno (2), e a proximidade de escolas (3). A equação de regressão linear múltipla seria:

Prec¸o da Casa=0+1Nuˊmero de Quartos+2Aˊrea do Terreno+3Proximidade de Escolas+

E o que nos levaria a escolher a regressão linear múltipla? 

Ela permite levar em consideração múltiplas variáveis independentes, capturando relações mais complexas e fornece insights sobre como cada variável contribui para a variação na variável dependente. porém, requer a suposição de linearidade e independência entre as variáveis e é sensível à presença de multicolinearidade, onde as variáveis independentes estão altamente correlacionadas.

Alguns exemplos de aplicações:

  • Finanças: Previsão de preços de ações com base em vários indicadores.
  • Ciências Sociais: Modelagem de fatores que influenciam o desempenho acadêmico.
  • Medicina: Relacionamento entre vários fatores de saúde e uma condição específica.

A regressão linear múltipla é uma ferramenta poderosa para analisar e prever relações complexas entre variáveis em diversas áreas. Ela é comumente utilizada em estudos estatísticos e análises de dados para entender melhor as influências de várias variáveis sobre um resultado específico. Na aplicação podemos analisar os dados da mesma forma como na regressão linear afim de descobrir quais as melhores variáveis, e depois podemos começar a aplicação do algoritmo, então vamos lá!

Vamos iniciar nosso algoritmo, e hoje trouxe uma abordagem diferente dos gráficos, onde ao invés de analisar os dados visualmente, podemos inserir os dados e ter a previsão dos valores. 












Pergunte ao nosso algoritmo e tenha a previsão para o valor da nossa casa, nesse exemplo, uma família com renda de R$12.000,00, pode encontrar uma casa com 3 quartos e com 10 anos de construída por R$5.337,19, veja só:








Por hoje é só! Espero que tenham gostado, ano que vem volto com mais conteúdos, dessa vez vamos iniciar nossa jornada para conhecer um pouco mais da parte estatística por trás de todos esses algoritmos e muitos outros que ainda quero trazer por aqui. 

Feliz 2024! Até breve! 😉


Comentários

Postagens mais visitadas deste blog

Resenha: Storytelling com dados - Cole Nussbaumer Knaflic

Trilha estatística: Variância e desvio padrão

Trilha machine learning: Algoritmo de regressão linear