top of page
ESTATÍSTICA no EXCEL 
REGRESSÃO LINEAR

REGRESSÃO LINEAR

Conceitos, análise de Pressupostos e aplicação com Excel

Imagem3.png
EQUAÇÃO-REGRESSÃO-MULTIPLA.png
REGRESSÕES LIN-LOGIST.png

 

 

O que é método de regressão linear?

Regressão é um método estatístico que permite modelar relações entre uma variável dependente e uma ou mais variáveis ​​independentes.

Uma análise de regressão permite inferir ou prever outra variável com base em uma ou mais variáveis.

Por exemplo, você pode estar interessado no que influencia o salário dos funcionários de uma empresa, e em prever o valor desses salários. Para isso, você pode considerar os dados sobre  nível de educação,  tempo de experiência e a idade dos funcionários dessa empresa.

 

 

 

 

 

 

 

 

 

A análise de regressão permitirá que você investigue se essas três variáveis ​​têm influência nos valores dos salários dos funcionários dessa empresa. Se houver influência, você poderá prever o salário de funcionários dessa empresa usando dados de nível educacional, tempo de experiência e a idade.

 

O que são variáveis ​​dependentes e independentes?

A variável a ser inferida é chamada de variável dependente (prevista). As variáveis ​​usadas para predição são chamadas de variáveis ​​independentes (preditoras).

Assim, no exemplo acima, o salário é a variável dependente e o nível educacional, tempo de experiência e a idade são as variáveis ​​independentes.

 

Por que o nome Regressão Linear ?

O termo "regressão" vem da ideia de "regredir" ou "voltar" para uma média ou uma linha que melhor explica a relação entre as variáveis. Na prática, a regressão linear utiliza dados históricos para ajustar uma equação de reta que explica a relação entre as variáveis independentes e a variável dependente. A partir dessa equação ajustada, o modelo pode ser usado para prever valores futuros ou estimar a relação entre as variáveis. A ideia é que, com base nos dados já observados (do passado), o modelo possa "regredir" ou "voltar" à tendência observada nos dados anteriores e, assim, projetar essa relação para prever novos resultados.

Já o termo "linear" refere-se ao fato de que o modelo matemático utilizado para descrever a relação entre a variável dependente e as variáveis independentes é uma equação linear, ou seja, pode ser representado por uma linha reta (ou hiperplano em múltiplas dimensões). A equação geral é dada por:

 

 

 

Aqui,  Y é a variável dependente;                       são as variáveis independentes, ​ B0 é o intercepto (constante); e os valores de                          são os coeficientes que representam o impacto de cada variável independente; e      é o termo de erro.

Dessa forma, vemos que a "Regressão linear" descreve o método estatístico que busca encontrar a melhor linha reta que representa a relação entre as variáveis, utilizando a soma dos quadrados dos erros para ajustar o modelo.

 

Qual o objetivo da regressão?

A análise de regressão pode ser realizada quando se deseja atingir dois objetivos. Um deles é estudar a influência de uma ou mais variáveis (preditoras) ​​sobre outra variável (a ser prevista), pois com a regressão é possível mensurar a influência do conjunto de variáveis preditoras sobre a variável a ser prevista. Outro objetivo é a própria previsão da variável de interesse a partir de uma ou mais variáveis preditoras, o que será possível por meio de uma equação de regressão (modelo de regressão).

Resumidamente a análise de regressão serve para quando você tem como objetivos:

  • Prever uma variável de interesse

  • Avaliar a influência de uma ou mais variáveis preditoras sobre a variável de interesse (a ser prevista).

 

Quando usar a regressão linear?

Quando houver correlação linear entre  ​​as variáveis independentes e a variável dependente, e seu objetivo envolva fazer previsões da variável do seu interesse, e/ou avaliar se o conjunto das variáveis escolhidas como preditoras tem influência significativa sobre a variável a ser prevista.

Quando usar Regressão Simples e Múltipla?

  • Regressão Linear Simples se estiver considerando uma única variável independente  (preditora) para estimar o valor da variável de interesse .

  • Regressão Linear Múltipla se estiver considerando duas ou mais variáveis independentes (preditoras) para estimar o valor da variável de interesse .

 

Observe que essa influência conjunta das variáveis independentes sobre a variável dependente não é captada por uma análise de correlação entre as variáveis, pois a correlação só mede o relacionamento de cada par de variáveis, isoladamente, e não supõe quem são as variáveis independentes ou dependente.

Por exemplo, nos casos em que seu objetivo seja:

1) Medir a influência de uma ou mais variáveis ​​sobre outra variável, em contextos como:

  • O nível de concentração de adolescentes (Y) é influenciado por tempo que utilizam dispositivos eletrônicos diariamente (X)??

  • A renda familiar (X1)  e o local de residência (X2) afetam o desempenho educacional das crianças (Y)?

 

2) Previsão de uma variável por meio de uma ou mais variáveis conjuntamente, contextos como:

  • Quanto tempo um paciente pode permanecer internado em hospital (Y), a partir de dados de idade (X1) e quantidade de comorbidades (X2).

  • Qual tipo de produto uma pessoa tem mais probabilidade de comprar em uma loja online (Y) a partir de dados de renda familiar (X).

 

 

Quais são os modelos de regressão?

As análises de regressão são divididas em regressão linear simples , regressão linear múltipla e regressão logística . O tipo de análise de regressão que deve ser usado depende do número de variáveis ​​independentes e da escala de medição da variável dependente.

 

 

Regressão logística pode ser utilizada quando a variável dependente  for nominal, como por exemplo a satisfação ou não de funcionários com seu o trabalho.

 

Podemos realizar uma regressão linear simples que preveja o salário dos funcionários (Y) em função do  tempo de experiência (X); uma regressão linear múltipla que estime salários de funcionários (Y) em função do nível de escolaridade (X1), do tempo de experiência (X2), e de sua idade (X3), conjuntamente;  e uma regressão logística que indique a satisfação ou não dos funcionários (Y) em função das mesmas variáveis independentes nível de escolaridade (X1), do tempo de experiência (X2), e de sua idade (X3).

 

 

 

 

 

 

 

 

 

 

Quais são os pressupostos da regressão linear?

Os pressupostos básicos da regressão linear são condições que precisam ser atendidas para garantir que os resultados do modelo sejam confiáveis e válidos. Esses pressupostos incluem:

 

  • Linearidade: A relação entre as variáveis independentes (preditoras) e a variável dependente deve ser linear. Isso significa que a variação na variável dependente pode ser explicada de forma linear pelas variáveis independentes.

  • Independência dos Erros (Autocorrelação): Os erros (ou resíduos) do modelo devem ser independentes uns dos outros. Em séries temporais, por exemplo, os valores sucessivos não devem estar correlacionados.

  • Homoscedasticidade: A variância dos erros deve ser constante ao longo de todas as observações. Isso implica que os erros não devem se expandir ou contrair conforme o valor das variáveis preditoras muda.

  • Normalidade dos Erros: Os resíduos devem seguir uma distribuição normal. Isso é particularmente importante para testes de hipóteses, como os testes de significância dos coeficientes. 

O atendimento a esses pressupostos contribui para validação do modelo de regressão linear como um modelo eficaz para prever e inferir a relação entre as variáveis analisadas.

 

 

Como fazer regressão linear no Excel?

O Excel é uma ferramenta poderosíssima e de fácil acesso para uso pessoal e amplamente difundido no mercado de trabalho. A maioria das empresas usa planilhas com diferentes objetivos nos processos de trabalho, e dessa forma a habilidade no uso do Excel torna-se uma competência básica para profissionais de diversas áreas e níveis.

Nos vídeos a seguir, você acompanhará um passo a passo de uma análise de Regressão Múltipla no Excel, desde a execução até à verificação de pressupostos, passando pela montagem do modelo de regressão (equação) e simulação de uma previsão usando o modelo. Além disso, um dos vídeos conta com tutorial rápido sobre como habilitar a Ferramenta de Análise de Dados do Excel, que é um suplemento do Excel, e precisa ser habilitado para que possamos utilizar.

REGRESSÃO-TABELA-VARIAVEIS.png
Xis.png
bottom of page